今天又是小龙猫语音调试失败的一天,但是好的是,终于向破案的这个方向走了一步了
我们这几天研究了千问TTS这个AI模型,最后研究透了,它的语气指令和它的seed值只能控制同一句话的音色保持一致
但是它不能控制AI说不同话的时候的音色,一旦说不同的话,音色就会飘得非常厉害。如果你读一本书的几页内容的话,感觉像七八个人在读书一样
虽然今天又是失败的一天,但是终于找到原因了。明天直接上语音克隆,如果语音克隆都不能把跨语句朗读的音色稳定下来的话,只能把千问模型给换掉了
所以说,在AI编程的这个过程中,一定要实践呐,实践出真知