目前市面上TTS 模型汇总

补充两个吧,效果领先以上绝大多少,一是cosyvoice,而是f5-tts。

2 个赞

感谢大佬分享 :tieba_002:

zero-shot的话这俩确实天花板了,cosy语气更自然,f5音质好些,应该还有优化空间。个人觉得目前来说稳定使用还是首推gpt-sovits

5 个赞

是的,但是很多人没什么训练经验

make~收藏一下

好东西,mark一份

马克住!!!!!

F5-TTS 比较不错,迭代比较快

我怎么搜到最多人用的是什么coquitts,这个怎么样

既然都被顶起来了 就顺手提一个非开源的商业 TTS
在 EN 方面 和其他模型比较了一下 暂时没有能达到这个水平的*
*: sovits 只试过 1 但是他们出了 2 不清楚实际水平

推荐SWivid/F5-TTS: Official code for “F5-TTS: A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching”

有沒有推薦在 mac mini 上能跑的TTS?
上述模型都要N卡或A卡

我自己查到就只有

马克一下

其实可以不用显卡,这有个项目甚至手机上都可以,就是速度慢了些

感谢佬友无私分享,收藏下

感谢收集,收藏了

感谢分享

cosyvoice也能在m4 mini跑