目前市面上TTS 模型汇总

1、GPT-SoVITS

AI 卖货主播大模型Streamer-Sales销冠用的这款TTS模型
支持英语、日语和中文,零样本文本到语音(TTS),集成工具包
github:GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

2、Fish Speech v1.2
效果稳定非常好,支持克隆语音。经过 30 万小时的英语、中文和日语音频数据的训练。
模型:fishaudio/fish-speech-1.2 · Hugging Face
在线版:https://fish.audio/zh-CN/

3、字节的Seed-TTS(不开源)
支持多种语言包括英语、中文,能够进行同语言生成和跨语言生成
能处理各种文本,叙述性文本、情感表达、描述性文本等,能根据不同的情感和语境生成相应的语音
项目:Seed-TTS

4、ChatTTS
对话式 TTS(可多人),支持中英文,韵律细腻
github:GitHub - 2noise/ChatTTS: A generative speech model for daily dialogue.
模型:2Noise/ChatTTS at main

5、HuggingFace的Parler-TTS
可以控制音调、速度、性别、噪音水平、情绪特征等等
github:GitHub - huggingface/parler-tts: Inference and training library for high-quality TTS models.
模型:parler-tts (Parler TTS)

6、MetaVoice-1B
支持多语言,在英语处理上实现了情感语音节奏
github:GitHub - metavoiceio/metavoice-src: Foundational model for human-like, expressive TTS

7、MARS5-TTS
MARS5可以为体育解说、动漫等韵律复杂和多样化的场景生成语音
github:GitHub - Camb-ai/MARS5-TTS: MARS5 speech model (TTS) from CAMB.AI

8、OpenVoice
原生支持英语、西班牙语、法语、中文、日语和韩语,具有灵活的语音风格控制和零样本跨语言语音克隆能力。
github:GitHub - myshell-ai/OpenVoice: Instant voice cloning by MIT and MyShell.

9、EmotiVoice
支持中英文双语,包含2000多种不同的音色
github:EmotiVoice/README.zh.md at main · netease-youdao/EmotiVoice · GitHub

167 个赞

我发过啦:rofl:

11 个赞

可恶

11 个赞

好东西 半夜睡不着的时候就找个萝莉音

11 个赞

感谢分享

10 个赞

Mark了

5 个赞

感谢

6 个赞

mark 回头试试效果

2 个赞

微软的tts应该是最好的

8 个赞

一直在用GPT-Sovits

2 个赞

谢谢!

3 个赞

谢谢,本地搭建跑跑试试

2 个赞

mark

这必须点个赞

你俩文案咋一模一样

mark

不是听说有个阿里的吗

From #develop:ai to 资源荟萃

收藏一下,多谢分享

怎麼沒有opensi的