1、GPT-SoVITS
AI 卖货主播大模型Streamer-Sales销冠用的这款TTS模型
支持英语、日语和中文,零样本文本到语音(TTS),集成工具包
github:GitHub - RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
2、Fish Speech v1.2
效果稳定非常好,支持克隆语音。经过 30 万小时的英语、中文和日语音频数据的训练。
模型:fishaudio/fish-speech-1.2 · Hugging Face
在线版:https://fish.audio/zh-CN/
3、字节的Seed-TTS(不开源)
支持多种语言包括英语、中文,能够进行同语言生成和跨语言生成
能处理各种文本,叙述性文本、情感表达、描述性文本等,能根据不同的情感和语境生成相应的语音
项目:Seed-TTS
4、ChatTTS
对话式 TTS(可多人),支持中英文,韵律细腻
github:GitHub - 2noise/ChatTTS: A generative speech model for daily dialogue.
模型:2Noise/ChatTTS at main
5、HuggingFace的Parler-TTS
可以控制音调、速度、性别、噪音水平、情绪特征等等
github:GitHub - huggingface/parler-tts: Inference and training library for high-quality TTS models.
模型:parler-tts (Parler TTS)
6、MetaVoice-1B
支持多语言,在英语处理上实现了情感语音节奏
github:GitHub - metavoiceio/metavoice-src: Foundational model for human-like, expressive TTS
7、MARS5-TTS
MARS5可以为体育解说、动漫等韵律复杂和多样化的场景生成语音
github:GitHub - Camb-ai/MARS5-TTS: MARS5 speech model (TTS) from CAMB.AI
8、OpenVoice
原生支持英语、西班牙语、法语、中文、日语和韩语,具有灵活的语音风格控制和零样本跨语言语音克隆能力。
github:GitHub - myshell-ai/OpenVoice: Instant voice cloning by MIT and MyShell.
9、EmotiVoice
支持中英文双语,包含2000多种不同的音色
github:EmotiVoice/README.zh.md at main · netease-youdao/EmotiVoice · GitHub