如题,不包括赠送的 要长期投入使用,支持高并发,看了豆包并不便宜
9 个赞
语音模型都是按次计费的,比较贵
有个简单的方案就是:内容生成 + GPT-SoVits 来输出
3 个赞
Step Audio不是开源吗?这个可以本地部署的
4 个赞
本地部署个人玩玩还可以,但如果要高并发不行,还是要买API
2 个赞
佬,找到解决方案的话,麻烦分享下
1 个赞
我也在找,佬你找到解决方案了吗
我看这个里面chat 模型显存最低要求 265G
豆包的体验最好,但是也太贵了
Step-Audio-Chat 有点大了,一般搞不起,可以试试 Qwen2-Audio-7B-Instruct,比较小,部署要求不高,性能还行,如果阿里升级到基于 Qwen2.5 的,估计就更好了。