具体看文档,gui部分其实没做完
厉害厉害
1 个赞
在哪里买的,好便宜啊
1 个赞
谢谢分享
1 个赞
某鱼买的,那个哥就直接说 15块赚我个智商税
都是之前刷邀请刷的,硅基的key
佬去割小白了,做個gui,加個激活碼,50一份
Api再另算
1 个赞
不是不可以啊,但是我不会做流量这方面的东西
站裏有教學,一毛錢成本能刷1個碼
最簡單就黃魚掛一個,然後b站抖音小紅書搞點圖文和短頻,我弄了個ai翻譯pdf和電子書的,也時不時有單子
太强了,大佬!
有地址吗?我去康康
我之前也考虑做这个的,主要不能做成直接读,这样app自带的朗读没区别了。你这个虽然分角色了,但是效果不太好,最好通过llm先分析一遍角色,然后用tool创建符合角色特征的音色,然后结构化(标记)文本再tts,最后合成。
音色这块可以看看 SparkAudio/Spark-TTS: Spark-TTS Inference Code,我有想过整个活儿,搞一些名人的声音。
3 个赞
支持方言吗大佬
1 个赞
语音模型不太好 考虑使用Seasame的模型啊
我以为是那种抖音上的ai画面,佬,有没有那种
1 个赞
试试火山的自动分镜自动生成画面
好,去看看效果,主要是自己想看,哈哈哈哈
1 个赞
感谢分享 ~
1 个赞
搞别人声音还要考虑声音版权什么的问题
你这个思路感觉很棒欸
因为我用的是线上的硅基,线上是不支持上传自己的音色的,所以限制性有点大
我本地跑的话速度有点慢
所以没有尝试
欢迎大佬在这个基础上修改
翻我的帖子,我上一个就是小说推文的,这俩可以结合起来用其实
这个项目就是小说推文中拆出来修改的