距离上次发帖过去快一个月了,我又来水贴更新了哈哈哈
备考真头疼啊,从早学到晚,感觉改改项目居然还挺放松减压的(我大抵是病了)
专业课第一轮已经学完了,感觉学不完呢,这个月继续加油!
好了不吐槽了┭┮﹏┭┮,介绍一下这次主要更新了啥:
-
重构了项目页面
感觉之前的布局有点丑,布局也不太合理,虽然现在还是很丑哈哈哈(直男审美) -
支持调用本地LLMs翻译
配合本地whisper,现在可以实现完全本地化,妈妈再也不用担心并发和token的问题啦,就是吃配置哈哈哈 -
支持仅翻译字幕
很多UU想只翻译字幕,于是他来了,翻译的prompt还是之前的。 -
支持保存所有设置参数
很多人吐槽每次都要重调哈哈哈,所以加了这个,确实每次重调有点麻烦。 -
项目运行流程更改
目前改为两种方案:
1.一键直出,方便直接出视频,不改字幕(当然最终不满意也可以改)。
2.先出字幕后出视频,这样省了合并的时间,不用每次都等全流程跑完才能改字幕。 -
新增(缝)几个FFmpeg的功能
把FFmpeg的一些功能重新缝合上去了,比如日志啊,GPU加速合并啊,字幕大小,字体颜色,软/硬字幕,编码器啥的哈哈哈。 -
最后就是一些体验优化和一大堆自己写的BUG修复啦
注意到GitHub也有一些新手朋友,不会一些环境和库的安装啥的于是就开了个项目文档(emm写的有点烂)项目文档
虽然项目很简单,但是能帮助到有需要的人还是很开心的耶!
大家问的一些区分音色、实时语音和声音克隆的功能实在是没更多时间搞,考等完研究吧哈哈哈
备考加油! 链接奉上:
贴几个界面图片