免费开源的全自动音视频翻译工具,利用 Whisper 识别声音

全自动音视频翻译工具,利用 Whisper 识别声音,并可通过多种翻译引擎进行翻译,支持多种语言和文件格式,支持一键生成、字幕微调、视频预览,并可对内容进行 AI 总结和问答,免费开源。

:octopus: [项目地址]

18 个赞

感谢分享

感谢佬友分享

感谢 !

mark!

感谢分享

谢佬

好像想有个按译文字幕自动AI配音的,然后视频也是译文的的发音。

1 个赞

我之前有这个想法,先用whisper语音转文字,然后把视频里的人声分离了,通过GPT-SoVITS,训练人声模型,然后再文字转语音。whisper语音转文字,它是有字幕时间轴的,可以通过FFmpeg指定字幕轴,人声分离。然后通过文字转语音方式,再把通过文字转语音的翻译人声加上去。

这个项目很棒 谢谢分享

有没有支持实时流的