是的~目前看到的主流解决方案都是用 whisper,楼上提到的 VideoLingo 应该就是一个打包版
感谢!这个教程写得非常清楚,回头试试;这个网站做的也很不错,感谢推荐!
我试过 5 个小时的视频,就是要把字幕分割,然后把英文翻译为中文,再把中文对齐时间轴,然后再全部合并,用 AI + 脚本 基本可以 80%以上 完成度,质量也比机翻高的多,回看视频的时候顺便调整有问题的地方。
现在最头疼的还是 whisper 幻觉和正确率问题还是有待解决,转录的英文还是会受很多因素出现差错,基本无解
ffmpeg 提取音频,再转录成文字
之前用过个项目,本地可直接生成字幕文件,当然对准确度有要求需要再校对。
你也没找到其他的,我回头给你找找项目名称,不常用所以没记住名字
确实,VideoLingo 处理短视频已经非常方便了;但是似乎处理长视频(1 小时以上)还是没有很理想的解决方案。目前我也是把一个视频拆成几段处理的
上边提到的 VideoLingo 就是按这个思路来的,确实很方便