AsrTools：智能语音转字幕文本工具

weifeng_liang · 2024 年9 月 29 日 07:04

关于第二个工作，最近已经在投入。倒不如说这个项目本来也是为了我最初的视频字幕全流程自动处理的项目而进行的。可以后续关注一下。

至于capcut，你说的是网页版或者手机版本吗，因为我觉得这个和剪映一样的接口。

NBXX · 2024 年9 月 29 日 07:12

Capcut 是剪映的国际版，也是有 PC 和移动端多个版本。
相比国内版，国际版的字幕生成可选语言更多大概有十几种，此外还有很多国内版加入 VIP 的功能可以免费用。

刚才还发现一个小问题，就是接口返回生成的 SRT 是非标准的，（可参考的标准）时间戳的秒数没有补位，毫秒使用的是英文句号而非逗号分隔。这在导入 Aegisub 等软件的时候会报错 Parsing SRT:Expected timestamp pair at line 2。
我这里写了个小脚本去修复。

python3 fix_srt.py [srtfile_path]

import sys
import re

def fix_timestamps(line):
    fixed_line = re.sub(r'(\d+):(\d+):(\d+)\.(\d+)', lambda m: f"{int(m.group(1)):02}:{int(m.group(2)):02}:{int(m.group(3)):02},{int(m.group(4)):03}", line)
    return fixed_line

def fix_srt_file(input_file, output_file):
    with open(input_file, 'r', encoding='utf-8') as file:
        lines = file.readlines()
    
    with open(output_file, 'w', encoding='utf-8') as file:
        for line in lines:
            if '-->' in line:
                line = fix_timestamps(line)
            file.write(line)

if __name__ == '__main__':
    input_srt_path = sys.argv[1]
    output_srt_path = input_srt_path.replace('.srt', '_fixed.srt')
    fix_srt_file(input_srt_path, output_srt_path)

weifeng_liang · 2024 年9 月 29 日 07:33

谢谢反馈，相关的字幕的格式可以直接在ASRData.py里修改。有空的话我修正一下，或者也欢迎pr

weifeng_liang · 2024 年9 月 29 日 11:37

好了问题弄好了

naihe · 2024 年9 月 29 日 11:50

项目挺好的，可惜我不做媒体没需求，不过我有个想法，能不能给没有字幕的视频实时添加字幕，甚至增加机器翻译。

weifeng_liang · 2024 年9 月 29 日 12:06

实时的这个调用的接口估计做不来。要是离线处理的我现在正在做：识别字幕+大模型优化字幕+大模型翻译+添加视频字幕全自动化。

clardemasol · 2024 年10 月 9 日 08:01

有点厉害支持~~

bojue · 2024 年10 月 9 日 08:06

很厉害，不过软件打不开，需要安装qt插件是什么意思

dtemiemie · 2024 年10 月 9 日 08:07

看起来很不错

HOK · 2024 年10 月 14 日 23:27

感谢分享，再加个翻译功能就更完美了

Carlxlx · 2024 年11 月 14 日 17:06

这个语音识别的B接口跟J接口都是什么呢？是云服务平台吗？

weifeng_liang · 2024 年11 月 15 日 04:24

是的，调用网络接口

Carlxlx · 2024 年11 月 15 日 04:42

能透露一下是啥模型不？很好奇，回来想仔细研究研究。现在语音识别的模型我就知道一个whisper

谢了

stream1990 · 2024 年11 月 15 日 04:43

泰语能翻译吗

weifeng_liang · 2024 年11 月 15 日 05:11

需要翻译的话可以使用这个项目，翻译的话支持任何语言。

yangbuyiya · 2024 年11 月 19 日 05:41

大佬支持 linux部署吗 api 调用

1713375484 · 2024 年11 月 24 日 02:48

同问啊大佬

ABandonLove · 2024 年11 月 24 日 02:50

佬这个和Buzz哪个好捏

van27 · 2025 年1 月 10 日 03:32

试试，谢谢分享

话题		回复	浏览量
【卡卡字幕助手】VideoCaptioner - 基于 LLM 的智能字幕助手，支持生成、断句、优化、翻译、视频合成全流程！资源荟萃 ChatGPT , OpenAI , GitHub , 软件开发	73	3071	2025 年1 月 16 日
AI 精校验处理ass字幕是否可行？开发调优人工智能 , 快问快答	10	244	2025 年1 月 23 日
请问bibigpt这种音视频生成字幕并总结分析对加快网课学习有效吗？开发调优快问快答	21	300	2025 年1 月 9 日
无字幕外语视频添加字幕解决方案？资源荟萃	31	1265	2024 年12 月 12 日
如何从 B 站视频中手工提取字幕文本来做笔记资源荟萃纯水	13	150	2025 年1 月 20 日

AsrTools：智能语音转字幕文本工具

相关话题