如何提取视频里面的文字

RT,有一段视频,想将视频中所说的话提取为文字,导出txt 这种

1 个赞

支持 whisper 模型的应用或API调用。
可以看下这个帖子:

groq 的文档

GroqCloud

剪映好像就可以

楼上说的剪映可以,识别字幕再导出txt。

简单一点的就是剪影,中文友好一点,如果是其他语言的话就只能用语音识别大模型了,我现在用的是下面的这个,识别英语很好用,识别之后手动再调整一下

From 快问快答 to 开发调优