如何从 B 站视频中手工提取字幕文本来做笔记

好吧 分享一个自己常用的 b站, 视频下载 音频提取单独下载的脚本,提取音频你懂的继续讨论:

动机:放寒假了,想读点中国历史,希望能学到记住些内容。

但直接看文言文,你懂得,咱们普通人没啥文化,也看的困倦,看了就忘;

B站物华天宝,什么课程,什么资源没有?于是自己就看起了百家讲坛王立群讲解的 汉代风云人物之项羽

看了若干集,打算记点笔记,打开md编辑器,回头发现,前些集的内容大概是想不起来了,重看视频又太麻烦;于是想 导出B站视频字幕,找了找导出字幕的工具,奈何这种老视频根本没有字幕可以导出

L站人杰地灵,自己也从佬友身上学到不少知识技术。于是打算用google ai studio免费提供的多模态模型来提取所有的视频/音频字幕文本

下面说明如何得到B站视频(无法导出字幕时)的音频转文本结果。方法比较土,纯手工操作。

  1. 得到视频的音频 .mp4
  • 使用佬友分享的b站视频下载,音频提取脚本。这里得到MP4文件,因为提取的音频文件.m4s,在google ai studio 上不支持。
  1. 转成 .mp3文件
  • 这是因为我将 .mp4文件上传至ai studio时,总是 error; http status code: 500,而.mp3文件可以正常上传。
  • 使用convertio 转换格式。这个网站是否保护隐私是未知的! 这种不在意的信息就随意了。
  1. 导入ai studio
  • 右侧选择模型,gemini 2 flash足矣;temperature我喜欢小一点。
  • 一个40分钟的视频,光输入tokens就已经7w+了,而ai studio的单次回复上限是8192 tokens. 一次输出不完,就多输出几次,上下文还是连贯的。

notes:

  • 如果要加时间戳变成字幕,也完全ok,
  • 似乎文件的时长不能超过1h.

这样有了文本,我们就可以愉快地整理笔记了!

9 个赞

感谢分享,大佬太强了

感谢大佬!

感谢大佬分享

感谢分享

我也送两个方案 :tieba_001:
这个,本地模型, 将音视频文件拖动到客户端打开,即可转录生成 srt 字幕
虽然目前只有CPU版本,但确实挺快,中文效果还行

这个是将视频中的硬字幕提取为外挂字幕文件(srt格式)
建议使用N卡,也是本地的,稍微有点慢

2 个赞

补充个方案: bibiGPT

2 个赞

佬友太强了

你这操作太麻烦了,直接通义听悟的效率,音视频转写就行,支持视频链接,一键导出所有字幕,自动总结重点,还有思维导图。佬友可以试试

3 个赞

mark一下。 等后续编辑。

佬友太强了!

学到了!

佬友厉害!

没错我就想推荐这个