做了个最快的B站直播录制、自动切片、自动渲染弹幕和字幕并投稿的项目,兼容 10 年前的机器!欢迎各位佬友使用并提建议。

由于上个帖子的自我管理没有申请结果,所以编辑不了上个帖子的主题,所以我就新开贴跟大家汇报一下开发进度,欢迎各位佬继续提出修改和优化建议。

7 x 24 小时无人监守录制直播、渲染弹幕、识别字幕、自动切片、自动上传、兼容超低配置电脑,启动项目,人人都是录播员

自动监听并录制B站直播和弹幕(含付费留言、礼物等),根据分辨率转换弹幕、语音识别字幕并渲染进视频,根据弹幕密度切分精彩片段并通过视频理解大模型生成有趣的标题,自动投稿视频和切片至B站,兼容无GPU版本,兼容超低配置服务器与主机。

  • 速度快:采用 pipeline 流水线处理视频,理想情况下录播与直播相差半小时以内,没下播就能上线录播,目前已知 b 站录播最快版本
  • 多房间:同时录制多个直播间内容视频以及弹幕文件(包含普通弹幕,付费弹幕以及礼物上舰等信息)。
  • 占用小:自动删除本地已上传的视频,极致节省空间。
  • 模版化:无需复杂配置,开箱即用,( :tada: NEW)通过 b 站搜索建议接口自动抓取相关热门标签。
  • 检测片段并合并:对于网络问题或者直播连线导致的视频流分段,能够自动检测合并成为完整视频。
  • 自动渲染弹幕:自动转换xml为ass弹幕文件并且渲染到视频中形成有弹幕版视频并自动上传。
  • 硬件要求极低:无需GPU,只需最基础的单核CPU搭配最低的运存即可完成录制,弹幕渲染,上传等等全部过程,无最低配置要求,10年前的电脑或服务器依然可以使用!
  • ( :tada: NEW)自动渲染字幕(如需使用本功能,则需保证有 Nvidia 显卡):采用 OpenAI 的开源模型 whisper,自动识别视频内语音并转换为字幕渲染至视频中。
  • ( :tada: NEW)自动切片上传:根据弹幕密度计算寻找高能片段并切片,结合多模态视频理解大模型 GLM-4V-PLUS 自动生成有意思的切片标题及内容,并且自动上传。
68 个赞

大佬有考虑做其他平台的吗

15 个赞

前排支持大佬!

12 个赞

很牛逼啊,话说硬件要求低的话,是视频上传云端模型计算吗?

10 个赞

会考虑的,大家平时都看哪些平台的直播?我统计一下,分别进行针对性的开发和优化。

9 个赞

国内平台斗鱼看得多,海外的话就是soop和twitch

8 个赞

太强了!

2 个赞

感谢支持,欢迎使用并提需求。

是的,关于切片的部分生成视频标题采用的智谱的 GLM-4V-PLUS 模型接口进行计算。ASR 字幕部分采用的是本地运行 OpenAI 的 whisper 模型推理来完成,因此如果不需要识别字幕功能的话,其他功能完全可以运行在 1 核 1 G 的机器上,应该算是机器中的最低配置了。

1 个赞

这玩意感觉是真的好东西啊

好的,我后面会针对这些平台进行优化与支持。

抖音考虑吗?大佬

太强了!

佬友好像获得 2024 评论王了吧 :smile:

大帅哥,无处不在

抖音可以搞一下 :tieba_025:

不过还是需要持续迭代,欢迎佬提出自己的需求以及改进意见。

有考虑的,最近在看抖音等平台的接口。

感谢佬,如果有更多改进或者添加的需求,欢迎提出。

确实,哈哈