「开源」使用 gemini 或者 gpt4 解析视频转成文本～

Zeus · 2024 年1 月 29 日 04:39

简单逻辑：使用 ffmpeg 将视频切成视频帧图片传给 gemini 或者 gpt4v 做解析最后再进行整理和总结

支持某音和某tok 支持使用本地视频

写的很菜，大佬勿喷

neo · 2024 年1 月 29 日 04:46

neo · 2024 年1 月 29 日 04:47

有趣有想法

Brantfang · 2024 年1 月 29 日 04:52

图片信息太少了吧。音频和字幕信息呢？一般来说直接导出字幕直接做总结和整理。

NINE · 2024 年1 月 29 日 04:53

我刷的短视频，gpt4看了都羞涩

wo_zu_long · 2024 年1 月 29 日 04:54

想法非常好，但是一个视频的帧数量太多了，用大语言模型的话一个视频用时和模型的使用量太大了

Zeus · 2024 年1 月 29 日 04:57

万一没有字幕呢我这个也就只是一个想法最好的方式是音频转换成字幕同时再使用视频的一些图片结合起来分析

Zeus · 2024 年1 月 29 日 04:57

是的这是一个问题目前也就只能是一个 demo 没办法落地

Zeus · 2024 年1 月 29 日 04:57

哈哈哈哈

Brantfang · 2024 年1 月 29 日 05:04

拉出音频流，生成字幕呗

Zeus · 2024 年1 月 29 日 05:14

是呀我知道但是我没写

Zeus · 2024 年1 月 29 日 05:14

哈哈哈哈

neo · 2024 年1 月 29 日 05:15

写啊，生产队的驴都不敢这么歇着

Zeus · 2024 年1 月 29 日 05:27

我等人给我提pr 写不动了

zhhc88 · 2024 年1 月 29 日 05:36

写啊，生产队的驴都不敢这么歇着

lua · 2024 年1 月 29 日 06:51

写啊，赶紧把磨拉起来

cdd · 2024 年1 月 29 日 06:54

你不写，有的是帕鲁写，这片大陆最不缺的就是帕鲁

Zeus · 2024 年1 月 29 日 07:48

我就不

Zeus · 2024 年1 月 29 日 07:49

后面有时间再写我这种 go 萌新写个这个，掉了半个脑袋的头发

benny · 2024 年1 月 31 日 06:12

掉半个转职阿哥帕鲁

话题		回复	浏览量
如何从 B 站视频中手工提取字幕文本来做笔记资源荟萃纯水	13	199	2025 年1 月 20 日
AsrTools：智能语音转字幕文本工具资源荟萃	38	1856	2025 年1 月 10 日
将视频内容提取为文本开发调优快问快答	13	424	2025 年1 月 2 日
【卡卡字幕助手】VideoCaptioner - 基于 LLM 的智能字幕助手，支持生成、断句、优化、翻译、视频合成全流程！资源荟萃 ChatGPT , OpenAI , GitHub , 软件开发	96	3764	2025 年2 月 11 日
一款一键全自动视频搬运工具：VideoLingo 资源荟萃人工智能	71	3180	2025 年1 月 3 日