最近朋友想找一个能把整场会议语音转文字的软件,whisper 正好可以做这件事,但是有什么能使用始皇的 api 的语音转文字应用呢?求大佬推荐
3 Likes
mark,以备不时之需
1 Like
占楼补充,我的手机是 iOS的,朋友是安卓的,有些 APP 可能没有在两个平台都上架
1 Like
始皇的chat2api服务的话,很难做这种,基本上最长只能几分钟的mp3音频。除非是一点点切割。如果你用的是官转的whisper的话可能会长一点
1 Like
是呀,所以我在想有没有开箱即用的会自动切割的项目,Github 上找到了一个可以自动切割音频块长度的项目,但是我朋友小白不会用这个命令行软件
1 Like
用whisper那你还得解决发言人角色区分问题。我想起国内厂商做了几个在线平台,可以免费用用来做视频字幕、会议纪要都是不错的选择。
飞书妙记:https://gb3robjyri.feishu.cn/minutes/home
网易见外:https://jianwai.youdao.com/
可能有一定额度限制,好久没有了我也不清楚限制多少。应该几个小时的免费时长是有的。
3 Likes
感谢,我去试试看
1 Like
一般来说比较长的音频用本地部署的whisper比较方便
这个项目是用colab部署的,可以识别比较长的音频,不过没办法实时识别
Ayanaminn/N46Whisper: Whisper based Japanese subtitle generator (github.com)
btw,如果会议都是中文的话阿里的通义听悟也可以试试
3 Likes
by the way,用户名很亮
1 Like
感谢
这个C++的好用
1 Like
From #develop:qa to 开发调优
1 Like