Whisper 有什么值得推荐的 APP 或者 WebUI?

最近朋友想找一个能把整场会议语音转文字的软件,whisper 正好可以做这件事,但是有什么能使用始皇的 api 的语音转文字应用呢?求大佬推荐:pleading_face::pleading_face::pleading_face::pleading_face:

3 Likes

mark,以备不时之需

1 Like

占楼补充,我的手机是 iOS的,朋友是安卓的,有些 APP 可能没有在两个平台都上架

1 Like

始皇的chat2api服务的话,很难做这种,基本上最长只能几分钟的mp3音频。除非是一点点切割。如果你用的是官转的whisper的话可能会长一点

1 Like

是呀,所以我在想有没有开箱即用的会自动切割的项目,Github 上找到了一个可以自动切割音频块长度的项目,但是我朋友小白不会用这个命令行软件:face_holding_back_tears::face_holding_back_tears::face_holding_back_tears:

https://github.com/ochen1/insanely-fast-whisper-cli

1 Like

用whisper那你还得解决发言人角色区分问题。我想起国内厂商做了几个在线平台,可以免费用用来做视频字幕、会议纪要都是不错的选择。
飞书妙记:https://gb3robjyri.feishu.cn/minutes/home
网易见外:https://jianwai.youdao.com/

可能有一定额度限制,好久没有了我也不清楚限制多少。应该几个小时的免费时长是有的。

3 Likes

感谢,我去试试看

1 Like

一般来说比较长的音频用本地部署的whisper比较方便 :thinking:
这个项目是用colab部署的,可以识别比较长的音频,不过没办法实时识别
Ayanaminn/N46Whisper: Whisper based Japanese subtitle generator (github.com)

btw,如果会议都是中文的话阿里的通义听悟也可以试试

3 Likes

by the way,用户名很亮

1 Like

感谢

这个C++的好用

1 Like

From #develop:qa to 开发调优

1 Like