佬友们有没有好用的语音实时翻译软件推荐?我试过谷歌和微软的,但感觉准确率一般。大家有其他的推荐吗?
另外,对于利用 AI 模型进行实时翻译,佬友们有什么建议吗?
佬友们有没有好用的语音实时翻译软件推荐?我试过谷歌和微软的,但感觉准确率一般。大家有其他的推荐吗?
另外,对于利用 AI 模型进行实时翻译,佬友们有什么建议吗?
飞书。通义
我今天试试
考虑试一试asr->ai翻译->tts吗
正在考虑
1.愿意为多语种付费就科大讯飞(软件或直接购买硬件,小米手机有内置免费版本,华为好像也有类似的),通义,飞书,百度,有道等大厂软件;
2.window端:
2.1 部分语种:win11自带+字幕: LiveCaptions-Translator
2.2 浏览器:speech translator(在线,多语种)
2.3 语音转文字,无翻译,本地中英双语: CapsWriter-Offline:
CapsWriter (GitHub - HaujetZhao/CapsWriter-Offline: CapsWriter 的离线版,一个好用的 PC 端的语音输入工具)
3.ios:yplayer 69元
4.Mac: BeMyEars
受教了。看在哪个端使用,场景的话ios以沟通辅助为主,mac以会议辅助为主。
科大讯飞吧
我之前大概比较过几个厂商的服务,阿里通义,字节飞书,感觉准确率差不多,主要我没法控制同一个音频做变量。
感觉实时的准确率比离线的还是差不少
两个不能同时开吗?
如果从开发的角度:
看你要多“实时”了,如果能接受秒级别的延迟大概 ASR->LLM 比较好的。
ASR 可以用 Azure 的实时 STT 服务,效果挺好的。也可以本地 faster-whisper + https://arxiv.org/pdf/2307.14743 ,我测过效果还可以的。
如果能进一步接受更大延迟可以考虑 VAD + gemini 2.0 flash 转录+翻译,比较省钱的同时应该效果也还行
在用科大讯飞和有道词典, 最主要是我没技术自己部署
唉 我全是安卓设备
可以试试这个方案
有道词典还挺准的
感谢佬友的建议 太详细了
(GitHub - H1DDENADM1N/CapsWriter-Offline: 离线语音输入简/繁体、中译英、字幕转录;在线多译多、云剪贴板等等 (选用SenseVoice模型 支持中粤英日韩多语种))
补一个多语种win10+版本
我试试这个