【求助】语音实时翻译推荐

佬友们有没有好用的语音实时翻译软件推荐?我试过谷歌和微软的,但感觉准确率一般。大家有其他的推荐吗?

另外,对于利用 AI 模型进行实时翻译,佬友们有什么建议吗?

11 个赞

飞书。通义

2 个赞

我今天试试

1 个赞

考虑试一试asr->ai翻译->tts吗 :smiley:

1 个赞

正在考虑

1 个赞

1.愿意为多语种付费就科大讯飞(软件或直接购买硬件,小米手机有内置免费版本,华为好像也有类似的),通义,飞书,百度,有道等大厂软件;
2.window端:
2.1 部分语种:win11自带+字幕: LiveCaptions-Translator
2.2 浏览器:speech translator(在线,多语种)
2.3 语音转文字,无翻译,本地中英双语: CapsWriter-Offline:
CapsWriter (GitHub - HaujetZhao/CapsWriter-Offline: CapsWriter 的离线版,一个好用的 PC 端的语音输入工具)

3.ios:yplayer 69元
4.Mac: BeMyEars

4 个赞

受教了。看在哪个端使用,场景的话ios以沟通辅助为主,mac以会议辅助为主。

  • iOS的实时翻译我用量不大,没深入研究过,一般用自带的翻译,用起来还凑合。
  • mac端感觉whisperkeyboard这个软件有点意思,很有潜力,但实际运行起来还有待改进,留存备用吧。
    目前暂时用通义听悟。
1 个赞

科大讯飞吧

1 个赞

我之前大概比较过几个厂商的服务,阿里通义,字节飞书,感觉准确率差不多,主要我没法控制同一个音频做变量。
感觉实时的准确率比离线的还是差不少

两个不能同时开吗?

如果从开发的角度:

看你要多“实时”了,如果能接受秒级别的延迟大概 ASR->LLM 比较好的。

ASR 可以用 Azure 的实时 STT 服务,效果挺好的。也可以本地 faster-whisper + https://arxiv.org/pdf/2307.14743 ,我测过效果还可以的。

如果能进一步接受更大延迟可以考虑 VAD + gemini 2.0 flash 转录+翻译,比较省钱的同时应该效果也还行

在用科大讯飞和有道词典, 最主要是我没技术自己部署

唉 我全是安卓设备

可以试试这个方案

有道词典还挺准的

感谢佬友的建议 太详细了

(GitHub - H1DDENADM1N/CapsWriter-Offline: 离线语音输入简/繁体、中译英、字幕转录;在线多译多、云剪贴板等等 (选用SenseVoice模型 支持中粤英日韩多语种))
补一个多语种win10+版本

1 个赞

我试试这个