OpenAI将发布三个语音模型API

据OpenAI最新推特和油管直播预告,ChatGPT中的语音模式将支持API调用:

  • gpt-4o-mini-tts
  • gpt-4o-transcribe
  • gpt-4o-mini-transcribe

目前尚不确定,ChatGPT原生用的是哪一个。这是首个支持对话VoiceEngine的大模型API吗?

直播北京时间今天1点马上开始
直播指路

9 个赞

有人说官方最近发的一个神秘图片就是预示语音功能全面增强
不知道这算不算一个证据

1 个赞

官方发布了在线体验网站
指路
试了下,支持中文,支持通过命令改变情绪音色等
直播提了下价格好像是一美分一分钟,看起来不怎么贵

感觉现有的这些,已经可以完美上岗替代现有的机器人电话了,官方demo我试了一下一些场景,基本的交流能力很强,不了解这方面的人很难辨别

2 个赞

豆包如果能上线这个api的话,比gpt强很多很多很多。

是不是gpt高级语言要增强了?

以后可以玩色情的语言角色扮演了,哈哈哈

openai语音不会搞降智吧