今天 OpenAI 4-0 发布了,今日不讲情怀…什么 AI 牛逼改变世界,我们就一起看看到底发布了个啥
发布总结(省流:
-
干死了至少有几十个 AI 厂商吧…比如搜索新贵, 什么老牌Gemini,Claude3
-
兄弟们给我哭,更好更快更牛逼的 GPT-4o 竟然给我免费了…我对不起我再也不敢对 Sam 大声说话了
-
OpenAI 不玩虚的,每次都有新东西。
真的好期待迫不及待的其他 AI 大厂要怎么硬对(我没打错别字…
来看看今天的 OpenAI干掉几个创业公司
1. GPT-4o 干翻 Google Gemini 1.5 Pro
Google:我不是创业公司啊喂
几个月前 Gemini 发布史上最牛逼的最长姿势对多的大模型,那时候以经验的视频剪辑技术,让我们感受一点与 AI 实时交互的牛逼的人工智能…
后面大家发现,原来牛逼的不是技术哈,牛逼的是 PS 能力。
OpenAI的 GPT-4o 发布后:
我们来看下 GPT-4o 有啥能力?
GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,这与人类在对话中的响应时间相似。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。
在 GPT-4o 之前,为了实现实现语音模式与 ChatGPT 对话,需要用到以下的三个模型:
步骤 1:一个简单模型将音频转录为文本。
步骤 2:GPT-3.5 或 GPT-4 接收文本并输出文本。
步骤 3:第三个简单模型将该文本转换回音频。
这串行的体验,意味着:
-
平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。
-
GPT3.5 或者 GPT4 失了大量信息——它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。
融合大模型将能直接与人类产生更简单,更直接的交互。
当然OpenAI自然打开是语音的输入与输出,实时检测(这个对于 Token 的消耗会更小)而真正的视频视频输入是需要额外按钮。 看这个视频就知道了,会有一个掩饰的发送的动作。
都是多模态,谷歌就能把产品设计的这么烂,以至于不得不用视频 PS。
OpenAI却是围绕着 Fast is all u need,让你感觉到更快,更自然,真正把基础痛点通杀满足了。
核心要点其实是:Fast is all u need,如果做不到快,不用视频剪辑,能看吗?
2. Perplexity AI
PerPlexity AI,作为搜索引擎 AI 的鼻祖,在 GPT的联网搜索面前其实是不够看的,毕竟付费用户,一开始就能联网搜索的,只是说效果有点糟糕,GPT 只要做点微微的调整,都是基于搜索引擎结果的,要啥好内容没有?
PerPlexity AI能起来,归根到底是免费的ChatGPT用户的不能使用联网搜索… 因此被撬动了一个地球。
3. Sider等第三方客户端与插件
大概是看到第三方的生产效率异军突起,比如 Sider,monica 等收割大量用户…
OpenAI 将 Touch 用户这个入口进一步提前,算是掀起了一场入口的新战争,国内只有智谱提供桌面版 APP,就此 OpenAI拉齐了生产效率的新战争开始了。。
然后可怜的 Sider 等第三方客户端,开始要退出历史舞台了…
微软的 Copilot…估计也悬了…
当然什么读PDF等有的没的各种简单的能力都已经集成好了。
4.一众翻译软件…
得益于新的实时模型,基本实现了,语音 → 文本 → 推理 → 语音输出。
自然交互状态下,能做到近似同声传译的水平,而一干翻译软件,无论基于 AI 与否,都基本要被干趴下了,还需要翻译吗?
答案:不需要…
5.无数的新模型厂商…
之前就有预测 GPT4 免费使用,那么这个大招来,所有的用户都可以有免费的 GPT4额度,是会员版 25%,也就是我只要有 4 个 OpenAI 账号(实际上我有好多好多个)就可以等于一个会员账号。
这使得所有的新 AI 入局者会非常难受,如何烧钱,如何烧出亮点,是横在所有新 AI 的入局者的灵魂拷问…
甚至狠狠的影响了当前的格局,要知道虽然 Gemini 多模态牛逼,但是没用起来啊,OpenAI 真的是用起来的…这一用起来之后就形成了新的标准了…新的格局。
看看支持那些功能:
我们的使命包括为尽可能多的人提供先进的人工智能工具。每周都有超过一亿人使用 ChatGPT。我们将在未来几周内开始向 ChatGPT 免费用户推出更多智能和高级工具。
使用 GPT-4o 时,ChatGPT 免费用户现在可以访问以下功能:
-
体验GPT-4级AI 能力
-
从模型和搜索引擎中获取回应(能联网)
-
分析数据并创建图表(高级数据分析)
-
聊聊你拍摄的照片(GPT-4V 的读图能力)
-
上传文件以帮助总结、写作或分析(文件读取能力)
-
发现并使用 GPTs…
Sam 从过去的一段时间就疯狂在暗示,创业不要围绕着ChatGPT的缺点疯狂开展,不然这头大象从头上过去,你就知道什么叫着飞来横祸了。
其他信息与细节吧
跑分重回第一宝座,嘿嘿嘿
注意细节: GPT-4o sets a new high-score of 88.7% on 0-shot COT MMLU (general knowledge questions).
吊打你们这些 5-shots的渣渣评分,段位碾压。
更便宜了
-
GPT-4o 速度提高 2 倍,价格降低一半。
-
速率限制提高 5 倍。
当然再便宜也是很贵,嘿嘿 XD,我相信很多人还是会选择使用 DeepSeek 了。
市场策略是不是要进入 2.0 阶段了? 大大方方的承认是 GPT 的平替,也不赖呀。
新的界面交互,更加好看
aaa
One More things:
!!!注意啊 GPT4 免费了!!
!!!注意啊 GPT4 免费了!!
!!!注意啊 GPT4 免费了!!
!!!注意啊 GPT4 免费了!!
!!!注意啊 GPT4 免费了!!
!!!注意啊 GPT4 免费了!!
总结:
OpenAI 每次都在突破 AI赛道的想象空间,不管是Sora 还是 GPT-4-omni 。 这背后就是 OpenAI 断层的能力领先。
OpenAI 的目标客户一直都不是只有企业用户,To C 客户群体仍然是 OpenAI 最重要的目标市场。 从这次免费的 GPT4-Omni 就看的出来,OpenAI 捍卫免费客户群体的心!
事实证明!如果你只是在 OpenAI 身上修修补补,并从这上面嫖到免费用户,那么他们就有决心把你的业务直接掀翻。
小弟不才公众号,欢迎扫码关注