含泪继续免费使用 Gemini,Google 已经开始半夜改 PPT 了

今天 OpenAI 4-0 发布了,今日不讲情怀​…什么 AI 牛逼改变世界,我们就一起看看到底发布了个啥​

发布总结(省流:

  • 干死了至少有几十个 AI 厂商吧…比如搜索新贵, 什么老牌Gemini,Claude3

  • 兄弟们给我哭,更好更快更牛逼的 GPT-4o 竟然给我免费了…我对不起我再也不敢对 Sam 大声说话了

  • OpenAI 不玩虚的,每次都有新东西。

真的好期待迫不及待的其他 AI 大厂要怎么硬对(我没打错别字…

来看看今天的 OpenAI干掉几个创业公司

1. GPT-4o 干翻 Google Gemini 1.5 Pro

Google:我不是创业公司啊喂

几个月前 Gemini 发布史上最牛逼的最长姿势对多的大模型,那时候以经验的视频剪辑技术,让我们感受一点与 AI 实时交互的牛逼的人工智能…

后面大家发现,原来牛逼的不是技术哈,牛逼的是 PS 能力。

OpenAI的 GPT-4o 发布后:

我们来看下 GPT-4o 有啥能力?

GPT-4o(“o”代表“o​​mni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,这与人类在对话中的响应时间相似。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

在 GPT-4o 之前,为了实现实现语音模式与 ChatGPT 对话,需要用到以下的三个模型:

步骤 1:一个简单模型将音频转录为文本。

步骤 2:GPT-3.5 或 GPT-4 接收文本并输出文本。

步骤 3:第三个简单模型将该文本转换回音频。

这串行的体验,意味着:

  • 平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。

  • GPT3.5 或者 GPT4 失了大量信息——它无法直接观察音调、多个说话者或背景噪音,也无法输出笑声、歌唱或表达情感。

融合大模型将能直接与人类产生更简单,更直接的交互。
当然OpenAI自然打开是语音的输入与输出,实时检测(这个对于 Token 的消耗会更小)而真正的视频视频输入是需要额外按钮。 看这个视频就知道了,会有一个掩饰的发送的动作。

都是多模态,谷歌就能把产品设计的这么烂,以至于不得不用视频 PS。

OpenAI却是围绕着 Fast is all u need,让你感觉到更快,更自然,真正把基础痛点通杀满足了。

核心要点其实是:Fast is all u need,如果做不到快,不用视频剪辑,能看吗?

2. Perplexity AI

PerPlexity AI,作为搜索引擎 AI 的鼻祖,在 GPT的联网搜索面前其实是不够看的,毕竟付费用户,一开始就能联网搜索的,只是说效果有点糟糕,GPT 只要做点微微的调整,都是基于搜索引擎结果的,要啥好内容没有?

PerPlexity AI能起来,归根到底是免费的ChatGPT用户的不能使用联网搜索… 因此被撬动了一个地球。

3. Sider等第三方客户端与插件

大概是看到第三方的生产效率异军突起,比如 Sider,monica 等收割大量用户…

OpenAI 将 Touch 用户这个入口进一步提前,算是掀起了一场入口的新战争,国内只有智谱提供桌面版 APP,就此 OpenAI拉齐了生产效率的新战争开始了。。

然后可怜的 Sider 等第三方客户端,开始要退出历史舞台了…

微软的 Copilot…估计也悬了…

当然什么读PDF等有的没的各种简单的能力都已经集成好了。

4.一众翻译软件…

得益于新的实时模型,基本实现了,语音 → 文本 → 推理 → 语音输出。

自然交互状态下,能做到近似同声传译的水平,而一干翻译软件,无论基于 AI 与否,都基本要被干趴下了,还需要翻译吗?

答案:不需要…

5.无数的新模型厂商…

之前就有预测 GPT4 免费使用,那么这个大招来,所有的用户都可以有免费的 GPT4额度,是会员版 25%,也就是我只要有 4 个 OpenAI 账号(实际上我有好多好多个)就可以等于一个会员账号。

这使得所有的新 AI 入局者会非常难受,如何烧钱,如何烧出亮点,是横在所有新 AI 的入局者的灵魂拷问…

甚至狠狠的影响了当前的格局,要知道虽然 Gemini 多模态牛逼,但是没用起来啊,OpenAI 真的是用起来的…这一用起来之后就形成了新的标准了…新的格局。

看看支持那些功能:

我们的使命包括为尽可能多的人提供先进的人工智能工具。每周都有超过一亿人使用 ChatGPT。我们将在未来几周内开始向 ChatGPT 免费用户推出更多智能和高级工具。

使用 GPT-4o 时,ChatGPT 免费用户现在可以访问以下功能:

  • 体验GPT-4级AI 能力

  • 从模型和搜索引擎中获取回应(能联网)

  • 分析数据并创建图表(高级数据分析)

  • 聊聊你拍摄的照片(GPT-4V 的读图能力)

  • 上传文件以帮助总结、写作或分析(文件读取能力)

  • 发现并使用 GPTs…

Sam 从过去的一段时间就疯狂在暗示,创业不要围绕着ChatGPT的缺点疯狂开展,不然这头大象从头上过去,你就知道什么叫着飞来横祸了。

其他信息与细节吧

跑分重回第一宝座,嘿嘿嘿

注意细节: GPT-4o sets a new high-score of 88.7% on 0-shot COT MMLU (general knowledge questions).

吊打你们这些 5-shots的渣渣评分,段位碾压。

更便宜了

  • GPT-4o 速度提高 2 倍,价格降低一半。

  • 速率限制提高 5 倍。

当然再便宜也是很贵,嘿嘿 XD,我相信很多人还是会选择使用 DeepSeek 了。

市场策略是不是要进入 2.0 阶段了? 大大方方的承认是 GPT 的平替,也不赖呀。

新的界面交互,更加好看

aaa

One More things:

!!!注意啊 GPT4 免费了!!

!!!注意啊 GPT4 免费了!!

!!!注意啊 GPT4 免费了!!

!!!注意啊 GPT4 免费了!!

!!!注意啊 GPT4 免费了!!

!!!注意啊 GPT4 免费了!!

总结:

OpenAI 每次都在突破 AI赛道的想象空间,不管是Sora 还是 GPT-4-omni 。 这背后就是 OpenAI 断层的能力领先。

OpenAI 的目标客户一直都不是只有企业用户,To C 客户群体仍然是 OpenAI 最重要的目标市场。 从这次免费的 GPT4-Omni 就看的出来,OpenAI 捍卫免费客户群体的心!

事实证明!如果你只是在 OpenAI 身上修修补补,并从这上面嫖到免费用户,那么他们就有决心把你的业务直接掀翻。

:smiling_face_with_three_hearts: 小弟不才公众号,欢迎扫码关注

37 个赞

哈哈

1 个赞

看完真不容易,估计你写的也不太容易

点个赞吧

3 个赞

上压力

1 个赞

ai这个领域,领先一步就步步领先。这才是真正的遥遥领先!

1 个赞

谷歌要哭了,刚刚收费,openai就免费4o

3 个赞

哭晕在厕所~~~

2 个赞

领先一步 ,就是步步领先 这个就是 遥遥领先

2 个赞

AI领域看来真的是赢家通吃,就这还没发布GPT5呢

2 个赞

AI这东西本就是open了才有价值和市场,如果只是局限在企业端或特定群体,其实说白了,也就跟被逐渐替代的C端产品一样,到一定程度,总会被灭掉。
希望openai初创时的open不再是close

1 个赞

有理

2 个赞

谷歌拍案而起,这年轻人不讲武德啊

2 个赞

有理

2 个赞

写的很好,学习了

1 个赞

2 个赞

这个渐变字体很nice

1 个赞

好有趣的贴纸,配图好玩

1 个赞

配图专门做的,搞了好久,嘿嘿

2 个赞

写的不错

1 个赞

写的很详细

1 个赞