OpenAI 发布的 4o mini,正式跌落神坛,加入一元俱乐部

你不愿意当帕鲁,有的是AI愿意当帕鲁。 - Sanlang

towards intelligence too cheap to meter

一觉醒来,感觉奥特曼的怒气都在写屏幕上,AI 解释了以下,“intelligence” 是核心主题 “too cheap to meter” 是一个常用表达,意味着某物如此廉价以至于不值得计量,使用"intelligence"和"too cheap"这样的词组合,可能带有一定的讽刺意味,暗示智能的贬值。

我想奥特曼是有点难受把?对,这就是傲慢的代价,唠叨结束,看看具体情况:

整体来看,主要卖点有如下几个:

GPT-4o mini

  1. GPT-4o mini 的优势:
  • 价格比以往的前沿模型便宜了一个数量级,比 GPT-3.5 Turbo 便宜了 60% 以上。
  • 在 MMLU 上的得分高达 82%,目前在 LMSYS 排行榜上的聊天偏好方面超过了 GPT-4。
  • 支持文本和视觉,未来还将支持文本、图像、视频和音频输入和输出。
  • 具有 128K 标记的上下文窗口,每个请求最多支持 16K 输出标记,知识期限到 2023 年 10 月。
  • 以其低成本和低延迟实现了广泛的任务,如连锁或并行多个模型调用、向模型传递大量上下文或通过快速、实时文本响应与客户交互。
  1. GPT-4o mini 的性能:

  • 在涉及文本和视觉的推理任务方面优于其他小型模型,在 MMLU 上的得分率为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
  • 在数学推理和编码任务中表现出色,在 MGSM 和 HumanEval 中得分分别为 87.0% 和 87.2%,优于市场上以前的小型机型。
  • 在 MMMU 多模态推理评估中也表现出色,得分率为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。
    1. GPT-4o mini 定价:
  • 现已作为文本和视觉模型提供给 Assistants API、Chat Completions API 和 Batch API。
  • 开发人员需为每 100 万个Token支付 15 美分,每 100 万个输出TOken支付 60 美分。
  • ChatGPT 的免费、Plus 和 Team 用户从今天开始将能访问 GPT-4o mini,以取代 GPT-3.5。企业用户也将从下周开始访问。

看起来很强,但是你也不知道强在哪里

江湖格局一览

性价比图(横轴费用、纵轴跑分):

跑分图:

实际体验下:

虽然鲁迅不打架了。

但是 月夜忆舍弟仍然霸榜。

ChatGPT 也不能上传文件,也不能读图片,笑死,系统提示语则直接阉割了一下

Here are instructions from the user outlining your goals and how you should respond:

You are ChatGPT, a large language model trained by OpenAI.
Knowledge cutoff: 2023-10
Current date: 2024-07-19

Personality: v2

# Tools

## bio

The `bio` tool allows you to persist information across conversations. Address your message `to=bio` and write whatever information you want to remember. The information will appear in the model set context below in future conversations.

傲慢会杀死OpenAI

我想过去的 180 天,OpenAI 并没有深刻地认识到,他构建的 AI 领先优势已被自己的傲慢撕的稀碎。

曾经他有一张王牌,那么就是表现领先一整年的 GPT4,以及一票愿意付费的 OpenAI 粉,

OpenAI的护城河除了领先的产品以外,还有海量的免费用户,而过傲慢的 OpenAI,把这些用户推向了其他 AI供应商。

如果你从 OpenAI 的收入推算来看.

OpenAI 目前的盈利在 Enterprise 中并没有打开局面,仍然依靠海量的付费用户收入占比全部收入 75%,而这背后就是海量的免费用户了。免费课程吸引私域流量的开口,付费的服务接踵而至,不断在免费用户提纯用户才是王道。

而过去的 180 天,除了免注册使用 GPT 3.5,就仅仅在上个月才给了3 个小时也不知道几次的廉价阉割版 GPT4o,用户早跑了,过去的 180 天,我打开 OpenAI 的次数屈指可数,他的唯一作用变成了,对比下 4o 的效果。

所以说 4o-min 能拯救这个局面吗? 那就看OpenAI 为了用户活跃愿不愿加入到真正的加入这场战局了,目前来看哈,:wave:

今日对我爱理不理,明日我让你高攀不起

首发:FishAI公众号 二次编辑 Linux.do,欢迎大家搜索关注。

23 Likes


裂了一个图

3 Likes

:tieba_006: :tieba_006: :tieba_006: :tieba_006: :tieba_006:

2 Likes

用梯子追着订阅&购买API,结果被封号无退款的恶心感谁懂。 :smiling_imp:

7 Likes

低价区卷的也很厉害啊 :rofl:

这跟4o有什么区别呢,都是阉割版的 :rofl:

最后都吐槽, 说挣得少了, 大头都给老黄, 还有电力公司了

1 Like

楼主,那横轴纵轴跑分图哪里可以看?
最后的评价性表述表示认同,由于不知道什么时候突然会降智,我也经常把gpt4o当成一个效果的兜底比较,而未必是主力使用模型了。

刚刚测试了一下,生成速度更快了,不知道它的限制是多少,gpt4o和4o-mini限制一样吗

其实大模型 API 和服务都应该倒付用户钱的,毕竟拿用户数据做训练了

3 Likes


gpt4的太长不看版

1 Like

傻得多,mini

看到电力公司笑了,风扇呼呼地吹是吧 :rofl:

跟老黄学的刀法,先做一个4o,再砍出一个4o-mini,再给手机端上砍出个4o-dumb

链接在这里:
https://langgptai.feishu.cn/wiki/HteYwsIMpimxO8kFqJ8cylqEnoe?table=tbl2mBh6CE5ezghR&view=vewbhF3k1V

2 Likes

好奇这玩意儿的知识库到底被压缩了多少。:joy:

3 Likes

哈哈哈,ChatGPT-4o-tiny

还是得有基础的免费服务

:rage:首先是犯下了傲慢之罪的openai,其次是犯下贪婪之罪的奥特曼

我懂,用了3天