你不愿意当帕鲁,有的是AI愿意当帕鲁。 - Sanlang
towards intelligence too cheap to meter
一觉醒来,感觉奥特曼的怒气都在写屏幕上,AI 解释了以下,“intelligence” 是核心主题 “too cheap to meter” 是一个常用表达,意味着某物如此廉价以至于不值得计量,使用"intelligence"和"too cheap"这样的词组合,可能带有一定的讽刺意味,暗示智能的贬值。
我想奥特曼是有点难受把?对,这就是傲慢的代价,唠叨结束,看看具体情况:
整体来看,主要卖点有如下几个:
GPT-4o mini
- GPT-4o mini 的优势:
- 价格比以往的前沿模型便宜了一个数量级,比 GPT-3.5 Turbo 便宜了 60% 以上。
- 在 MMLU 上的得分高达 82%,目前在 LMSYS 排行榜上的聊天偏好方面超过了 GPT-4。
- 支持文本和视觉,未来还将支持文本、图像、视频和音频输入和输出。
- 具有 128K 标记的上下文窗口,每个请求最多支持 16K 输出标记,知识期限到 2023 年 10 月。
- 以其低成本和低延迟实现了广泛的任务,如连锁或并行多个模型调用、向模型传递大量上下文或通过快速、实时文本响应与客户交互。
- GPT-4o mini 的性能:
- 在涉及文本和视觉的推理任务方面优于其他小型模型,在 MMLU 上的得分率为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
- 在数学推理和编码任务中表现出色,在 MGSM 和 HumanEval 中得分分别为 87.0% 和 87.2%,优于市场上以前的小型机型。
- 在 MMMU 多模态推理评估中也表现出色,得分率为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。
-
- GPT-4o mini 定价:
- 现已作为文本和视觉模型提供给 Assistants API、Chat Completions API 和 Batch API。
- 开发人员需为每 100 万个Token支付 15 美分,每 100 万个输出TOken支付 60 美分。
- ChatGPT 的免费、Plus 和 Team 用户从今天开始将能访问 GPT-4o mini,以取代 GPT-3.5。企业用户也将从下周开始访问。
看起来很强,但是你也不知道强在哪里
江湖格局一览
性价比图(横轴费用、纵轴跑分):
跑分图:
实际体验下:
虽然鲁迅不打架了。
但是 月夜忆舍弟仍然霸榜。
ChatGPT 也不能上传文件,也不能读图片,笑死,系统提示语则直接阉割了一下
Here are instructions from the user outlining your goals and how you should respond:
You are ChatGPT, a large language model trained by OpenAI.
Knowledge cutoff: 2023-10
Current date: 2024-07-19
Personality: v2
# Tools
## bio
The `bio` tool allows you to persist information across conversations. Address your message `to=bio` and write whatever information you want to remember. The information will appear in the model set context below in future conversations.
傲慢会杀死OpenAI
我想过去的 180 天,OpenAI 并没有深刻地认识到,他构建的 AI 领先优势已被自己的傲慢撕的稀碎。
曾经他有一张王牌,那么就是表现领先一整年的 GPT4,以及一票愿意付费的 OpenAI 粉,
OpenAI的护城河除了领先的产品以外,还有海量的免费用户,而过傲慢的 OpenAI,把这些用户推向了其他 AI供应商。
如果你从 OpenAI 的收入推算来看.
OpenAI 目前的盈利在 Enterprise 中并没有打开局面,仍然依靠海量的付费用户收入占比全部收入 75%,而这背后就是海量的免费用户了。免费课程吸引私域流量的开口,付费的服务接踵而至,不断在免费用户提纯用户才是王道。
而过去的 180 天,除了免注册使用 GPT 3.5,就仅仅在上个月才给了3 个小时也不知道几次的廉价阉割版 GPT4o,用户早跑了,过去的 180 天,我打开 OpenAI 的次数屈指可数,他的唯一作用变成了,对比下 4o 的效果。
所以说 4o-min 能拯救这个局面吗? 那就看OpenAI 为了用户活跃愿不愿加入到真正的加入这场战局了,目前来看哈,
今日对我爱理不理,明日我让你高攀不起
首发:FishAI公众号 二次编辑 Linux.do,欢迎大家搜索关注。