【原创】深度分析Deepseek R1 vs O3-mini vs O3-mini-high vs O1竞争态势

本文原创,纯手写,首发于L站,欢迎转载,转载请标明作者和链接

如有错误请指正

o3-mini-high vs o1
o3-mini-high性能与o1相当,编程和指令遵循更强,语言和数学更弱
免费用户不能使用o3-mini-high,与o1相同
$20的Plus用户o3-mini-high每周限50条,与o1限量相同
$200的Pro用户o3-mini-high不限量,与o1相同
o3-mini-high貌似暂时没有单独的API,o1虽然有API但以前限制用户必须是Tier5,实际上很少有人能达到。今天貌似降到tier3
o3-mini API有个参数,可以自己指定reasoning effort=high,medium(默认),low
o3-mini-high速度不确定是否比o1快,但确定比o3-mini慢很多
o3-mini-high支持联网,不支持图片和pdf等。o1不支持联网,支持图片,不支持pdf
o3-mini和high上下文200k,最大输出100k(含推理token),与o1相同,比o1-mini的128k/64k多
佬友jerryust说支持function calling,对开发者很有用,o1和o1-mini不支持

结论:o3-mini-high基本上是o1的低成本平替,主要区别就是支持了联网,但又不支持图片,会员的开销没有任何变化,但是OpenAI的成本更低了,利润更高了

o3-mini-high vs r1
应该类似o1 vs r1,性能相近
o3-mini-high的$20会员就是个试用性质,根本不够用,收费$200才不限量

结论:相比于r1的免费+不限量+API开放用,o3-mini-high性能相当+高价+限量+不支持文档+API限等级,根本没有竞争力

o3-mini vs o1-mini
o3-mini-low性能强于o1-mini
o3-mini的API价格输入$1.1,输出$4.4,o1-mini输入$3,输出$12,降价约2/3,这么大幅的降价,很可能是为了应对Deepseek的压力
o3-mini的API在官网已经上线,官网声称需要Tier3以上,但有的佬友测试要Tier4才能实用,不愧为
OpenRouter也上线了,也需要填自己的API Key,否则无法用
o3-mini支持联网,o1-mini不支持
o3-mini在$20会员限每天150次,o1-mini限50次,提升3倍
免费会员可以用o3-mini,支持联网,佬友说每五小时10次,参考4o也才给每三小时10次。免费会员不能用o1-mini。
对免费会员开放o3-mini,是在Deepseek在美区Appstore登顶第二天Sam公布的,显然是为了应对r1的压力

o3-mini vs r1
LiveBench上,o3-mini-low性能弱于flash-thinking-0121
o3-mini-mediu在LiveBench还没看到,应该明显弱于r1
r1的Chat版是免费不限量的,o3-mini的Chat版免费会员可用,但严重限量,就是个体验版
o3-mini的API价格输入$1.1,输出$4.4,r1是0.55和$2.19,o3-mini刚好是r1的2倍,哪有这么巧合的,说OpenAI不慌,鬼都不信
r1命中缓存价格是1/4价格,o3-mini命中缓存是1/2

o3-mini代表OpenAI发布会中的o3-mini-low还是o3-mini-medium?
暂不确定,LiveBench中只有o3-mini-high和low并没有出现medium
API默认是Medium,但不代表Chat版默认也是medium,等待后续有人实测吧
还有一种可能(无依据),Chat版o3-mini用low还是medium,取决于①服务器压力,②你是免费还是付费用户,③你是不是中国人,中国人就给你降智

总的结论
GPT免费会员:o1-mini部分代替4o,仍然高度限量,只是体验版
GPT$20会员:o3-mini代替了o1-mini
GPT$200会员:o3-mini-high部分代替了o1
o3-mini并未改变openai三层会员结构的盈利模式,换汤不换药,并不会对r1的"顶级推理+免费"的竞争战略,形成实质威胁
OpenAI真是不见棺材不落泪,被deepseek抢了海量用户,还在修修补补,小打小闹,资本始终无法放弃既得利益,无法抗拒金钱的诱惑

未来展望,o3 vs r2
r1刚面市,r2显然不会马上面市,估计也要小几个月时间才能面市,但是deepseek的进化速度,显然比其他公司快很多

现在o3-mini-high,性能上也没明显超过r1。deepseek真正的对手是o3,o3也不会马上面市,deepseek还有段时间抢市场

在r2出来之前,理论上Deepseek也完全可以学OpenAI,搞个延长推理时间的r1-high,这样的1.5代产品出来,这应该不是一个技术问题,而是一个推理成本和市场策略问题,毕竟r1是免费的,增加成本只能Deepseek自己买单

参考资料
https://livebench.ai/
https://openai.com/index/openai-o3-mini/
https://platform.openai.com/docs/guides/reasonin

14 个赞

那o3-mini和R1孰强孰弱? :bili_062:

又赢麻了zszs

1 个赞

O3-mini API 参数 reasoning effort high =o3 mini high?

4 个赞

随便你怎么说吧,o1系列的api作为穷鬼的我已经是没法随意挥霍了,谁用谁知道,在r1的价格面前,一切都是浮云,除非你有远超r1的性能,比如未来的o3?没有不好的产品只有不好的价格

4 个赞

呵呵,真远不如r1,倒不是说性能比r1差,但是openai降智的体验能把模型拉到跟三流模型一样的体验。现在r1能够直接使用的渠道满天飞呢。

5 个赞

应该是这样没错,low/medium/high是根据你需要多长的推理过程决定的

是这个理

目前来说r1速度太慢了,o3-mini速度可观

几个地方不对:
根据OpenAI最新官网,o1和o3-mini都是tier3起步就可以用了,目前o1已经对一部分tier3用户开放了。
o3-mini有low,medium,high三种effort参数。
o3-mini真正好的是支持function calling了。这个对开发者很有用的。这是第一个支持function calling的推理模型。

1 个赞

deepseek冲冲冲!冲爆openai

佬友有没有r1免费渠道推荐一下,官网似乎还没回复稳定。。。。。

這人真不是DeepSeek派來的營銷嗎?12/26註冊,發的全是DeepSeek的文章 :thinking:

2 个赞

硅基,Nebius(OpenRouter或官网)

佬写得真好,请问可以转载到别的论坛吗,会标明原作者和地址的 :bili_110:

欢迎转载:blush:

分析非常全面,感谢:pray:

硅基也有了!!!!

怀疑o3-mini-high就是原本的o3,看这样子o3-mini-high就是占据原来的o1的位置,然后closeai看效果没有非常领先,就把o3的饼先画着

3 个赞

思考模型卷起来啊,什么时候降低到1元百万token我就日用 :lark_012:
还有,openai的那个100k输出我感觉国产厂商还要努力