本文原创,纯手写,首发于L站,欢迎转载,转载请标明作者和链接
如有错误请指正
o3-mini-high vs o1
o3-mini-high性能与o1相当,编程和指令遵循更强,语言和数学更弱
免费用户不能使用o3-mini-high,与o1相同
$20的Plus用户o3-mini-high每周限50条,与o1限量相同
$200的Pro用户o3-mini-high不限量,与o1相同
o3-mini-high貌似暂时没有单独的API,o1虽然有API但以前限制用户必须是Tier5,实际上很少有人能达到。今天貌似降到tier3
o3-mini API有个参数,可以自己指定reasoning effort=high,medium(默认),low
o3-mini-high速度不确定是否比o1快,但确定比o3-mini慢很多
o3-mini-high支持联网,不支持图片和pdf等。o1不支持联网,支持图片,不支持pdf
o3-mini和high上下文200k,最大输出100k(含推理token),与o1相同,比o1-mini的128k/64k多
佬友jerryust说支持function calling,对开发者很有用,o1和o1-mini不支持
结论:o3-mini-high基本上是o1的低成本平替,主要区别就是支持了联网,但又不支持图片,会员的开销没有任何变化,但是OpenAI的成本更低了,利润更高了
o3-mini-high vs r1
应该类似o1 vs r1,性能相近
o3-mini-high的$20会员就是个试用性质,根本不够用,收费$200才不限量
结论:相比于r1的免费+不限量+API开放用,o3-mini-high性能相当+高价+限量+不支持文档+API限等级,根本没有竞争力
o3-mini vs o1-mini
o3-mini-low性能强于o1-mini
o3-mini的API价格输入$1.1,输出$4.4,o1-mini输入$3,输出$12,降价约2/3,这么大幅的降价,很可能是为了应对Deepseek的压力
o3-mini的API在官网已经上线,官网声称需要Tier3以上,但有的佬友测试要Tier4才能实用,不愧为
OpenRouter也上线了,也需要填自己的API Key,否则无法用
o3-mini支持联网,o1-mini不支持
o3-mini在$20会员限每天150次,o1-mini限50次,提升3倍
免费会员可以用o3-mini,支持联网,佬友说每五小时10次,参考4o也才给每三小时10次。免费会员不能用o1-mini。
对免费会员开放o3-mini,是在Deepseek在美区Appstore登顶第二天Sam公布的,显然是为了应对r1的压力
o3-mini vs r1
LiveBench上,o3-mini-low性能弱于flash-thinking-0121
o3-mini-mediu在LiveBench还没看到,应该明显弱于r1
r1的Chat版是免费不限量的,o3-mini的Chat版免费会员可用,但严重限量,就是个体验版
o3-mini的API价格输入$1.1,输出$4.4,r1是0.55和$2.19,o3-mini刚好是r1的2倍,哪有这么巧合的,说OpenAI不慌,鬼都不信
r1命中缓存价格是1/4价格,o3-mini命中缓存是1/2
o3-mini代表OpenAI发布会中的o3-mini-low还是o3-mini-medium?
暂不确定,LiveBench中只有o3-mini-high和low并没有出现medium
API默认是Medium,但不代表Chat版默认也是medium,等待后续有人实测吧
还有一种可能(无依据),Chat版o3-mini用low还是medium,取决于①服务器压力,②你是免费还是付费用户,③你是不是中国人,中国人就给你降智
总的结论
GPT免费会员:o1-mini部分代替4o,仍然高度限量,只是体验版
GPT$20会员:o3-mini代替了o1-mini
GPT$200会员:o3-mini-high部分代替了o1
o3-mini并未改变openai三层会员结构的盈利模式,换汤不换药,并不会对r1的"顶级推理+免费"的竞争战略,形成实质威胁
OpenAI真是不见棺材不落泪,被deepseek抢了海量用户,还在修修补补,小打小闹,资本始终无法放弃既得利益,无法抗拒金钱的诱惑
未来展望,o3 vs r2
r1刚面市,r2显然不会马上面市,估计也要小几个月时间才能面市,但是deepseek的进化速度,显然比其他公司快很多
现在o3-mini-high,性能上也没明显超过r1。deepseek真正的对手是o3,o3也不会马上面市,deepseek还有段时间抢市场
在r2出来之前,理论上Deepseek也完全可以学OpenAI,搞个延长推理时间的r1-high,这样的1.5代产品出来,这应该不是一个技术问题,而是一个推理成本和市场策略问题,毕竟r1是免费的,增加成本只能Deepseek自己买单
参考资料
https://livebench.ai/
https://openai.com/index/openai-o3-mini/
https://platform.openai.com/docs/guides/reasonin