o3-mini-high 真的比 o1 强吗

对于 o1 和 o3-mini ,openrouter 之前按照 openai 的要求,是要用自己的 tier-3 tier-4 的 key 的,但是个人用户没那么多钱,很难受

前几天终于开放了,迫不及待地使用了一下,按照 openai 自己的 benchmark ,o3-mini 把 reasoning_effort 开到 high 是比 o1 性能好的

但是我自己试用了自己平时遇到的几个问题,o1 大部分场景下都优于 o3-mini-high ,大家的体验如何?

47 Likes

价格说明很多

40 Likes

o1 强, o3 -mini 能联网

34 Likes

主要是便宜吧

1 Like

high和o1差不多吧?

1 Like

同样有这个疑问,感觉 o3-mini-high 在很多场景下还不如 gpt-4o 或 claude-3-5-sonnet

请问 o3-mini-high 和 o3-mini 区别在哪里?没看到官方的详细解释。

(一直记不住 gpt-4o、4o-mini、o1-mini、o3-mini、o1这些有啥区别,官网看感觉越来越多,越来越混乱,有没有佬友能一阵见血的解释一下。。)

o3-mini-high 就是推理强度为高的 o3-mini
推理强度分低中高,对应网页版的low,m,high。

我是一直都觉得o1 更强,o1 模型大,知识库比较大,o3 只是纯推理能力强。不能看 benchmark,最强的还是之前o1-preview,那个分都是通过强化学习刷上去的

2 Likes

同样的文档,o1对文档的理解能力不如o3mini high,体验两天下来得出的结论

啊?放开了么?你是说的网页版还是 API?
我是 T4,但是依然没法使用 API 呀。。。

o3-mini 纯一坨,用起来效果是真不如claude。

佬佬 想要deep research​:sob:

基准模型就是:gpt-4o → o1 → o3

对于每个基准模型,都有 mini 版本,gpt-4o-mini,o1-mini,o3-mini

o3-mini 有一个新参数 reasoning_effort,可选 low medium high,越高 cot 强度越大,性能也越好,大家一般把这个参数的选择加到 o3-mini 后面,变成 o3-mini-high,但这个不是标准的模型类型

tier-4 都能用 openai 的官方 api 了吧?至少文档上是这么说的

放开是 openrouter 这个第三方转发站放开限制了,他们之前因为 openai 的政策要求,要提供足够 tier 的自己的 key,不然没法用 o1 和 o3,现在放开了,openai 官方一直没放开,还有 tier-3 tier-4 的限制吧?

牛呀 太透彻了 佬。
(但是gpt-4o比o1要好吗?为啥感觉o1最近风声比较大?)

可能我没表达清楚,上面的 → 的意思是推出时间,不是性能排序,先有 gpt-4o,然后是 o1,然后是 o3( o3 还没开放访问,目前只有 o3-mini),o1 的性能肯定比 gpt-4o 强的,就是有点贵

感谢,所以理论上还是应该后出的强一些吧。
比如官方建议o3-mini替代o1-mini,如果o3出了应该会比o1再强一些吧。

1 Like

文档上说是 select developers in API T3~T5
https://openai.com/index/openai-o3-mini/
我自己的 LobeChat 配置上后还是没法请求 o3 :unamused:

看了眼,的确 OpenRouter 上放开了。。。赞