o1-preview不是o1,被OpenAI骗麻了

起因是看到大伙都在测试9.8和9.11的问题,但是o1-preview居然答不出来,实在有点离谱。

然后,就看到了这个:


o1-preview和o1完全是两个东西,而在数学能力上,o1-preview不仅比o1差得远,甚至远远不如o1-mini!
于是我用o1-mini重测了一遍这个问题:

这下对了
看名字和条数限制,本来还以为o1-preview全面强于o1-mini。结果o1-preview只是个o1的阉割版,甚至有的情况下还打不过o1-mini。被OpenAI骗麻了呀:sob:

8 个赞

不好玩 :tieba_087: :tieba_087: :tieba_087:

preview还是弱了

官方文档好像说了,preview 擅长跨领域问题回答,mini 则擅长数理内容。

4 个赞

看这个官图,o1-preview数学能力反而是不如o1-mini的 :rofl:

啊哈
凑四个字

啊?一直以为o1-preview比o1-mini要厉害的,结果我也被骗了

1 个赞