起因是看到大伙都在测试9.8和9.11的问题,但是o1-preview居然答不出来,实在有点离谱。
然后,就看到了这个:
o1-preview和o1完全是两个东西,而在数学能力上,o1-preview不仅比o1差得远,甚至远远不如o1-mini!
于是我用o1-mini重测了一遍这个问题:
这下对了
看名字和条数限制,本来还以为o1-preview全面强于o1-mini。结果o1-preview只是个o1的阉割版,甚至有的情况下还打不过o1-mini。被OpenAI骗麻了呀
起因是看到大伙都在测试9.8和9.11的问题,但是o1-preview居然答不出来,实在有点离谱。
然后,就看到了这个:
不好玩
preview还是弱了
看这个官图,o1-preview数学能力反而是不如o1-mini的
啊哈
凑四个字
啊?一直以为o1-preview比o1-mini要厉害的,结果我也被骗了