O1 性能真的暴强了

概率问题 :bili_040:
我第一次问他也答对了

但我还是冷静下来 笑

到底谁把谁强暴了? :clown_face:

是有点牛的哇

刚才又重新问了好几个问题,包括之前答对的,开始胡言乱语了,画的图是对的,思路也类似,但是掺杂胡说八道 :sweat_smile:

立刻就清晰命了

有了思考链条确实强了不少,特别是一些数学问题,之前 GPT-4o 根本没法做的,到了 o1 之后稍微给点提示就能自主做出正确答案。

我测了两个24年文科高考题




9.11>9.8吗



image


加上提示词”核对每一个步骤再回答“就能回答对了,狗屎openai貌似根据你问题的难易程度来调用资源,太简单了反而错误率高。

1 个赞