满血o1(包括o1-pro)数学能力并无显著增长

如题,o1-mini有概率做对的问题o1第一次就回答错误(题目是我随手出的:xy'''=y''y+y'y'; y(0)=-1)
正解为y(x)=(3Cx-1)/(1-Cx)(C为常数)

感觉o1真正的差别还是支持多模态了(upd-12-7: 貌似多模态本身能力也不比4o强)

o1-pro回答也不完整:

107 Likes

OAI营销效果大于实际能力

4 Likes

oai还我o1-preview

2 Likes

不太行啊。。

同感,现在不信不看任何评测和软文

是的,我这边也是一样的感觉,很多o1-mini能做对的数学题,o1完全体反而做不对

还真是,昨晚我还专门用数学竞赛题将poe积分刷完对比了一下o1p、o1m和deepseek,今天发现o1几道题结果对过程错

数据结构的内容都够它喝一壶了,前两天复习借o1帮忙,但是还是会出问题

感觉还是o1mini好

事实证明o1-pro也做不对 :rofl: