如题,o1-mini有概率做对的问题o1第一次就回答错误(题目是我随手出的:xy'''=y''y+y'y'; y(0)=-1)
正解为y(x)=(3Cx-1)/(1-Cx)(C为常数)
感觉o1真正的差别还是支持多模态了(upd-12-7: 貌似多模态本身能力也不比4o强)
o1-pro回答也不完整:
如题,o1-mini有概率做对的问题o1第一次就回答错误(题目是我随手出的:xy'''=y''y+y'y'; y(0)=-1)
正解为y(x)=(3Cx-1)/(1-Cx)(C为常数)
感觉o1真正的差别还是支持多模态了(upd-12-7: 貌似多模态本身能力也不比4o强)
o1-pro回答也不完整:
OAI营销效果大于实际能力
oai还我o1-preview
不太行啊。。
同感,现在不信不看任何评测和软文
是的,我这边也是一样的感觉,很多o1-mini能做对的数学题,o1完全体反而做不对
还真是,昨晚我还专门用数学竞赛题将poe积分刷完对比了一下o1p、o1m和deepseek,今天发现o1几道题结果对过程错
数据结构的内容都够它喝一壶了,前两天复习借o1帮忙,但是还是会出问题
感觉还是o1mini好
事实证明o1-pro也做不对