【持续测试】Microsoft Copilot Think Deeper 逻辑能力怎么样?

15 Likes


错误

1 Like

辣,我让他写个deno还不如 gemini 2.0

1 Like

思考过程不能看就很难受,思考时间也不显示


这个模型就是一个废物,o1 mini都不如

5 Likes

不知道当初的sydney放在现在是什么一个水平

3 Likes

那个就是聊天机器人,应该没有针对数学进行优化

如果能一直进化到现在的话,可能是最强的模型了,当时sydney刚出场的时候就是最强的存在


惨不忍睹

好的,还是一如既往的拉胯

数学比Gemini 1206强一点,感觉不像是一个思考模型

看上去,似乎不是o1 mini搞不好,不会是自研的模型吧?

copilot已经废到连侧栏都呆不下去了(

提前抢跑了几天 根据微软以往的发布习惯 应该是o3mini的某个版本…?

远不如o1 mini,怎么可能是o3

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。