官方版的deepseek-r1也降智了?

一个高中数学考试题目,给满血deepseek做,结果官方的deepseek答案错了,魔塔社区的满血网页版居然做对了

题目:已知圆 C : {x}^{2} + {y}^{2} - {4y} + 3 = 0 ,过直线 l : y = \frac{1}{2}x 上的动点 M 作圆 C 的切线 切点分别为 P,Q . (1)当 \angle {PMQ} = \frac{\pi }{3} 时,求出点 M 的坐标; (2)经过 M,P,C 三点的圆是否过定点?若是,求出所有定点的坐标; (3)求线段 {PQ} 的中点 N 的轨迹方程.
官方版的最终答案是:
https://chat.deepseek.com/a/chat/s/882ccd64-6fab-4f12-8f2d-65daf4966916


魔塔版的最终答案是:

最终答案

(1) (\boxed{(0,0)}) 和 (\boxed{\left( \dfrac{8}{5}, \dfrac{4}{5} \right)})

(2) (\boxed{\left( \dfrac{4}{5}, \dfrac{2}{5} \right)})

(3) (\boxed{4x^2 + 4y^2 - x - 14y + 12 = 0})


第一问和第二问都正确,第三问官方版做错了!

10 个赞

建议把官方版的回复贴出来哈,这个网页咱看不了的

5 个赞

估计也不一定是100%做对的题目,有概率对

5 个赞

我一直测难题的,感觉没什么变化

有缓存吧

但是缓存是每个人分别保存的吗

缓存是全局的吧
不太懂
一个人也不会问那么多次同样的问题,针对人保存没这个必要吧

1 个赞

全局的应该是,每个人保存成本可能更高了
缓存或许是有时间限制

已经贴图了

1 个赞

另外测试过70b,只能做对第一问。

这几天测一些难题,没发现降智,就是繁忙

是不是思考:thinking:截断


火山方舟的。。。:thinking:
但是之前这道题又可以答对?

我觉得像这些数学题AI不一定能答对而且每次问可能结果都不一样。能测试出思考不截断就很不错了。

1 个赞

o3-mini-medium 这个答案

有可能降智了,不过我感觉更像是每次生成结果的随机幻觉,你想问他是谁每次答案都能不一样,这种数学题更容易出错了

1 个赞

这两个都是完整做完,木有截断的

o3也不行,只做对第三问

感觉多少有点问题,同样的问题,我问过3天,就第一天回答对过


o3-mini-high

可以多试几次,不一定每次都对的