猜想大语言模型或许是查表法来做部分计算题?

今天使用DeepSeek来算一个题目,思考过程里面出现了一个算式


我事后验证了一下,答案正确。

很明显DeepSeek不是Agent,官网也不是SaaS,没有后端调用计算器。

这是不是相当于人类背三角函数数值和九九乘法表把答案背下来了?不可能用口算这种计算吧。

包括三角函数计算
基本也都是能直接给出正确结果。

难以置信……

感觉跟三角函数数值和二次幂计算一样,猜想大语言模型或许是查表法来做部分计算题的

4 个赞

应该不是, 我中午算小数(手动输入的), copilot 直接给我答案了, 然后我计算器验证了一下, 没问题

很难理解这种超出想象的口算能力
e^(-1/100)口算,什么神仙

有时候会算错,叫它重算又会对

佬还是没有理解AI的计算能力是怎么来的

有没有人做过大模型的激活可视化啊?

r1 lite版本算9个8组合成1000会算错给出8个8组合成1000的答案,r1就没问题了

有算法的吧?我猜的

他都会写代码了还不能自己算个数?

token直接生成可以理解成口算吧 :joy:

对啊为什么啊?deepseek又没有代码解释器

ds 的无 CoT 数值计算能力一直都很强(自 v2 开始就是这样了),而且精度相当之高。我的猜想是使用了合成数据进行这方面的加强训练,再加上大模型本身拟合能力就很强,所以有这种结果

个人倾向于作为训练语料喂过,就和以前数学家查表一样

常见组合的计算结果更容易存在数据库里,就跟 gpt-3.5 也能知道(100以内的质数之和),但是不知道(100以内的合数之和)

对于这道题或许它可以用泰勒展开算:


DS还挺聪明

是的,最早我就看模型能不能用逆向思维算这个题目来看智力哈哈,正着加能做对的都少数

投喂的多,刚好有。