1+1 和 1*1 哪个大?为什么大模型都会在这个问题上出错?

测试了今天刚发布的讯飞,一样的错误。
image

之前用过海螺,也是说这两者相等。

这些厂商是用的同一个数据集训练的原因?还是什么问题在这么简单的数学计算都不需要推理的题目上出现雷同的错误。这是模型架构的问题?

3 个赞

我去,这也能错?

3 个赞

神奇

1 个赞

GPT、Claude都没问题,暂不清楚你那个东西到底是啥情况


GPT4o

image

还会自纠了 :stuck_out_tongue_closed_eyes:

Clip_2024-06-27_19-32-10

20 个赞

和人家的比 国内就是小辣机啊

2 个赞

深度求索


智谱

gpt3.5的回答也是说相等
4o倒是回答对了

谷歌的免费gemma7b

:tieba_086: :tieba_086:

1 个赞

难绷


每个人的讯飞还不一样滴?

2 个赞

重试

快问快答人工智能

大模型确实不擅长数学运算,这都能翻车 :sweat:

国内起码有一个答对了


deepseek, qwen2, gpt4o都能答对,moonshot, gemini都答错了,claude3.5对了一半 :rofl:

1 个赞


kimi使用了计算器。。。 :rofl: :rofl:

5 个赞


天工时间

claude-3-opus-20240229
claude-3-sonnet-20240229
claude-3-haiku-20240307
yi-large
yi-large-preview
在竞技场里试了一圈这些模型是错的

1 个赞

连gpt3.5都能答对:rofl: