1+1 和 1*1 哪个大?为什么大模型都会在这个问题上出错?

测试了今天刚发布的讯飞,一样的错误。
image

之前用过海螺,也是说这两者相等。

这些厂商是用的同一个数据集训练的原因?还是什么问题在这么简单的数学计算都不需要推理的题目上出现雷同的错误。这是模型架构的问题?

3 Likes

我去,这也能错?

3 Likes

神奇

1 Like

GPT、Claude都没问题,暂不清楚你那个东西到底是啥情况


GPT4o

image

还会自纠了 :stuck_out_tongue_closed_eyes:

Clip_2024-06-27_19-32-10

20 Likes

和人家的比 国内就是小辣机啊

2 Likes

深度求索


智谱

gpt3.5的回答也是说相等
4o倒是回答对了

谷歌的免费gemma7b

:tieba_086: :tieba_086:

1 Like

难绷


每个人的讯飞还不一样滴?

2 Likes

重试

快问快答人工智能

大模型确实不擅长数学运算,这都能翻车 :sweat:

国内起码有一个答对了


deepseek, qwen2, gpt4o都能答对,moonshot, gemini都答错了,claude3.5对了一半 :rofl:

1 Like


kimi使用了计算器。。。 :rofl: :rofl:

5 Likes


天工时间

claude-3-opus-20240229
claude-3-sonnet-20240229
claude-3-haiku-20240307
yi-large
yi-large-preview
在竞技场里试了一圈这些模型是错的

1 Like

连gpt3.5都能答对:rofl: