Claude 加一分


8 Likes

???这不是右边的更大吗

3 Likes

不是都没分吗 tieba_125

3 Likes

claude不是被你误导错了吗

1 Like

要是能拒绝你的错误引导就好了

1 Like


GPT你多试一试,可能是你的被降智了

1 Like

gpt的图像识别很差劲,不信的可以试试把家里洗发水配料表拍给他让他识别。它能错一大半

1 Like




分别是 claude 3.5sonnet、gpt 4o、Gemini1121

Gpt 加一分

2 Likes

佬们,这个视觉错觉 不应该是问蓝色的谁大么,怎么都问橙色的

2 Likes

训练的素材都是问蓝色,所以才会回答那么离谱的答案

1 Like

一语道破天机

1 Like

常见的问法早就在训练数据里到处都有了,体现不出来模型能力

就要用平时不常见的问法测试才有意思

1 Like

这测试很好,常见的题目改个变量就能看出模型基本上还是在背诵答案

3 Likes


有意思, 反而因为知识较少, 通过真正比较图案来获得答案