几何是视觉模型的弱点?平行线难倒众AI

介绍

这道初中的平行线判断角关系的题,我测试了 **ChatGPT-4o、Gemini 2.0 Thinking、Cluade 3.5 Sonnet,没有一个答对的,都回答是 37°

prompt: 根据图上有的条件,求出A的角度。

正解:53°

模型回答

  1. 4o

  2. gemini

  3. claude

疑问

有无佬能测试一下其他的视觉模型吗?如o1

还有,为什么它们答不对,有没有大佬懂得?

1 Like

测试了一下,随便加个思考提示词就行了tieba_087

这种大语言模型说白了还是,推断算概率的,数学这种强逻辑不适合大语言模型,还是得用 Function calling 这种调函数,这种图形估计也是弱势

2 Likes

gemini它本身就有提示词,为什么还答不对啊?

不知道tieba_087,几乎没用过thinking模型tieba_087

1 Like


o1也不行

1 Like

o1可以,上面那个思考只有几秒降智了吧 :tieba_087:

1 Like

终于有个能注意到平行线的了,不容易

1 Like

Thought for a couple是降智了Thought about才是没有降智的 :tieba_087:


Thought about了也是这样:joy:

那就是IP不行了,我用的是tag家宽 :tieba_087:




1 Like

这是怎么了???


4o,没思考词,对了

这不是秒出?