是我想多了，AI这样用还是不行啊

l2021v · 2025 年2 月 15 日 09:41

我本来想通过Qwen2.5-VL-72B-Instruct识别数学题目，然后让deepseek来回答，没想到一上来，qwen就自己做了，还做了个错的。

后面喊他好好描述清楚，结果他想了个好主意，用图形来表示，只是，想法很好，识别的东西不对啊。当我复制给deepseek的时候，ds估计也是蒙圈的。
但是他做对了，就很离谱！
题目：

Dabble · 2025 年2 月 15 日 10:36

这个题目很有意思，测试了gemini （2.0-flash 001），也是直接二话不说做成 D
让它仔细描述下题目，结论就很接近

从正面看，应该看到一个类似于 “L” 形的排列，底部是三个正方形，左边和中间的正方形上方各有一个正方形

也用英语测试下，这个模型确实看不懂

l2021v · 2025 年2 月 15 日 10:45

可能是对正方体的识别不准确？

l2021v · 2025 年2 月 15 日 10:50

后续：很有趣的是，当我在网页端使用qwenvl问的时候，他就可以回答正确。

sakurawen · 2025 年2 月 15 日 11:45

要多试几次，一次正确也不能代表每次都正确

folow20601 · 2025 年2 月 15 日 11:46

sota o1图像识别能力也不咋的，还是老老实实用文字吧

wwow · 2025 年2 月 15 日 11:46

这么厉害

Dabble · 2025 年2 月 15 日 11:47

能识别 cube ，但是对 column 和 row 的理解是混乱的，且相互矛盾，（在英语里面，不像中文的行，列，是比较确定的，column 是竖的，row的横的，能比较清晰看出问题），可能目前这个 3维的几何问题，对大模型都算是比较难的

rick_w · 2025 年2 月 15 日 11:51

handsome · 2025 年2 月 15 日 11:58

这题怎么会错呢

OpenLXMP · 2025 年2 月 15 日 12:17

厉害

l2021v · 2025 年2 月 15 日 13:20

对啊，按说是不应该的。

l2021v · 2025 年2 月 15 日 13:20

有可能，但是看谷歌、网页端都可以的。

l2021v · 2025 年2 月 15 日 13:21

感觉以后针对大模型的测试，还是要多试几次才能看出是不是真的能做对。

hyperion · 2025 年2 月 15 日 22:30

ai的多模态对于识别图像很差劲，比如说电路图，很难分析正确。最好还是用自然语言准确描述出来。

话题		回复	浏览量
又出现了一道测试AI智商的问题了。搞七捻三人工智能	45	830	2025 年3 月 6 日
有意思的识图题，测测模型能正确回答吗？开发调优人工智能	19	173	2025 年2 月 22 日
qwen实乃ai界汪峰 qwq模型性能到底如何？搞七捻三人工智能	33	1094	2025 年2 月 27 日
这一道题没有大模型能作对，不服拿AI来战！搞七捻三人工智能	66	896	2025 年1 月 21 日
测试一下哪个AI能做对（视觉“错觉”题，我已笑死😆）搞七捻三人工智能 , 纯水	7	620	2024 年12 月 9 日