有意思的识图题,测测模型能正确回答吗?

1 个赞

o1 模型回答正确

怎么不看一下Gemini?

发出来让大家测,节省时间

看起来chat01的质量确实可以

o3mini和o3mini high都行,低风险普号chatgpt-4o-latest也行

1 个赞

能对

grok 3
不回答,有点差

元宝的R1和V3也可以多模态识图,貌似是腾讯自家的识图技术加成的,你看看能不能做对

4o和qwen-2.5-vl-72b都可以


1 个赞

难绷~联不联网和开推理都没用

注意力全在图片上了,文字没看

图片是什么都答对了

强也挺强的,就是没答对 :tieba_087:

这个结果有点意思了,Grok没答对,但是描述是正确的

@F-droid

kimi 1.5少了一个

我记得之前数鸡蛋的没几个对的

1 个赞

帅哥还能找到吗

找不到了,得有三四个月了吧

1 个赞

题目来源于AWS的验证码,考虑到之前曾用于测试GPT,如果正确率比较高的话,可以换这张图试试

1 个赞
1 个赞