Sonnet 有点笨啊

如图

这个问题好像确实()opus能一次性答对,你继续问sonnet也可以改正

很少有人批评sonnet的,这家伙目前没有对手

2 个赞

sonnet3.5现在是最强模型啦

我问3.5 sonnet物理和数学,几乎没答对的。但是gpt4o就正确率远高于3.5sonnet(虽然也很低)
你自己高强度使用一下claude就知道到底咋样了

2 个赞

一样 :rofl:

它甚至认为总量的 80% 比总量的 90% 还要多。

还剩45本

没读。

没毛病 :laughing:

这题,豆包答对了。这种题还是得中国国情。

毕竟豆包更适合中国宝宝 :rofl:

前排

没有考虑是否借出的情况

你加一句,“但没有借走”,试试

1 个赞

sonnet笨,太笨了

4o

看上边朋友的回复,大部分和我一样,你这种是偶然现象


这个没办法,claude对数字这些一点都不敏感,a社官方也感到奇怪

用的api。模型把“读了”默认是“借走”,如果更清楚提问的话,应该都能答对!

所以算是一个理解逻辑问题吧?不能算是智能问题?




我觉得这种问题纯粹是因为你前提条件或者是提示词没有说清楚,有些东西是有默认规则的,就像楼下说的,有可能在AI的理解中,读书默认就是借阅的。

1 个赞

Llama 3.1竟然回答正确