Sonnet 有点笨啊

Sakamoto023 · 2024 年7 月 31 日 11:20

如图

Hiccup_620 · 2024 年7 月 31 日 11:26

这个问题好像确实（）opus能一次性答对，你继续问sonnet也可以改正

EDWINCHENC · 2024 年7 月 31 日 11:27

很少有人批评sonnet的，这家伙目前没有对手

syclove · 2024 年7 月 31 日 11:33

sonnet3.5现在是最强模型啦

Ghidra · 2024 年7 月 31 日 11:41

我问3.5 sonnet物理和数学，几乎没答对的。但是gpt4o就正确率远高于3.5sonnet（虽然也很低）
你自己高强度使用一下claude就知道到底咋样了

a8645322 · 2024 年7 月 31 日 11:41

一样

Eridanus · 2024 年7 月 31 日 11:48

它甚至认为总量的 80% 比总量的 90% 还要多。

EDWINCHENC · 2024 年7 月 31 日 11:51

还剩45本

没读。

没毛病

EDWINCHENC · 2024 年7 月 31 日 11:54

这题，豆包答对了。这种题还是得中国国情。

a8645322 · 2024 年7 月 31 日 11:57

毕竟豆包更适合中国宝宝

civil · 2024 年7 月 31 日 12:02

前排

updownup · 2024 年7 月 31 日 12:09

没有考虑是否借出的情况

handsome · 2024 年7 月 31 日 12:13

你加一句，“但没有借走”，试试

lueluelue · 2024 年7 月 31 日 12:14

sonnet笨，太笨了

nayang · 2024 年7 月 31 日 12:16

4o

Sakamoto023 · 2024 年7 月 31 日 13:06

看上边朋友的回复，大部分和我一样，你这种是偶然现象

kaitkuroba · 2024 年7 月 31 日 13:13

这个没办法，claude对数字这些一点都不敏感，a社官方也感到奇怪

wazg · 2024 年7 月 31 日 14:24

用的api。模型把“读了”默认是“借走”，如果更清楚提问的话，应该都能答对！

所以算是一个理解逻辑问题吧？不能算是智能问题？

MergeC · 2024 年8 月 1 日 01:46

我觉得这种问题纯粹是因为你前提条件或者是提示词没有说清楚，有些东西是有默认规则的，就像楼下说的，有可能在AI的理解中，读书默认就是借阅的。

nuclear · 2024 年8 月 1 日 07:56

Llama 3.1竟然回答正确

话题		回复	浏览量
Claude 3.5 Sonnet 回归，继续舞资源荟萃人工智能 , Claude35-sonnet	9	457	2024 年8 月 29 日
Claude3.5 sonnet真的有点东西资源荟萃 Claude , 人工智能	10	844	2024 年8 月 29 日
这就是claude-3-5-sonnet-20240620，有点离谱资源荟萃人工智能	14	1078	2024 年8 月 29 日
Claude 3.5 Sonnet.感觉还可以啊资源荟萃人工智能	11	705	2024 年8 月 29 日
对claude-3-5-sonnet-20240620 道歉，确实有点东西资源荟萃人工智能	5	461	2024 年8 月 29 日