再战挑战题！几乎只有3-Opus能做对的题，3.5-Sonnet能挑战成功吗？

Leon01 · 2024 年6 月 20 日 16:41

前情提要：

Drawing letters "LaTeX", using ASCII art 

Note the upper and lower case

Note that the result must be wrapped in a code box

现在3.5-Sonnet出来了，话不多说，开测！！

(来自OpenRouter的API调用)

很遗憾，试了好几次都不能答对。

不过毕竟成本不如Opus，而且这是非典型题目，需要模型从广泛的训练数据中学习到对应的模式，对模型的能力要求还是比较高的。

gyxzhao · 2024 年6 月 20 日 17:39

佬的openrouter是付费的吗

Leon01 · 2024 年6 月 20 日 17:44

是的

Yes_Man · 2024 年6 月 21 日 00:53

和它说不对，它又好像画对了

handsome · 2024 年6 月 21 日 00:57

这个问题居然还能测

user374 · 2024 年6 月 21 日 01:00

不行，话说有无逻辑题我来测测

Leon01 · 2024 年6 月 21 日 03:06

哇这个不错

Leon01 · 2024 年6 月 21 日 03:12

Perplexity的回答让我严重怀疑是缓存了还是掺水了每次都是完全一致的回复且几乎没有延迟

话题		回复	浏览量
模型挑战题!! 欢迎来战（目前几乎只有Claude-3-Opus能做对）人工智能	78	2162	2024 年6 月 20 日
Claude 3 系列还是有点太聪明了 - Sonnet + Opus + Haiku 智商评测 + 免费 Claude 3 API 全家桶人工智能 Claude3-opus , Claude-3-Sonnet , Claude-3-Haiku	61	2737	2024 年6 月 15 日
实测 Claude 3.5 Sonnet VS GPT-4o，最强大模型的宝座可能要易主了人工智能 chatgpt	26	1974	2024 年7 月 1 日
Claude Opus 有点聪明的样子人工智能 openai	23	1212	2024 年3 月 6 日
对claude-3-5-sonnet-20240620 道歉，确实有点东西人工智能	4	335	2024 年6 月 21 日