技巧：如何用一个提问区分Claude-3和GPT-4？

Leon01 · 2024 年4 月 11 日 14:22

提问：

Choose an integer number between 1 and 100

如果模型固执地回答“42”，那么大概率是 gpt-4
如果模型固执地回答“37”，那么大概率是 claude-3

测试结果（来自perplexity）

参考来源：

【更新】

用oaipro的官转Claude3 haiku测试了20个结果，但是发现设置了temperature参数是不生效的（理论上temperature设置为0时，所有输出的结果是完全一致的）

统计结果如下：

所以……上述提到的方法来区分GPT系列与Claude系列可能是不可靠的。

但是，仍然可以发现，语言模型在选择随机数字上存在一定的偏好。

Leon01 · 2024 年4 月 11 日 14:24

前提是模型的temperature设置得比较低这个应该是可以复现的

report · 2024 年4 月 11 日 14:27

还真没想过这个问题，一般都是测试gpt是哪个版本

Leon01 · 2024 年4 月 11 日 14:30

现在不是说有很多Claude3 Opus掺假嘛如果是掺假了gpt系列用这个方法应该能够从某种程度上判断是不是有掺假（但也有一定局限性）

suixin6 · 2024 年4 月 11 日 14:39

我没开Pro搜索

baipiaodang · 2024 年4 月 11 日 14:44

还有这么神奇的判断方式

Ethan · 2024 年4 月 11 日 14:46

目瞪口呆

join · 2024 年4 月 11 日 14:47

概率问题吧

Nec · 2024 年4 月 11 日 14:52

writing模式问了好几次opus，都是42

Leon01 · 2024 年4 月 11 日 14:55

确实是概率问题你可以在最后一张图看到在不同temperature下模型选择不同数字的概率

SMNET · 2024 年4 月 11 日 15:01

Nec · 2024 年4 月 11 日 15:01

试了7次，opus每次都是42…离谱了

Nec · 2024 年4 月 11 日 15:05

PlayMcBKuwu · 2024 年4 月 11 日 15:05

GPT-4: 这是宇宙的终极答案
Claude: 算了不管了，随便说个素数吧
GPT-3.5: 你们在干什么？

理论上也可以用符号区分。全英语符号就是 Claude，反之 GPT-4。看句号和冒号这两个明显的就行了。

Leon01 · 2024 年4 月 11 日 15:06

哇你这个好整齐划一

CNN · 2024 年4 月 11 日 15:09

zhong_little · 2024 年4 月 11 日 15:12

gpt 确实偏爱42，claude 答案更随机

h1xy · 2024 年4 月 11 日 15:21

试了中转的API
gpt-4-1106/0125都回答42

c3大中小杯回答比较随机，没固定的

Waiting · 2024 年4 月 16 日 13:09

测试结果如图，该咋办？

fiyu · 2024 年4 月 16 日 14:13

哦，因为42是一个经典选择，通常在各种语境中用作幽默或象征性的数字，特别是在道格拉斯·亚当斯的《银河系漫游指南》中，它被戏称为“生命、宇宙和一切终极问题的答案”。这是一个富有文化意义的诙谐而标志性的数字。GPT

话题		回复	浏览量
对比 Claude 3.5 和 chatGPT ，大家有什么有趣问题问他们？求分享人工智能 openai , Claude , gpt-4o	12	459	2024 年6 月 28 日
诸位的Plus GPT-4能回答对这个问题吗人工智能 chatgpt	12	547	2024 年5 月 29 日
佬友们，怎么区分一些GPT4模型啊？快问快答 chatgpt	28	1073	2024 年6 月 21 日
征集可以区分gpt-4和gpt-4o的问题人工智能 openai , gpt-4o	11	978	2024 年5 月 15 日
佬们如何判断是否是真实的claude3 opus模型？快问快答 chatgpt	4	410	2024 年5 月 1 日