如何鉴定claude-3-5-sonnet

hbykdx · 2024 年9 月 11 日 23:21

坛佬们，只有聊天的网页界面，如何鉴别Claude的模型是不是claude-3-5-sonnet，十万火急。最下面那个不是gpt4 turbo吗

Sallionder · 2024 年9 月 11 日 23:29

音乐专辑什么时候发行的 Ariana Grande "Eternal Sunshine. 答案是:它于2024年3月8日发行。如果回答是这样的,那一定是十四行诗3.5版。

voheep · 2024 年9 月 12 日 00:09

做不到很准确

fantasy · 2024 年9 月 12 日 00:16

官网都不是这样答的啊

elfmaid · 2024 年9 月 12 日 00:25

我也是官网

ysen · 2024 年9 月 12 日 00:29

有点难，感觉跟随机值有关

fantasy · 2024 年9 月 12 日 00:31

我走的fuclaude，这总不能有影响吧（

fantasy · 2024 年9 月 12 日 00:33

又试了试，总共问了三次，答3月8日了一次，感觉这个问题不太能作为评判c3.5的标准（

SCzheng · 2024 年9 月 12 日 00:33

试试英文怎么样

elfmaid · 2024 年9 月 12 日 00:34

我也是fuclaude啊
我用这个问题在fuclaude（正确）、cursor（正确）、pplx（家宽回答正确，其他ip回答错误）

fantasy · 2024 年9 月 12 日 00:36

英文倒是三次都答March 8了

barrylongface · 2024 年9 月 12 日 00:36

奇怪，按理说sonnet3.5的api，知识截断是在2023年下半年。
至少gcp的api是这样

lecou · 2024 年9 月 12 日 00:37

lecou · 2024 年9 月 12 日 00:38

好像多问几次就有答案了

songbailu · 2024 年9 月 12 日 00:39

claude-3-5-sonnet

40mini

enliven · 2024 年9 月 12 日 00:40

SCzheng · 2024 年9 月 12 日 00:41

这东西好像和我的这个问题一样:
我们需要找到一组数，它们的和大于或等于100，且和最小。
给定的集合是：16, 19, 18, 16, 45, 33, 30。
正确答案是:{19,18,33,30}. 但是Claude和GPT有时候需要提示一下才能答对

他们都偏好一个答案{45,33,30}.
我倒是测试过API的,好像一次答对的几率更大.

songbailu · 2024 年9 月 12 日 00:49

难道不是应该多次多模型测试么,只测一个模型不行吧.

Sallionder · 2024 年9 月 12 日 00:50

请访问lmarena.ai。选择Sonnet 3.5。想出一个词语。写下这个词语，并要求该神经网络为这个词语提供20个同义词或30个同义词。记住这些同义词。然后，访问另一个使用不同Sonnet 3.5的站点。再次输入相同的词语，并要求提供30个同义词。这样您就可以进行比较。GPT 的词汇量较少，语言表达较为匮乏，且词语使用精确度较低。

dwl · 2024 年9 月 12 日 00:56

API 一次答对，给出了python代码，并计算了正确结果。

话题		回复	浏览量
钻石AI的Claude 3.5 Sonnet是假的吗？搞七捻三 Claude , 人工智能 , 快问快答 , 纯水	10	458	2024 年11 月 2 日
佬们，claude哪个模型最智能啊搞七捻三快问快答	2	223	2024 年9 月 19 日
对于claude-3-5-haiku,我有个问题，这个模型到底啥段位，简单对比了一下写html，不知道怎么评价搞七捻三 Claude , 人工智能 , 快问快答 , 纯水	9	1526	2024 年11 月 20 日
完全没有Claude用了。。。汉语新解用别的模型跑感觉效果一般搞七捻三 Claude , Gemini , 人工智能	10	636	2024 年9 月 13 日
大家怎么分辨非官方站的Claude模型版本真实性的？开发调优快问快答	17	754	2024 年8 月 29 日

如何鉴定claude-3-5-sonnet

相关话题