实测 Claude 3.5 Sonnet VS GPT-4o,最强大模型的宝座可能要易主了

Claude太抠门,问不了几条就没了,4o能力差不多,账号还好注册,之前注册的几个Claude封的就剩一个独苗了

2 个赞

开会员

1 个赞

claude 太小气了,我选择oaifree

1 个赞

写作论文润色能力目前还得是claude 3 opus,希望等到claude 3.5 opus出来的时候,写作能力不被降智。

1 个赞

claude比4o大方吧,我免费的都能用来写一个横版跳跃游戏都没到限制,而且免费的4o阉割了很多上下文。claude的没怎么感觉到阉割。

1 个赞

4o 根据文本解题应该是比给图片解题要强的,没看到你解答过程,不知道它是否是文本有识别出错,我之前用高考题测 4o 能力是很强的

以及你是6个题目截图一次性解答的吗,我单截2、4的图片让4o做题,都做对了,所以可能还有长文输出时的遗忘和能力衰退问题?

Clip_2024-06-23_18-44-09

image

1 个赞

主要Claude 封号太严重了,动不动就封,付费照封

1 个赞

可能分IP地区和运气吧,运气差的问个七八条对话就开始提示负载不足了

1 个赞

有道理,晚上应该高峰期限制多一些,我下午测试的就还好,晚上用就看到说限制多少条的提示了

1 个赞

我用gpt-4o作了你的数学题,全对。

1 个赞

Claude的理解能力很强,就是很小气,而且我感觉chatgpt的生态要更好一点

1 个赞

好用心的测试 赞一个

1 个赞

感觉还可以拿LeetCode或者Codefroces上的题目测试下编程能力。这样好定量分析

1 个赞

和 C35聊着好爽啊 :tieba_024:
不像4o 有点冷和僵硬:cold_face:

把3 opus拎出来对比一下啊

4o 是前座的学霸,c35是同桌的她 :tieba_024:

师傅,那个还原网页UI是怎么提问的,UI实在太难开发了

claude封号太搞了

1 个赞

还是4o大方啊,高低都能用两下

给用,满分,不给用,0分 :tieba_001:

1 个赞