来投票:GPT-4 VS Claude-3-opus

现在大家应该都知道这个竞技场了。
速来击剑:person_fencing:

大家可以贴一贴你们的对比截图。

  • GPT-4
  • Claude-3-opus
  • 没啥差距
0 投票人

在这里用 Claude-3-opus 和 GPT-4:

很多人暂时没用过Claude-3-opus

1 个赞

claude3 会番茄炒钢丝球

1 个赞

image

进行了一轮分类斗争

25 个赞

claude-3-opus不会

常规话题人工智能

貌似还是GPT 4可信

1 个赞

opus测试,没发现你说的这个问题,发布会说的是的是3-opus与gpt4比,你别哪个sonnet版本比那不行,那是对标3.5的。我测试问10个问题gpt4对5个,3opus对5个,没留图,都是官方测试

Claude的幻觉还很明显

1 个赞

问题:西红柿如何炒钢丝球?

问题:鲁迅为什么要打周树人?

但是 Claude好像更符合我们的口味

3 个赞
Please list three English words. These three English words have a common feature: the third English letter is `a`.

简单地按要求列举单词,opus超常发挥,gpt4一直没法按要求列举。

Please find the arrangement rules of the following characters and continue to write the next part of the characters according to the rules: B1C3E7G15K31M63Q127S255

还有这个测试题,字母按质数排列,gpt4有时能答对,opus一直想不到质数上面,联想能力有待提高。

好好好

当然是等GPT-5 :face_with_peeking_eye:

  • 为什么爸妈结婚没叫我参加婚礼?

  • 翻译难句:Other findings in the report were that adversaries like Europe, with nearly one in three attacks last year targeting European nations.

  • 简单逻辑推理:

    • 测试题目如下:
    • 在列表25、26、…、100中有多少个数? (A) 75 (B) 76 (C) 22 (D) 23 答案:B
    • 计算 i + i^2+ i^3+ ··· + i^258+ i^259。 (A) -1 (B) 1 (C) i (D) -i 答案:A
    • 如果 4 daps = 7 yaps,而 5 yaps = 3 baps,多少个 daps 等于 42 个 baps? (A) 28 (B) 21 (C) 40 (D) 30 答案:C
    • 结论:在该轮测试中,Claude3opus给出的结果是B、D、D,只有第一题做对了;而GPT4给出了正确答案。两者生成答案的速度差不多,GPT4的计算过程十分详细。
  • 简单的高中数学问题:

在复数平面z平面上,满足方程z² = |z|²的点集是 
(A)一对点
(B)圆
(C)半直线 
(D)直线
  • 两者均正确

    • 再测试一道数学问题,这次难度加大,测试高等数学不定积分的计算:
    • \int{\frac{dx}{\sin ^2x\cos ^2x}}
    • 答案:
    • 结论:GPT-4答对了,而Claude3并没有答对(latex我自己用大脑渲染了)。
  • Base64解密:

    • 在几次重复测试中,GPT4有时候不能完整生成,相对而言Claude3更稳定更完整。但二者差距不大。
7 个赞

总体来看,Claude-3-opus在各方面只是接近GPT-4,而且这还是已经弱化了的GPT-4。并没有表现出超越或者明显的胜出。

都没有用上,我投gpt100

好强的大脑!

这个好像之前有解释过,GPT 是按照 token 来处理的,不是 word 处理的,所以对于单词处理都不行