deepseek-v3确实超过了claude-3-5-sonnet-20241022

lezishen · 2024 年12 月 28 日 05:07

但其实语言没claude-3-5-sonnet-20241022 好

luoawai · 2024 年12 月 28 日 05:08

排行榜不一定可信

lezishen · 2024 年12 月 28 日 05:09

还是可信的

pengzhile · 2024 年12 月 28 日 05:09

编程水平我实测就是中流水平，比不上claude

Chosen · 2024 年12 月 28 日 05:09

一般都用来写代码的吧

lezishen · 2024 年12 月 28 日 05:12

代码真比GPT好么

Apaa · 2024 年12 月 28 日 05:13

别看广告，看疗效~

pengzhile · 2024 年12 月 28 日 05:17

我不怎么看排行榜，只看我实际体验。当然只能代表我个人体验

pengzhile · 2024 年12 月 28 日 05:18

而且我没说比不过gpt啊，gpt4o编码能力确实一般

lezishen · 2024 年12 月 28 日 05:20

就问下没事的

lezishen · 2024 年12 月 28 日 05:20

那你觉得最好是谁

pengzhile · 2024 年12 月 28 日 05:22

编码方面感觉是o1和sonnet结合起来用比较好。前端用claude写，复杂的逻辑用o1

pengzhile · 2024 年12 月 28 日 05:22

语言方面可能gemini和sonnet强一些，但是有定制提示词的情况下o1表现也非常好

cabudon · 2024 年12 月 28 日 05:24

不可能，我只认lm排行榜

1o2t · 2024 年12 月 28 日 05:25

我也是代码用o1+sonnet，语言方面感觉opus仍然坚挺，gemini也很强

RichardChou · 2024 年12 月 28 日 05:37

榜只略微有参考价值，竞技场都不看了。

日常豆包+GPT；编程主sonnet+辅o1；gemini 图片。

现在看大V们吹的倒不是 deepseek 的能力，而是 deepseek 对训练的创新应用（非首提，但首用），大幅降低训练成本。
那这里会加速大模型的迭代，对 GPU 利空，连带 ASIC 也利空。ASIC 只能对特定的计算算子进行加速，无法承受快速迭代带来的灵活性成本。

newcomer · 2024 年12 月 28 日 05:39

和国际上比差距还很大，在国内不错，比豆包强多了

QAWS12g · 2024 年12 月 28 日 05:42

马克思今天的话也是很正确的

lezishen · 2024 年12 月 28 日 05:45

我只认lm排行榜这是啥

lezishen · 2024 年12 月 28 日 05:46

而是 deepseek 对训练的创新应用这是啥

话题		回复	浏览量
deepseek-v3 超过 claude-3.5？前沿快讯 ChatGPT , OpenAI , 人工智能	63	2316	2024 年12 月 29 日
claude-3.5-sonnet已经可以完美替代gpt-4o 资源荟萃人工智能	46	1686	2024 年12 月 28 日
685B的Deepseek V3上抱脸了，Aider榜上超sonnet了，LiveBench数据好像也出了搞七捻三人工智能	26	1113	2024 年12 月 26 日
deepseek V3在lmarena的结果出来了，第7名前沿快讯人工智能	26	984	2024 年12 月 31 日
DeepSeek V3 代码能力评测：在 Aider 编辑任务中超越 Claude 3.5 前沿快讯 DeepSeek , 人工智能	6	542	2024 年12 月 27 日