deepseek-v3确实超过了claude-3-5-sonnet-20241022


但其实语言没claude-3-5-sonnet-20241022 好

3 个赞

排行榜不一定可信

1 个赞

image
还是可信的

编程水平我实测就是中流水平,比不上claude

一般都用来写代码的吧


代码真比GPT好么

别看广告,看疗效~

5 个赞

我不怎么看排行榜,只看我实际体验。当然只能代表我个人体验

而且我没说比不过gpt啊,gpt4o编码能力确实一般

就问下没事的

那你觉得最好是谁

1 个赞

编码方面感觉是o1和sonnet结合起来用比较好。前端用claude写,复杂的逻辑用o1

3 个赞

语言方面可能gemini和sonnet强一些,但是有定制提示词的情况下o1表现也非常好

1 个赞

不可能,我只认lm排行榜

我也是代码用o1+sonnet,语言方面感觉opus仍然坚挺,gemini也很强

2 个赞

榜只略微有参考价值,竞技场都不看了。

日常 豆包+GPT;编程 主sonnet+辅o1;gemini 图片。

现在看大V们吹的倒不是 deepseek 的能力,而是 deepseek 对训练的创新应用(非首提,但首用),大幅降低训练成本。
那这里会加速大模型的迭代,对 GPU 利空,连带 ASIC 也利空。ASIC 只能对特定的计算算子进行加速,无法承受快速迭代带来的灵活性成本。

3 个赞

和国际上比差距还很大,在国内不错,比豆包强多了

马克思今天的话也是很正确的

我只认lm排行榜这是啥

而是 deepseek 对训练的创新应用这是啥

1 个赞