3 个赞
排行榜不一定可信
1 个赞
还是可信的
编程水平我实测就是中流水平,比不上claude
一般都用来写代码的吧
别看广告,看疗效~
5 个赞
我不怎么看排行榜,只看我实际体验。当然只能代表我个人体验
而且我没说比不过gpt啊,gpt4o编码能力确实一般
就问下没事的
那你觉得最好是谁
1 个赞
编码方面感觉是o1和sonnet结合起来用比较好。前端用claude写,复杂的逻辑用o1
3 个赞
语言方面可能gemini和sonnet强一些,但是有定制提示词的情况下o1表现也非常好
1 个赞
不可能,我只认lm排行榜
我也是代码用o1+sonnet,语言方面感觉opus仍然坚挺,gemini也很强
2 个赞
榜只略微有参考价值,竞技场都不看了。
日常 豆包+GPT;编程 主sonnet+辅o1;gemini 图片。
现在看大V们吹的倒不是 deepseek 的能力,而是 deepseek 对训练的创新应用(非首提,但首用),大幅降低训练成本。
那这里会加速大模型的迭代,对 GPU 利空,连带 ASIC 也利空。ASIC 只能对特定的计算算子进行加速,无法承受快速迭代带来的灵活性成本。
3 个赞
和国际上比差距还很大,在国内不错,比豆包强多了
马克思今天的话也是很正确的
我只认lm排行榜这是啥
而是 deepseek 对训练的创新应用这是啥
1 个赞