从哪里可以看到实时的大模型写代码能力的排行榜?

我发现了这个网站 Chatbot Arena Leaderboard - a Hugging Face Space by lmarena-ai

但是我看到 claude 3.7 居然排名那么靠后, 和社区里 大佬的看法不一致呀

所以我怀疑 这个榜单 可能不是针对代码能力的

请问 从哪里可以看到 大模型写代码能力的 排行榜?

谢谢

1 Like
2 Likes

WebDev Arena要看webdev板块

听我说 谢谢你 ,因为有你 世界才美丽

gemini2.5pro这么强吗 :tieba_087:

长上下文的注意力强无敌,现在我是直接把2.5和火山的v3用uniapi中转,2.5做架构师v3做编辑器模型

我也很震惊为啥Gemini这么强。

思考模型,本来就比普通模型要强不少。

缺点就是首字慢,思考慢。

1 Like