我发现了这个网站 Chatbot Arena Leaderboard - a Hugging Face Space by lmarena-ai
但是我看到 claude 3.7 居然排名那么靠后, 和社区里 大佬的看法不一致呀
所以我怀疑 这个榜单 可能不是针对代码能力的
请问 从哪里可以看到 大模型写代码能力的 排行榜?
谢谢
我发现了这个网站 Chatbot Arena Leaderboard - a Hugging Face Space by lmarena-ai
但是我看到 claude 3.7 居然排名那么靠后, 和社区里 大佬的看法不一致呀
所以我怀疑 这个榜单 可能不是针对代码能力的
请问 从哪里可以看到 大模型写代码能力的 排行榜?
谢谢
WebDev Arena要看webdev板块
听我说 谢谢你 ,因为有你 世界才美丽
gemini2.5pro这么强吗
长上下文的注意力强无敌,现在我是直接把2.5和火山的v3用uniapi中转,2.5做架构师v3做编辑器模型
我也很震惊为啥Gemini这么强。
思考模型,本来就比普通模型要强不少。
缺点就是首字慢,思考慢。