求大模型对比图

司南里好像除了Claude opus和GPT-4o就没有最新的了,想看看有没有更全的

1 Like

对比哪方面啊

什么司南 :thinking:

什么是对比图?
竞技场排行榜不够看吗?

我也不懂,提问意图太模糊了

opencompass

就是那种总体能力的分数对比图

啥东西?

这个就是竞技场排行榜:https://chat.lmsys.org/?leaderboard
还有一个superclue的(有人说是野榜,具体不懂:joy:): SuperCLUE (superclueai.com)

虽然我感觉竞技场的也挺野的 :innocent:

但是至少 sam altman 都认。。。把 4o 提前放上去测试了。

这个 opencompass 长见识了

那看来Gemini1.5Pro还是会比Claude Sonnet强一些的

竞技场吧