claude-3-5-sonnet-20241022 实测排行榜

11 个赞

遥遥领先oai了

1 个赞

什么时候来个3.5 opus啊 :xhs_033:

1 个赞

这个是啥网站,https://lmarena.ai/ 没看到这张表

livebench

感谢zsbd

1 个赞

已经去除模型列表了,今年应该是没了

coding成了o1的短板?

https://livebench.ai/#

coding感觉还是o1-preview更强。

sonnet偶尔出现的幻觉会让人吐血,排查半天。

想问一下现在claude封号还频繁吗?


coding 还得是claude, 一骑绝尘