11 个赞
遥遥领先oai了
1 个赞
什么时候来个3.5 opus啊
1 个赞
这个是啥网站,https://lmarena.ai/ 没看到这张表
livebench
感谢zsbd
1 个赞
已经去除模型列表了,今年应该是没了
coding成了o1的短板?
coding感觉还是o1-preview更强。
sonnet偶尔出现的幻觉会让人吐血,排查半天。
想问一下现在claude封号还频繁吗?