佬们,竞技场又上新模型了“sus-column-r”,据说接近人类推理水平,赶快来测试啊。更新:原来是Grok-2

是的,有很多类似的,可以看这里大模型排行榜看花了眼啊