斯坦福大学报告称中美AI差距缩小至0.3%

斯坦福大学以人为本AI研究所发布的《2025年人工智能指数报告》显示,中国高性能AI模型的数量和质量不断提升,对美国的领先地位构成挑战,顶级模型之间的性能差距正在缩小。中国是人工智能出版物和专利产出最多的国家,如今其开发的模型在性能上已经与美国的竞争对手不相上下。2023年,在大规模多任务语言理解测试中,中国领先的模型落后于美国顶级模型近20个百分点。然而,到2024年底,美国的领先优势缩小到了0.3个百分点。报告强调,随着AI的快速持续发展,没有一家公司能够领先。在聊天机器人竞技场排行榜上,2024年初排名第一的模型比排名第十的模型得分高出约12%,但到2025年初,这一差距缩小到了5%。

—— 《自然》杂志:link:原文链接

17 Likes

有oai,claude,gemini,grok在,Stanford是搞笑么。。。

16 Likes

不至于吧?

10 Likes

问就是瞎编

8 Likes

美国AI是排除了跨国企业吧 :bili_004:

9 Likes

如果开源的权重高一些的话,这个数字还可以理解

毕竟,美国的开源ai太弱了

8 Likes

目前真的有能完全竞争过 gpt-4o, o1, o3, claude-3.7-sonnet, gemini-2.5-pro, grok-3, llama-4 这些的模型吗……

9 Likes

可以排除llama4了,这玩意竞技场造假,目前国产模型最有竞争力的是qwq32b跟r1还有新版的dsv3,打过4o没问题,也能跟o1能打一打,但离o3mini,grok3,claude7sonnet,特别是gemini2.5pro差距很大

3 Likes

看新闻,好像有的印度大学教授也说上海跟孟买差距进一步缩小,上海快超过孟买了。

3 Likes

竞技场造假?会不会是 hf 的模型上传错了,我看有的人测试是说本地部署的跑出来的结果和竞技场的跑出来的结果不一样,竞技场的明显更优,说明至少是训练出来了,但是没完全开放,总不能竞技场是别的模型套皮吧

1 Like

没有上传错误,竞技场那边说是meta那边上传了一个特调模型,专门用来刷分的,现在正在重新测评开源的这个版本

3 Likes

这就很……逆天,meta竟然还干这种事

你看看这个吧,https://x.com/lmarena_ai/status/1909397817434816562?t=Wt1WprD2px6uULcuEp4GMg&s=19

1 Like
  1. llama4不算
  2. 现在不算25年初了

如果华人算中国人早就超过了吧,ai圈华人有很多厉害的呀,可惜都跑美国了

1 Like

要经费的手段吧,年初CNN被断经费的时候,也是连续正面报道我们国家。

风向有点变啊w

老美经典这样吧?鼓吹中国骗经费?

3 Likes

所以开源

ds的模型幻觉都太高,R1在算法题上比不上o3-mini-medium