soil
1
斯坦福大学以人为本AI研究所发布的《2025年人工智能指数报告》显示,中国高性能AI模型的数量和质量不断提升,对美国的领先地位构成挑战,顶级模型之间的性能差距正在缩小。中国是人工智能出版物和专利产出最多的国家,如今其开发的模型在性能上已经与美国的竞争对手不相上下。2023年,在大规模多任务语言理解测试中,中国领先的模型落后于美国顶级模型近20个百分点。然而,到2024年底,美国的领先优势缩小到了0.3个百分点。报告强调,随着AI的快速持续发展,没有一家公司能够领先。在聊天机器人竞技场排行榜上,2024年初排名第一的模型比排名第十的模型得分高出约12%,但到2025年初,这一差距缩小到了5%。
—— 《自然》杂志
原文链接
17 Likes
awtest
2
有oai,claude,gemini,grok在,Stanford是搞笑么。。。
16 Likes
KXG
(KXG)
7
目前真的有能完全竞争过 gpt-4o, o1, o3, claude-3.7-sonnet, gemini-2.5-pro, grok-3, llama-4 这些的模型吗……
9 Likes
Fange
(繁歌)
8
可以排除llama4了,这玩意竞技场造假,目前国产模型最有竞争力的是qwq32b跟r1还有新版的dsv3,打过4o没问题,也能跟o1能打一打,但离o3mini,grok3,claude7sonnet,特别是gemini2.5pro差距很大
3 Likes
Leon.L
(Leon)
9
看新闻,好像有的印度大学教授也说上海跟孟买差距进一步缩小,上海快超过孟买了。
3 Likes
KXG
(KXG)
10
竞技场造假?会不会是 hf 的模型上传错了,我看有的人测试是说本地部署的跑出来的结果和竞技场的跑出来的结果不一样,竞技场的明显更优,说明至少是训练出来了,但是没完全开放,总不能竞技场是别的模型套皮吧
1 Like
Fange
(繁歌)
11
没有上传错误,竞技场那边说是meta那边上传了一个特调模型,专门用来刷分的,现在正在重新测评开源的这个版本
3 Likes
Fange
(繁歌)
13
1 Like
yonxinli
(你若丹东来换我一身雪白)
15
如果华人算中国人早就超过了吧,ai圈华人有很多厉害的呀,可惜都跑美国了
1 Like
lu-wen
16
要经费的手段吧,年初CNN被断经费的时候,也是连续正面报道我们国家。
ds的模型幻觉都太高,R1在算法题上比不上o3-mini-medium