“大的来了”：疑似超大杯-双子星 Gemini 2.0 Pro Thinking？“星云”现身 LMArena ，挑战最强模型？

tiga6367 · 2025 年3 月 24 日 13:04

据称，各个方面都远远超过了谷歌的所有先前模型，在数学相关任务上有超越Claude 3.7 Sonnet Thinking/o1 /o3 mini-high的表现。

xuanx · 2025 年3 月 24 日 13:06

牛逼u啦

tiga6367 · 2025 年3 月 24 日 13:14

也有网友表示，星云可能是 LIama4。这个时间窗口，倒也不能排除。

不过更多的证据，指向了这个是Google 的模型

handsome · 2025 年3 月 24 日 13:39

gemini冲冲冲

sehsapneb · 2025 年3 月 24 日 14:29

就是不知道编码能力怎么样

Jason_ghost · 2025 年3 月 24 日 14:32

大爱Gemini

chunkk · 2025 年3 月 24 日 14:39

我的找不到这个模型

Jason_ghost · 2025 年3 月 24 日 14:50

这个还没公开，要盲测，我一测就测出来了

Lain1984 · 2025 年3 月 24 日 15:15

测试了一下，果然是gemini系的模型

tiga6367 · 2025 年3 月 24 日 15:20

目前的智力超过之前所有的gemini，所以疑似超大杯-双子星 Gemini 2.0 Pro Thinking

austin · 2025 年3 月 24 日 15:22

数学这么强？期待帮我解决数学问题

tiga6367 · 2025 年3 月 24 日 16:37

号外号外

tiga6367 · 2025 年3 月 24 日 16:40

感觉o1和claude 3.7 thinking有平替了。

这个模型如果真的是gemini的话，简直无敌了。考虑到价格和渠道，在claude 4出来之前，gemini 2.0 pro thinking 可能应该是编码最佳选择。综合应该更是没得选（渠道便宜），超越GPT-5作为高频首选，毫无悬念。

tiga6367 · 2025 年3 月 24 日 16:42

有佬测下来，可能有claude 3.7 sonnet thinking的水平。

tiga6367 · 2025 年3 月 24 日 16:55

Coker · 2025 年3 月 24 日 16:57

打起来打起来，我要看血流成河

Sam_Altman · 2025 年3 月 24 日 17:07

期待gemini2.0pt，gemini超长上下文巨好使

lueluelue · 2025 年3 月 24 日 17:15

感觉llama5能有这个水平就不错了

OpenAI_Q-Star · 2025 年3 月 24 日 17:22

在盲测时对上了o3 mini high 满意nebula的答案
（可能是参数量更多答案细节更多）高参数模型配搭高容量长上下文
回答前的等待时间相信是O3 mini high 引起大善人硬体实力
强~

cohen8s · 2025 年3 月 24 日 17:26

免费的吗？还是要advanced

话题		回复	浏览量
gemini-2.5-pro疑似正在推送中前沿快讯人工智能	116	1307	2025 年3 月 26 日
Gemini 2.5 Pro 现已发布前沿快讯人工智能	30	1322	2025 年3 月 26 日
【gpt-4o-250326】来了，对抗gemini2.5pro，新版编程能力大幅增加，lmarena/Livebench评分搞七捻三 ChatGPT , 人工智能 , 纯水	43	1354	2025 年3 月 29 日
新模型-Gemini 2.0 Flash Thinking-APP，推理能力进步明显，在AIME 2025远超旧版（Gemini 2.0 Flash Thinking-0121版）前沿快讯人工智能	14	1304	2025 年3 月 18 日
Gemini 官方网页端出现的新模型选项前沿快讯人工智能	19	1172	2025 年3 月 16 日