“大的来了”:疑似超大杯-双子星 Gemini 2.0 Pro Thinking?“星云”现身 LMArena ,挑战最强模型?

据称,各个方面都远远超过了谷歌的所有先前模型, 在数学相关任务上有超越Claude 3.7 Sonnet Thinking/o1 /o3 mini-high的表现。

25 个赞

牛逼u啦

2 个赞

也有网友表示,星云可能是 LIama4。这个时间窗口,倒也不能排除。

不过更多的证据,指向了这个是Google 的模型

2 个赞

gemini冲冲冲

1 个赞

就是不知道编码能力怎么样

1 个赞

大爱Gemini :tieba_087:

2 个赞

我的找不到这个模型

这个还没公开,要盲测,我一测就测出来了


1 个赞

测试了一下,果然是gemini系的模型


1 个赞

目前的智力超过之前所有的gemini,所以疑似超大杯-双子星 Gemini 2.0 Pro Thinking

数学这么强?期待帮我解决数学问题

号外号外

1 个赞

感觉o1和claude 3.7 thinking有平替了。

这个模型如果真的是gemini的话,简直无敌了。考虑到价格和渠道,在claude 4出来之前,gemini 2.0 pro thinking 可能应该是编码最佳选择。综合应该更是没得选(渠道便宜),超越GPT-5作为高频首选,毫无悬念。

@Sam_Altman

1 个赞

有佬测下来,可能有claude 3.7 sonnet thinking的水平。

@ Coker

1 个赞

打起来打起来,我要看血流成河 :nerd_face:

3 个赞

期待gemini2.0pt,gemini超长上下文巨好使

2 个赞

感觉llama5能有这个水平就不错了

1 个赞

在盲测时 对上了o3 mini high 满意nebula的答案
(可能是参数量更多 答案细节更多)高参数模型配搭高容量长上下文
回答前的等待时间 相信是O3 mini high 引起 大善人硬体实力
强~

免费的吗?还是要advanced:bili_040: