OpenRouter 上了一个 Gemini 2.5,不过有点不对劲。。

OpenRouter 上了一个 Gemini Pro 2.5 Experimental (free),不知道保不保真


这道题错得离谱。因为没有完全浸没,需要计算水位和浸没体积的关系,正确答案是 27 厘米。
R1 大概有一半概率做对,新 V3 会注意到没完全浸没但后面分析形状会错。就连 QwQ-32B 都会挣扎一下。
试了3次,3次这个 Gemini 2.5 都这么爽快地掉坑里了。有没有佬去官方测测?

一个棱长为30厘米的立方体铁块,从8个角各去掉一个棱长10厘米的立方体铁块。然后放入一个底面积为2500平方厘米,原本盛有20厘米水的容器。放入后水位是多少厘米

编辑:OpenRouter 没问题。官网也一样。这确实是 Gemini 2.5 (中文提示)做不出来的题。

32 个赞

看起来完全正确

24 个赞

这个是对的。那看来OpenRouter的免费版有问题。不过也有可能是温度之类的参数不对。

24 个赞

我这边默认参数
Top设置为0.45

22 个赞

温度呢?

24 个赞

我在官网直接问 也是27.6

19 个赞

我说默认了呀

:tieba_087:

11 个赞

我没有gemini官网,不知道_(:з)∠)_

2 个赞

所以官网也错了?:thinking:

赶快加入豪华午餐(


我这怎么不能用,别的模型都正常

重置一下模型设置试试

还是不行


其他两个模型都正常响应

没事了,谷歌普号都能随便用2.5pro了,懒得找原因了

官網API測試了幾次。
英文提示詞:思考84.2秒與65.4秒,連續兩次答對27cm
中文提示詞:思考11.9秒,連續四次都答錯

卧槽,新 V3 做对了一次!
虽然正确率大概要低于 10% 吧


openrouter不至于假吧