doomooo
(Zjuwyz)
1
OpenRouter 上了一个 Gemini Pro 2.5 Experimental (free),不知道保不保真
这道题错得离谱。因为没有完全浸没,需要计算水位和浸没体积的关系,正确答案是 27 厘米。
R1 大概有一半概率做对,新 V3 会注意到没完全浸没但后面分析形状会错。就连 QwQ-32B 都会挣扎一下。
试了3次,3次这个 Gemini 2.5 都这么爽快地掉坑里了。有没有佬去官方测测?
一个棱长为30厘米的立方体铁块,从8个角各去掉一个棱长10厘米的立方体铁块。然后放入一个底面积为2500平方厘米,原本盛有20厘米水的容器。放入后水位是多少厘米
编辑:OpenRouter 没问题。官网也一样。这确实是 Gemini 2.5 (中文提示)做不出来的题。
32 个赞
doomooo
(Zjuwyz)
3
这个是对的。那看来OpenRouter的免费版有问题。不过也有可能是温度之类的参数不对。
24 个赞
L93
(鲁道夫)
14
还是不行
其他两个模型都正常响应
没事了,谷歌普号都能随便用2.5pro了,懒得找原因了
官網API測試了幾次。
英文提示詞:思考84.2秒與65.4秒,連續兩次答對27cm
中文提示詞:思考11.9秒,連續四次都答錯
doomooo
(Zjuwyz)
16
卧槽,新 V3 做对了一次!
虽然正确率大概要低于 10% 吧