Gemini Thinking模型聪明程度高

用如下例子测试Gemini的2.0和Thinking模型,还是凸显了Thinking模型的聪明程度高一截,不会被干扰,它还知道识别干扰信息!

阿芳去摘桃子,第一天摘了44个,第二天摘了58个,第三天摘的桃的数量是第一天的2倍,但有5个比较小,问三天一共摘了多少个桃。

Gemini-2.0-flash-exp:

Gemini-2.0-flash-thinking-exp

2 个赞


R1也对啊而且考虑更周全

我用R1测试也挺准确的

4o都能对,很难吗。

1.5 pro也能解出来

1.5 pro似乎有小问题

他说的是pro

你用的是1.5flash,用错模型了。

思考模型有时候也会被干扰

另外flash模型更开放 支持生成任意敏感内容
1209会严厉拒绝

@StellaFortuna @catis114514 看到了,我看错了,用了1.5 Pro的确可以

1 个赞

下次换电脑回答,手机不知道怎么贴图,1.5系模型好像就pro行,gemma全军覆没,2.0没试过,但1.5pro都行2.0系应该没悬念了

抗干扰性和知识水平不属于同一维度吧

1.5pro都能做出来。。说明这题太简单了

2 个赞

这个题目描述就很。。。

给清扬点赞