用如下例子测试Gemini的2.0和Thinking模型,还是凸显了Thinking模型的聪明程度高一截,不会被干扰,它还知道识别干扰信息!
阿芳去摘桃子,第一天摘了44个,第二天摘了58个,第三天摘的桃的数量是第一天的2倍,但有5个比较小,问三天一共摘了多少个桃。
Gemini-2.0-flash-exp:
Gemini-2.0-flash-thinking-exp
用如下例子测试Gemini的2.0和Thinking模型,还是凸显了Thinking模型的聪明程度高一截,不会被干扰,它还知道识别干扰信息!
阿芳去摘桃子,第一天摘了44个,第二天摘了58个,第三天摘的桃的数量是第一天的2倍,但有5个比较小,问三天一共摘了多少个桃。
Gemini-2.0-flash-exp:
Gemini-2.0-flash-thinking-exp
我用R1测试也挺准确的
1.5 pro也能解出来
他说的是pro
你用的是1.5flash,用错模型了。
思考模型有时候也会被干扰
另外flash模型更开放 支持生成任意敏感内容
1209会严厉拒绝
@StellaFortuna @catis114514 看到了,我看错了,用了1.5 Pro的确可以
下次换电脑回答,手机不知道怎么贴图,1.5系模型好像就pro行,gemma全军覆没,2.0没试过,但1.5pro都行2.0系应该没悬念了
抗干扰性和知识水平不属于同一维度吧
1.5pro都能做出来。。说明这题太简单了
这个题目描述就很。。。
给清扬点赞