语言模型联网比拼:Gemini 2.0 flash Thinking VS o3-mini

测试一



测试二

测试三



14 个赞

感觉 gemini 没联网查,完全靠猜啊。

1 个赞

看得出联网了,但是几乎全回答错了


:flushed:

搜的网站太少了吧,都没有linuxdo

2.0 Flash Thinking Experimental with apps不是联网模型吧,其实这道题不联网的2.0 flash 都能答对一半

但是直接暴露了 :tieba_087:

1 个赞

这个是增强的联网模型

搜索很不稳定

并不是联网模型哦,只是有应用交互,2.0系好像只有2.0 flash支持联网

2 个赞

给你证明一下

:face_with_monocle:好吧,我看在google ai studio中不能联网

没什么好说的,都写明了联网

image

1 个赞

chat 的智商明显不如 AI studio 的,不知道为什么。

我测了一遍现在和 ai studio一样了

来搜搜你

不一样,我刚测了下,还是不行。同样的题,AI studio 可以回答对,chat 的不行。

不管怎么样,联网能力比以前还是好些

很不稳定,有时候ai studio不能答对,chat又能答对

gpt也能搜到你