感觉Gemini 官网的思考模型联网效果不如o3 mini联网

yeahhe (Mozi) 2025 年2 月 7 日 10:49 24

https://livebench.ai/#/

我自己建立了一些题库，livebench也有基准测试，Gemini的思考模型的水平都不太行

话题		回复	浏览量	活动
gemini的推理模型很快很强搞七捻三人工智能	4	399	2025 年2 月 6 日
谷歌新出的那个gemini ios，有佬用了吗？跟ai studio比，有没有什么不同？搞七捻三 Gemini , 人工智能	3	201	2024 年11 月 15 日
语言模型联网比拼：Gemini 2.0 flash Thinking VS o3-mini 开发调优 ChatGPT , Gemini , 人工智能	74	913	2025 年2 月 8 日
我发现gemini 2.0很强啊搞七捻三人工智能	10	306	2025 年1 月 17 日
Gemini 新出了个模型搞七捻三人工智能 , 纯水	13	460	2025 年2 月 6 日