请大家评价一下gemini的最新模型,排行榜一是实力吗?





图1是截止于1月27日的ai综合能力排行榜
图2是gemini2.0-flash-thinking-0121
图3是gemini-exp-1206
图4是deepseek-R1
图5是这个排行榜的评选规则
deepseek-R1能爆火,gemini的热度却一直是没有(国内),想了解一下大家对于gemini模型的看法,真有排行榜所评判的那么强吗,后面3张图片是各自对于ai觉醒的回答

6 个赞

测试题分数…

原来是测试题分数啊

上面写着score…

毕业很久了,英文差不多都忘了

这个排行榜是基于用户的主观体验批判的,体验好坏也和网站里面的模型速度有关,而且可能有人故意刷榜

国内有墙,除开一开始的ChatGPT,三大家有火过?国内大部分人都没接触过三大家,这次deepseek免费+中文优秀,让不少人不用梯子看到了新世界,才被封神的。多语言多环境下,个人体感还是Gemini,ChatGPT好。特别是日语和英语,相反中文不如deepseek

3 个赞

三大家之一claude还是有知名度的,在编程这一块,都说claude3.5是最好的

那也不是自媒体和一般人能懂的,国内没听过cursor大有人在,再者Claude见中就封的基操

Gemini在我这里评分一直都挺高的,大模型,免费额度高,可用性尚可

1 个赞


这个排行榜投票是两个模型竞争,盲测出来的,应该刷不了榜吧

没错没错,评价的很客观,个人觉得是Claude体验最好,其次是ChatGPT和Gemini,Gemini最大的优势是他的API可以免费使用,虽然在某些方面比不了GPT和Claude,但是胜在全能!

一样一样

从格式就能判断模型的型号,每个模型都有自己的风格

我也认为gemini一直很好用

谷歌很喜欢刷榜 实际上性能不咋地

怎么说呢,这个排行榜前几名都可以用,人是有主观感受的不同的。

从我实际使用感受来说,claude在编程问题,以及代码辅助解释问题上是最好的。Gemini thinking在解释科学问题上最详细也最到位,比如化学、物理等方面(英文)。ChatGPT比较均衡,往往用来和其它模型的答案相互印证。

gemini2.0,claude3.5,4o,o1,R1,v3都用过,我觉得,编程还是要claude,r1,文本生成及多模态还是gemini2.0,4o,数学及推理还得是R1及o1,就是不知道gemini的thinking推理模型和r1及o1对比如何

第一不至于