图1是截止于1月27日的ai综合能力排行榜
图2是gemini2.0-flash-thinking-0121
图3是gemini-exp-1206
图4是deepseek-R1
图5是这个排行榜的评选规则
deepseek-R1能爆火,gemini的热度却一直是没有(国内),想了解一下大家对于gemini模型的看法,真有排行榜所评判的那么强吗,后面3张图片是各自对于ai觉醒的回答
测试题分数…
原来是测试题分数啊
上面写着score…
毕业很久了,英文差不多都忘了
这个排行榜是基于用户的主观体验批判的,体验好坏也和网站里面的模型速度有关,而且可能有人故意刷榜
国内有墙,除开一开始的ChatGPT,三大家有火过?国内大部分人都没接触过三大家,这次deepseek免费+中文优秀,让不少人不用梯子看到了新世界,才被封神的。多语言多环境下,个人体感还是Gemini,ChatGPT好。特别是日语和英语,相反中文不如deepseek
三大家之一claude还是有知名度的,在编程这一块,都说claude3.5是最好的
那也不是自媒体和一般人能懂的,国内没听过cursor大有人在,再者Claude见中就封的基操
Gemini在我这里评分一直都挺高的,大模型,免费额度高,可用性尚可
没错没错,评价的很客观,个人觉得是Claude体验最好,其次是ChatGPT和Gemini,Gemini最大的优势是他的API可以免费使用,虽然在某些方面比不了GPT和Claude,但是胜在全能!
一样一样
从格式就能判断模型的型号,每个模型都有自己的风格
我也认为gemini一直很好用
谷歌很喜欢刷榜 实际上性能不咋地
怎么说呢,这个排行榜前几名都可以用,人是有主观感受的不同的。
从我实际使用感受来说,claude在编程问题,以及代码辅助解释问题上是最好的。Gemini thinking在解释科学问题上最详细也最到位,比如化学、物理等方面(英文)。ChatGPT比较均衡,往往用来和其它模型的答案相互印证。
gemini2.0,claude3.5,4o,o1,R1,v3都用过,我觉得,编程还是要claude,r1,文本生成及多模态还是gemini2.0,4o,数学及推理还得是R1及o1,就是不知道gemini的thinking推理模型和r1及o1对比如何
第一不至于