claude3.7、grok3、gpt4.5、gemini 2.0、o3 deepresearch都号称历史最强

到底哪个最强,现在弄的人有点糊涂了

5 个赞

不同方面最强w

吸引你去用的噱头而已

一年之后的大模型能吊打上面说的所有这些

4 个赞

这跟5t5一样。
现代最强 vs 历史最强 :rofl:

都强,哪个能用就用哪个

t0:o1-pro(初版最强,前提不降智,最近砍了很多次,和o3本体差不多),3(非mini,只能在deepresarch,目前最强);关于这两个讨论蛮多的,其实oai经常砍老版本的模型算力来填充给新模型

t1:Claude3.7-thinking,o3-mini-hight(不降智)

t1.5:o1系列(不降智且初版,现在已死)

t2:grok3-thinking,o3其他系列,Claude3.7sonnet,Gemini2.0-flash-thinking(英语限定),deepseek(中文限定,非长文限定)

t2.5:gpt-4.5

t3:grok3,Gemini 2.0pro

t4:4o

数学问题各有区别,oai和deepseek疑似背题

代码,写作方面Claude3.7系列独挡,4.5好像勉强也可以;长文处理和科学处理Gemini,搜索最新信息的话grok3系列,平均各项都过得去的ChatGPT除开4o和gpt4.5版本;deepreserch的话ChatGPT独挡;Gemini不是信息量问题是模型常年不更新,论外

审核最严格deepseek,中等GPT-4.5(o1o3没有解除限制吧?),放飞自我的grok3

日常使用,性价比最高deepseek和Gemini(ai studio,非app);对ui和信息上有追求的人就是grok3;抖m不怕折腾的话Claude和ChatGPT
赚钱的话:三大家+grok3全部都要
学习新技巧和论文的话:notebooklm和三大家

19 个赞

怎么没有我R1 :tieba_025:

有,t2那里,14%幻觉,非中文语言,长文属实难绷

你这个t是什么意思?

合理tieba_013

tier

我觉得Claude3.7 thing可以和o1p 一桌

比不了满血版的o1-pro(刚放出来那会),o1-pro疑似和o1其他系列一样被砍了很多次。

那到确实,现在确实可以坐一桌,希望Claude和deepseek可以再带来惊喜 ,每天fk一遍close ai

少看点营销号文章,所谓的历史最强,从对比自家产品角度来说,确实是历史最强,毕竟是最新一代。对比其他家来说,没有哪个最强,各有优劣(各个方面,不但是模型能力方面,还有使用成本在内的考虑)

所谓最强,考虑使用成本在内,普通人用不起,你最强又有啥用嘞?俺又用不着

claude!冲冲冲!

o3不如o1是什么逻辑?

感谢佬友总结,雀食河里~~

o3哪个模型超越了o1-pro?不是数字越大越强啊,o1-pro现在有哪家哪个模型赢了?

不怎么讨论和不上竞技场是因为它非常贵!大部分人不可能去体验到!而且已经被砍了很多次,现在的话理论上和o3本体差距不是非常大,就像为了推5g降低4g的速度一样