到底哪个最强,现在弄的人有点糊涂了
不同方面最强w
吸引你去用的噱头而已
一年之后的大模型能吊打上面说的所有这些
这跟5t5一样。
现代最强 vs 历史最强
都强,哪个能用就用哪个
t0:o1-pro(初版最强,前提不降智,最近砍了很多次,和o3本体差不多),3(非mini,只能在deepresarch,目前最强);关于这两个讨论蛮多的,其实oai经常砍老版本的模型算力来填充给新模型
t1:Claude3.7-thinking,o3-mini-hight(不降智)
t1.5:o1系列(不降智且初版,现在已死)
t2:grok3-thinking,o3其他系列,Claude3.7sonnet,Gemini2.0-flash-thinking(英语限定),deepseek(中文限定,非长文限定)
t2.5:gpt-4.5
t3:grok3,Gemini 2.0pro
t4:4o
数学问题各有区别,oai和deepseek疑似背题
代码,写作方面Claude3.7系列独挡,4.5好像勉强也可以;长文处理和科学处理Gemini,搜索最新信息的话grok3系列,平均各项都过得去的ChatGPT除开4o和gpt4.5版本;deepreserch的话ChatGPT独挡;Gemini不是信息量问题是模型常年不更新,论外
审核最严格deepseek,中等GPT-4.5(o1o3没有解除限制吧?),放飞自我的grok3
日常使用,性价比最高deepseek和Gemini(ai studio,非app);对ui和信息上有追求的人就是grok3;抖m不怕折腾的话Claude和ChatGPT
赚钱的话:三大家+grok3全部都要
学习新技巧和论文的话:notebooklm和三大家
怎么没有我R1
有,t2那里,14%幻觉,非中文语言,长文属实难绷
你这个t是什么意思?
合理
tier
我觉得Claude3.7 thing可以和o1p 一桌
比不了满血版的o1-pro(刚放出来那会),o1-pro疑似和o1其他系列一样被砍了很多次。
那到确实,现在确实可以坐一桌,希望Claude和deepseek可以再带来惊喜 ,每天fk一遍close ai
少看点营销号文章,所谓的历史最强,从对比自家产品角度来说,确实是历史最强,毕竟是最新一代。对比其他家来说,没有哪个最强,各有优劣(各个方面,不但是模型能力方面,还有使用成本在内的考虑)
所谓最强,考虑使用成本在内,普通人用不起,你最强又有啥用嘞?俺又用不着
claude!冲冲冲!
o3不如o1是什么逻辑?
感谢佬友总结,雀食河里~~
o3哪个模型超越了o1-pro?不是数字越大越强啊,o1-pro现在有哪家哪个模型赢了?
不怎么讨论和不上竞技场是因为它非常贵!大部分人不可能去体验到!而且已经被砍了很多次,现在的话理论上和o3本体差距不是非常大,就像为了推5g降低4g的速度一样