Gemini-exp-1206、deepseek R1、chatgpt o3mini、Claude 3.5哪个更好用现在

25年2月了。
已经好久没关注过AI了,目前这几个模型孰强孰弱?
求科普,主要用来读论文写代码

只付费一个的话推荐哪个?

23 Likes

o3-mini, R1

2 Likes

各有用途,写文字用deepseek,写数学题用o3 mini

6 Likes

当然是1206

3 Likes

各有所长
也许你需要一个 https://livebench.ai/

6 Likes

gemini2.0 think_0121>1206>03mini>R1

2 Likes

寫代碼考慮用o3-mini-high、claude-3.5-sonnet唄
讀論文不知道,建議用o3-mini-high吧

沒錢的話選R1當下位替代

3 Likes

这个榜单准么佬
评论区好像都意见不一 :bili_021:

Think 没用过,是所有账号都能用了吗

代码03mini-high、claude3.5 数学就用r1 (现在不一定用得上),gemini-flash-2-thinking

livebench应该算是最权威的榜单之一
使用模型用途不同导致的

中文能力的话,我用下来觉得1206比2.0flash好点点。

1 Like

R1,Claude

1 Like

gemini-flash-2-thinking感觉考虑没那么全面,问题模糊挺容易歪

1206没有这么强吧

R1+claude3.5

1 Like

最舒服的,gemini 2.0 flash 0121 thinking

1 Like

o3-mini-high要用api版本的好一些,网页版的很容易降智

我选择用r1

1 Like

使用需求不同,那对模型能力的感知也不同。
因此脱离具体需求来比较高下,就是无稽之谈。

2 Likes

gemini2.0 think_0121,这个很强,主要免费