现在推理模型是不是只有3家?

openai的o系列
Gemini的think系列
deepseek的r1

话说anthropic在干啥呢,Claude3.5opus就杳无音讯很久了

3 个赞

他在写作文呢,和国会老爷们喝酒呢,哈哈哈

anthropic现在专注封帐号,期待deepseek雄起

2 个赞

国内也有几家

阿里的 qwq 比 r1 早,智谱和 kimi 最近也推出了自己的推理模型

claude摸鱼呢

智谱清言前些天有免费体验 3 个月的,吐字速度飞快。

笑死我了,a社数年如一日的坚守,只为能封杀所有可疑账号 :laughing:

1 个赞

gemini的1206是推理模型不?

Dario 访谈时说过思考模型,他说多了 test time 或 每一步的 reflection 应该是更加流畅的操作,和目前流行的观点有出入,准备好好研究下,推出个更加流畅的 方便用户操作使用的产品。
简单理解就是,OpenAI 的意思 这是模型质变成 思考型模型,Dario 认为还是普通 LLM,只不过能力强化了点。
#个人看法,思考模型确实已经质变,Dario的量变 需要站在更高的思维层次理解,那个级别可能都超越AGI的层次,不知道是不是能拿来用的)

有兴趣可以看看 OpenAI 对 reasoning model 的介绍,里面的advice 很有意思,比如 Try zero shot first, then few shot if needed (这点和deepseek 如出一辙),Be very specific about your end goal

1 个赞

qwen kimi glm也有 不过不能打

我也认为GPT类的模型和思考推理模型已经是两个类型了,作为使用者,我最直观的感受就是不再需要繁琐的工程级prompt作为用好模型的工具了,自我思考推理的过程使得AI达到预期目标的能力得到极大提升

2 个赞

有时候炒作是一部分,不好用就是不好用,r1能火的基础就是能打动用户,就像初见chatgpt3.5的时候

qwen 智谱 kimi 阶跃 都有 reasoning model

国产模型很卷,大概率以后都会有。然而有钱烧的目前看就 deepseek 和 qwen 了。