openai的o系列
Gemini的think系列
deepseek的r1
话说anthropic在干啥呢,Claude3.5opus就杳无音讯很久了
openai的o系列
Gemini的think系列
deepseek的r1
话说anthropic在干啥呢,Claude3.5opus就杳无音讯很久了
他在写作文呢,和国会老爷们喝酒呢,哈哈哈
anthropic现在专注封帐号,期待deepseek雄起
国内也有几家
阿里的 qwq 比 r1 早,智谱和 kimi 最近也推出了自己的推理模型
claude摸鱼呢
智谱清言前些天有免费体验 3 个月的,吐字速度飞快。
笑死我了,a社数年如一日的坚守,只为能封杀所有可疑账号
gemini的1206是推理模型不?
Dario 访谈时说过思考模型,他说多了 test time 或 每一步的 reflection 应该是更加流畅的操作,和目前流行的观点有出入,准备好好研究下,推出个更加流畅的 方便用户操作使用的产品。
简单理解就是,OpenAI 的意思 这是模型质变成 思考型模型,Dario 认为还是普通 LLM,只不过能力强化了点。
(#个人看法,思考模型确实已经质变,Dario的量变 需要站在更高的思维层次理解,那个级别可能都超越AGI的层次,不知道是不是能拿来用的)
有兴趣可以看看 OpenAI 对 reasoning model 的介绍,里面的advice 很有意思,比如 Try zero shot first, then few shot if needed (这点和deepseek 如出一辙),Be very specific about your end goal
qwen kimi glm也有 不过不能打
我也认为GPT类的模型和思考推理模型已经是两个类型了,作为使用者,我最直观的感受就是不再需要繁琐的工程级prompt作为用好模型的工具了,自我思考推理的过程使得AI达到预期目标的能力得到极大提升
有时候炒作是一部分,不好用就是不好用,r1能火的基础就是能打动用户,就像初见chatgpt3.5的时候
qwen 智谱 kimi 阶跃 都有 reasoning model
国产模型很卷,大概率以后都会有。然而有钱烧的目前看就 deepseek 和 qwen 了。