DeepSeek 推出全新推理模型 R1-Lite 预览版
DeepSeek 全新研发的推理模型预览版 DeepSeek-R1-Lite 现已正式上线网页版。R1 系列模型采用强化学习训练,推理过程中包含大量反思和验证,思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果。
目前,DeepSeek-R1-Lite 仍处于迭代开发阶段,仅支持网页使用(50次/天),暂不支持 API 调用。官方表示,正式版 DeepSeek-R1 模型将完全开源,并公开技术报告和部署 API 服务。
还得是 DeepSeek,加油!
谷歌推出 LearnLM 1.5 Pro Experimental:专为教育研究微调的 AI 模型
谷歌 AI Studio 最近上线了一个新模型 LearnLM 1.5 Pro Experimental ,这是一个专门针对学习和教育研究进行微调的模型系列。早在今年 5 月份,谷歌就发布了一篇文章来介绍这个模型。
我试下,常规任务的表现与 Gemini-Pro 差不多,但在文学能力方面,感觉比最新的 1114 模型还要好。不过,这个模型的上下文窗口只有 32k。
OpenAI 的 GPT-4o 模型重夺竞技场榜首
OpenAI 发布了 GPT-4o 的新版本,其写作能力现在更加自然、吸引人且富有个性,进一步提高了相关性和可读性。
同时,4o 模型在 lmarena 上超越了谷歌的 Gemini 1114 模型,重新夺得了榜首。从得分来看,新版本在创意写作、数学和编码方面都有显著提升。