241121 三花AI日报：OpenAI 的 GPT-4o 模型重夺竞技场榜首；DeepSeek 推出全新推理模型 R1-Lite 预览版；谷歌推出专为教育研究微调的 AI 模型

ke_jun · 2024 年11 月 21 日 00:48

DeepSeek 全新研发的推理模型预览版 DeepSeek-R1-Lite 现已正式上线网页版。R1 系列模型采用强化学习训练，推理过程中包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果。

目前，DeepSeek-R1-Lite 仍处于迭代开发阶段，仅支持网页使用(50次/天)，暂不支持 API 调用。官方表示，正式版 DeepSeek-R1 模型将完全开源，并公开技术报告和部署 API 服务。

还得是 DeepSeek，加油！

谷歌 AI Studio 最近上线了一个新模型 LearnLM 1.5 Pro Experimental ，这是一个专门针对学习和教育研究进行微调的模型系列。早在今年 5 月份，谷歌就发布了一篇文章来介绍这个模型。

我试下，常规任务的表现与 Gemini-Pro 差不多，但在文学能力方面，感觉比最新的 1114 模型还要好。不过，这个模型的上下文窗口只有 32k。

OpenAI 发布了 GPT-4o 的新版本，其写作能力现在更加自然、吸引人且富有个性，进一步提高了相关性和可读性。

同时，4o 模型在 lmarena 上超越了谷歌的 Gemini 1114 模型，重新夺得了榜首。从得分来看，新版本在创意写作、数学和编码方面都有显著提升。

Flail7127 · 2024 年11 月 21 日 00:59

gemini 似乎要来大的了

ycj3 · 2024 年11 月 21 日 01:05

这竞技场网站哪儿看

aepax · 2024 年11 月 21 日 01:15

感觉国产正经干的就deepseek和qwen俩啊

hohohowgo · 2024 年11 月 21 日 01:35

Kevin525 · 2024 年11 月 21 日 04:09

早安！我們的日報

SomeBottle · 2024 年11 月 21 日 04:11

deepseek 牛哇

cnm · 2024 年11 月 21 日 04:17

mistral large 1121呢？

bjZDv · 2024 年11 月 21 日 04:24

还得是deepseek

handsome · 2024 年11 月 21 日 05:51

来了，每日看报

话题		回复	浏览量
241122 三花 AI 日报：谷歌 Gemini 模型重夺竞技场榜首；京东健康数字人头；黑森林实验室 FLUX Tools；Tülu 3：完全开放的大模型前沿快讯人工智能	12	634	2024 年11 月 22 日
DeepSeek-R1-Lite VS ChatGPT o1 开发调优 ChatGPT , OpenAI , 人工智能	9	921	2024 年12 月 6 日
DeepSeek新模型写代码能力与o1相当网友：今年编程只剩Tab键前沿快讯 ChatGPT , OpenAI , DeepSeek , 人工智能	19	1422	2025 年1 月 20 日
DeepSeek 放出超重磅全新模型！ - 新模型直接对标 OpenAI 搞七捻三人工智能	41	972	2024 年11 月 21 日
谷歌 Gemini 突发试验版模型：重回竞技榜第一，新版 GPT-4o 只领先了 1 天前沿快讯	3	392	2024 年11 月 22 日