DeepSeek-R1-Lite 预览版正式上线
DeepSeek 全新研发 R1 系列推理模型,使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。
该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。
地址:chat.deepseek.com
开启 “深度思考”,立即体验
DeepSeek-R1-Lite 预览版正式上线
DeepSeek 全新研发 R1 系列推理模型,使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。
该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。
地址:chat.deepseek.com
开启 “深度思考”,立即体验
没有 API 还好像
测试了一下,感觉逻辑推导确实进步了,但是感觉步骤非常多,中间还有重复推理,不知道代码能力提升如何
有佬友实测了吗?这个 50 次是每天 50 次还是怎么计算的?deepseek 牛啊,不搞发布会直接就来个大的
他这个思考时间似乎很弹性,公众号的例子用了30秒,我随便问了一个问题只用了15秒。
深度思考这个套路,国内感觉都在跟进,360AI搜索搞的那个就是几个大模型来回倒腾3、4次,给你出一个篇幅尽量长的结果
360 那个就是实打实的演绎了什么是照猫画虎,没技术硬水的东西
为什么试lite
又更新了?坏了,打脸了
,之前还是选几个模型搁那“假装思考”
每天 50 次
非常了不起的工作,恭喜贵司团队!期待后续完整版和开源!
我简单测了一下算法能K leetcode 2题,离o1还有差距
感觉思考了一堆废话
问题回答的回馈会好好利用不,我发现了挺多bad case
bad case 可以私发给我,会比直接在页面上点踩的优先级高一点
在聊天里发了
直接将整个网页复制粘贴给你?