DeepSeek-R1-Lite 预览版正式上线

:tada: DeepSeek-R1-Lite 预览版正式上线

DeepSeek 全新研发 R1 系列推理模型,使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。

该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。

:backhand_index_pointing_right:地址:chat.deepseek.com
:backhand_index_pointing_right:开启 “深度思考”,立即体验

40 个赞

没有 API 还好像

测试了一下,感觉逻辑推导确实进步了,但是感觉步骤非常多,中间还有重复推理,不知道代码能力提升如何

有佬友实测了吗?这个 50 次是每天 50 次还是怎么计算的?deepseek 牛啊,不搞发布会直接就来个大的

1 个赞

他这个思考时间似乎很弹性,公众号的例子用了30秒,我随便问了一个问题只用了15秒。

深度思考这个套路,国内感觉都在跟进,360AI搜索搞的那个就是几个大模型来回倒腾3、4次,给你出一个篇幅尽量长的结果 :rofl:

1 个赞

360 那个就是实打实的演绎了什么是照猫画虎,没技术硬水的东西

2 个赞

为什么试lite


应该是三个臭皮匠顶过一个诸葛亮 :crazy_face:

又更新了:new_moon_with_face:?坏了,打脸了:sob:,之前还是选几个模型搁那“假装思考”

1 个赞

每天 50 次

4 个赞

非常了不起的工作,恭喜贵司团队!期待后续完整版和开源!

3 个赞

我简单测了一下算法能K leetcode 2题,离o1还有差距

到第5轮对话开始飙英文了 :rofl:

感觉思考了一堆废话

2 个赞

问题回答的回馈会好好利用不,我发现了挺多bad case

bad case 可以私发给我,会比直接在页面上点踩的优先级高一点 :xhs_021:

1 个赞

在聊天里发了

直接将整个网页复制粘贴给你?