🎉DeepSeek-R2-Lite-Preview已经训练完成!

据我在DeepSeek工作的朋友透露,DeepsSeek-R2-Lite-Preview已经完成训练,在各种基准测试中碾压OpenAI o3-mini和Grok 3!更重要的是,本次训练采用的是Ascend 910C NPU计算集群,已经彻底摆脱了对NVIDA GPU的依赖。更恐怖的是,它的上下文长度达到了10M,而训练成本,却只是之前的1/10。官方已经开放了内测申请,你只需要发送KFCVW50到DeepSeek官方邮箱([email protected])就能够参与内测排队,通过之后你会收到官方的邮件。

:warning:注意

DeepSeek-R2-Lite-Preview只是DeepSeek第二代推理模型的雏形,后续会继续更新,迭代到DeepSeek-R2-Lite,最终会以DeepSeek-R2正式发布。

74 个赞

服啦。没看标签,差点就信了

2 个赞

《KFCVW50》 :tieba_025:

1 个赞

关键词提取

5 个赞

你这个码是真的像编的假消息

2 个赞

埋了埋了,先宰了再套上敌军的衣服。

7 个赞

太疯狂了!

差点就信了

每到周四看各类消息都需要特别谨慎 :rofl:

1 个赞

大水B

1 个赞

窝要是真的就好了最好在优化优化让模型在最小的内存和gpu下还可以正常使用就好了 :grinning:

1 个赞

要不是看了一眼回复,我就信了

3 个赞

要不是今天星期四,差点就信了

2 个赞

差点真发邮件去了,佬友里面有坏人啊

8 个赞

每周就靠这个标定星期几了

2 个赞

认真的看完了

1 个赞

满怀期待地点了进来 :tieba_087:

1 个赞

可恶 我都打开邮件准备发了 :rofl:

3 个赞

没看码前还高兴得很,还想着npu训练的,那么int8推理应该不会降智了 :triumph:

1 个赞

虽然但是,我感觉这玩笑有点不合适
假如真有人没反应过来发给官方了,不就成骚扰了吗

4 个赞