据我在DeepSeek工作的朋友透露,DeepsSeek-R2-Lite-Preview已经完成训练,在各种基准测试中碾压OpenAI o3-mini和Grok 3!更重要的是,本次训练采用的是Ascend 910C NPU计算集群,已经彻底摆脱了对NVIDA GPU的依赖。更恐怖的是,它的上下文长度达到了10M,而训练成本,却只是之前的1/10。官方已经开放了内测申请,你只需要发送KFCVW50
到DeepSeek官方邮箱([email protected])就能够参与内测排队,通过之后你会收到官方的邮件。
注意
DeepSeek-R2-Lite-Preview只是DeepSeek第二代推理模型的雏形,后续会继续更新,迭代到DeepSeek-R2-Lite,最终会以DeepSeek-R2正式发布。