英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台

被削弱了,下午用好好的,现在已经不能用了

为什么老黄一个卖显卡的人提供的推理服务居然会卡…

1 Like

我在cherry studio里用老黄这个没有thing过程,回答还没几秒就出了

nvidia的R1,思考过程是和最终输出放在一起的,没有分开。
跑R1的蒸馏模型,也是一起输出的,<think>后紧跟的就是最终输出。
没有<think>的一般都是客户端进行了特殊处理,给删除了。