被削弱了,下午用好好的,现在已经不能用了
为什么老黄一个卖显卡的人提供的推理服务居然会卡…
1 Like
我在cherry studio里用老黄这个没有thing过程,回答还没几秒就出了
nvidia的R1,思考过程是和最终输出放在一起的,没有分开。
跑R1的蒸馏模型,也是一起输出的,<think>
后紧跟的就是最终输出。
没有<think>
的一般都是客户端进行了特殊处理,给删除了。