为什么只有deepseek官方的api是正常的R1

官方在输出模板中似乎加了这些内容

Additionally, we have observed that the DeepSeek-R1 series models tend to bypass thinking pattern (i.e., outputting “\n\n”) when responding to certain queries, which can adversely affect the model’s performance. To ensure that the model engages in thorough reasoning, we recommend enforcing the model to initiate its response with “\n” at the beginning of every output.

deepseek-ai/DeepSeek-R1 · Hugging Face — deepseek-ai/DeepSeek-R1 · Hugging Face

截图上面的其他模型似乎并没有

<think>(\n)

而是直接输出内容、或是同一行输出 <think></think> ,符合官方说的缺失思考过程的情况

说简单点是不是就是学会偷懒了 :rofl:

不是啊,官方训练时候用的数据集格式如果是这样的话,那比如你本地部署设置输出对话格式也应该这样做,这样输出的效果才会与官方相同

那我理解错意思了,这样子的话那就只有塞提示词的API提供商能解决了

就是。。官方有没有预置的 Prompt?(公开的或套出来的),现在情况就是几乎所有第三方都倾向于绕过思考,但加上上面佬那条 system prompt 反而比较正常了。(但也和官方 API 的不一样,官方的有一种特定的输出排版格式)

azure的也这样

和我之前的推理一样,官方锁定了开头是<think>\n
而大部分供应商没有

(这群人都不看hugginface card的)

2 个赞

估计是自己部署的那些公司加了当地政治正确的限定,不然他们怎么敢公开发布给大家用。

检查的办法大概可以看看有没有可能出现任何说米尤的不好,或者是种族之类的话题。

官网和app的回答是最好的

乐,之前才在外网上看到有人批评deepseek只会回复一些意义不明的官话,原来是第三方加料了。

<think>\n
**重要:请务必按照以下步骤操作:**

1. **首先,务必输出思考过程,以 `<think>\n` 开始,以 `\n</think>` 结束。**  思考内容请放在 `<think>` 和 `</think>` 标签之间。
2. 接着,在思考过程之后,输出最终的答案或回复。

请根据以上步骤,回答以下问题或执行以下指示:

[在此处输入你的问题或指示。尽量避免依赖模型记住之前的对话内容。]

[如果问题是数学问题则加入这段话:请确保逐步推理,并将最终答案放在 \boxed{} 中。]
4 个赞

终于有人说这个了。

昨天有位佬发了一个满血版的在线使用,只要触发关键词,也会有这种政治正确内容。包括Cloudflare Workers AI的千问32b蒸馏版。

model card 里的话是今天新加的,绝大部分服务商不知道,应该是和 siliconflow 联调的结果

1 个赞

牛逼!给azure和poe的deepseek-r1试了下 好用!