为什么只有deepseek官方的api是正常的R1

bbznop · 2025 年2 月 1 日 09:13

官方在输出模板中似乎加了这些内容

Additionally, we have observed that the DeepSeek-R1 series models tend to bypass thinking pattern (i.e., outputting “\n\n”) when responding to certain queries, which can adversely affect the model’s performance. To ensure that the model engages in thorough reasoning, we recommend enforcing the model to initiate its response with “\n” at the beginning of every output.

deepseek-ai/DeepSeek-R1 · Hugging Face — deepseek-ai/DeepSeek-R1 · Hugging Face

截图上面的其他模型似乎并没有

<think>(\n)

而是直接输出内容、或是同一行输出 <think></think> ，符合官方说的缺失思考过程的情况

Guducat · 2025 年2 月 1 日 09:21

说简单点是不是就是学会偷懒了

bbznop · 2025 年2 月 1 日 09:23

不是啊，官方训练时候用的数据集格式如果是这样的话，那比如你本地部署设置输出对话格式也应该这样做，这样输出的效果才会与官方相同

Guducat · 2025 年2 月 1 日 09:31

那我理解错意思了，这样子的话那就只有塞提示词的API提供商能解决了

Qiner · 2025 年2 月 1 日 09:45

就是。。官方有没有预置的 Prompt？（公开的或套出来的），现在情况就是几乎所有第三方都倾向于绕过思考，但加上上面佬那条 system prompt 反而比较正常了。（但也和官方 API 的不一样，官方的有一种特定的输出排版格式）

kkk2 · 2025 年2 月 1 日 09:50

azure的也这样

Moeblack · 2025 年2 月 1 日 10:08

和我之前的推理一样，官方锁定了开头是<think>\n
而大部分供应商没有

（这群人都不看hugginface card的）

emx · 2025 年2 月 1 日 10:11

估计是自己部署的那些公司加了当地政治正确的限定，不然他们怎么敢公开发布给大家用。

检查的办法大概可以看看有没有可能出现任何说米尤的不好，或者是种族之类的话题。

hiagfh · 2025 年2 月 1 日 10:32

官网和app的回答是最好的

qaz741wsd856 · 2025 年2 月 1 日 10:35

乐，之前才在外网上看到有人批评deepseek只会回复一些意义不明的官话，原来是第三方加料了。

ayndpa · 2025 年2 月 1 日 13:31

<think>\n
**重要：请务必按照以下步骤操作：**

1. **首先，务必输出思考过程，以 `<think>\n` 开始，以 `\n</think>` 结束。**  思考内容请放在 `<think>` 和 `</think>` 标签之间。
2. 接着，在思考过程之后，输出最终的答案或回复。

请根据以上步骤，回答以下问题或执行以下指示：

[在此处输入你的问题或指示。尽量避免依赖模型记住之前的对话内容。]

[如果问题是数学问题则加入这段话：请确保逐步推理，并将最终答案放在 \boxed{} 中。]

MoeWang · 2025 年2 月 1 日 13:51

终于有人说这个了。

昨天有位佬发了一个满血版的在线使用，只要触发关键词，也会有这种政治正确内容。包括Cloudflare Workers AI的千问32b蒸馏版。

GrantDong · 2025 年2 月 1 日 15:34

model card 里的话是今天新加的，绝大部分服务商不知道，应该是和 siliconflow 联调的结果

Bubble7766 · 2025 年2 月 7 日 07:08

牛逼!给azure和poe的deepseek-r1试了下好用!

话题		回复	浏览量
英伟达的deepseekr1求生欲满满搞七捻三人工智能 , 纯水	24	866	2025 年2 月 11 日
Deepseek 食用指南开发调优人工智能	44	4217	2025 年2 月 4 日
尽量让你的 deepseek r1 api 思考开发调优 DeepSeek , 人工智能	10	1764	2025 年2 月 6 日
分享一个引导第三方DeepSeek-R1思考的system prompt 开发调优人工智能	24	1984	2025 年2 月 10 日
🚀 目前最完美的官替 DeepSeek R1！比硅基大善人的还快！！开发调优 Azure , DeepSeek , 人工智能	46	3862	2025 年2 月 6 日

为什么只有deepseek官方的api是正常的R1

相关话题