本文在 Claude 上”复刻“了 DeepSeek-R1 效果,给出了提示词的编写过程和最终的提示词,大家可以直接拿去用。
通过提示词工程来“复刻”,并不能让 Claude 真正替代 DeepSeek-R1,但是可以让 Claude 来模拟 DS 的思考过程,让思考过程更显性化,通过 Claude 给出的思考过程,可以反向验证我们的输入是否完整和准确,是否清晰易懂,从而反向提高我们的表达能力。
一、背景
DeepSeek R1 凭借其在复杂推理任务中的卓越表现引发了业界关注,近期非常火爆。这款模型采用强化学习方法训练,具备处理数万字长思维链的能力,在数学和编程等逻辑任务中的表现可与 OpenAI 的 o1 模型相媲美。更重要的是,它公开了完整的推理过程,保证了技术的透明度。通过算法创新和硬件架构优化,DeepSeek R1 实现了显著的成本降低。该模型还配备了 660B 参数的深度思考模式和联网搜索功能,特别适合私有化部署和实时信息处理场景。
反观 Anthropic 自从去年 6月之前发布了 Claude 3.5 Sonnet 以后没啥动静了,对于当初被 Claude Artifacts 惊艳到而开通了 Claude 会员的同学瞬间感觉自己手中会员不香了。客观来说,Claude 会员确实提供了不少实用功能:可以使用最新的 Claude 3.5 Sonnet、支持自定义 Projects、享受 Claude Artifacts 等便捷服务。但作为 DeepSeek-R1 的爱好者,我更希望在使用 Claude 时也能体验到类似 DeepSeek-R1 的深度思考特性,让模型的推理过程更加透明化。
于是乎,我在想:如果能够在 Claude 上体验到 DeepSeek-R1 的“效果”岂不是完美?
注意: 本文主要站在大模型使者的角度,通过提示词工程实现使用“效果”上的“复刻”
二、“复刻” DeepSeek-R1 的“效果”
DeepSeek-R1 的特点是先展示深度思考过程,再给出最终答案。要在 Claude 上实现类似效果,我们需要调整 Claude 思考逻辑,让它先模仿 Claude 的典型思考框架输出推理过程,再给出结论,同时用 markdown 引用标签来展示思考过程。
2.1 找现成的资料
在搜索 Claude 复刻 DeepSeek-R1 的提示词的过程中,除了一篇 Claude 官方关于 CoT 的论述:《Let Claude think (chain of thought prompting) to increase performance》 外,未发现其他实用的提示词资源。
这篇文章指出,在处理复杂的研究分析和问题解决任务时,给予 Claude 充分的思考空间能显著提升其表现。这种被称为思维链(CoT)的提示技术,通过引导模型逐步分解问题,可以产生更精确和深入的结果。
思维链的优势:
- 准确性:通过逐步解决问题降低错误率,尤其适用于数学、逻辑和复杂分析任务
- 连贯性:结构化思考有助于形成逻辑清晰、组织完善的回答
- 调试:观察思考过程便于发现提示词中的模糊之处
使用限制:
- 较长的输出可能导致响应延迟
- 简单任务无需深入思考,应权衡性能和延迟
文章还提供了使用 <thinking>
和 <answer>
xml 标签来区分推理过程和答案的结构化提示示例。
这些资料虽然不能直接帮助我们复刻 DeepSeek-R1,但启发我们要根据具体场景来判断是否需要模型进行深度思考。
2.2 失败的案例
既然没有现成好用的提示词,还是自己动手吧!
基于 2.1 中的结构,采用结构化方式编写提示词,详细说明任务要求,并将 DeepSeek-R1 的官方输出作为示例供 Claude 3.5 Sonnet 参考。
## 任务
在回答问题之前请先 think step by step,并将你思考的内容放在 <thinking> 标签中,换行后给用户输出最终的结果。
注意 <thinking> 后和 </thinking> 前都要加上换行符。
最终的输出结果中可以适当使用多级标题、序号、换行、加粗、分割线等 markdown 标记让结果的可读性更强。
## 例子
### 例子1
用户输入:
有没有和《源代码》、《黑客帝国》、《创战纪》类似的科幻片推荐一下
你的输出:
<thinking>
好吧,用户让我推荐类似《源代码》、《黑客帝国》、《创战纪》的科幻片。首先,我需要分析这几部电影的共同点。这三部电影都涉及到虚拟现实、人工智能、时间循环、意识上传或者数字世界这样的主题。比如,《黑客帝国》是关于人类被困在模拟现实中的故事,《源代码》涉及时间循环和意识传输,《创战纪》则是数字世界的冒险。
用户可能喜欢高概念科幻,带有哲学思考,紧张的情节以及视觉冲击力强的电影。我需要考虑推荐那些探讨类似主题,或者有相似叙事结构的电影。同时,用户可能已经看过一些主流作品,所以可能需要推荐一些稍微不那么知名但质量不错的片子。
接下来,我需要回顾自己知道的科幻电影库。比如,《异次元骇客》探讨虚拟现实;《盗梦空间》的多层梦境;《全面回忆》的虚拟身份;《超验骇客》里的意识上传;《普罗米修斯》虽然更多是太空恐怖,但涉及人类起源;《阿基拉》和《攻壳机动队》是经典的赛博朋克动画;《湮灭》的未知领域和身份认知;《升级》的科技控制;《感官游戏》的虚拟游戏;《云图》的多重叙事;《月球》的克隆和孤独;《她》的人机关系;《银翼杀手》系列的复制人主题;《头号玩家》的虚拟世界冒险;《十二猴子》的时间旅行。还要包括剧集,比如《黑镜》和《西部世界》。
需要考虑每部推荐的电影是否紧密符合用户的喜好,比如《雪国列车》可能更偏向社会寓言,但如果是《时间规划局》或者《明日边缘》这样的时间循环电影可能更合适。但用户提到了《源代码》,所以时间循环或意识传输是关键。同时,视觉效果强的电影如《创战纪》可能需要推荐画面风格独特的作品,比如《银翼杀手2049》。
还要检查是否有遗漏的电影,比如《感官游戏》可能比较小众,但符合虚拟现实的设定。另外,是否包括较新的电影,比如《升级》是2018年的,可能用户还没看过。同时,考虑不同地区的电影,比如日本的《阿基拉》和《攻壳机动队》。
最后,整理这些推荐,按照主题分类,并给出简短的推荐理由,说明为什么它们和用户提到的电影类似。确保推荐的数量足够,但不过多,大概15-20部左右。可能还需要注意剧集的推荐,用户可能想要电影,但黑镜和西部世界是剧集,应该分开说明。
</thinking>
根据你提到的《源代码》《黑客帝国》《创战纪》的科幻风格,推荐以下作品。这些电影或剧集大多涉及虚拟现实、人工智能、意识上传、时间循环、数字世界等硬核科幻概念,兼具哲学思考与视觉冲击:
---
### **高概念科幻电影推荐**
1. **《异次元骇客》(The Thirteenth Floor, 1999)**
- **关键词**:虚拟世界、身份认知
- 比《黑客帝国》更早探讨“虚拟现实嵌套”的作品,剧情反转经典。
2. **《盗梦空间》(Inception, 2010)**
- **关键词**:多层梦境、意识入侵
- 诺兰的标志性烧脑叙事,探讨梦境与现实的边界。
3. **《全面回忆》(Total Recall, 1990/2012)**
- **关键词**:记忆植入、身份解谜
- 施瓦辛格版更狂野,2012版视觉更贴近《创战纪》风格。
4. **《超验骇客》(Transcendence, 2014)**
- **关键词**:意识上传、AI觉醒
- 约翰尼·德普将意识注入网络的哲思科幻。
5. **《普罗米修斯》(Prometheus, 2012)**
- **关键词**:人工智能、人类起源
- 视觉美学与《创战纪》同源的太空史诗,法鲨的仿生人堪称经典。
6. **《湮灭》(Annihilation, 2018)**
- **关键词**:未知领域、自我毁灭
- 克苏鲁风格的心理惊悚,探讨生命形态的异化。
7. **《升级》(Upgrade, 2018)**
- **关键词**:AI控制、赛博格复仇
- 小成本科幻黑马,动作设计堪比《黑客帝国》。
8. **《感官游戏》(eXistenZ, 1999)**
- **关键词**:虚拟游戏、虚实混淆
- 大卫·柯南伯格的邪典之作,层层嵌套的脑洞世界。
9. **《云图》(Cloud Atlas, 2012)**
- **关键词**:轮回宿命、文明寓言
- 跨时空叙事,探讨自由意志与系统压迫。
10. **《月球》(Moon, 2009)**
- **关键词**:克隆伦理、孤独觉醒
- 极简设定下的心理震撼,媲美《源代码》的封闭空间叙事。
11. **《她》(Her, 2013)**
- **关键词**:人机情感、未来孤独
- 温柔而孤独的科幻小品,探讨AI的情感可能性。
12. **《银翼杀手2049》(Blade Runner 2049, 2017)**
- **关键词**:复制人觉醒、末日美学
- 视觉与哲学的双重盛宴,延续前作的赛博朋克世界观。
13. **《头号玩家》(Ready Player One, 2018)**
- **关键词**:虚拟世界冒险、流行文化狂欢
- 斯皮尔伯格对元宇宙的浪漫化诠释。
14. **《十二猴子》(12 Monkeys, 1995)**
- **关键词**:时间旅行、宿命悖论
- 特里·吉列姆的荒诞末世,非线性叙事的经典。
---
### **动画与赛博朋克经典**
- **《阿基拉》(Akira, 1988)**
日本赛博朋克鼻祖,预言式末世寓言。
- **《攻壳机动队》(Ghost in the Shell, 1995)**
意识与机械的哲学思辨,直接影响《黑客帝国》。
---
### **剧集延伸**
- **《黑镜》(Black Mirror)系列**
单集独立故事,探讨科技对人性的异化(推荐S3E4《圣朱尼佩洛》)。
- **《西部世界》(Westworld)系列**
AI觉醒与乐园崩塌,叙事复杂度堪比《黑客帝国》。
---
### **补充说明**
若你偏爱《源代码》的时间循环,可延伸观看《明日边缘》《恐怖游轮》;若更爱《创战纪》的视觉美学,推荐《电子世界争霸战》(1982年原版)和《异星觉醒》的霓虹光影风格。
如果需要更具体的类型细分(如侧重哲学、动作或悬疑),可以进一步补充需求,我会调整推荐方向!
实际测试表明效果并不理想。
2.3 优化后的提示词
为找出问题根源,借鉴稀土掘金平台《系统掌握大语言模型提示词- 从理论到实践》中的提示词调优技巧,直接向 DeepSeek-R1(满血版)寻求建议。
我构造的提示词如下:
我主要使用 Claude 3.5 Sonnet 模型,我想让它可以模拟 DeepSeek-R1 的深度思考过程,我的提示词如下:
<这里省略 2.2 中的提示词>
你认为上述提示词可以模拟出 DeepSeek-R1 的深度思考过程吗?你有什么改进建议吗?
DeepSeek-R1 分析了当前提示词的优势:
- 结构清晰,明确任务和示例要求,强调先思考后回答
- 运用标签和 Markdown 格式化,确保输出结构化
- 示例中的思考过程详实,涵盖问题分析、推理逻辑和分类思路
同时指出可改进方向:
- 思考深度控制:加强对问题本质的深入拆解,特别是用户潜在需求分析
- 思维框架标准化:引入具体思考步骤模板
- 认知过程显性化:突出专业知识调用过程和逻辑链完整性
- 错误纠正机制:增设误区预判和验证环节
- 领域适配性:根据不同问题类型设计相应思考模式
- 术语准确性:提升专业术语使用的精确度
DeepSeek-R1 建议的思考流程架构:
## 思考流程要求
请严格遵循以下思考路径:
问题解构:分析用户问题的显性需求与潜在需求
知识图谱:调用相关领域的结构化知识体系
逻辑推演:构建至少三条解决方案路径并评估优劣
风险预判:识别可能的认知偏差或信息盲区
验证机制:通过反向推理验证结论合理性
表达优化:根据用户身份特征调整表达方式
对比发现,DeepSeek-R1 提供的思考路径与其满血版思考路径高度一致。基于这一发现,在任务设计中采纳了这套思考框架,同时选用更具代表性的示例,并注意保持思考内容的口语化表达特点。
经过反复测试和优化,最终确定了更新版本的提示词:
## 任务
在回答问题之前请先按照“思考流程要求”进行思考,并结合“示例”中的表达方式,将你思考的内容放在 [思考开始] 和 [思考结束] 中间,换行后给用户输出最终的结果。
注意:[思考开始] 和 [思考结束] 和中间(包含[思考开始] 和 [思考结束] )的每一行的内容前都要加上 markdown 的 > 标识,并且务必加上必要的换行。思考中的内容请采用相对口语化的风格进行描述。
## 思考流程要求
请严格遵循以下思考路径:
问题解构:分析用户问题的显性需求与潜在需求
知识图谱:调用相关领域的结构化知识体系
逻辑推演:构建至少三条解决方案路径并评估优劣
风险预判:识别可能的认知偏差或信息盲区
验证机制:通过反向推理验证结论合理性
表达优化:根据用户身份特征调整表达方式
## 参考示例
用户输入:我有个朋友让我问,怎样才能找到女朋友?
你的回答:
> [思考开始]
> 嗯,用户的朋友想知道怎么找女朋友。首先,我得考虑用户可能的情况。用户的朋友可能比较害羞,或者社交圈子小,或者不知道如何开始。需要从多个方面给出建议,比如自我提升、扩大社交圈、有效沟通等等。
>
> 然后,可能用户自己就是那个朋友,不好意思直接问,所以用朋友的名义。这时候要避免让用户感到被评判,保持建议的友好和实用性。
>
> 接下来,要分点回答,但先得组织好逻辑顺序。自我提升是基础,因为自信和内在价值很重要。然后是扩大社交,因为得有机会认识人。接着是沟通技巧,如何建立联系。最后是保持真诚,不能急于求成。
>
> 可能还需要提醒不要过于急躁,感情需要时间培养。同时,避免一些常见的误区,比如一味讨好对方或者不尊重对方的意愿。还要注意线上和线下的结合,比如社交软件和兴趣活动相结合。
>
> 另外,用户可能没有说出来的深层需求,比如如何保持长期关系,或者如何判断对方是否合适。不过当前问题主要是如何找到,所以先集中在前期阶段。但可以稍微提到真诚相处是长期发展的基础。
>
> 需要确保建议具体可行,比如参加什么活动,如何提升自己,沟通时的注意事项。避免太笼统,比如只说“多出去走走”而没有具体方法。
>
> 最后,用鼓励的语气收尾,让用户的朋友保持积极心态,同时耐心等待合适的缘分。可能还要提到自我接纳,先爱自己才能更好地爱别人。
> [思考结束]
你的朋友想找到合适的伴侣,可以从以下几个方向入手,核心在于**自我提升、主动社交、真诚沟通**的结合:
---
### 1️⃣ **先成为「更好的自己」**
- **提升内在**:培养兴趣爱好(阅读、运动、艺术等)、保持学习习惯,丰富自己的精神世界,聊天时自然有话题深度。
- **外在管理**:保持整洁得体的形象,无需过度精致,但需体现对生活的认真态度。
- **情绪价值**:练习倾听、共情能力,避免过度自我中心,让人感到相处舒适。
---
### 2️⃣ **拓展社交圈:增加相遇概率**
- **线下渠道**:参加兴趣类活动(徒步、桌游、读书会)、行业交流会、志愿活动,认识志趣相投的人。
- **线上渠道**:善用社交软件(明确标注兴趣标签),但需保持警惕,初期建议从公共场合见面开始。
- **朋友介绍**:主动告知单身状态,靠谱的朋友推荐往往匹配度更高。
---
### 3️⃣ **沟通技巧:自然推进关系**
- **破冰阶段**:从共同话题切入(比如活动内容、对方朋友圈动态),避免查户口式提问。
- **深度交流**:适当自我暴露脆弱或幽默感,展现真实性格,同时观察对方三观是否契合。
- **分寸感**:初期避免过度频繁联系,尊重对方回应节奏,保持松弛感。
---
### 4️⃣ **关键心态调整**
- **拒绝「任务心态」**:把认识新朋友当作丰富生活的方式,而非必须「成功脱单」。
- **接受不确定性**:对方不回应未必是你不够好,可能只是需求不匹配。
- **专注当下**:约会时放下手机,真诚关注对方,比套路更打动人。
---
**提醒**:健康的感情建立在双向吸引上,与其费心讨好,不如用个人特质筛选真正适合的人。过程中保持自我反思,但不必过度自责——对的人出现时,往往比你想象中自然。
用几个问题验证了一下,发现效果符合预期。
而且有了思考链路的加持,有些原本容易做错的题目,也有较大概率可以推理正确。
做戏就要做全套,我们直接把 Project 命名为 DeepSeek-R1 满血版,情绪价值拉满。这样我们既实现了思考过程的显性化,还有 Claude Artifacts 神器在手,瞬间感觉手里的 Claude 会员又香了起来。希望 Claude 4.0 早点出来,能够带来点新的惊喜。
当然,上述提示词可能并不完美,大家也可以根据自己的想法继续优化。
三、一点看法
3.1 关于本次“复刻” 的意义
最近很多大厂的同学使用 DeepSeek-R1 的目的是学习其思考逻辑。通过提取其思考模式,我们获得了更大的收益。
这次“复刻”致力于引导 Claude 采用接近 DeepSeek-R1 的一种典型思考路径,在使用 Claude 时也可以显式地展现大模型的思考过程,使思考过程更加透明。通过观察大模型的推理过程,提高使用大语言模型的趣味性,能帮助我们验证输入信息的准确性、完整性,反思自己表达的清晰度,进而培养自己逻辑的严谨性,提升语言表达能力。
同时,本文展示了提示词的编写和调优过程,展现了提示词工程在不支持深度思考的大模型中的应用价值。
3.2 DeepSeek-R1 对提示词工程的冲击
DeepSeek-R1 发布后,市场出现了"提示词工程已死"的声音。以下两篇文章对此有较为客观的分析:
DeepSeek-R1 改变了提示词工程的范式,但并未完全消除其重要性。模型输出的上限取决于用户的提问质量,提示词技巧则保证了回复质量的下限。真正的突破来自于用户的思考深度和表达能力,包括逻辑清晰度和需求定义精准度。
传统提示词技巧如思维链和角色扮演在 DeepSeek-R1 中的应用减少,提示词结构趋于简化。但提供充分的上下文信息(如需求的背景、目标设定、约束条件等)仍是确保模型输出质量的基础。值得注意的是,在这类推理模型中,示例的使用可能反而降低效果。正如《系统掌握大语言模型提示词- 从理论到实践》中提到的:示例应遵循从无到有,从少到多循序渐进的原则。
DeepSeek-R1 推动提示词工程从"技巧依赖"转向"精准表达"。用户需要深入理解模型特性,在简洁沟通与策略引导间取得平衡。
随着模型能力的不断增强,模型的知识储备、理解能力等远超我们,我们和 AI 交流时更多地是 AI 对我们向下兼容,想要更高效地沟通,我们依然需要更好地表达自己的需求。提示词工程不只是思维链,更是一种沟通交流的艺术依然具有存在的意义。在更加个性化的和复杂的场景中,提示词工程依然会发挥更大的作用。
3.3 为什么你还不弃坑 Claude?
很多事情并不是非此即彼的, DeepSeek-R1 的确更先进,我也不排斥使用甚至喜欢 DeepSeek-R1。我即是 DeepSeek 的深度爱好者,也是 Claude 的深度使用者。官网使用 DeepSeek-R1 目前不稳定,经常无法访问。Claude 3.5 Sonnet 在个别基准测试中高于 DeepSeek-R1; Claude 支持定义 Projects ,预置提示词以后,直接对 Project 提问即可,避免了重复任务每次需要粘贴提示词的不便,可以设置知识库,对知识库的提取更准确,支持更长的上下文窗口;Claude 支持 Artifacts 可以实现 SVG、前端页面的渲染让交互式和可视化的学习成为可能。
Claude 4.0 也已经有点风声,或许在 25年也将会发布,能带来一些新的惊喜。
四、总结
本文从用户需求出发,通过精心设计的提示词工程,在 Claude 3.5 Sonnet 上实现了类似 DeepSeek-R1 的思考过程可视化。尽管无法完全复制 DeepSeek-R1 的深度思考能力,但这次尝试探索出一种提升人机交互透明度的创新方法,让我们能更清晰地观察和理解 AI 的推理过程。
在实际应用中,这种思考过程的可视化带来了多层面的价值:
- 提升沟通效率:通过观察模型的思考过程,我们可以反向验证输入信息的准确性和完整性,不断优化自己的表达方式。例如,当我们发现模型理解偏差时,能够及时调整提问策略。
- 促进思维成长:对比自己与模型的思考路径,我们能发现自己思维中的盲点和不足。这种比对学习帮助我们建立更系统的思考框架,培养更全面的问题解决能力。
- 深化学习体验:模型展示的结构化思维方式,为我们提供了一个"思维导师",指导我们如何更有条理地分析问题、构建解决方案。
这次实践也为提示词工程带来了重要启示:优秀的提示词并非一蹴而就,而是在反复调优和实践验证中逐步完善;在设计过程中,充分理解目标模型的特点并参考其反馈至关重要。这表明在新一代大模型时代,提示词工程正从简单的技巧积累,转向一门助力用户优化表达、理解模型思维的系统化方法。
展望未来,随着大模型能力的持续提升,这种透明化的思考过程不仅能帮助个人提升认知水平,更将在教育培训、决策支持等领域发挥重要作用。它提醒我们:与其专注于获取现成答案,不如通过理解和吸收 AI 的思维方式来促进自身成长,这才是人机协作的更高境界。