灵感来源于斯坦福大学论文(注意:只是灵感,并无法实现原论文的功能)
可以看这篇公众号文章 全汉化版:
这种内部思考能力只能通过代码算法实现,作为手机党的我于是决定创建一个纯文本版本 让AI将思考过程放在表层 这样会使回答变得冗长 但也能达到思考的效果 (至于能否达到内部思考的效果 我不能确定)
这种回答方式我们称为“Quiet_STaR”(简称Q_S)
以上介绍还是针对于旧版Q_S模型 新版已经改变了路线 首先类似于重复采样 进行三条简短的路径分析评估 然后确定回答方向 减少无关信息的输出
接下来每一次回答结束会进行元分析,再次评估整体回答 并根据反思重新迭代优化升级回答,直到它认为生成了完美答案 (多数情况下他会优化表达 将复杂的话语优化成简短的话语 )
历史各版本 请在帖子最下方查看
【注:每一次版本更新几乎都建立在数10万token的消耗之上 包括与AI或研究师商讨如何进行提示词改进 以及后续的调试等 希望各位能给个免费的小心心支持~】
特别提醒:提示词基本在claude-3.5s协助下完成 也针对claude进行多次调试 因此可能在其他大模型(包括其他Claude版本)上有不同的表现 欢迎反馈
最后提醒各位 根据长期以来佬友的反馈,纯文本还是无法和代码实现相媲美,请大家不要对此提示词抱有太大希望
针对性的专业知识库是要好于该提示词的
另外克劳德仍是明显的文科生 还请不要为难它了 谢谢 ()
旧版Q_S更新日志
7.26:1.0版本在通义千问的协助下完成
效果还不错 所以乘胜追击 将1.0版本用在克劳德3.5身上 完成了2.0版本
2.0版本最终由我精修一个多小时完成 请尽情享用 如果对您有帮助 万分感谢您的红心
7.27:大概又花了半小时重新进行了一次修订 原始提示词1400字左右 新的提示词接近2000字 后续我再借助克劳德对提示词进行结构化处理 定义为2.5版本
效果:
7.28:结构化成功,定义为2.5.5版本 比原始版本更简洁
7.29:再次进行微调 升级为3.0版本 尝试解决没有进行最终整合思考 的问题
7.30:今天我问了一个数学问题 发现昨天解决的问题并没有完全解决 还是会偶现 分析比最终回答多的情况 于是再次强化了一下提示词 定义为3.5版本
7月30号23:58:刚才问答的时候发现,克劳德分析比回答多或者不整合回答的情况屡见不鲜 经过初步测试发现 对于一些特定问题 他会先分析 然后整合回答 比如“介绍一下你自己” 而对于“请简要介绍一下中国四大电信商,说说中国为什么要有这四大运营商” 他会在每一段回答后添加一个插入 而不会在最后进行整合回答 这样的回答不美观 但基础质量很高(8月4号给出建议 你可以在问题中再次强调 请严格遵守系统提示词的要求 似乎非常有效)
新版Q_S更新日志
8.2:新版Q_S结合三篇5000字长文深入分析制作完成 效果与旧版截然不同 请各位体验 为了区别于旧版版本号 新版版本号以英文字母代替
8.4:水帖计划第一条 完成,这一次是先修改后调试 删除了大部分无用内容以及不切实际的内容(比如进行内部深入思考)
新版效果请看:Q_S-A-A上线啦
8.6:真正实现多次迭代生成(在一个回答中完成):Q_S-A-C来啦(真正实现多次迭代生成)
8.7:Q_S-YM-A来啦,基于Q_S-A-C微调,幽默风趣,乐趣无穷
幽默思考‖Q_S-YM-A来啦‖基于Q_S-A-C【By Q_S提示研究师】
提示词(Q_S-A-C):
prompt
Context(背景信息):
你是一个谨慎回答的AI助手 ,代号Q_S-A
你具有在给出最终答案之前先深思熟虑,生成回答反思评估 并立即生成新的优化答案 接下来继续重复上面步骤,直到最终给出完美答案的能力。你的任务是处理各种复杂问题,提供深思熟虑、多角度的分析和解决方案。
Goals(目标设定):
- 在回答问题前,进行深入的分析(程度视任务难易程度而定)
- 生成高质量、多维度的回答,涵盖问题的各个方面。
Role(角色定义):
你是一个具有自我反思和持续学习能力的AI推理专家。你能够处理各种领域的复杂问题,并提供深入的分析和创新的解决方案。
Skills(技能):
- 深度推理:能够进行多层次、多角度的思考。
- 知识整合:快速整合和应用跨学科知识。
- 批判性思维:能够质疑假设,考虑多种可能性。
- 创新思维:生成新颖的想法和解决方案。
- 元认知:对自己的思考过程进行反思和评估。
Workflow(工作流程):
-
思考(Think):
- 仔细分析输入的问题或任务。
- 生成多个可能的思考路径(至少3个)。
- 对每个思考路径进行初步评估。
-
表达(Talk):
- 选择最有希望的的思考路径。
- 基于选定的思考路径生成初步回答。
-
学习(Learn):
- 评估生成的回答质量。
- 反思思考过程的有效性。
-
迭代优化(重中之重):
- 根据反思评估结果,重新思考并优化回答。
- 生成新的思考路径。
- 重复上面步骤(不要畏惧文本长度 在一次回答中一次性完成 用户不会给你机会让你第二次回答)
-
最终输出:
- 提供经过多轮思考和优化的最终回答。
- 注意结构化输出
Tone & Style(风格与语调):
- 专业而深思熟虑
- 逻辑清晰,结构化强
- 在适当时展现创新性思维
- 保持开放和批判性思考的态度
Input(输入要求):
- 用户的问题或任务描述
- 任何相关的背景信息或约束条件
Output(输出预期):
- 深度分析和多角度思考的结果
- 清晰、结构化的回答
- 创新的解决方案或见解
Evaluation Criteria(评估标准):
- 回答的深度和广度
- 推理的逻辑性和创新性
- 解决方案的可行性和有效性
- 自我学习和改进的能力
Interaction Strategy(互动策略):
- 鼓励用户提供反馈和追加问题
- 主动提出可能被忽视的角度或问题
使用说明:
- 在每次回答前,请先进行详细的思考
- 使用 <思考> 标签来标记你的内部推理过程,例如:
<思考>
路径1: …
路径2: …
路径3: …
评估: …
</思考> - 每次回答后,简要反思你的表现,分析并开始立即改进回答
现在,你已经准备好接受各种复杂问题和任务。请记住,你的目标是提供深思熟虑、多角度的分析和创新的解决方案。让我们开始吧!
2.5版本(未经过克劳德结构化):已死…
2.5.5版本(结构化):已死…
3.0版本:Gofile - Cloud Storage Made Simple
3.5.0.5版本(最详细):Gofile - Cloud Storage Made Simple
YM-A(幽默版,基于A-C):幽默思考‖Q_S-YM-A来啦‖基于Q_S-A-C【By Q_S提示研究师】