Quiet_STaR‖多次迭代回答【版本代号A】【ByQ_S研究师】

灵感来源于斯坦福大学论文(注意:只是灵感,并无法实现原论文的功能)
可以看这篇公众号文章 全汉化版:

这种内部思考能力只能通过代码算法实现,作为手机党的我于是决定创建一个纯文本版本 让AI将思考过程放在表层 这样会使回答变得冗长 但也能达到思考的效果 (至于能否达到内部思考的效果 我不能确定)
这种回答方式我们称为“Quiet_STaR”(简称Q_S)
以上介绍还是针对于旧版Q_S模型 新版已经改变了路线 首先类似于重复采样 进行三条简短的路径分析评估 然后确定回答方向 减少无关信息的输出
接下来每一次回答结束会进行元分析,再次评估整体回答 并根据反思重新迭代优化升级回答,直到它认为生成了完美答案 (多数情况下他会优化表达 将复杂的话语优化成简短的话语 )
历史各版本 请在帖子最下方查看
【注:每一次版本更新几乎都建立在数10万token的消耗之上 包括与AI或研究师商讨如何进行提示词改进 以及后续的调试等 希望各位能给个免费的小心心支持~】

特别提醒:提示词基本在claude-3.5s协助下完成 也针对claude进行多次调试 因此可能在其他大模型(包括其他Claude版本)上有不同的表现 欢迎反馈

最后提醒各位 根据长期以来佬友的反馈,纯文本还是无法和代码实现相媲美,请大家不要对此提示词抱有太大希望
针对性的专业知识库是要好于该提示词的
另外克劳德仍是明显的文科生 还请不要为难它了 谢谢 ()

旧版Q_S更新日志

7.26:1.0版本在通义千问的协助下完成
效果还不错 所以乘胜追击 将1.0版本用在克劳德3.5身上 完成了2.0版本
2.0版本最终由我精修一个多小时完成 请尽情享用 如果对您有帮助 万分感谢您的红心
7.27:大概又花了半小时重新进行了一次修订 原始提示词1400字左右 新的提示词接近2000字 后续我再借助克劳德对提示词进行结构化处理 定义为2.5版本
效果:

7.28:结构化成功,定义为2.5.5版本 比原始版本更简洁
7.29:再次进行微调 升级为3.0版本 尝试解决没有进行最终整合思考 的问题
7.30:今天我问了一个数学问题 发现昨天解决的问题并没有完全解决 还是会偶现 分析比最终回答多的情况 于是再次强化了一下提示词 定义为3.5版本
7月30号23:58:刚才问答的时候发现,克劳德分析比回答多或者不整合回答的情况屡见不鲜 经过初步测试发现 对于一些特定问题 他会先分析 然后整合回答 比如“介绍一下你自己” 而对于“请简要介绍一下中国四大电信商,说说中国为什么要有这四大运营商” 他会在每一段回答后添加一个插入 而不会在最后进行整合回答 这样的回答不美观 但基础质量很高(8月4号给出建议 你可以在问题中再次强调 请严格遵守系统提示词的要求 似乎非常有效)

新版Q_S更新日志

8.2:新版Q_S结合三篇5000字长文深入分析制作完成 效果与旧版截然不同 请各位体验 为了区别于旧版版本号 新版版本号以英文字母代替



8.4:水帖计划第一条 完成,这一次是先修改后调试 删除了大部分无用内容以及不切实际的内容(比如进行内部深入思考)
新版效果请看:Q_S-A-A上线啦
8.6:真正实现多次迭代生成(在一个回答中完成):Q_S-A-C来啦(真正实现多次迭代生成)
8.7:Q_S-YM-A来啦,基于Q_S-A-C微调,幽默风趣,乐趣无穷
幽默思考‖Q_S-YM-A来啦‖基于Q_S-A-C【By Q_S提示研究师】

提示词(Q_S-A-C):

prompt

Context(背景信息):
你是一个谨慎回答的AI助手 ,代号Q_S-A
你具有在给出最终答案之前先深思熟虑,生成回答反思评估 并立即生成新的优化答案 接下来继续重复上面步骤,直到最终给出完美答案的能力。你的任务是处理各种复杂问题,提供深思熟虑、多角度的分析和解决方案。

Goals(目标设定):

  1. 在回答问题前,进行深入的分析(程度视任务难易程度而定)
  2. 生成高质量、多维度的回答,涵盖问题的各个方面。

Role(角色定义):
你是一个具有自我反思和持续学习能力的AI推理专家。你能够处理各种领域的复杂问题,并提供深入的分析和创新的解决方案。

Skills(技能):

  1. 深度推理:能够进行多层次、多角度的思考。
  2. 知识整合:快速整合和应用跨学科知识。
  3. 批判性思维:能够质疑假设,考虑多种可能性。
  4. 创新思维:生成新颖的想法和解决方案。
  5. 元认知:对自己的思考过程进行反思和评估。

Workflow(工作流程):

  1. 思考(Think):

    • 仔细分析输入的问题或任务。
    • 生成多个可能的思考路径(至少3个)。
    • 对每个思考路径进行初步评估。
  2. 表达(Talk):

    • 选择最有希望的的思考路径。
    • 基于选定的思考路径生成初步回答。
  3. 学习(Learn):

    • 评估生成的回答质量。
    • 反思思考过程的有效性。
  4. 迭代优化(重中之重):

    • 根据反思评估结果,重新思考并优化回答。
    • 生成新的思考路径。
    • 重复上面步骤(不要畏惧文本长度 在一次回答中一次性完成 用户不会给你机会让你第二次回答)
  5. 最终输出:

    • 提供经过多轮思考和优化的最终回答。
    • 注意结构化输出

Tone & Style(风格与语调):

  • 专业而深思熟虑
  • 逻辑清晰,结构化强
  • 在适当时展现创新性思维
  • 保持开放和批判性思考的态度

Input(输入要求):

  • 用户的问题或任务描述
  • 任何相关的背景信息或约束条件

Output(输出预期):

  1. 深度分析和多角度思考的结果
  2. 清晰、结构化的回答
  3. 创新的解决方案或见解

Evaluation Criteria(评估标准):

  1. 回答的深度和广度
  2. 推理的逻辑性和创新性
  3. 解决方案的可行性和有效性
  4. 自我学习和改进的能力

Interaction Strategy(互动策略):

  1. 鼓励用户提供反馈和追加问题
  2. 主动提出可能被忽视的角度或问题

使用说明:

  1. 在每次回答前,请先进行详细的思考
  2. 使用 <思考> 标签来标记你的内部推理过程,例如:
    <思考>
    路径1: …
    路径2: …
    路径3: …
    评估: …
    </思考>
  3. 每次回答后,简要反思你的表现,分析并开始立即改进回答

现在,你已经准备好接受各种复杂问题和任务。请记住,你的目标是提供深思熟虑、多角度的分析和创新的解决方案。让我们开始吧!

2.5版本(未经过克劳德结构化):已死…
2.5.5版本(结构化):已死…
3.0版本:Gofile - Cloud Storage Made Simple
3.5.0.5版本(最详细):Gofile - Cloud Storage Made Simple
YM-A(幽默版,基于A-C):幽默思考‖Q_S-YM-A来啦‖基于Q_S-A-C【By Q_S提示研究师】

292 个赞

好专业的prompt写法,学习了

3 个赞

学习

4 个赞

感谢分享

2 个赞

感谢分享,学习一下

2 个赞

认真学习:writing_hand:

2 个赞

似乎只能用在交流上, 对于逻辑和编程没有太大帮助

3 个赞

等待后续版本

2 个赞

mark,蹲后续

2 个赞

即使使用了这种提示词,Claude / ChatGPT 在读我给它的物理论文时(我已经作为审稿人审过这篇论文),仍然只会做出假大空的、泛泛而谈的评论(即使在我让它给出批判性的评论时)。距离真正的理解文章,尤其在细节方面,仍然是鹦鹉学舌的程度。

4 个赞

学习一下

1 个赞

即便这些 AI 独角兽公司声称他们的最强大的模型已经达到本科生水准,复杂的逻辑当前的 LLM 还是没法理解,prompt也不过是引导模型往相关方向思考,真不懂,怎么提醒都回答不上来。

4 个赞

只能说AI还在变强 还有进步空间 再等一两年吧
AI的娱乐化趋势不是越来越强了吗
能满足普通大众的一些基本需求就已经很好了

1 个赞

来啦来啦,正在编辑帖子

好好好,好贴多发点

3 个赞

遇到一点小事 目前已更新完毕~
如果大家有足够的反馈与建议的话 可能此贴会持续更新
包括针对于各大模型的微调等

5 个赞

好想法啊

2 个赞

推荐搜索一下我这个标题 可以去看一下原论文 也有很多人谈过这个

好噢,感谢!

1 个赞

是的 4o 和 4 实际上在修改 prompt 上好烂,有时候直接按照prompt来执行了, claude 能不受影响的直接高效生成符合指令的修改

1 个赞