在多轮对话中发现Gemini1206模拟R1思维链的情况

Moeblack · 2025 年1 月 27 日 02:48

今天看到了这个讨论

我提出我的一个发现。

使用网页R12api在本地聊天保持思维链输出，聊2~3轮之后切换Gemini1206, 在无需额外提示词的介入情况下，1206可以通过自我反思，自我验证等手段提升输出质量，个人感觉有明显提高（我在做小说推理和文字润色）。

xyz1261689132 · 2025 年1 月 27 日 02:52

相当于给Gemini1206提交了上下文R1思维链输出，达到了提升输出质量的效果？

daxia031126 · 2025 年1 月 27 日 02:54

强啊，等一下去试试

purr · 2025 年1 月 27 日 02:54

本质上就是 few shot
你甚至可以提前生成一些很长的general example
直接丢给 gemini
甚至都不需要每次对话了
唯一的问题还是上下文长度上千的prompt确实…
不如直接R1了就

Moeblack · 2025 年1 月 27 日 02:55

R1在文字风格保持方面有待提高，当然，不妨碍他是我的SOTA

而且一个场景写不长，写着写着就强行切换场景

purr · 2025 年1 月 27 日 02:58

没法 cot 抽风也不是一天两天了
gemini 风格也抽象的虽然保持还行但保持的是一种很奇怪的列表式回答
纠正起来也麻烦

Moeblack · 2025 年1 月 27 日 02:58

嗯，就是这样

Moeblack · 2025 年1 月 27 日 03:01

一个案例

xyz1261689132 · 2025 年1 月 27 日 03:01

可以的，相当于利用了deepseek的能力，给其他模型赋能了，如果能探索出高仿deepseek思考的prompt，就更加方便了

davidatls · 2025 年1 月 27 日 03:19

挺详细的思考过程，赞

DFobainx · 2025 年1 月 27 日 03:32

同样的道理聊天中也可以切换其他支持CoT的模型只要上下文在

handsome · 2025 年1 月 27 日 05:08

哇，强呀！

hinayand · 2025 年1 月 27 日 08:55

可能是谷歌吹过的少样本学习？

话题		回复	浏览量
讨论：Deepseek R1的思考过程能否使用prompt来实现高仿搞七捻三人工智能	14	376	2025 年1 月 27 日
分享一个引导第三方DeepSeek-R1思考的system prompt 开发调优人工智能	24	1815	2025 年2 月 10 日
deepseek-reasoner的思考搞七捻三人工智能	12	554	2025 年1 月 21 日
deepseek的r1用着好像prompt加ai 开发调优人工智能 , 纯水	11	513	2024 年12 月 9 日
尽量让你的 deepseek r1 api 思考开发调优 DeepSeek , 人工智能	10	1710	2025 年2 月 6 日