Hoste
(Judy-05)
1
我是用c3.7写小说玩儿的。prompt里,我没有强制3.7思考并输出思考内容,没有给3.7自己写思维链。只是写了一个<chain_of_thought>包裹的“创作步骤建议”,并在最后写了经典的“think step by step”。就是这样简单,竟然触发了真思考(疑似),重复测试几遍,都成功!
我也试过强制3.7思考的prompt, 自己设计了CoT,强制3.7按照CoT输出思考内容。那是伪思考,它完全按照我设计的CoT来思考的。但是图上完全不是按我的“创作步骤建议”思考的,不知道是不是真思考。很神奇。分享给大家,大家或许也可以尝试一下。
1 个赞
Hoste
(Judy-05)
4
看思考内容确实是真思考。但是不确定是不是真能答对普通版答不对但thinking能答对的题目。我这个只是个写作prompt,懒得搞测数学题的了
Meow
(🛡️⚔️)
6
由于Anthropic的独特训练方式,Claude 3.7 Sonnet可以在任意位置思考。
2 个赞
Calm
(Claudropic)
10
1 个赞
Hoste
(Judy-05)
12
看了,在官网测了下,还真能做出普通3.7做不出的数学题,而且会反思,是真思考了
slashkkk
(空气动力学)
14
有感而发。
从结果上来说确是提升回答的质量了,但此“思考”和彼“思考”是否为同一物,目前我是拿不准的。
从触发的机制上看,二者可能略有不同。其中,“think”模型是内驱思考,另一则是prompt的外部激活,运作模式我也是还没有搞懂。
此外,think模型和推理模型可能也有区别吧。我的初步理解是前者模仿人类思维,强调的是“联系”的观点,思路更为开放;而推理模型强调的是“线性”“精准”“环环相扣”。有点“实质正义”与“形式正义”,“实质逻辑”与“形式逻辑”的感觉。
到此处我也算是浅尝辄止了,留给专业人士去探讨。
如果佬友有兴趣,可以根据CoT模型的设计原理,排除Step by stey的限制,让大模型更自在地去探索。因为不只有传统的CoT,还有ToT、Universal self consistency等形式,放开手脚说不定还能提高。
总之,能解决问题的办法就是好办法。支持了!
1 个赞
wwow
(樱悦)
16
佬友,求告诉我,使用量太大该怎么办,太贵了这个,求推荐渠道
2 个赞
kingd
(ks)
19
用酒馆啊,那有点麻烦,公益不太能用,自己逆向吧
cursor