deepseek的r1用着好像prompt加ai

跟我用流传的prompt加tc的prompt得出的回答差不多 :joy:感觉没有o1那种类似“真正”的思考方式

2 个赞

啊?我觉得很像思考诶

你看别人做的数学题

歪一下,种子用户是怎么来的

论坛刚开那个月注册的时候才有

哭了,我是第三个月注册的

单纯的prompt应该达不到这样的效果

用简单问题或者类似“语言游戏”的测试是没有意义的,得用一些逻辑或者数理测试。我昨天一开始用简单代码测试也以为只是做了个工作流,后来用数理分析测试发现没那么简单,他真的实现了一套带反馈的CoT过程

2 个赞

不懂就问,r1是什么?

那段提示词确实跟前几天那个非常火的思维链prompt效果很接近。。。特别是引用框里那段仿人类的思考,味道一模一样。
不过考了他一些问题,确实推理能力和数学能力都有大幅提升,代码能力就不用提了。

没有佬破解一下 r1 的 prompt 么

不是提示词实现的,提示词只能提高下限但是没法拔高上线,推理能力是从模型本身pre train阶段就开始做的