O1初体验,所见所感

在微信群说了一点,引用过来
Screenshot_2024-09-15-17-24-01-01_e39d2c7de19156b0683cd93e8735f348

变化真的太大了
有很多可以说的地方

可以理解为什么官方说“新模型不再兼容旧提示词,甚死可能适得其反”了
New站不允许自定义聊天风格,于是直接把Q_S-A-C提示词发送给他并附加问题 思考深深路径和重复迭代的效果似乎是被他尝试在“思考”中完成了,但现在只有他知道他干了什么,思考的预览也只是一个像是第三方讲述思考过程的概括,具体的内容他不告诉我 比如有一段思考内容是“正在考虑三条路径” 然后就开始下一段思考内容了…
似乎在思考的过程中他已经回答过一遍问题了,在思考结束之后把最终答案输出给我们 但这一切还是个谜题
整体给我的感觉是更呆滞笨拙了,未来应该会优化
相比于思考,我感觉他的能力方面确实是提了一个台阶,不再是GPT4级别了
在某些大模型榜单中,新模型已经以IQ120遥遥领先(claude IQ90,世界第二…)

老样子,让他为标签狂人创建个人主页


不建议大家去读所谓的思考过程内容
太晦涩难懂(上图所示的思考过程还勉强是个流畅的句子)

最终的个人主页是这样的,改了三遍,每次都无限次强调核心美观要素



亮点是代码中也充斥着标签…
这无法掩盖他第二次代码也只有不到100行的残酷事实
思考中他的确想到并尝试添加鲜艳的色彩,但事实是回答中他没有这么做…
这是很奇怪的现象

全文告终

7 个赞

期待后续能更优化! Q_S-A-C 目前用起来很棒 :face_with_open_eyes_and_hand_over_mouth:

2 个赞

感谢你的分享

2 个赞

感谢fen分享

2 个赞

大佬一直在为科研奋斗:fist:支持大佬! :smiling_face_with_three_hearts:

1 个赞

看着有点像思维链 但是他这个感觉还不如我自己写思考步骤

1 个赞

:face_with_hand_over_mouth:之前试过大部分主流大模型的翻译,英语和日语的翻译已经很人话了,不过除了gemini 1.5 pro的引申义和特定结构几乎全军覆没,还有日语代词问题,不知道新模型能不能更进一步

1 个赞

谢谢分享,一个好的开始

1 个赞

意外之喜是在new站里面还可以使用语音对话,它同样会思考但思考的很快

1 个赞

感谢你的分享

3 个赞

感觉 o1 - preview 有点过誉了

做数理化确实比之前好一些而

然而一些深度的逻辑推演依然没有追上人类平均水平

1 个赞

Qsac是啥 佬能說說明嗎

这个吧,他这个命名我都看懵了

1 个赞

多謝已大懵 去寫作業了

1 个赞

感觉确实不太成熟,赶鸭子上架的感觉

1 个赞

期待一手以后吧

1 个赞

可以看一下官方发的帖子,preview在大多数能力上和真正的o1相差30%

1 个赞

Quiet-STaR是"Quiet Self-Taught Reasoner"的缩写,可以理解为"安静的自学推理者"。这个名字恰如其分地描述了该技术的核心理念:让AI在不显式表达的情况下,学会自主推理。

1 个赞

红衣大炮说o1,背后至少3种模型在起效,负责推理的无限制模型,负责简略摘要的总结模型,和负责输出审查的对话模型,过三层以强化学习+思维链的方式来获得新的推理范式,核心是跳过了对齐结果,创新地选择了对齐过程。

1 个赞