O1初体验，所见所感

StellaFortuna · 2024 年9 月 15 日 09:37

在微信群说了一点，引用过来
Screenshot_2024-09-15-17-24-01-01_e39d2c7de19156b0683cd93e8735f348

变化真的太大了
有很多可以说的地方

可以理解为什么官方说“新模型不再兼容旧提示词，甚死可能适得其反”了
New站不允许自定义聊天风格，于是直接把Q_S-A-C提示词发送给他并附加问题思考深深路径和重复迭代的效果似乎是被他尝试在“思考”中完成了，但现在只有他知道他干了什么，思考的预览也只是一个像是第三方讲述思考过程的概括，具体的内容他不告诉我比如有一段思考内容是“正在考虑三条路径” 然后就开始下一段思考内容了…
似乎在思考的过程中他已经回答过一遍问题了，在思考结束之后把最终答案输出给我们但这一切还是个谜题
整体给我的感觉是更呆滞笨拙了，未来应该会优化
相比于思考，我感觉他的能力方面确实是提了一个台阶，不再是GPT4级别了
在某些大模型榜单中，新模型已经以IQ120遥遥领先(claude IQ90，世界第二…)

老样子，让他为标签狂人创建个人主页

…

不建议大家去读所谓的思考过程内容
太晦涩难懂(上图所示的思考过程还勉强是个流畅的句子)

最终的个人主页是这样的，改了三遍，每次都无限次强调核心美观要素

…
亮点是代码中也充斥着标签…
这无法掩盖他第二次代码也只有不到100行的残酷事实
思考中他的确想到并尝试添加鲜艳的色彩，但事实是回答中他没有这么做…
这是很奇怪的现象

全文告终

Tim88 · 2024 年9 月 15 日 09:40

期待后续能更优化！ Q_S-A-C 目前用起来很棒

CRI4250 · 2024 年9 月 15 日 09:40

感谢你的分享

xx13295 · 2024 年9 月 15 日 09:45

感谢fen分享

ayt407123 · 2024 年9 月 15 日 09:48

大佬一直在为科研奋斗支持大佬！

kurokuro · 2024 年9 月 15 日 09:50

看着有点像思维链但是他这个感觉还不如我自己写思考步骤

Lain1984 · 2024 年9 月 15 日 10:04

之前试过大部分主流大模型的翻译，英语和日语的翻译已经很人话了，不过除了gemini 1.5 pro的引申义和特定结构几乎全军覆没，还有日语代词问题，不知道新模型能不能更进一步

RichardChou · 2024 年9 月 15 日 10:10

谢谢分享，一个好的开始

StellaFortuna · 2024 年9 月 15 日 10:25

意外之喜是在new站里面还可以使用语音对话，它同样会思考但思考的很快

user3 · 2024 年9 月 15 日 11:12

感谢你的分享

BuDs · 2024 年9 月 15 日 13:35

感觉 o1 - preview 有点过誉了

做数理化确实比之前好一些而

然而一些深度的逻辑推演依然没有追上人类平均水平

joegodwanggod · 2024 年9 月 15 日 13:44

Qsac是啥佬能說說明嗎

LostMyHead · 2024 年9 月 15 日 13:46

这个吧，他这个命名我都看懵了

joegodwanggod · 2024 年9 月 15 日 13:55

多謝已大懵去寫作業了

idkbungle · 2024 年9 月 15 日 14:00

感觉确实不太成熟，赶鸭子上架的感觉

handsome · 2024 年9 月 15 日 15:05

期待一手以后吧

StellaFortuna · 2024 年9 月 15 日 15:07

可以看一下官方发的帖子，preview在大多数能力上和真正的o1相差30%

StellaFortuna · 2024 年9 月 15 日 15:08

Quiet-STaR是"Quiet Self-Taught Reasoner"的缩写，可以理解为"安静的自学推理者"。这个名字恰如其分地描述了该技术的核心理念：让AI在不显式表达的情况下，学会自主推理。

feahter · 2024 年9 月 19 日 06:43

红衣大炮说o1,背后至少3种模型在起效，负责推理的无限制模型，负责简略摘要的总结模型，和负责输出审查的对话模型，过三层以强化学习+思维链的方式来获得新的推理范式，核心是跳过了对齐结果，创新地选择了对齐过程。

话题		回复	浏览量
Quiet_STaR‖多次迭代回答【版本代号A】【ByQ_S研究师】资源荟萃 Prompt , 人工智能	138	3014	2024 年9 月 19 日
幽默思考‖Q_S-YM-A来啦‖基于Q_S-A-C【By Q_S提示研究师】资源荟萃人工智能	23	305	2024 年8 月 31 日
【表现谁牛逼的时候来了~】随着互联网的普及、人工智能的应用，越来越多的问题能很快得到答案。那么，我们的问题是否会越来越少？搞七捻三	37	895	2024 年6 月 7 日
GPT带来的一些思考搞七捻三 ChatGPT , OpenAI , Copilot	34	660	2024 年7 月 24 日
星系列提示词合集(可一键导入NextChat)‖提示词之路回顾资源荟萃 Prompt , 人工智能	25	306	2024 年9 月 5 日

O1初体验，所见所感

相关话题