又是一个拿灰羽连盟开涮（划掉）玩坏 o1 / o1pro 的抛砖引玉

hanashiro · 2025 年1 月 17 日 19:20

首先感谢 chat01.ai 佬的不降智 o1 和 o1 pro 参与本次展示
昨天通过 Sroan 和灰羽字谜的串联发现并不能有效区分 o1 / o1 pro 故出此题

使用 Projects 功能，Project 的标题只使用了一个 “?” 以确保最低程度的干扰
85% 能在 Meta 下回答
10~15% 用 LaTeX 回答
0~5% 出错

o1 pro

然后 o1 的话在默认情况下应该就是迷晕了，会提供一个论证类的示例回答。
80% 的灰羽论证
20% 的 LatTeX 回答

之前的没完全控制的案例

同样的提示词，
o1 (0/5) 不会意识到他需要回答话题而自顾自论证；
o1 pro (4/5) 会意识到自己要回答12个回答的问题。

还在改良.jpg

o1 pro 的正确案例

o1 的翻车案例

下面是佬友征集部分：

o1 pro 的翻车案例

广泛征集 o1 在上面给定的提示词下的过关案例，或者 o1 pro 翻车案例。

wwow · 2025 年1 月 17 日 19:27

佬友好厉害

lueluelue · 2025 年1 月 17 日 19:39

测试一下其他站点的o1 pro

hanashiro · 2025 年1 月 17 日 19:42

整！但是有两个 Constraints:

lueluelue · 2025 年1 月 17 日 19:43

我只试了一次o1 pro，可能是降智了

hanashiro · 2025 年1 月 17 日 19:51

但是这回我控制变量了……在关闭所有自订提示词的情况下在空白项目里提问，我不清楚……

hanashiro · 2025 年1 月 17 日 19:56

chat01.ai 的 o1 肯定没降，我在排除自己那边的其他变量，抱歉.jpg

Naproxen · 2025 年1 月 17 日 23:59

赶在8点前没刷新积分，拿Pro试了一下。这是翻车还是正常？思考了55秒。

lueluelue · 2025 年1 月 17 日 23:59

这应该是正常，我这个可能才是翻车了

handsome · 2025 年1 月 18 日 02:26

强呀大佬！

liulapatuoni · 2025 年1 月 18 日 03:03

我好像知道3lue意有所指

hanashiro · 2025 年1 月 18 日 03:09

征集常见 o1 pro 镜像站

xgfy · 2025 年1 月 18 日 03:20

我也知道

liulapatuoni · 2025 年1 月 18 日 04:03

金主站之外的话，可能知名的也就某水了吧
b站感觉宣传镜像站的多

lueluelue · 2025 年1 月 18 日 11:07

啊哈哈哈哈哈哈！

话题		回复	浏览量
来测试一下你的ChatGPT plus账户有没有被降智。搞七捻三 ChatGPT , OpenAI , 人工智能	42	1321	2025 年1 月 6 日
来压榨o1&o1 pro的极限性能搞七捻三 ChatGPT , OpenAI , 人工智能	32	993	2025 年1 月 20 日
一行提示词 o1普通变pro 前沿快讯人工智能	31	1338	2025 年1 月 22 日
注意站内某人假o1站点搞七捻三 ChatGPT , OpenAI , 人工智能 , 纯水	65	2304	2025 年1 月 23 日
200刀的 ChatGPT pro，我先帮大家尝尝鲜前沿快讯 ChatGPT , 人工智能	143	6102	2025 年1 月 24 日