针对o1/o1-pro的降智级别检测

感觉这种方法也不科学

有可能只是你的其他任务简单,这道题的意义就是为了测试他思考上限的,一般任务不会让他到上限,在一分钟以内哪怕几秒也可能是正常的,你可以看看有没有Thought about字样,如果有about的话说明没什么大问题(虽然不排除是否有更细分的降iq系统)

Solve this how to get 24 from 23, 3, 11, 16 by simple addition, subtraction, multiplication and division, using each number once.

这个也可以一试:

这个24点组合是有解的,但并不是每次都能成功算出。


更多类似的prompt自取

1 个赞

是不是openai暗地里修改了
我测这个问题30s都不到
但我今天随便扔给它一个简单的算法题都能干到3min

Thought for就是降了的,Thought about才可能没降(o1pro是进度条就没降)

2 个赞

不如计算器

你这计算器不太行,都是本质相同的解法,写个代码就好了:

1 个赞

今天用o1pro,网页版直接降智到几秒。安卓卡死。ios卡了半小时没反应。
换IP、清cookie后,网页版11m16s。ios卡的对话也恢复了,显示是10分钟左右出的结果。

3 个赞

7分钟


1 个赞

这种prompt是用于测试o1的最大思考时间的 :laughing:

1 个赞

:melting_face: CPP 11ms太虐了

佬有实力的

顶级o1mini


接近4分钟,这是我换了一个相对纯净ip的情况下,感觉有点小降

新号

然后没几小时就开始降智 :laughing:

ratingeater
今天用 o1 pro 的时候发现它直接变成了
“ Request for o1 pro mode
Finished thinking”
这是否是一种降智?

我试了几次Request for o1 pro mode好像都是带进度条的,也能思考比较久,应该不算降智?主要还是得看能力,因为不知道有没有分层降智


确实 谢谢楼主 调了ip立马不降智了

Chat2API思考41秒

2 个赞

佬友看看这个回复是否正确呢?用gemini-2.0-flash-thinking-exp-1219测的,输出了4.7k tokens

不正确的,或许说是完全错误也不为过(?),目前貌似只有o1(pro)可以

1 个赞