针对o1/o1-pro的降智级别检测

Aliya1 · 2024 年12 月 15 日 15:09

感觉这种方法也不科学

ratingeater · 2024 年12 月 15 日 15:12

有可能只是你的其他任务简单，这道题的意义就是为了测试他思考上限的，一般任务不会让他到上限，在一分钟以内哪怕几秒也可能是正常的，你可以看看有没有Thought about字样，如果有about的话说明没什么大问题（虽然不排除是否有更细分的降iq系统）

carlpayne · 2024 年12 月 16 日 03:08

Solve this how to get 24 from 23, 3, 11, 16 by simple addition, subtraction, multiplication and division, using each number once.

这个也可以一试：

这个24点组合是有解的，但并不是每次都能成功算出。

更多类似的prompt自取

Paolo · 2024 年12 月 16 日 14:33

是不是openai暗地里修改了
我测这个问题30s都不到
但我今天随便扔给它一个简单的算法题都能干到3min

ratingeater · 2024 年12 月 16 日 14:35

Thought for就是降了的，Thought about才可能没降（o1pro是进度条就没降）

Paolo · 2024 年12 月 16 日 14:35

不如计算器

ratingeater · 2024 年12 月 16 日 14:42

你这计算器不太行，都是本质相同的解法，写个代码就好了：

polaris · 2024 年12 月 16 日 14:47

今天用o1pro，网页版直接降智到几秒。安卓卡死。ios卡了半小时没反应。
换IP、清cookie后，网页版11m16s。ios卡的对话也恢复了，显示是10分钟左右出的结果。

di_mo · 2024 年12 月 16 日 14:48

7分钟

carlpayne · 2024 年12 月 16 日 15:47

这种prompt是用于测试o1的最大思考时间的

carlpayne · 2024 年12 月 16 日 15:48

CPP 11ms太虐了

佬有实力的

Paolo · 2024 年12 月 17 日 15:17

顶级o1mini

BGHong7G · 2024 年12 月 18 日 02:16

接近4分钟，这是我换了一个相对纯净ip的情况下，感觉有点小降

carlpayne · 2024 年12 月 18 日 02:20

新号

然后没几小时就开始降智

hanashiro · 2024 年12 月 19 日 08:58

ratingeater
今天用 o1 pro 的时候发现它直接变成了
“ Request for o1 pro mode
Finished thinking”
这是否是一种降智？

ratingeater · 2024 年12 月 19 日 09:46

我试了几次Request for o1 pro mode好像都是带进度条的，也能思考比较久，应该不算降智？主要还是得看能力，因为不知道有没有分层降智

crazyhitman · 2024 年12 月 20 日 03:16

确实谢谢楼主调了ip立马不降智了

F-droid · 2024 年12 月 20 日 03:26

Chat2API思考41秒

carlpayne · 2024 年12 月 20 日 10:40

佬友看看这个回复是否正确呢？用gemini-2.0-flash-thinking-exp-1219测的，输出了4.7k tokens

ratingeater · 2024 年12 月 20 日 11:48

不正确的，或许说是完全错误也不为过（？），目前貌似只有o1(pro)可以

话题		回复	浏览量
一人分享一部你最近在看的动漫（国漫、日漫、美漫等）搞七捻三纯水	198	938	2025 年1 月 17 日
国漫沧元图还是一如既往的强啊搞七捻三动漫 , 影视 , 纯水	23	726	2024 年12 月 8 日
最近看动漫《剑来》感觉太好看了，还有这种动漫剧吗？求推荐搞七捻三快问快答 , 纯水	55	535	2025 年1 月 8 日
大家都看过什么番呢？搞七捻三纯水	123	1268	2025 年1 月 17 日
佬们看动漫吗？搞七捻三动漫	107	836	2024 年12 月 20 日