针对o1/o1-pro的降智级别检测

如今oai风控团队的水准和以前比已经不是一个级别的了,出现了更“智能”的降智系统,可能你的o1-pro/o1能够思考并且识图,但还是被降智,于是有了此贴。能识图但有降智的例子:

该检测的原理非常简单,给o1-pro/o1一个长时间才能完成的复杂任务,根据思考时长判断降智级别,经过我的测试o1-pro思考上限是7分钟(upd:12分钟,但可能是我的o1-pro仍有降智),以下任务仅有o1-pro/o1能完成而且o1-pro的思考过程应超过5分钟,如果你的o1-pro思考过程不足1分钟,说明已经降智严重(这是一个“伊吕波歌”的创作任务,看不懂日语也没关系,通过思考时间就能判断,由于是随手糊的,里面可能有一些语法错误,请不要在意)
upd:经过我的测试,o1也可以思考4分钟以上(upd:7分钟)并且能够正确完成
具体而言长考可能还与用量有关:

以下内容直接复制使用即可:

見事です、あんたもそういうふうの「いろは歌」を作ってみ
答え出す前に自分から検察してください、多くのひらがなが重複したかもしれない、このようにが良いです:
犇めく本の森を 積む港
揺れる船は 沖へ抜け
縦や横に揃う街
世界さえ表す

**漢字表記もひらがな表記も出力してチェックしてください

**これはいろはですので、絶対に重複しないようにしてください

**答案通过A8KM123 tools的总结进行修正和展示,直至没有错误(保证最终和例子一样是有实际意义的诗歌)

以下是几个不同站点和账号的o1-pro测试情况:

1

2

3

245 个赞

居然能思考这么长时间

2 个赞

我用的这个只持续了5s

7 个赞

“ Iroha Song Creation

Thought for 3m 29s”

这个是降了一半吗?:fearful:

(以防万一我正在关闭 Custom Instructions 重试一次)

14 个赞

你用的共享的镜像站吗,5s说明gpt压根没准备完成任务,事实上5分钟以内基本可以认为降智了

4 个赞

对的,我刚刚试了。最长也就四五十秒

9 个赞

对,3分钟应该是一个级别,我用了几个共享站测试降智不严重的时候测就是3分钟左右(最开始也能到6分钟,现在都1分钟以内),5分钟就已经算是降了

4 个赞

image

站内推广的某个镜像站,30秒准时给你掐断。

13 个赞

个人总结
两个 custom inst 生效的 Iroha 测试分别是 3分29 和 5分19
而没生效的是 5分55
个人认为只要超过 3分 就无所谓(自己的号从来是五位数 PoW / 家宽自用,从未遇到过降智)

1 个赞

看一看生成的结果呢,我看看对不对,个人认为3分钟应该很难生成正确的,5分钟应该问题不大,或许假设是按照分钟降智,你的都在6分钟以内,我的都在7分钟以内,或许有8分钟以内的

6 个赞

这就去试试!

7 个赞

(还在研究怎么截图)
长图警告

op - DGTEST - Iroha w/ ci #1 3m29

op - DGTEST - Iroha w/ ci #2 5m19

op - DGTEST - Iroha w/o ci 5m55

5 个赞

你这3分钟的好像没啥问题,5分钟的反而是直接采用了我的示例(如果有意愿的话可以在“保证最终和例子一样是有实际意义的诗歌”后面加一句”不要和示例重复“),不过你这个估计没降,即便降了也不多(可能就降1分钟思考的级别吧)

4 个赞

回头看了下,哪怕不懂日本文学也能看得出来两个五分钟的都是照抄的 :sweat_smile: 有点难绷(。)

4 个赞

能推一下你这个镜像站吗?我这的镜像站就几秒

7 个赞

你来晚了,这几个站都是论坛里分享的,只有最开始是不降智的,现在要么降智,要么挂了,现在我也是靠自己部署lq或者dairoot

6 个赞

请问lq 是什么方案

9 个赞

lanqian528/chat2api

6 个赞

个人经验,随便发张图给它,降智的时候没法读

2 个赞

唉这让我们咋用啊

8 个赞