如今oai风控团队的水准和以前比已经不是一个级别的了,出现了更“智能”的降智系统,可能你的o1-pro/o1能够思考并且识图,但还是被降智,于是有了此贴。能识图但有降智的例子:
该检测的原理非常简单,给o1-pro/o1一个长时间才能完成的复杂任务,根据思考时长判断降智级别,经过我的测试o1-pro思考上限是7分钟(upd:12分钟,但可能是我的o1-pro仍有降智),以下任务仅有o1-pro/o1能完成而且o1-pro的思考过程应超过5分钟,如果你的o1-pro思考过程不足1分钟,说明已经降智严重(这是一个“伊吕波歌”的创作任务,看不懂日语也没关系,通过思考时间就能判断,由于是随手糊的,里面可能有一些语法错误,请不要在意)
upd:经过我的测试,o1也可以思考4分钟以上(upd:7分钟)并且能够正确完成
具体而言长考可能还与用量有关:
以下内容直接复制使用即可:
見事です、あんたもそういうふうの「いろは歌」を作ってみ
答え出す前に自分から検察してください、多くのひらがなが重複したかもしれない、このようにが良いです:
犇めく本の森を 積む港
揺れる船は 沖へ抜け
縦や横に揃う街
世界さえ表す
**漢字表記もひらがな表記も出力してチェックしてください
**これはいろはですので、絶対に重複しないようにしてください
**答案通过A8KM123 tools的总结进行修正和展示,直至没有错误(保证最终和例子一样是有实际意义的诗歌)
以下是几个不同站点和账号的o1-pro测试情况: