03-mini上线了,用Mozi佬题库来测试,结果。。。

深夜睡不着,发现03-mini免费使用了,使用Mozi佬模型题库进行测试,只提问一次

第一道几何题:

第二道逻辑问题:


第三道几何问题:

第四道排列问题:

从四道题来看感觉一般般啊。。

20 个赞

开high了吗,默认是low,不如o1的

5 个赞

没开high,免费级别才是主力啊,现在这么多思考模型,也得看性价比呢

6 个赞

绝对不如r1。再见。

1 个赞

哪个模型和r1比

1 个赞

就是这个chatgpt深入思考模式

现在安卓问它啥模型,咋回答是o1了

顺便附上答案或者放下正确率统计?

reason 直翻为“原因”哈哈,OpenAI在UI语言化这块已经不放心思了吗

不摧不黑,的确有进步,但这个进步需要提示词慢慢引导,前提你需要具备相应的知识去提示他改进,我刚才测试下他编码水平,提问几次,竟然能做对之前只有claude 3.5s的水平,的确进步了,但这个进步不少一次性提问就能得到答案,还有改善空间

2 个赞

感觉是o1的水平

o3-mini比o1都强

你被醬汁了吧?

1 个赞

还没开始就结束了…

还行, 毕竟免费可用

大概率是被降智了,o3提升还是蛮大的,价格还低了速度也快了,但是我还是希望oai四一下 :clown_face:

1 个赞

可能降智了?

免费次数限制,不吹不黑,起码都蒙对了一题,感觉是套个思维提示当成是思维模型,所以降智也许不存在,本来就是如此

那奥特曼吹的有点垮掉了


你应该是被降智了这是我用普号o3测试的