深夜睡不着,发现03-mini免费使用了,使用Mozi佬模型题库进行测试,只提问一次
第一道几何题:
第二道逻辑问题:
第三道几何问题:
第四道排列问题:
从四道题来看感觉一般般啊。。
开high了吗,默认是low,不如o1的
没开high,免费级别才是主力啊,现在这么多思考模型,也得看性价比呢
绝对不如r1。再见。
哪个模型和r1比
就是这个chatgpt深入思考模式
现在安卓问它啥模型,咋回答是o1了
顺便附上答案或者放下正确率统计?
reason 直翻为“原因”哈哈,OpenAI在UI语言化这块已经不放心思了吗
不摧不黑,的确有进步,但这个进步需要提示词慢慢引导,前提你需要具备相应的知识去提示他改进,我刚才测试下他编码水平,提问几次,竟然能做对之前只有claude 3.5s的水平,的确进步了,但这个进步不少一次性提问就能得到答案,还有改善空间
感觉是o1的水平
o3-mini比o1都强
还没开始就结束了…
还行, 毕竟免费可用
大概率是被降智了,o3提升还是蛮大的,价格还低了速度也快了,但是我还是希望oai四一下
可能降智了?
免费次数限制,不吹不黑,起码都蒙对了一题,感觉是套个思维提示当成是思维模型,所以降智也许不存在,本来就是如此
那奥特曼吹的有点垮掉了