03-mini上线了，用Mozi佬题库来测试，结果。。。

lbls888 · 2025 年1 月 31 日 20:03

深夜睡不着，发现03-mini免费使用了，使用Mozi佬模型题库进行测试，只提问一次

第一道几何题：

第二道逻辑问题：

第三道几何问题：

第四道排列问题：

从四道题来看感觉一般般啊。。

Yuanhao · 2025 年1 月 31 日 20:14

开high了吗，默认是low，不如o1的

lbls888 · 2025 年1 月 31 日 20:36

没开high，免费级别才是主力啊，现在这么多思考模型，也得看性价比呢

Davidasx · 2025 年1 月 31 日 22:58

绝对不如r1。再见。

lueluelue · 2025 年1 月 31 日 22:58

哪个模型和r1比

Davidasx · 2025 年1 月 31 日 22:59

就是这个chatgpt深入思考模式

dwl · 2025 年1 月 31 日 23:03

现在安卓问它啥模型，咋回答是o1了

zhong_little · 2025 年1 月 31 日 23:25

顺便附上答案或者放下正确率统计？

zhong_little · 2025 年1 月 31 日 23:27

reason 直翻为“原因”哈哈，OpenAI在UI语言化这块已经不放心思了吗

sonygod · 2025 年2 月 1 日 00:45

不摧不黑，的确有进步，但这个进步需要提示词慢慢引导，前提你需要具备相应的知识去提示他改进，我刚才测试下他编码水平，提问几次，竟然能做对之前只有claude 3.5s的水平，的确进步了，但这个进步不少一次性提问就能得到答案，还有改善空间

handsome · 2025 年2 月 1 日 03:09

感觉是o1的水平

yuyuyang · 2025 年2 月 1 日 03:14

o3-mini比o1都强

passerby064857 · 2025 年2 月 1 日 05:51

你被醬汁了吧?

stevessr · 2025 年2 月 1 日 06:04

还没开始就结束了…

song54573 · 2025 年2 月 1 日 06:45

还行, 毕竟免费可用

kiliy · 2025 年2 月 1 日 06:47

大概率是被降智了，o3提升还是蛮大的，价格还低了速度也快了，但是我还是希望oai四一下

yueliusu · 2025 年2 月 1 日 06:48

可能降智了？

lbls888 · 2025 年2 月 1 日 07:08

免费次数限制，不吹不黑，起码都蒙对了一题，感觉是套个思维提示当成是思维模型，所以降智也许不存在，本来就是如此

yueliusu · 2025 年2 月 1 日 07:11

那奥特曼吹的有点垮掉了

qyfxw · 2025 年2 月 1 日 07:24

你应该是被降智了这是我用普号o3测试的

话题		回复	浏览量
o3-mini正式发布前沿快讯 ChatGPT , 人工智能	13	535	2025 年2 月 1 日
o3mini出来了，但是好像又偷偷降智了搞七捻三 ChatGPT , OpenAI , 人工智能 , 纯水	30	841	2025 年2 月 1 日
o3 mini模型低、中、高三种推理强度，是通过调节同一个模型的思考时间实现？是否有办法破解搞七捻三 ChatGPT , 人工智能	86	1304	2025 年2 月 8 日
【长期更新Wiki】语言模型区分题库：主要用来区分语言模型，也能测试逻辑能力文档共建人工智能	551	8173	2025 年2 月 8 日
发现安卓APP上的o3 mini联网是降智的，网页端和电脑端发送问题就不会降智开发调优 ChatGPT , 人工智能	33	244	2025 年2 月 5 日