这道题是我去年考研的一道题,我问了许多模型,答案五花八门,只有Google AI studio作对过一次,还不是次次稳定,这次o4确实可以随便拿捏这种概念题目了。而且最重要的是思考时间特别短,20年高考那道题一般模型思考都是几分钟,这个o4十几秒就可以做出来,目前看数学的能力还是满厉害的
o4mini还是o4-mini-high?
两个模型都可以作对,但是high的思考时间要短一些
答案又是什么呢?
这四个全都是对的 选D
o4mini还便宜
进来学习,
advance是降智模型,不仅模型本身降,识图也降,并且上下文有砍,基本就是个大幅阉割模型
o3mini我还真没用过API,但是我用网页版我记的很清楚他选择A,因为考试的时候我选的A,当时就chatgpt和我答案一样,我还以为作对了
A绝对是降智了(o3-mini 没差到这种程度),稳定测试总是需要 API。
开了推理模式就不是 4o 了
试了几次,仔细检查了下回答的过程,发觉问题不是在于能否解出题目,而是ocr就失败了好几次。经常出现绝对值打错位置导致说某条件和某条件是一样的情况。
在不使用图片而是直接给出文字版本的题目后,进行是5次测试,5对2,但是每次都有些瑕疵。其中第1次第2次错误原因一样:认为条件1中f(0)=0时极限存在无法得出去掉绝对值后的极限(也就是x=0处的导数)存在,因为有可能振荡无极限。由于该情况后续3个条件都会碰到,因此会选A。在追问要求给出一个振荡的例子后得出正确结果:该极限必须是0,因此答案是D。第3次正确且几乎完美证明(在证明前述极限等于0时有一点小疏漏)。第4次正确但是认为条件1中f(0)必须为0忽视了当其大于0时就是导数的定义。第5次犯了和第4次一样的错误(怎么相同的错误老是连续犯),并且还出现了一个非常离谱的情况:为条件4构造了一个根本不连续的反例,即使题目第一句就说了f是连续的。
上述例子中如果指出其错误均可以正确改正,给出完美证明,所以不好说这数学能力算强还是差吧
advance只有dr值得,其他都是垃圾,各种各样的阉割
o4mini也有多模态吗
实测gemini采用文字版问题回答正确率还是很高的,目前没看到错误答案
文字版:\begin{aligned}
& 7.\text{设函数 }f(x)\text{ 连续, 给出下列四个条件} \
& ①\operatorname*{lim}{x\to0}\frac{\mid f(x)\mid-f(0)}{x}\text{存在;}②\operatorname*{lim}{x\to0}\frac{f(x)-\mid f(0)\mid}{x}\text{存在:} \
& ③\lim_{x\to0}\frac{|f(x)|}{x}\text{存在};\quad④\lim_{x\to0}\frac{|f(x)|-|f(0)|}{x}\text{存在}; \
\text{其中能得到“}f(x)\text{ 在 }x=0\text{ 处可导”的条件个数是}(\quad)
\end{aligned}
o4说是可以使用全部的工具,包括搜索,数据分析,生图啥的。测试了下,新的对话记忆功能也能使用