现在gemini 1114、1121和o1模型都能写对我的数学题库了,有没有佬有新的题目能区分出o1和gemini

https://www.yeahhe.online/📚电子书/💡AI提示词/🧪测试

6 Likes

提升这么大啊,那估计要用gemini冒充o1了

2 Likes

2024 高考数学题,

我把一个盘子放在苹果上面,然后把盘子从厨房带到餐厅。苹果现在在哪儿?

gemini全系flash pro exp正确率100%
oai 哪怕是o1也是概率错

2 Likes

\begin{aligned}&20、(12分)已知向曲线L是球面x^2+y^2+z^2=2x\text{ 与平面}&2x-z-1=0\text{ 的交线,从}z\text{轴正向往}z\text{ 轴负向看为逆时针方}&\text{向,计算曲线积分}&I=\int_L\left(6xyz-yz^2\right)\mathrm{d}x+2x^2z\mathrm{d}y+xyz\mathrm{d}z .\end{aligned}

这题 gemini 002 有时候能对, o1也会做错



如果单纯是为了区分,这里有个最简单的题,9.11和9.9谁更大

1 Like


对吗




红温了,1121反而是错的

目前得出结论,Gemini的数学和代码能力远不如o1 preview

可以用这个物理题目分辨

有一轻弹簧,下面悬挂质量为 1.0 g 的物体时,伸长量为 4.9 cm。用这个弹簧和一个质量为 8.0 g 的小球构成弹簧振子,将小球由平衡位置向下拉开 1.0 cm 后,给予向上的初速度 v0 = 5.0 cm · s^-1 求振动周期和振动方程。

image

这个题目只有o1 preview可以做出

设集合A中的元素皆为[每个数位上的数字不重复]的三位正整数,且元素中任意两者之积皆为偶数,求集合中元素个数的最大值

这一题呢,除了O1,其他的行不行

简单方法是,让模型写文言文


gemini质量远高于gpt系列

2 Likes

看来Gemini在文字处理上挺优秀


强内模型遥遥领先了一回