GPT4o/4turbo做高考数学题(2024新课标1卷)

继续测试国内大模型啊,

果然不咋行

1 个赞

那以后我们还有啥用

也许吧 :thinking: 专业做题家

开发高考专用 gpt

1 个赞

是我提问的方式有问题吗 为什么我问的时候gpt答非所问:sob:

1 个赞

懒啦

做测试 :tieba_025: :tieba_025: :tieba_025:

怎么提问的呀,我就是直接发给他了(一道题一道题发给他)

我也是这样的 后面还加了一句请详细讲解
但是它回复的基本就是把题目又读了一遍 很浅显呢

回复是啥样的

4-1


我也试了一下, 型号是4-turbo-2024-4-09, GPT一开始很啰嗦, 然后我让它只给答案就好.

Gemini1
gemini2

我还试了一下Gemini…由于第一次我复制题目的时候没加序号, 所以我让它测了两次…

Gemini1.1
Gemini1.2

感谢测试

一个一个题答会不会更好点

如果有一个合适的prompt,应该会好一些,我因为只是随便试试,什么提示都没写。
晚点我试一下。

1 个赞

谢谢~~~

举报考生BingAI作弊,使用web搜索功能 :rofl:

1 个赞

对于高考数学2024年新课标一卷中的选择(40分)、多选(18分)、填空题(15分),共73分。单次作答,不调用代码解释器。

gpt-4o:选择错1个,多选漏选2个,填空题错2个,得52分

gpt-4-all:选择错3个,多选漏选1个,填空题错2个,得45分

嫌太罗嗦,让直接输出答案会显著降低正确率,具体参照openai文档该部分内容:

https://platform.openai.com/docs/guides/prompt-engineering/give-the-model-time-to-think

2 个赞

我又试了一下, 这次写了一个简单一点的提示试了8道单选题. 不过这次的结果很有意思, 4-Turbo会详解,单选题中只有第二题错了, 但是每当做错的时候它会知道自己做错了, 并会在回答中尝试要求再试一次, 然而对于第二道问题, 我让它做了3次都是错的, 甚至出现了一些离谱的系统错误. 像是下面这样…

Gemini就更离谱了, 当它不试图写出详细步骤的时候基本还能准大半, 然而当它尝试写下详细步骤之后…

它特么一道题都没做对!!!

1 个赞