(正在更新)让现代的模型参加去年的阿里巴巴数学竞赛,能否超越姜萍?

对于问题部分,使用如下prompt进行增强

现在你是一位数学做题家,请你尝试使用各种方式来拿到这道题的尽可能的多的分,深入思考并解答:{问题部分}

GPT(来自镜像站)
  • o4-mini-high:使用工具,第一题,第二题做出来了
  • o3:使用工具,第一题,第二题都做出了
Gemini(来自AIStudio)
  • Gemini-2.5-Pro-0605 第一题做出来
6 Likes

马克一下,坐等佬友直播(同时可不可以分享一下题目prompt:clap:

这prompt有点东西啊,我上次用类似方法解了道高数题

你无法得知答案是不是已经被用来训练模型了 测试无意义

之前用这俩做李氏第二法判稳的题都没做对

实际上如果不用代码工具,基本都错了(还只是第一题)

题目从官网,使用gemini直接解析,由于是从pdf到md的格式,图去掉了,难度比原来的要难

1 Like

应该是不能的,第三题证明题看不懂跳过,第四题跳过第一问证明,抽取二三问试试GPT


o3像极了人类不会做的题目猜个特殊值0,1。o4-mini也没做对

1 Like

AI能证明 主=6 么:wink:

普通的AI也能秒杀Jumping吧,毕竟主等于6