qwen2.5math 的数学能力好像很强,是怎么做到的

题目不难,不涉及高等数学,就是管综数学(高中难度)的水平,给 gpt 和 Claude 做,虽然偶尔能做出来,但结果不稳定,每次生成的都是不同的答案,也经常出现一直做一直错的情况

但是交给 qwen2.5math ,几乎每次都能稳定答对,对某一步不了解直接问,也能给出令人信服的解释

比较遗憾的是,此模型不支持ocr,截图问问题会比较麻烦,想试试通用版的千问 2.5,但担心没有 math 版本的好用,这个担忧是合理的吗

另问说做数学题有什么更适合的模型吗

7 Likes

比 o1-mini 更强吗?

试了一下高等数学,使用以下 prompt

the number of roots of the equation

\[
\int_0^x \sqrt{4a^2 - t^2} \, dt + \int_x^a \frac{1}{\sqrt{4a^2 - t^2}} \, dt = 0
\]

on the interval \([0, a]\), where \( a > 0 \)

常规方法是使用零点定理,然后验证单调性。这也是 o1-mini 的方法。Qwen2.5-Math 的方法是把两个积分硬算了出来。

不考虑模型大小的话,o1-mini 解数学题确实是最强了

担心合理,普通版远不如 Math;Qwen Math 现在是唯二(另一个是 Gemini 1.5 Pro)非 o1 的数学很不错的模型。

它这个语言控制不是很稳定啊哈哈

阿里的模型吗?

对,如果直接问,他会中文夹英文回答,也会说着说着变成全英文,加一个请无论如何以中文回答的提示词之后,情况有所缓解

o1 做的比他强很多,特别是遇到一些需要用巧妙的方法做的问题时

但是因为价格的问题,一直没舍得用o1来作为日常的解答机器,虽然有便宜的 api 站,但常常不稳定,继续的时候突然没法访问会让人很恼火

请教有什么价格合理+服务稳定的 o1 代理站推荐吗

就用论坛的 shared.oaifree.com 就行了。能抽到plus号的,多刷新几次。

1 Like

似了 :tieba_087: :tieba_087: :tieba_087: :tieba_087:

哎,没办法。。