题目不难,不涉及高等数学,就是管综数学(高中难度)的水平,给 gpt 和 Claude 做,虽然偶尔能做出来,但结果不稳定,每次生成的都是不同的答案,也经常出现一直做一直错的情况
但是交给 qwen2.5math ,几乎每次都能稳定答对,对某一步不了解直接问,也能给出令人信服的解释
比较遗憾的是,此模型不支持ocr,截图问问题会比较麻烦,想试试通用版的千问 2.5,但担心没有 math 版本的好用,这个担忧是合理的吗
另问说做数学题有什么更适合的模型吗
题目不难,不涉及高等数学,就是管综数学(高中难度)的水平,给 gpt 和 Claude 做,虽然偶尔能做出来,但结果不稳定,每次生成的都是不同的答案,也经常出现一直做一直错的情况
但是交给 qwen2.5math ,几乎每次都能稳定答对,对某一步不了解直接问,也能给出令人信服的解释
比较遗憾的是,此模型不支持ocr,截图问问题会比较麻烦,想试试通用版的千问 2.5,但担心没有 math 版本的好用,这个担忧是合理的吗
另问说做数学题有什么更适合的模型吗
比 o1-mini 更强吗?
试了一下高等数学,使用以下 prompt
the number of roots of the equation
\[
\int_0^x \sqrt{4a^2 - t^2} \, dt + \int_x^a \frac{1}{\sqrt{4a^2 - t^2}} \, dt = 0
\]
on the interval \([0, a]\), where \( a > 0 \)
常规方法是使用零点定理,然后验证单调性。这也是 o1-mini 的方法。Qwen2.5-Math 的方法是把两个积分硬算了出来。
不考虑模型大小的话,o1-mini 解数学题确实是最强了
担心合理,普通版远不如 Math;Qwen Math 现在是唯二(另一个是 Gemini 1.5 Pro)非 o1 的数学很不错的模型。
阿里的模型吗?
对,如果直接问,他会中文夹英文回答,也会说着说着变成全英文,加一个请无论如何以中文回答的提示词之后,情况有所缓解
o1 做的比他强很多,特别是遇到一些需要用巧妙的方法做的问题时
但是因为价格的问题,一直没舍得用o1来作为日常的解答机器,虽然有便宜的 api 站,但常常不稳定,继续的时候突然没法访问会让人很恼火
请教有什么价格合理+服务稳定的 o1 代理站推荐吗
就用论坛的 shared.oaifree.com 就行了。能抽到plus号的,多刷新几次。
似了
哎,没办法。。