让R1和QwQ-32B做了两道24年高考数学题

NINE · 2025 年3 月 9 日 02:10

thinking模型, 小学数学题都解不明白

yqyan · 2025 年3 月 9 日 02:44

仅从这个结果来看，R1 的能力仅仅略胜 QwQ，如果考虑性价比，那 QwQ 简直是完胜啊，同时代，即使以 Deepseek 所称道的低成本技术实力，也无法弥补二十几倍的参数量所带来的成本增加幅度，不论训练还是推理。当然，仅仅这个比较结果，还是很片面，无法体现模型的完整能力水平。

Lush · 2025 年3 月 9 日 02:55

有没有可能努力也不如人机

Walker042 · 2025 年3 月 9 日 03:58

确实，光是几道数学题还是太片面了，没法完全比较两个模型能力，只是拿来测试玩一下。而且QwQ-32B的性价比确实高，大概只要1/10的成本好像，速度也很快

话题		回复	浏览量
QwQ-32B发布前沿快讯人工智能	73	2441	2025 年3 月 9 日
Perplexity又好起来了吗？DeepSeek-R1 居然没有截断搞七捻三 DeepSeek , 人工智能 , 纯水	14	612	2025 年2 月 13 日
QwQ-32B真的和跑分一样强吗？搞七捻三人工智能 , 纯水	33	1221	2025 年3 月 8 日
qwen实乃ai界汪峰 qwq模型性能到底如何？搞七捻三人工智能	33	1103	2025 年2 月 27 日
livebench将重跑qwq 32b，据说成绩将会大幅提高，甚至超过deepseek R1 前沿快讯人工智能	38	1180	2025 年3 月 10 日