QwQ-32B真的和跑分一样强吗?

rt,QwQ-32B发布的时候看跑分高的吓人,,32B的模型能拳打O1mini脚踢R1,有没有用了的佬友?真的有跑分那样好使吗?
我自己拿来写了写文什么的,也写了点小程序,但是感觉体验不怎么样

40 Likes

感觉一般w

3 Likes

用了一下,还行,会跟r1一样,疯狂思考,然后给出答案。主要是参数少,效果跟r1接近,感觉就是最大的进步 :grin:

数学推理方面挺强的,比预览版强了不少,编程是差点

3 Likes

这样吗w
我去找点数学题试一下()

确实,就是好奇会不会有大参数量的版本

感觉很一般,但是文笔还行。

佬友们有没有链接,我也想去看一下

@here

:bili_040: 32B 光看基础面板都知道被 671B 的 R1 摁着捶吧。大概就是同样用木遁 QwQ 是大和、R1 是柱间。找灵感不错找答案还是用正儿八经的【大】模型吧。

跑分终究是个理论的东西。
就像50系显卡宣发说可以吊打40系一样。
结果出来吊打了吗?开启科技与狠活(DLSS4),你就说吊没吊打吧。
实际出来就是一坨。

看跑分没太大意义,直接手上实测就好 :crazy_face:

1 Like

感谢佬友,

随时为樱佬效劳 :smiling_face_with_sunglasses:

确实,跑分就是图一乐)

感谢感谢

32B天花板了

1 Like

跑分看看就行,实际体验跟dp r1、claude3.7都有差距

32b里面算不错了

1 Like

测试了之后不太行,相对 r1 来说更容易进入无意义内容的死循环,不过比其他小模型好一点在于它能在200个token之内跳出循环(但是很快又进入下一个循环:downcast_face_with_sweat:

怎么感觉不像官方的啊