在红迪上看到有人推荐大杂烩模型FuseAI/FuseO1-DeepSeekR1-QwQ-SkyT1-Flash-32B-Preview,可惜显卡正在路上没法评估。已知R1-distill-32B和原版qwen32B相比不咋样,这是否是一条出路?
(没人测的话就等下周显卡到了评估)
这个也是 32b 吗 和 普通蒸馏配置一样跑吗还是
是的,一样
那我晚上试试 上次试过 r1 32b 大概 10tokens 1s
我想知道能力,速度都差不多的
比R1-distill-qwen-32b强,不如原版qwen2.5
此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。