有人尝试FuseO1这款R1大杂烩模型吗?

在红迪上看到有人推荐大杂烩模型FuseAI/FuseO1-DeepSeekR1-QwQ-SkyT1-Flash-32B-Preview,可惜显卡正在路上没法评估。已知R1-distill-32B和原版qwen32B相比不咋样,这是否是一条出路?
(没人测的话就等下周显卡到了评估)

这个也是 32b 吗 和 普通蒸馏配置一样跑吗还是

是的,一样

那我晚上试试 上次试过 r1 32b 大概 10tokens 1s

我想知道能力,速度都差不多的

更新:使用vLLM推理FuseAI/FuseO1-DeepSeekR1-QwQ-SkyT1-32B-Preview的AWQ量化,用LiveBench评分,分数如下:

比R1-distill-qwen-32b强,不如原版qwen2.5

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。