QwQ-32B发布

synbio · 2025 年3 月 5 日 19:20

今天发布了 QwQ-32B，这是我们的新推理模型，它只有 320 亿个参数，可以与 DeepSeek-R1 等尖端推理模型相媲美。

博客： QwQ-32B: Embracing the Power of Reinforcement Learning | Qwen
高频： Qwen/QwQ-32B · Hugging Face
模型范围： modelscope.cn/models/Qwen/Qw…
演示： huggingface.co/spaces/Qwen/Qw…
Qwen 聊天：
chat.qwen.ai

这次，我们研究了扩展 RL 的方法，并基于我们的 Qwen2 取得了一些令人印象深刻的成果。 5-32B 。我们发现 RL 训练可以不断提高性能，尤其是在数学和编码方面，并且我们观察到 RL 的持续扩展可以帮助中型模型实现与巨型 MoE 模型相媲美的性能。欢迎随时与我们的新模型聊天并向我们提供反馈！

更新下价格

Openrouter上线了，免费

synbio · 2025 年3 月 5 日 19:20

biribiri · 2025 年3 月 5 日 19:38

啊？认真的吗

Juya · 2025 年3 月 5 日 20:17

补充一下：在线体验可以在 Qwen Chat里面选Qwen-2.5-Plus并选择QwQ，此时会调用QwQ-32B。

cat3399 · 2025 年3 月 5 日 21:18

这么强？？

lueluelue · 2025 年3 月 5 日 21:25

qwen max嘞

skyfox · 2025 年3 月 5 日 21:56

对啊qwen max嘞

eugeneL · 2025 年3 月 5 日 22:27

不拉高规模就只能变成特定领域模型，agi 还是要烧显卡

gokyo · 2025 年3 月 5 日 22:40

Apache 2.0开源

Grok · 2025 年3 月 5 日 23:05

起得好早呀。。。

6512345 · 2025 年3 月 5 日 23:43

QwQ

XDX-pp · 2025 年3 月 5 日 23:50

等一个OVO

ZvgBbW · 2025 年3 月 6 日 00:03

问了下左木右乞，思考了一阵之后直接卡死。。。

L93 · 2025 年3 月 6 日 00:11

经典天气卡片任务，实测做的真的很差

user695 · 2025 年3 月 6 日 00:11

QWQ 呜呜呜

fengchris · 2025 年3 月 6 日 00:16

这么说 qwen-max的QwQ不应该更强？

zhong_little · 2025 年3 月 6 日 00:34

有一个 QvQ

jaydenmirror · 2025 年3 月 6 日 00:41

说是能比肩dsr1,它比肩的是671B版本吗

homeworkkun · 2025 年3 月 6 日 00:55

从分数上看是的

handsome · 2025 年3 月 6 日 01:10

期待一个！

话题		回复	浏览量
241128 三花AI日报：阿里通义开源国产推理模型；GUI 自动化 Agent；OneDiffusion：多功能生图模型； OpenAI 的 Sora API 泄露事件回顾前沿快讯人工智能	11	649	2024 年12 月 18 日
QWQ 32B分数更新，超过DeepSeek R1 前沿快讯人工智能	38	1511	2025 年3 月 15 日
关于硅基流动QwQ 32B思考截断的研究发现开发调优人工智能 , SiliconFlow	27	777	2025 年3 月 17 日
混元T1上线了，真的快!逆得也很快！前沿快讯人工智能 , 纯水	53	2435	2025 年3 月 24 日
【原创长文】关于Gemini 2.5 Pro，你想知道的一切。250409：2.5pro版Deep research上线，最强文生视频Veo2上线Gemini app【长期更新】搞七捻三 Gemini , 人工智能 , 纯水	247	9107	2025 年4 月 9 日

QwQ-32B发布

相关话题