qwen实乃ai界汪峰 qwq模型性能到底如何？

takatorury · 2025 年2 月 27 日 00:59

我觉得算是吧

kiki · 2025 年2 月 27 日 01:00

这还没宣发啊…只不过效果不如对岸大佬自发带货好罢了…

chunkBurst · 2025 年2 月 27 日 01:01

不知道哇，佬你这个是哪里的

stevessr · 2025 年2 月 27 日 01:03

qwq还是preview

PositionZero · 2025 年2 月 27 日 01:07

和 DS 比感觉不火主要是因为 DS 自来水多，真说宣发那还得是 Kimi 和 Doubao。

user1108 · 2025 年2 月 27 日 01:29

测过一下数学推理能力，正确率没有r1高

liubei · 2025 年2 月 27 日 01:31

楼主标题不是说了嘛，是qwen

liubei · 2025 年2 月 27 日 01:33

我感觉max输出格式比较好，我当时的题目是Google搜索指令

tuhu · 2025 年2 月 27 日 01:53

QwQ，不知道的还以为是个表情呢

tiga6367 · 2025 年2 月 27 日 03:18

输出太短了，无法撰写2000字以上的报告。

和R1一样。

能用grok 3的情况下，不会用这个。

desire0119 · 2025 年2 月 27 日 03:53

这么短吗

tiga6367 · 2025 年2 月 27 日 04:10

一般情况上限
QWQ=2.4K
R1=2.9K
Grok3=4.0K
Gemini 2.0 pro exp=8.0K

10K以上：
Claude 3.7
o1
o3 mini
gemin 2.0 flash thinking

Lyn_Ford · 2025 年2 月 27 日 04:28

好像是这个网站

qbug · 2025 年2 月 27 日 13:20

想到驼铃这个意向有什么问题吗？
当然如果只输出驼铃就不太对了，不过一直不输出驼铃好像也不太对。

话题		回复	浏览量
QwQ-32B发布前沿快讯人工智能	73	2432	2025 年3 月 9 日
阿里32B新模型比肩满血DeepSeek-R1 前沿快讯	8	907	2025 年3 月 6 日
好家伙真是好家伙 QwQ-32B 文笔没谁了搞七捻三人工智能	42	2187	2025 年3 月 7 日
QwQ-32B真的和跑分一样强吗？搞七捻三人工智能 , 纯水	33	1214	2025 年3 月 8 日
让R1和QwQ-32B做了两道24年高考数学题搞七捻三 DeepSeek , 人工智能 , 纯水	23	774	2025 年3 月 9 日