qwen实乃ai界汪峰 qwq模型性能到底如何?

我觉得算是吧

:rofl:这还没宣发啊…只不过效果不如对岸大佬自发带货好罢了…

不知道哇,佬你这个是哪里的

qwq还是preview

和 DS 比感觉不火主要是因为 DS 自来水多,真说宣发那还得是 Kimi 和 Doubao。

测过一下数学推理能力,正确率没有r1高

楼主标题不是说了嘛,是qwen

1 个赞

我感觉max输出格式比较好,我当时的题目是Google搜索指令

QwQ,不知道的还以为是个表情呢

输出太短了,无法撰写2000字以上的报告。

和R1一样。

能用grok 3的情况下,不会用这个。

这么短吗

一般情况上限
QWQ=2.4K
R1=2.9K
Grok3=4.0K
Gemini 2.0 pro exp=8.0K

10K以上:
Claude 3.7
o1
o3 mini
gemin 2.0 flash thinking

好像是这个网站

想到驼铃这个意向有什么问题吗?:thinking:
当然如果只输出驼铃就不太对了,不过一直不输出驼铃好像也不太对。