我觉得算是吧
这还没宣发啊…只不过效果不如对岸大佬自发带货好罢了…
不知道哇,佬你这个是哪里的
qwq还是preview
和 DS 比感觉不火主要是因为 DS 自来水多,真说宣发那还得是 Kimi 和 Doubao。
测过一下数学推理能力,正确率没有r1高
楼主标题不是说了嘛,是qwen
1 个赞
我感觉max输出格式比较好,我当时的题目是Google搜索指令
QwQ,不知道的还以为是个表情呢
输出太短了,无法撰写2000字以上的报告。
和R1一样。
能用grok 3的情况下,不会用这个。
这么短吗
一般情况上限
QWQ=2.4K
R1=2.9K
Grok3=4.0K
Gemini 2.0 pro exp=8.0K
10K以上:
Claude 3.7
o1
o3 mini
gemin 2.0 flash thinking
好像是这个网站
想到驼铃这个意向有什么问题吗?
当然如果只输出驼铃就不太对了,不过一直不输出驼铃好像也不太对。