ollama部署了qwen3:235b-a22b,用cherrystudio测试天气卡片,已经运行40分钟了,还没出结果,真是难绷
这到底是怎么了
根据大佬的设置调整了一下,现在不循环了,但是输出结果让人很失望
ollama部署了qwen3:235b-a22b,用cherrystudio测试天气卡片,已经运行40分钟了,还没出结果,真是难绷
这到底是怎么了
根据大佬的设置调整了一下,现在不循环了,但是输出结果让人很失望
QWen 疯了
多少显存?
8卡V100S
思考预算/思维链长度 设置短一点怎么样
我在官网测试这个天气卡片 效果也一般
参数有没有设置啊,我自己感觉影响超级大。
enable_thinking=True
),使用 Temperature=0.6
,TopP=0.95
,TopK=20
和 MinP=0
。不要使用贪婪解码,因为它可能导致性能下降和无休止的重复。enable_thinking=False
),我们建议使用 Temperature=0.7
,TopP=0.8
,TopK=20
和 MinP=0
。presence_penalty
参数在 0 到 2 之间,以减少无休止的重复。但是,使用较高的值有时可能导致语言混合和模型性能略有下降。Ollama 默认的 qwen3:235b 是 Q4 量化,应该需要 160 GB 显存,8 * V100S 足以支持。
无限输出了?
我调整试一下
感谢大佬建议,我试试看
40分钟??这么拉跨
是的,循环
无限循环了
Qwen3自己钻牛角尖了吧
cot 关了,赶鸭子上架。
关掉了也调整了参数,输出结果不是很好
我在官网 本地试了我的小球提示词,就没有一个地方能直接出能跑的代码,球是动也不动,要不就是干脆页面都打不开
附上我的提示词,这个是从glm之前官方example增强出来的,基本上目前第一梯队一到两轮对话都能出能跑的结果,区别只是参数调整效果和优化幅度,目前主观评分 gpt 4.1 遥遥领先(美化,物理参数,性能) :
使用 HTML 模拟从旋转六边形的中心释放一个小球的情景。考虑小球与六边形边缘的碰撞、作用在小球上的重力,并假设所有碰撞都是完全弹性的。
你可以自己微调参数让运动更有趣 : 期望UI加上调节各种参数的滑块和reset & start 按钮。
在转动速度快时, 需要防止更小的球容易漏出去的隧穿问题(tunneling), 理论这是一个封闭的六边形, 是不能出去的, 当然要兼顾性能表现, 尽量即可。
HTML JS CSS 合并在单个文件中。
我的 4.1 结果: pastebin
用GPT4.1跑了一下你的提示词,真是太强大了
可以说是天壤之别了
这这这这这?