qwen3:235b-a22b测试天气卡片,无限循环

ollama部署了qwen3:235b-a22b,用cherrystudio测试天气卡片,已经运行40分钟了,还没出结果,真是难绷


这到底是怎么了 :face_in_clouds:

根据大佬的设置调整了一下,现在不循环了,但是输出结果让人很失望 :tieba_087:

10 Likes

QWen 疯了

2 Likes

多少显存?

1 Like

8卡V100S

1 Like

思考预算/思维链长度 设置短一点怎么样
我在官网测试这个天气卡片 效果也一般

1 Like

参数有没有设置啊,我自己感觉影响超级大。

  • 对于思考模式(enable_thinking=True),使用 Temperature=0.6TopP=0.95TopK=20MinP=0不要使用贪婪解码,因为它可能导致性能下降和无休止的重复。
  • 对于非思考模式(enable_thinking=False),我们建议使用 Temperature=0.7TopP=0.8TopK=20MinP=0
  • 对于受支持的框架,您可以调整 presence_penalty 参数在 0 到 2 之间,以减少无休止的重复。但是,使用较高的值有时可能导致语言混合和模型性能略有下降。
3 Likes

Ollama 默认的 qwen3:235b 是 Q4 量化,应该需要 160 GB 显存,8 * V100S 足以支持。
无限输出了?

1 Like

我调整试一下

感谢大佬建议,我试试看

40分钟??这么拉跨

是的,:infinity:循环:tieba_087:

1 Like

无限循环了

Qwen3自己钻牛角尖了吧

1 Like

cot 关了,赶鸭子上架。

关掉了也调整了参数,输出结果不是很好

我在官网 本地试了我的小球提示词,就没有一个地方能直接出能跑的代码,球是动也不动,要不就是干脆页面都打不开:joy:

附上我的提示词,这个是从glm之前官方example增强出来的,基本上目前第一梯队一到两轮对话都能出能跑的结果,区别只是参数调整效果和优化幅度,目前主观评分 gpt 4.1 遥遥领先(美化,物理参数,性能) :

使用 HTML 模拟从旋转六边形的中心释放一个小球的情景。考虑小球与六边形边缘的碰撞、作用在小球上的重力,并假设所有碰撞都是完全弹性的。
你可以自己微调参数让运动更有趣 : 期望UI加上调节各种参数的滑块和reset & start 按钮。
在转动速度快时, 需要防止更小的球容易漏出去的隧穿问题(tunneling), 理论这是一个封闭的六边形, 是不能出去的, 当然要兼顾性能表现, 尽量即可。
HTML JS CSS 合并在单个文件中。

我的 4.1 结果: pastebin

用GPT4.1跑了一下你的提示词,真是太强大了

1 Like

qwen3:

优化了一下:
把前端显示变得更精致,更丝滑的动态效果,感觉是用户需要付费20元每月的绝美天气app的前端显示

claude 3.7:

3 Likes

可以说是天壤之别了 :tieba_086:

这这这这这?