本地尝试运行了 ChatGLM3 和 Qwen 7B量化的版本,效果还不错,还有其它推荐嘛?
从 常规话题 到 快问快答
opencpm可以试试
okk
能不能问下楼主是笔记本还是公司服务器,显存有多少?
自己的主机哈,显卡 4070 ti super,16g 显存
嗯,这个也尝试了,不过对中文的支持比较弱
From #develop:qa to 开发调优