override搭配qwen2.5-coder:32b能够实现较好效果

JayXuZ · 2024 年11 月 12 日 04:26

上一个帖子中尝试了各类开源模型本地部署情况下搭配 override 实现 github copilot 平替的方案，主要是为了离线开发能够用上比 continue.dev 仅仅是行级补全更好的方案

在今天更新了 qwen2.5-coder:32b 之后赶紧来尝试补全效果
使用的是 ollama 中 32B 默认的
32b-base-q4_K_M 量化模型
还是跟之前一样尝试在 1000 行代码中插入的注释看能否正常补全

可以看到，虽然代码不够准确优雅，但是达到了可用级别，不会出现之前脑补过度生成注释之外的内容了，模型内存是 20G，实际运行占用如下，大概在 24.3G 左右

大家有条件的可以尝试qwen2.5-coder:32b在内网搭建代码补全服务了

Leon01 · 2024 年11 月 12 日 04:34

感谢佬友分享

panda_l · 2024 年11 月 12 日 04:45

大佬，多分享分享使用，我马上也要用这个方案来实现内网代码补全

Winston_Charles · 2024 年11 月 12 日 04:54

你这是4bit量化考虑到32b本身参数也不算特别大所以性能损耗应该是还蛮严重的

JayXuZ · 2024 年11 月 12 日 05:08

用量化模型主要还是给大多数人离线部署使用的测试
毕竟完整32B模型66G，普通用户找不到那么大的卡。
我外网能拿来测试的也就这么一块32G的，内网倒是大点。

JayXuZ · 2024 年11 月 12 日 05:11

之前的帖子里面各种小参数开源模型我都试过了，qwen2.5-coder-32B是目前来看唯一可用的。
其他的只能搭配continue.dev用了

如果显存不是问题，deepseek2.5-236B肯定是首选。其次久只能是qwen2.5-coder-32B了

ysen · 2024 年11 月 12 日 05:18

过来支持一下

handsome · 2024 年11 月 12 日 05:34

感谢你的分享！

llllllll · 2024 年11 月 12 日 05:41

用的是ollama支持的fim的接口吗

user137 · 2024 年11 月 12 日 05:54

使用ollama部署的吗

JayXuZ · 2024 年11 月 12 日 05:56

是的，ollama已经支持FIM了，直接/v1/completions就能调用补全方法

JayXuZ · 2024 年11 月 12 日 05:56

是的，/v1/completions就能调用

K_Martin · 2024 年11 月 12 日 08:38

qwen的fim感觉要加几个停用词，而且suffix参数不能为空，为空要强制给它加上换行符，不然输出的就不是补全代码

JayXuZ · 2024 年11 月 12 日 09:04

偶尔确实会输出混乱，多随机几次就正常了

llllllll · 2024 年11 月 12 日 23:14

提个issue估计会解决

ohayo · 2024 年11 月 13 日 02:51

没有条件，哈哈哈

K_Martin · 2024 年11 月 13 日 08:32

自己改了下override,用起来也没太多问题

Timmy_0 · 2024 年11 月 19 日 07:59

现在是用continue搭配32b gptq int4版本，想问下continue和override，是override更好嘛？

INTJ · 2024 年11 月 19 日 08:00

试了fp8版本，感觉对于长篇幅code的modify还是远不如Claude3.5

JayXuZ · 2024 年11 月 19 日 08:01

override之后用github copilot肯定是比continue的提示更智能的
continue的联系上下文和其他部分代码的能力感觉不是太好，有点呆。

话题		回复	浏览量
override使用开源代码补全模型的测试情况资源荟萃 Copilot , CoCopilot , Override , 人工智能	18	1184	2024 年11 月 19 日
分享我的vscode的continue（类比copilot）插件配置，还请各位大佬指点资源荟萃人工智能	33	2605	2025 年2 月 27 日
公司内网环境如何实现类cursor的编程体验？搞七捻三快问快答	20	510	2025 年3 月 14 日
【分享开源】Copilot后端代理服务\|本地中转服务\|离线Copilot本地\|FIM模型本地补全资源荟萃 ChatGPT , Copilot , 人工智能	39	2067	2025 年3 月 31 日
livebench将重跑qwq 32b，据说成绩将会大幅提高，甚至超过deepseek R1 前沿快讯人工智能	43	1592	2025 年3 月 10 日