Qwen2.5-Coder-32B 发布:编码能力比肩 Claude-3.5-Sonnet

实际能力估计与这个图相似

体验链接

硅基流动

HuggingFace

其他

25 个赞

2.5 不是很早发了。2.5 coder 才发吗?

3 个赞

2.5B的coder之前只发了7B的这次是32B

4 个赞

已更新标题

2 个赞

本地资源不够,不然可以部署个试试

1 个赞

我只能说垃圾,我们公司全面跟阿里合作,用的全是阿里模型,闭源的qwen-coder-max,都不行,最大问题就是幻觉处理的真垃圾,有时候答非所问,或者卡死自循环,别提开源的。

25 个赞

今天这个时间你得告诉他.

1 个赞

你们用的是啥,api吗?我刚刚试了通义千问2.5的网页版可以正常回答

1 个赞

那不能这么比, 这对话前已经告诉他今天是哪天了.

web项目的对话是有初始化prompt的. 有些web给了有些没给. 我是这么理解的.

我在做的时候可以直接告诉他时间做计算或通过插件、prompt告诉他.

网页版有注入别的提示词的

放到cling裡面說不定不錯

这样的嘛?get到了


我有闭源的千问-coder,就那样,始终不信开源的能好哪里去

赶超没有吧。。

我正好前几天做这个测试. 我想在cursor 写changelog加时间嘛, 他也是不知道实际时间. 我后来发现最简单告诉他就好了. 通过插件我在元器上测试也是没问题的.但cursor上怎么调用插件我不知道怎么搞. 哈哈

不晓得同义灵码有没有的加强类

靠跑分就确定能打赢Claude是不是言之过早了? :clown_face:

2 个赞

:joy:确实如此,跑分和实际体验还是有差距的

国产作弊 吹b第一名

1 个赞

试了试,能摸到尾灯,能用,但还是有差距