Qwen2.5-Coder-32B 发布：编码能力比肩 Claude-3.5-Sonnet

Flail7127 · 2024 年11 月 12 日 01:00

实际能力估计与这个图相似

体验链接

Brantfang · 2024 年11 月 12 日 01:02

2.5 不是很早发了。2.5 coder 才发吗？

JayXuZ · 2024 年11 月 12 日 01:02

2.5B的coder之前只发了7B的这次是32B

Flail7127 · 2024 年11 月 12 日 01:04

已更新标题

sap · 2024 年11 月 12 日 01:06

本地资源不够，不然可以部署个试试

wanghanlin · 2024 年11 月 12 日 01:06

我只能说垃圾，我们公司全面跟阿里合作，用的全是阿里模型，闭源的qwen-coder-max,都不行，最大问题就是幻觉处理的真垃圾，有时候答非所问，或者卡死自循环，别提开源的。

wren · 2024 年11 月 12 日 01:09

今天这个时间你得告诉他.

Auto · 2024 年11 月 12 日 01:10

你们用的是啥，api吗？我刚刚试了通义千问2.5的网页版可以正常回答

wren · 2024 年11 月 12 日 01:12

那不能这么比, 这对话前已经告诉他今天是哪天了.

web项目的对话是有初始化prompt的. 有些web给了有些没给. 我是这么理解的.

我在做的时候可以直接告诉他时间做计算或通过插件、prompt告诉他.

zjy1412 · 2024 年11 月 12 日 01:13

网页版有注入别的提示词的

joegodwanggod · 2024 年11 月 12 日 01:13

放到cling裡面說不定不錯

yunxi5 · 2024 年11 月 12 日 01:14

这样的嘛？get到了

wanghanlin · 2024 年11 月 12 日 01:15

我有闭源的千问-coder,就那样，始终不信开源的能好哪里去

handsome · 2024 年11 月 12 日 01:15

赶超没有吧。。

wren · 2024 年11 月 12 日 01:16

我正好前几天做这个测试. 我想在cursor 写changelog加时间嘛, 他也是不知道实际时间. 我后来发现最简单告诉他就好了. 通过插件我在元器上测试也是没问题的.但cursor上怎么调用插件我不知道怎么搞. 哈哈

xdtz · 2024 年11 月 12 日 01:16

不晓得同义灵码有没有的加强类

jedixu · 2024 年11 月 12 日 01:18

靠跑分就确定能打赢Claude是不是言之过早了？

SCzheng · 2024 年11 月 12 日 01:19

确实如此，跑分和实际体验还是有差距的

a3members · 2024 年11 月 12 日 01:20

国产作弊吹b第一名

smark-d · 2024 年11 月 12 日 01:25

试了试，能摸到尾灯，能用，但还是有差距

话题		回复	浏览量
LiveBench测试qwen2.5-coder:32b编码能力前沿快讯人工智能	4	276	2024 年11 月 12 日
也就是Claude 3.5 sonnet能这么厉害了! 搞七捻三人工智能	6	899	2024 年12 月 16 日
Qwen 新模型上线啦啦啦～！开发调优人工智能	19	1090	2024 年11 月 28 日
阿里云开源 Qwen2.5-Coder 全系列模型前沿快讯	0	169	2024 年11 月 12 日
通义灵码换上qwen coder了开发调优纯水	6	485	2024 年11 月 19 日