DeepSeek又要升级了

xieisabug · 2024 年9 月 5 日 09:21

【通知】DeepSeek API 开放平台将于今晚18:00至明天进行模型版本升级，期间服务不会中断。

kill · 2024 年9 月 5 日 09:24

好耶希望长对话循环bug修复掉，然后更智能些

xieisabug · 2024 年9 月 5 日 09:25

盲猜一手加速，现在吐槽速度的太多了

kill · 2024 年9 月 5 日 09:26

你说的是代码补全的提速吧，代码补全我没怎么用过

Mamba_out · 2024 年9 月 5 日 09:26

这次会升级啥啊 @DS_touch_fish

velsa · 2024 年9 月 5 日 09:27

什么时候会有文件上传的功能啊？ @DS_touch_fish

momo4 · 2024 年9 月 5 日 09:28

@DS_touch_fish 联网有没有啊，可以有不同的对话吗，现在的有点像临时对话

DS_touch_fish · 2024 年9 月 5 日 09:36

这轮是模型本身的能力升级，别的 feature 要再等等，键盘冒烟了

xieisabug · 2024 年9 月 5 日 09:37

抓！
human eval还够你们用么

neteroster · 2024 年9 月 5 日 09:37

提升大吗，主要改进什么方面呢

Feng · 2024 年9 月 5 日 09:39

那也行。还以为是 fim 的速度提升，提升那真就起飞了

DS_touch_fish · 2024 年9 月 5 日 09:45

现在还是够的，这轮的模型提升的是一个很难猜到的切入角度

asoluer · 2024 年9 月 5 日 09:45

期待，希望看到更强的模型

asoluer · 2024 年9 月 5 日 09:45

能不能提前透露下

DS_touch_fish · 2024 年9 月 5 日 10:02

网页端已经可以体验了，算是个中等版本的更新，指令跟随能力优化了很多

另外还有个更新的点明天再揭晓（因为要下班了今天来不及改前端了）

neteroster · 2024 年9 月 5 日 10:37

这个版本会开源不

DS_touch_fish · 2024 年9 月 5 日 11:21

不清楚但是如果发了 huggingface 我可以来戳你

handsome · 2024 年9 月 5 日 13:11

太好了，要升级了

xieisabug · 2024 年9 月 5 日 14:40

来自微信群官方公告：
【更新说明】
DeepSeek Coder V2和DeepSeek V2 Chat两个模型已经合并升级，升级后的新模型为DeepSeek V2.5。
新模型在通用能力、代码能力上，都显著超过了旧版本的两个模型。
为向前兼容，API用户通过deepseek-coder或deepseek-chat均可访问新模型。

新模型更好地对齐了人类的偏好，在写作任务、指令跟随等多方面进行了优化：

ArenaHard winrate从 68.3% 提升至 76.3%；
AlpacaEval 2.0 LC winrate从 46.61% 提升至 50.52%；
MT-Bench 分数从 8.84 提升至 9.02；
AlignBench 分数从 7.88 提升至 8.04；

新模型在原Coder模型的基础上进一步提升了代码生成能力，对常见编程应用场景进行了优化，并在标准测试集上取得了以下成绩：

HumanEval: 89%；
LiveCodeBench (1-9月): 41%；

新模型会开源，预计明天会发布更多的细节。

outgoing · 2024 年9 月 5 日 14:45

还没用过旧版就又升级了，这个好用吗

话题		回复	浏览量
DeepSeek再升级！开发调优人工智能	28	1475	2024 年9 月 8 日
Deepseek（并非）最新消息资源荟萃人工智能	9	555	2024 年8 月 29 日
体验全新DeepSeek V2.5 开发调优人工智能	4	460	2024 年9 月 6 日
那么deepseek v2.5的api model应该填啥？开发调优 DeepSeek , 人工智能 , 快问快答	8	461	2024 年9 月 6 日
佬们，开源大模型又卷起来了资源荟萃人工智能	134	3169	2024 年8 月 29 日

DeepSeek又要升级了

相关话题