【通知】DeepSeek API 开放平台将于今晚18:00至明天进行模型版本升级,期间服务不会中断。
好耶 希望长对话循环bug修复掉,然后更智能些
盲猜一手加速,现在吐槽速度的太多了
你说的是代码补全的提速吧,代码补全我没怎么用过
这次会升级啥啊 @DS_touch_fish
什么时候会有文件上传的功能啊? @DS_touch_fish
@DS_touch_fish 联网有没有啊,可以有不同的对话吗,现在的有点像临时对话
这轮是模型本身的能力升级,别的 feature 要再等等,键盘冒烟了
抓!
human eval还够你们用么
提升大吗,主要改进什么方面呢
那也行。还以为是 fim 的速度提升,提升那真就起飞了
现在还是够的,这轮的模型提升的是一个很难猜到的切入角度
期待,希望看到更强的模型
能不能提前透露下
网页端已经可以体验了,算是个中等版本的更新,指令跟随能力优化了很多
另外还有个更新的点明天再揭晓(因为要下班了今天来不及改前端了)
这个版本会开源不
不清楚 但是如果发了 huggingface 我可以来戳你
太好了,要升级了
来自微信群官方公告:
【更新说明】
DeepSeek Coder V2和DeepSeek V2 Chat两个模型已经合并升级,升级后的新模型为DeepSeek V2.5。
新模型在通用能力、代码能力上,都显著超过了旧版本的两个模型。
为向前兼容,API用户通过deepseek-coder或deepseek-chat均可访问新模型。
新模型更好地对齐了人类的偏好,在写作任务、指令跟随等多方面进行了优化:
ArenaHard winrate从 68.3% 提升至 76.3%;
AlpacaEval 2.0 LC winrate从 46.61% 提升至 50.52%;
MT-Bench 分数从 8.84 提升至 9.02;
AlignBench 分数从 7.88 提升至 8.04;
新模型在原Coder模型的基础上进一步提升了代码生成能力,对常见编程应用场景进行了优化,并在标准测试集上取得了以下成绩:
HumanEval: 89%;
LiveCodeBench (1-9月): 41%;
新模型会开源,预计明天会发布更多的细节。
还没用过旧版就又升级了,这个好用吗