DeepSeek-V3-Base 开源，685B Moe

mrcat · 2024 年12 月 25 日 17:47

参数量：685B！

混合专家 (MoE)：256 个专家动态路由，智能分配计算任务，效率与性能兼备。

动态位置嵌入：结合 RoPE 动态扩展机制。

高效量化：支持 FP8 格式量化，部署友好（这正常凡人跑不起来应该）。

注意力机制改进：疑似使用 lora 思想进一步改进 multi latent attention（猜测，不懂装懂）

唯一的缺点是：没有 README ，一副「我们就是这么豪横」的气质。

官方：“README？我们还没来得及写，因为在忙着上传权重。”

权重链接：

homeworkkun · 2024 年12 月 25 日 17:51

Reddit上有人发了LiveBench，如果是真实分数的话，大概对应这个水平

现在最大问题是这个信源可信吗（

mrcat · 2024 年12 月 25 日 17:55

官网还没有，不好说哈哈哈哈

neteroster · 2024 年12 月 25 日 17:57

这个数据是没问题的，我自己跑的是62出头，群友也跑了，60.几，都是误差范围

ljoker · 2024 年12 月 25 日 17:58

685b比gpt4o能力强我倒不是很惊讶，问题是真比Claude3.5强吗，（opus在榜上都看不见？我觉得opus能力还是挺猛的）

homeworkkun · 2024 年12 月 25 日 18:02

livebench官网上3opus是49.12，我截掉了

ljoker · 2024 年12 月 25 日 18:04

4o这越更新越落后也是给我整笑了

passerby064857 · 2024 年12 月 25 日 18:09

這波能不能逼出claude的3.5-opus或者claude-4-sonnet?

mrcat · 2024 年12 月 25 日 18:23

貌似干翻了哈哈哈

mrcat · 2024 年12 月 25 日 18:39

根据大家的回复，思考了一些内容：

评测数据来源分析

LiveBench 数据：

P3

P4

该数据来源于公开的 P3 数据，这是基于 10.22 的测试数据。

最新数据测试：

P5

最新的测试数据为 P5 数据，目前尚未开源，所以佬提供的数据可能是与 P4 结果对标的测试数据，预计分数接近 60 分。

结合佬提供的 DeepSeek-v3 的成绩：

DeepSeek-v3 的测试分数为 60+ 分，直逼 o1。

lueluelue · 2024 年12 月 25 日 18:48

卧槽，果然很猛

lueluelue · 2024 年12 月 25 日 18:49

不思考的模型能和思考模型碰一碰的也就只有谷歌和deepseek了

jiu1 · 2024 年12 月 25 日 22:20

如果是真的话就很厉害了

1-debtor · 2024 年12 月 25 日 22:53

这波很猛啊

gokyo · 2024 年12 月 25 日 22:59

感觉openai再憋一个大招哈哈

bard · 2024 年12 月 26 日 00:04

太大了太大了

BenSu · 2024 年12 月 26 日 00:21

就是豪横！

ProxyCN · 2024 年12 月 26 日 00:30

跑这个模型需要至少30张4090，或者10张H100，成本大概60万-100万之间。有钱的佬可以部署一个玩玩。

mrcat · 2024 年12 月 26 日 00:37

非常人可玩版

Flail7127 · 2024 年12 月 26 日 00:37

编程的排行还是挺靠谱的，用过 OpenAI01.net 的o1，远超 Claude-3.5-Sonnet 和 gemini-exp-1206

话题		回复	浏览量
DeepSeek-V3 已悄咪咪上线网页端以及 API 开发调优人工智能	225	4256	2024 年12 月 31 日
deepseek疑似偷偷升级V3，速度快的吓人搞七捻三人工智能	105	2127	2024 年12 月 27 日
deepseek-v3 超过 claude-3.5？前沿快讯 ChatGPT , OpenAI , 人工智能	63	2360	2024 年12 月 29 日
DeepSeek开源6850亿参数V3模型，利好OAI套壳公司吗? 搞七捻三 DeepSeek , 人工智能 , 快问快答 , 纯水	18	672	2024 年12 月 26 日
DeepSeek-V3 技术报告，训练仅需550w💰，部署成本貌似也不低开发调优人工智能	19	1990	2024 年12 月 27 日