davy
(李成蹊)
1
Meta 的生成式 AI 部门陷入恐慌
事情始于 DeepSeek V3 的发布,它在基准测试中已经将 Llama 4 远远甩在身后。更令人雪上加霜的是,一家“训练预算只有 550 万美元的不知名的中国公司”也取得了如此成就。
工程师们正疯狂地分析 DeepSeek,并尽一切可能地复制它的所有东西。我毫不夸张。
管理层正在担心如何为生成式 AI 部门的巨额成本辩护。当生成式 AI 部门的每一个“领导者”的薪酬都超过了 DeepSeek V3 的全部训练成本时,他们将如何面对高层领导?而我们有几十个这样的“领导者”。
DeepSeek R1 的出现让情况变得更加糟糕。我不能透露机密信息,但它很快就会公之于众。
这本来应该是一个以工程为中心的小型组织,但由于一群人为了捞取影响力而蜂拥而至,并人为地抬高了该部门的招聘人数,最终导致所有人受损。
39 Likes
F-droid
(F-Droid)
9
DeepSeek连论文都公开了,Meta连抄作业都不会吗?
1 Like
Ghidra
()
10
只是这几十页还是不太够抄作业的,但是至少大概的思路都公开了
按照这些公开资料能知道大概怎么做一个deepseek v3,但是没法知道是怎么以如此低的成本做到的
1 Like
F-droid
(F-Droid)
12
Meta现在担心的是llama 4刚出来,DeepSeek v3.5又给它当头一棒
1 Like
linghch
(高行健)
16
大家卷起来!DS效率高是事实,这篇文章可能有点夸张,但业内肯定都会反思。证明是可以走出不完全依赖scaling law的道路的
DS低成本是应届生或工作不太久的非大腕居多,人力成本就省下一大笔,硬件其实幻方是有的。
1 Like
bjss
19
原来国外模型贵的原因不是硬件多厉害,而是领导工资高啊,而且高的离谱!
image
(image)
20
DS给出的$5.576M成本是只有训练成本的,哪里会算人工成本进去
3 Likes