小扎的Meta(Llama)被Deepseek吓到了

Meta 的生成式 AI 部门陷入恐慌

事情始于 DeepSeek V3 的发布,它在基准测试中已经将 Llama 4 远远甩在身后。更令人雪上加霜的是,一家“训练预算只有 550 万美元的不知名的中国公司”也取得了如此成就。

工程师们正疯狂地分析 DeepSeek,并尽一切可能地复制它的所有东西。我毫不夸张。

管理层正在担心如何为生成式 AI 部门的巨额成本辩护。当生成式 AI 部门的每一个“领导者”的薪酬都超过了 DeepSeek V3 的全部训练成本时,他们将如何面对高层领导?而我们有几十个这样的“领导者”。

DeepSeek R1 的出现让情况变得更加糟糕。我不能透露机密信息,但它很快就会公之于众。

这本来应该是一个以工程为中心的小型组织,但由于一群人为了捞取影响力而蜂拥而至,并人为地抬高了该部门的招聘人数,最终导致所有人受损。

39 Likes

有点离谱

1 Like

哈哈,不至于
自带戏码吧:grin:

3 Likes

:rofl:坐等llama4,不能是真的吧

1 Like

卷起来 美国佬日子太好确实不给力

1 Like

是有点离谱。

1 Like

这属于中国的后起之秀

1 Like

R1和V3技术报告

3 Likes

DeepSeek连论文都公开了,Meta连抄作业都不会吗?

1 Like

只是这几十页还是不太够抄作业的,但是至少大概的思路都公开了
按照这些公开资料能知道大概怎么做一个deepseek v3,但是没法知道是怎么以如此低的成本做到的

1 Like

:rofl::rofl::rofl:

3 Likes

Meta现在担心的是llama 4刚出来,DeepSeek v3.5又给它当头一棒

1 Like

太逗了

14 Likes

llama冲呀

…我不信

大家卷起来!DS效率高是事实,这篇文章可能有点夸张,但业内肯定都会反思。证明是可以走出不完全依赖scaling law的道路的
DS低成本是应届生或工作不太久的非大腕居多,人力成本就省下一大笔,硬件其实幻方是有的。

1 Like

25年肯定能复刻22-23年的LLM爆发

对上账了,美国资本家也感受到了不对劲

原来国外模型贵的原因不是硬件多厉害,而是领导工资高啊,而且高的离谱!

DS给出的$5.576M成本是只有训练成本的,哪里会算人工成本进去

3 Likes