领导想利用DeepSeek的开源搞出个自己的大语言模型

对啊,那个领导不是从员工做起来的,或者学起来的,所以就因为他这样,你就不想进步,什么都不做直到被裁么?人不应该随波逐流么?难道什么都杠,什么都要自己满意才成?等你混成了领导,一样这样剥削下属,只不过有人读书多,剥削的少而已。

哥们,你是不是会错意了…我有透露我不学习摆烂么?

我只是不想让他出成绩而已

1 个赞

问领导搞10张A100哈哈哈

1 个赞

列一个清单部署完整版R1 671B需要多少个a100给他直接就劝退了

其实是可以做的啊,deepseek-R1的70B的llama3.1不就是这么训出来的吗?懂的话感觉在llama或者qwen上用r1调一下整个行业的模型,感觉成本不会超过一万。

1 个赞

微调训练集里面是问题+回答的json格式,根据数据集的大小选择训练次数和频率,让他记住对应的问题和回答,微调是小成本的,预训练才是大成本。

也给我发一个,谢谢佬

哈哈,我们单位领导也是这样。
前几年大数据非常火的时候,提议想搞大数据。
这两年AI火了,提议要搞AI。
没有预算,先搞一个成品再说。
想了一下手上半闲置的服务器,1H1G。直接回复他说我能力不行,搞不了。
实际情况也确实是能力不行。 :joy:

1 个赞

跑个 1.5B 版本,改下 system prompt 估计足够应付他了

1 个赞

先买几张A100再说
把这几个图发出来

1 个赞

佬,我也想要tieba_099

这个就要揣摩一下领导意图了。是不是想利用开源的deepseek搞一个ai的智能服务台或知识库之类的来拉升企业效益啊。
搞个方案,或许会有惊喜~~

1 个赞

加我一个

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。