领导想利用DeepSeek的开源搞出个自己的大语言模型

374qie · 2025 年2 月 10 日 13:40

对啊，那个领导不是从员工做起来的，或者学起来的，所以就因为他这样，你就不想进步，什么都不做直到被裁么？人不应该随波逐流么？难道什么都杠，什么都要自己满意才成？等你混成了领导，一样这样剥削下属，只不过有人读书多，剥削的少而已。

kiki · 2025 年2 月 10 日 13:50

哥们,你是不是会错意了…我有透露我不学习摆烂么？

我只是不想让他出成绩而已

lueluelue · 2025 年2 月 10 日 13:52

问领导搞10张A100哈哈哈

x.xx · 2025 年2 月 10 日 14:33

列一个清单部署完整版R1 671B需要多少个a100给他直接就劝退了

Candy · 2025 年2 月 10 日 14:39

其实是可以做的啊，deepseek-R1的70B的llama3.1不就是这么训出来的吗？懂的话感觉在llama或者qwen上用r1调一下整个行业的模型，感觉成本不会超过一万。

javabase · 2025 年2 月 11 日 07:03

微调训练集里面是问题＋回答的ｊｓｏｎ格式，根据数据集的大小选择训练次数和频率，让他记住对应的问题和回答，微调是小成本的，预训练才是大成本。

bryant2009 · 2025 年2 月 11 日 07:07

也给我发一个，谢谢佬

origin · 2025 年2 月 12 日 08:05

哈哈，我们单位领导也是这样。
前几年大数据非常火的时候，提议想搞大数据。
这两年AI火了，提议要搞AI。
没有预算，先搞一个成品再说。
想了一下手上半闲置的服务器，1H1G。直接回复他说我能力不行，搞不了。
实际情况也确实是能力不行。

hansnow · 2025 年2 月 12 日 08:07

跑个 1.5B 版本，改下 system prompt 估计足够应付他了

meng_hao_hao · 2025 年2 月 12 日 09:12

先买几张A100再说
把这几个图发出来

ZuiFengTing · 2025 年2 月 14 日 01:09

佬，我也想要

likoo · 2025 年2 月 14 日 01:19

这个就要揣摩一下领导意图了。是不是想利用开源的deepseek搞一个ai的智能服务台或知识库之类的来拉升企业效益啊。
搞个方案，或许会有惊喜~~

ratuaroricus · 2025 年2 月 15 日 23:12

加我一个

system · 2025 年3 月 17 日 23:12

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。

话题		回复	浏览量
老板要求弄个AI让员工使用开发调优人工智能	77	2360	2025 年3 月 7 日
最近我司在搞AI赋能搞七捻三人工智能 , 职场	75	1976	2025 年3 月 13 日
DeepSeek 新手上路 (二) 模型自部署文档共建人工智能	53	2757	2025 年3 月 5 日
想搭建个本地AI，有没有那种精简版的？搞七捻三人工智能 , 快问快答	19	447	2025 年3 月 16 日
用不了多久，DeepSeek就会被国内大厂挤出赛道搞七捻三纯水	106	4192	2025 年3 月 6 日