如何本地部署DeepSeek-r1模型训练自己的大模型

coderEvan · 2025 年2 月 6 日 03:34

关于本地部署DeepSeek-r1模型进行定制化训练的问题，想请教一些技术细节。我们公司计划开发一套智能问答系统，主要用于内部业务指南的自动化处理。考虑到数据安全性和定制化需求，我们希望在本地环境部署DeepSeek-r1模型。

具体而言，我们有以下疑问：

我们计划使用公司积累的高质量业务文档和知识库作为训练数据，期望最终模型能够准确理解和回答与公司业务相关的问题。

感谢各位大佬的宝贵时间和建议！

Deno · 2025 年2 月 6 日 03:44

蹲一个答案

aniymx · 2025 年2 月 6 日 03:44

我也有同样的疑问

yk_chen · 2025 年2 月 6 日 05:28

建议基于DeepSeek-R1构建RAG，尽量不要训练

poplarO_O · 2025 年2 月 6 日 05:30

同蹲一个答案

WyInnovate · 2025 年2 月 6 日 05:33

就我的理解部署现有的模型不能训练训练模型是另外一个方面可以搜搜
其他参考如下

komisch · 2025 年2 月 6 日 05:35

这就是知识库的使用场景我的感觉是搭建知识库不需要用推理模型，我用deepseek V3 跑出来效果不错，私有部署可能搞个千问的72b模型就够用

chchchchc · 2025 年2 月 6 日 05:36

微调满血版的成本很高吧

coderEvan · 2025 年2 月 6 日 05:41

不会用到 671b ，只是 14b 或者 32b 这种能回答一些基本问题的，然后也能结合我们公司的业务知识

shuyu · 2025 年2 月 6 日 05:44

求解，如果是知识库的需求，使用deepseek v3模型部署之后，怎么去喂模型知识呢，

zilanlann · 2025 年2 月 6 日 05:45

搜索关键词：RAG

komisch · 2025 年2 月 6 日 05:45

V3私有部署成本可不是一点半点的 A100那样的计算卡没个十张八张的怕是不行
你先用fastgpt或者dify搭配硅基的API玩玩吧

nedved888 · 2025 年2 月 6 日 05:59

这个问题问过deepseek，回答基本上说是难度非常高，最多是有这方面专业人员可以对模型做微调，最简单还是rag之类的。

coderEvan · 2025 年2 月 6 日 06:02

我找到了一个开源项目貌似能解决我的问题，使用从外部知识库检索相关信息来辅助大语言模型生成更准确、更丰富的文本内容

myzr · 2025 年2 月 6 日 06:03

推理好像不用，堆个8台64G M4 pro mini就能起飞。

komisch · 2025 年2 月 6 日 06:06

这能搞到一起吗

WIlson · 2025 年2 月 6 日 06:12

研究一下,怎么样

coderEvan · 2025 年2 月 6 日 06:13

在测试了

coderEvan · 2025 年2 月 6 日 06:14

可以的，这个也支持deepseek了

myzr · 2025 年2 月 6 日 06:17

可以，m4 pro 都是雷电5，带宽贼高。用EXO项目可以分布式部署。GitHub - exo-explore/exo: Run your own AI cluster at home with everyday devices 📱💻 🖥️⌚
基本上模型都可以部署。还可以叠更多。比如几台192G的 m2 ultra。

话题		回复	浏览量
5GB左右企业私有pdf文档，想要基于大模型进行自建私有知识库，有请大佬们进来交流资源荟萃人工智能	46	2506	2024 年12 月 11 日
现在批量处理PDF 书籍最好的大模型是谁搞七捻三快问快答 , 纯水	8	350	2025 年1 月 16 日
感谢佬解答 Cherry Studio 新更新的知识库使用搞七捻三人工智能	75	2880	2025 年1 月 17 日
有没有自己训练ai的教程搞七捻三人工智能 , 快问快答 , 纯水	25	566	2025 年1 月 15 日
知识库搭建技术选型？搞七捻三快问快答	30	876	2025 年2 月 11 日