如题,请教下各位佬,比如我本地部署了满血版deepseek r1版本,那效果是不是就跟直接访问官网的效果是一样的?还有本地只需要部署模型就行了吗,问什么就都可以回答了吗,后续怎么更新知识库呢?还有我需要本地部署的deepseek了解我们公司的业务,想训练成一个公司的业务员水平,一般是怎么操作的?对这些不太懂,有懂的佬可以指点一下吗
与你一样,从来没有接触过,也是刚刚接触,这几天查询的资料,可以先搭建一下本地测试一下。deepseek可以先下载 7B的模型进行测试,本地可以正常输出内容。后续用dify或者 RagFlow 部署公司业务知识库,调优后续在想办法解决
好多人问这个,现搜搜看其他人的帖子怎么说。看了一圈下来,大概就是投入有点大,还不保熟
比如我本地部署了满血版deepseek r1版本,那效果是不是就跟直接访问官网的效果是一样的?
假设你能满足硬件要求(非常高),仅从模型思维能力上来说,是的。
但是,官网版本有自己的system prompt是没有公开的;官网版本有联网搜索能力。所以,严格来说你没法100%复原官网版本的效果。
后续怎么更新知识库呢?
知识库已经内置在模型里,几乎没有办法大量地更新知识库。但你可以借助 RAG 来外挂某个方面的知识库(比如某个行业、某个领域、某个游戏……)。这也解答了你最后一个问题。
这个问题很大,官网是最好的,投喂资料现在也没系统的稳定工具可用。都还在进化中。
个人本地部署我觉得没啥用,参数与精度都要降到很低,最终出来的就是个弱智模型,还不如用付费API
我的理解是模型是使用数据训练好的,比如使用截止到2024年1月的网上信息进行训练,训练出来了7b的模型,这个时候我下载了7b的模型,下载的模型里已经没有数据了,但是问的问题它都能给你较好的回答,是这样吗,那我用了一段时间后,我想把截止到2025年1月的数据给他训练,我要怎么做
前面的佬友提到了,外挂知识库是比较简单的方法,比较常见的有 MaxKB、 FastGPT 、Dify
或者也可以入职ds
MaxKB 或者 Dify 搭建下吧,如果只是对于公司内的知识库问答,用不上 671B 参数的;但是成本肯定不低
有哪些响应快的V3?首字起码在几百ms,官网这些都好卡
前面还好说,满血版的说法一直很奇怪,但加钱砸下去就行
不过你这个要求可就…
没有500万别想有官网那种体验