5GB左右企业私有pdf文档，想要基于大模型进行自建私有知识库，有请大佬们进来交流

doballll · 2024 年8 月 26 日 02:57

叠一下buff 仅代表个人观点

kuschzzp · 2024 年8 月 26 日 03:08

你的意思是数据整理这一步交给AI去做，叫它生成问答结构化数据？这咋感觉和dify的Q&A模式有点像了。
感觉有点鬼畜了，用导入知识库的Q&A模式分段成问答，然后再用知识库的问答内容做微调的数据集，“取之知识库，用之知识库呀” =。= 0.0

Sen · 2024 年8 月 26 日 03:10

mark一下学习学习

hl128k · 2024 年8 月 26 日 03:12

马克学习一下,感觉会用到

doballll · 2024 年8 月 26 日 03:19

我的意思是直接文档生成的qa去微调中间夹知识库的操作用dify、fastgpt这些也不合适要夹知识库这种效果的东西我觉得结合graghrag和一些别的操作更合适（对于上下逻辑链比较长的东西然后又要求准确性相当费钱就是）

doballll · 2024 年8 月 26 日 03:20

也不是说不合适就是很奇怪这样的操作

player · 2024 年8 月 26 日 04:51

blank00 · 2024 年8 月 26 日 04:54

最近在做RAG相关的研究，感觉很适合你这样的场景。

GonFreecss · 2024 年8 月 26 日 05:17

mark一下，最近在学习知识库

ratuaroricus · 2024 年8 月 26 日 06:12

你首先要明白微调和rag的区别和各自的适用场景，然后再决定该用什么。

kuschzzp · 2024 年8 月 26 日 06:14

大佬能举个例子么？

reepool · 2024 年8 月 26 日 06:16

mark，学习

xy3 · 2024 年8 月 26 日 06:18

自建知识库，比如fastgpt，maxkb，dify
一般部署用docker，迁移也很方便，新机器安装docker后把旧机器的文件夹搞过来就好了

xy3 · 2024 年8 月 26 日 06:19

训练的话，每次要新增数据都要重新进行训练，可能没那么方便

neo · 2024 年8 月 29 日 05:53

tan73123 · 2024 年10 月 6 日 14:16

做记号，感觉能用到

linghch · 2024 年10 月 6 日 15:50

标记一下，点赞支持！

LeoMaster · 2024 年10 月 26 日 03:02

大佬的知识库搭建起来了么？最终敲定的哪种方案啊？希望分享一下心得

kuschzzp · 2024 年10 月 29 日 07:12

我们最后选的是二次开发 ragflow 0.0

jayz · 2024 年11 月 8 日 03:47

我也测试过dify，fastgpt，ragflow 知识库应用，发现还是ragflow 更符合预期，同时又觉得这类知识库的应用，只是向量化。所以想了解一下你们二次开发是针对什么进行加强呢？

话题		回复	浏览量
【求助】老板让我搭建一个本地AI大模型开发调优人工智能	42	2358	2024 年12 月 16 日
急！！！🥲请问有没有局域网内的可供多人使用的知识库项目开发调优人工智能 , 职场 , 快问快答	114	2852	2025 年4 月 3 日
我想给自己学校，微调一个大模型，专门回答学校相关的问题开发调优人工智能	41	1665	2025 年3 月 22 日
佬们，知识库是怎么投喂的？开发调优 ChatGPT , 人工智能 , 快问快答	29	781	2025 年3 月 15 日
fastgpt和dify各有什么有缺点开发调优人工智能 , 快问快答	55	2503	2025 年3 月 26 日