知识库搭建技术选型？

komisch · 2025 年2 月 4 日 03:27

领导让研究一下知识库搭建相关技术方案，目前用了fastGPT搭建了个demo，嵌入模型用的是text-embedding-3-large，对话用的是4o，结果实在是一般,给的是乐企相关的开发文档，文档里面提供了全面字段和字段注释，但是都没有回答出来

使用cherrystudio测试比fastgpt好一些，但是返回的信息也不全，有佬知道问题出在哪了吗，或者有什么更好的技术方案

yhp666 · 2025 年2 月 4 日 03:32

佬可以关注下rerank模型，rag处理知识库效果不好的时候，也许会有奇效。

komisch · 2025 年2 月 4 日 03:39

感谢下午试一下

preacher · 2025 年2 月 4 日 03:42

加个reranker，本地性能不错试试bge reranker v2 m3，机器性能有限试试bge reranker base

Ke_Lee · 2025 年2 月 4 日 03:43

可以试试ragflow，文档最好转化成markdown

accfcx · 2025 年2 月 4 日 03:48

插眼关注

handsome · 2025 年2 月 4 日 04:27

硅基有rerank

newroot · 2025 年2 月 4 日 05:01

感觉还不如bm2，语义还需要量化这一步。

r1cky · 2025 年2 月 5 日 05:49

这个rerank好用吗佬友

komisch · 2025 年2 月 5 日 05:52

有用，效果比使用之前好，可以用硅基提供的免费重排序模型

okkk · 2025 年2 月 5 日 05:56

看你们需求是想要搭全私有的还是可以云端的。
如果用云端的就无脑都用openai的就ok了。包括embedding和gpt
rerank用m3的。
壳子感觉用dify更好一点

komisch · 2025 年2 月 5 日 05:58

那就是领导决定的事了我目前就是搭建看看效果，私有的话算力也是问题

okkk · 2025 年2 月 5 日 06:00

领导没规定，就无脑都上云端。效果更好，搭着也省劲。dify+openai+m3，不用m3也可以。

komisch · 2025 年2 月 5 日 06:07

这个dify和fastgpt比有什么优势吗目前用的是fastgpt

yhp666 · 2025 年2 月 5 日 06:10

dify功能比fastgpt丰富了很多，而fastgpt最大的优点就是兼容openai的标准gpt接口。我觉得各有千秋，侧重点不同吧

wangqiang · 2025 年2 月 5 日 06:13

切片问题，切得太碎了

mkdirmushroom · 2025 年2 月 9 日 06:07

插眼，谢谢

norsizu · 2025 年2 月 11 日 03:40

我感觉fastgpt的rag效果是比dify好的

a_meng · 2025 年2 月 11 日 03:43

佬，可以试一下AnythingLLM

komisch · 2025 年2 月 11 日 04:01

我试了dify后也觉得效果fastgpt最好，但是看到论坛有帖子说dify分块有问题，导致回答的效果也不行

话题		回复	浏览量
openwebui知识库向量化和重排模型选择分享开发调优人工智能 , 纯水	12	405	2025 年2 月 5 日
感谢佬解答 Cherry Studio 新更新的知识库使用搞七捻三人工智能	75	2860	2025 年1 月 17 日
5GB左右企业私有pdf文档，想要基于大模型进行自建私有知识库，有请大佬们进来交流资源荟萃人工智能	46	2502	2024 年12 月 11 日
dify 知识库试用搞七捻三人工智能 , 纯水	29	553	2025 年2 月 9 日
如何本地部署DeepSeek-r1模型训练自己的大模型开发调优人工智能 , 快问快答	26	1246	2025 年2 月 10 日