领导让研究一下知识库搭建相关技术方案,目前用了fastGPT搭建了个demo,嵌入模型用的是text-embedding-3-large,对话用的是4o,结果实在是一般,给的是乐企相关的开发文档,文档里面提供了全面字段和字段注释,但是都没有回答出来
使用cherrystudio测试比fastgpt好一些,但是返回的信息也不全,有佬知道问题出在哪了吗,或者有什么更好的技术方案
领导让研究一下知识库搭建相关技术方案,目前用了fastGPT搭建了个demo,嵌入模型用的是text-embedding-3-large,对话用的是4o,结果实在是一般,给的是乐企相关的开发文档,文档里面提供了全面字段和字段注释,但是都没有回答出来
佬可以关注下rerank模型,rag处理知识库效果不好的时候,也许会有奇效。
感谢 下午试一下
加个reranker,本地性能不错试试bge reranker v2 m3,机器性能有限试试bge reranker base
可以试试ragflow,文档最好转化成markdown
插眼 关注
硅基有rerank
感觉还不如bm2,语义还需要量化这一步。
这个rerank好用吗佬友
有用,效果比使用之前好,可以用硅基提供的免费重排序模型
看你们需求是想要搭全私有的还是可以云端的。
如果用云端的就无脑都用openai的就ok了。包括embedding和gpt
rerank用m3的。
壳子感觉用dify更好一点
那就是领导决定的事了 我目前就是搭建看看效果,私有的话算力也是问题
领导没规定,就无脑都上云端。效果更好,搭着也省劲。dify+openai+m3,不用m3也可以。
这个dify和fastgpt比有什么优势吗 目前用的是fastgpt
dify功能比fastgpt丰富了很多,而fastgpt最大的优点就是兼容openai的标准gpt接口。我觉得各有千秋,侧重点不同吧
切片问题,切得太碎了
插眼,谢谢
我感觉fastgpt的rag效果是比dify好的
佬,可以试一下AnythingLLM
我试了dify后也觉得效果fastgpt最好,但是看到论坛有帖子说dify分块有问题,导致回答的效果也不行