当《三体》遇见GraphRag，物理学是否还存在？

gebaini · 2024 年8 月 10 日 05:24

最近关注到微软开源了一个项目GraphRag，将知识图谱和Rag结合，具体可以看GitHub：microsoft/graphrag: A modular graph-based Retrieval-Augmented Generation (RAG) system (github.com)

首先安装部署，使用最简单的pip install 安装，详细过程参考官方文档，讲的也是比较清楚的。Get Started (microsoft.github.io)注意输入的txt编码需要和配置文件中对应，一般是utf-8，不然会报错。论坛里面也有大佬已经做过分享，这部分就不再赘述。要是想要图谱可视化，需要把配置文件后面三个选项开启：

snapshots:

  graphml: true

  raw_entities: true

  top_level_nodes: true

接下来就是体验，这次用来测试的是耳熟能详的科幻小说《三体》，用的是第一部，总共约20万字。

Pasted image 20240810122648

由于这玩意儿比较费钱，建立索引阶段只用了gpt-4o-mini来抽取实体关系。

chat_model: gpt-4o-mini
embedding_model: text-embedding-3-large

经过几分钟的等待，索引建立完成了。可以先看看实体抽取的情况，专业一点可以neo4j去进行展示分析。我这里偷个懒，直接用Python绘图。
top10的实体：

top20的实体：

top50的实体

所有的实体：

可以看出其中很多实体的关系过于冗余，一般情况下要有一些实体对齐过程。比如史强和大史应该是同一个实体。
想具体看里面关系还是用neo4j进行可视化比较好。

提问测试：

回归主题：为什么物理学不存在了？
首先使用局部搜索：

进行全局检索：

可以发现这时候全局检索会比局部检索效果好那么一些。

再问一问主角经历：

还有其他一些问题，就不一一展示了。
感觉还行，但是差点意思。PS：在提问阶段，我把模型换成gpt-4o了。

对于这种长文本理解，我们用kimi的官网试试：

不得不说，kimi的长文本理解确实更丝滑一下。

Tokens消耗方面，一路用下来，
索引阶段，花了大概3M-4M tokens
提问阶段基本上是一次提问输入10k-15k的Tokens
还是挺费的，并且抽取实体关系阶段对模型的要求也挺高，不然就瞎抽，当然我是用的提示词是官方默认的。如果可以根据应用领域进行提示词微调，效果可能会好一些。

总的来说：玩一玩就行，目前从成本和效果上考虑都差点意思

Pub · 2024 年8 月 10 日 05:28

不知道智谱行不行，最近任何參加他们活动的人都送不少Token

gebaini · 2024 年8 月 10 日 07:44

应该是可以的，不过在抽取阶段，需要结构化输出，如果指令跟随不行的话就容易出错。

Finch1 · 2024 年8 月 10 日 08:06

牛

CRI4250 · 2024 年8 月 10 日 08:11

技术佬太强了

OpenAI_Q-Star · 2024 年8 月 10 日 08:36

如有大量的知识图谱共享是否会为LLM带来改变？

lsolol · 2024 年8 月 10 日 08:48

学习了

linghch · 2024 年8 月 10 日 08:50

点赞支持，感谢分享！这是个值得继续深究的方向

handsome · 2024 年8 月 10 日 11:16

太强了

gebaini · 2024 年8 月 10 日 11:45

其实本质还是Rag，只是检索的时候多了知识图谱的推理关系

Nekof · 2024 年8 月 10 日 18:37

用三体测试其实有点问题，模型预训练阶段可能已经有相关的语料了，不一定全靠RAG的能力，也许能用小众一些的小说测试？

Nekof · 2024 年8 月 10 日 18:38

很感谢楼主的测试，我在今年上半年尝试过只用分块+普通RAG完成三体小说的召回，效果很差；也许使用deepseek的模型做信息抽取阶段的效果会更好？

skywater · 2024 年8 月 10 日 22:26

学习了

gebaini · 2024 年8 月 11 日 01:23

确实，大模型本身也知道三体剧情，但是小众的我没看过的，他要是瞎扯我应该也测不出来
deepseek也尝试了，结合提示词微调，确实会好很多，而且缓存命中确实给力，在这个场景下有一半多缓存命中了。

AuroraFly · 2024 年8 月 11 日 01:35

感谢分享，看到其他佬友说mini干这活儿不太行。另外昨天看到RAGFlow也支持了GraphRAG，不知道在给提示词的情况下效果如何

gebaini · 2024 年8 月 11 日 02:04

mini确实不太行，后面用deepseek-chat测试了，感觉好了一些。
RagFlow的GraphRag看群里大佬测试说还不稳定，后面再试试

Pub · 2024 年8 月 11 日 02:58

成本太高了

Theigrams · 2024 年8 月 11 日 04:00

GraphRAG 很强，就是比较费 Token

gebaini · 2024 年8 月 11 日 06:20

缓存命中率好高！

neo · 2024 年8 月 29 日 05:59

From #develop:ai to 资源荟萃

话题		回复	浏览量
上手GraphRAG心得（非GPT-4o跑通）资源荟萃人工智能 , GraphRAG	161	3504	2024 年8 月 29 日
吐槽一下微软的GraphRAG 资源荟萃人工智能	12	555	2024 年8 月 29 日
Open WebUI + RAG 基础资源荟萃人工智能	16	668	2024 年10 月 11 日
Dify还是Ragflow还是全都要？资源荟萃人工智能	39	1234	2024 年8 月 29 日
RAG 技术在 ChatGPT 中的使用资源荟萃 Prompt , 人工智能	7	569	2024 年8 月 29 日

当《三体》遇见GraphRag，物理学是否还存在？

提问测试：

总的来说：玩一玩就行，目前从成本和效果上考虑都差点意思

相关话题