吐槽一下微软的GraphRAG

Menghuan1111 · 2024 年7 月 15 日 03:27

效果确实挺好，但是这玩意儿的token消耗实在太恐怖了一点：

输入是加起来30几页的PDF，搭建知识图谱+回答了不到十个问题就花费了我接近250万的token。

试下来，甚至仅仅是回答一次都要花费接近10万token，很难想象要是使用更大的数据量构建会花费多少token…

还好提前改成了用deepseek，不然用它默认的gpt4怕是花费直接爆炸

superares · 2024 年7 月 15 日 11:26

这个听上去不太可能吧

Foward · 2024 年7 月 15 日 11:29

graphrag是搭建知识图谱消耗巨大吧，回答问题为什么也会有这么多token，deepseek的限制好像就是128k

OpenAI_Q-Star · 2024 年7 月 15 日 11:56

效果确实挺好
效果确实挺好
效果确实挺好

这才是最重要~

Menghuan1111 · 2024 年7 月 15 日 12:08

它这个回答问题会回调llm很多次，比如在上面这个微软官方给的例子中：

因为参数设置不同，它这个消耗甚至比我的还高

Menghuan1111 · 2024 年7 月 15 日 12:12

主要效果并没有好上很多，但是token消耗是好几倍

Flail7127 · 2024 年7 月 15 日 12:24

handsome · 2024 年7 月 15 日 12:35

消耗这么多啊，离谱

wangqazwsx · 2024 年7 月 15 日 13:07

就是这个缺点，消耗量太大，而且还有很多缺点，我感觉补充新知识也麻烦，牵一发动全身，重新构建大量计算，对于公司数据就是天文数字

zefeng_lin · 2024 年7 月 15 日 13:09

刚刚本来想把公司nas里面的资料来一下，想了想几个t消耗gpt3.5可能都顶的上来linux共享一天api了

yoyo · 2024 年7 月 15 日 13:27

这东西是把全文本发出去了,

xy3 · 2024 年7 月 15 日 15:11

他回复引用的知识太多了

neo · 2024 年8 月 29 日 06:06

From #develop:ai to #share

话题		回复	浏览量
当《三体》遇见GraphRag，物理学是否还存在？资源荟萃 ChatGPT , 人工智能 , GraphRAG	19	437	2024 年8 月 29 日
微软最近爆火开源的 GraphRAG 价格打下来了开源3.8B 端侧模型，价格仅 GPT-4o 的 1/60，构建知识图谱 SOTA LLM - Triplex 来了资源荟萃人工智能	4	393	2024 年8 月 29 日
Deepseek跑GraphRAG简直太棒辣资源荟萃人工智能	4	307	2024 年8 月 29 日
上手GraphRAG心得（非GPT-4o跑通）资源荟萃人工智能 , GraphRAG	161	3504	2024 年8 月 29 日
有没有尝试用一下微软的GraphRAG？开发调优快问快答	3	373	2024 年8 月 29 日