佬们想问一个rag开发的问题

如果想开发一个做题网站,或者学习什么网站
比如上传一个 pdf 的书,,根据书中内容出题,
又或者像腾讯 ima 一样生成一些知识图谱依次问答,这种应该怎么搞,有什么工具推荐吗
(其实感觉功能也有点像谷歌 notebook 但是那个对于整本书大小的 pdf 总结就很简略了

我说的这种需求是不是,比较异想天开?那现在有没有什么可以拆分一下容易实现的需求。

可以考虑 pdf 按章节拆分,然后 按章节喂给大模型 帮你生成内容

2 Likes

一种是微调模型。一种是喂给大数据,让其结构化返回,自己再做上层应用。

出题不难。
难的是出什么题目,什么深度。考试目标是什么。这个很难给模型将清楚。 会严重影响出题的可用性。

比较好的可控的路径 我认为应该这样
1 上传文档
2 告诉大模型学习目标和针对人群 让大模型总结知识点。
3 人工审查一下知识点
4 让大模型按照知识点进行出题,结合原文档,生成题库。
6 让大模型从题库中抽取题目综合考核目标出卷子。

其实就是知识库吧
GEMINI之前也出了这个出题的示例

有道理,,唉 还是噱头吧,那种输入文档生成题目,,很有噱头
现在也有一些是这样的不过上下文很少,而且吧,这种反正应用必然是文科题目,简单的选择填空 判断可以,论述题就得另说了

确实,,我听说vertex有自己搞rag的服务,但是之前薅gcp感觉整个vertex平台易用性太难评了

可以搞啊,主要是你要控制难度,回头答案得自己论证,毕竟你不能保证AI给的答案100%不出错

先将图书的文字切片,然后 embedding 存入 vector 数据库,进行 RAG 搜索。

knowledge Graph 知识图谱同理,存 neoj4 图数据库,进行 GraphRAG。

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。