第一次折腾cherry的RAG 这是正常的吗

因为怕网不好影响量化 所以我在cherry的知识库同时接了gemini embedding exp 03-07和bge-m3-pro处理一样的url 但是两个模型都是挂了八九个小时了还在处理中 这是正常的吗?

其实我是想把discord.py整个开发文档(https://discordpy.readthedocs.io)搬下来做rag方便查询 本来想搬到cursor里的但也不知道怎么搬 就想说放cherry里问问也行 但感觉要处理到天荒地老啊 :smiling_face_with_tear:

顺便问问佬们 如果想要在cursor里引入像discord这种开发文档的话(比如https://discordpy.readthedocs.io/en/stable/api.html) 一般怎么引入比较好啊?之前试过直接@url 但是不知道是不是上下文限制 感觉问出来完全答不对 有什么优化的技巧吗?

2 Likes

看看有没有sitemap

你可以在“网站”里粘贴这个站点地图:

https://discordpy.readthedocs.io/sitemap.xml

是可以建立索引的:

3 Likes

感谢佬!我去试试:tieba_087:

你可以试一下硅基的嵌入和重排 我在“网站”里导入这个也是可以的

感谢佬!可以了!我把索引和网址都重新加了一遍 :partying_face:

感觉昨晚网可能多少有点问题就一直卡在那了 我刚刚在规则模式下换了节点然后开了tun 两边都瞬间添加完了

嗯嗯 正常来说是最多一两分钟就可以的啦

1 Like