CherryStudio 知识库怎么用

unitywen · 2025 年2 月 9 日 10:04

为什么这个份PDF的内容它读取不到？这个pdf内容就是cs自己的教程pdf，我搜索知识库他索引只有我手写的那个笔记知识就是力量emmm PDF文件的内容没有

unitywen · 2025 年2 月 9 日 10:06

ElonMusk · 2025 年2 月 9 日 10:08

pdf是图片版的吗

unitywen · 2025 年2 月 9 日 10:23

算是？我直接在cs的官方教程导出的pdf文件，想试试效果

stevessr · 2025 年2 月 9 日 10:25

embedding模型没有OCR功能吧……
~~pdf 文档向量化详细过程 - 技术栈~~

unitywen · 2025 年2 月 9 日 10:27

那如果我转换成word文件，可以用吗

ElonMusk · 2025 年2 月 9 日 10:28

图片版pdf转word=图片版的word，需要找ocr的，一般需要收费毕竟是在服务器上跑的，或者你本地ocr

RU_Sirius · 2025 年2 月 9 日 10:31

借楼问有什么好用的embedding模型？

Crixs · 2025 年2 月 9 日 10:32

就用硅基流动免费的就行

EFL · 2025 年2 月 9 日 11:36

你手动划一下pdf看看能不能划到文字，如果不能就说明是图片。这个知识库只能识别 PDF 里面的文字

ygmjjdev · 2025 年2 月 9 日 12:03

扫描档的pdf是不行的。试试自己写个loader 调用ocr识别文字 lol

Lain10 · 2025 年2 月 9 日 13:02

要识别pdf文字可以用ABBYY FineReader PDF，这个识别个人觉得最准

话题		回复	浏览量
将报纸类PDF做到cherry studio的知识库里面，怎么处理比较好？开发调优人工智能 , 软件开发	4	193	2025 年1 月 25 日
寻找使用大模型来辅助pdf文件学习的解决方案搞七捻三人工智能 , 快问快答	7	308	2025 年1 月 16 日
想创建个自己专业的知识库，该如何选择呢开发调优人工智能 , 快问快答	18	593	2025 年2 月 11 日
有什么网站或者轻量化工具，可以转换那种图片化文档的PDF格式到txt、doc或epub格式？资源荟萃人工智能 , 快问快答	23	226	2025 年1 月 20 日
感谢佬解答 Cherry Studio 新更新的知识库使用搞七捻三人工智能	75	2860	2025 年1 月 17 日