我有个需求，大伙有什么主意

lxz07 · 2025 年1 月 9 日 11:33

我想把扫描版的pdf变成md，然后不能识别转化的部分截取照片，比如说机器难以识别的公式，和一些图片，目前的思路是文字可以ocr，然后可以找ai润色一下，但是怎么可以得到难以转化的部分的像素位置呢

yunxi5 · 2025 年1 月 9 日 11:47

瞧瞧这些开源项目,看看有没有帮助
marker
gptpdf
PDF-Extract-Kit

bqdong · 2025 年1 月 9 日 11:56

瞅瞅这个

lxz07 · 2025 年1 月 9 日 12:29

这么强的吗，都已经有产品了

thmu · 2025 年1 月 9 日 12:33

赞同。之前这个测试下来蛮准确，但是只是测试阶段，没有申请下来机器，没有机会部署。

ps：这个网站有API可以免费转换

saga · 2025 年1 月 10 日 03:36

顺便再求一个 markdown to epub 的工具，转成电子书看

话题		回复	浏览量
有什么网站或者轻量化工具，可以转换那种图片化文档的PDF格式到txt、doc或epub格式？资源荟萃人工智能 , 快问快答	23	206	2025 年1 月 20 日
求txt.pdf转makedown格式的软件资源荟萃人工智能 , 快问快答	23	987	2025 年1 月 20 日
将报纸类PDF做到cherry studio的知识库里面，怎么处理比较好？开发调优人工智能 , 软件开发	4	145	2025 年1 月 25 日
pdf 提取的方案，大家都有什么好的项目吗开发调优人工智能	16	398	2025 年1 月 18 日
你们都用啥PDF转WORD----最好还可以一堆都可以互相转网站最好开发调优快问快答	44	1679	2025 年1 月 18 日