如何把一整个PDF的论文发给AI？

Carlxlx · 2025 年3 月 7 日 13:57

绝大部分论文都是以PDF形式存储的，据我所知也就Gemini有能力读取PDF，剩下的都得以文字或者图片形式发给他

一般文字还好，要是有示意图也可以截个图给AI；
主要是各种公式跟图表，根本没法复制，直接是乱码，而且识图也有问题，经常识别错误，公式错一点后面的分析根本没法看

请问各位有啥方法把整个PDF内容尽可能完整的发给AI呢？

非常感谢

Hanhai · 2025 年3 月 7 日 13:59

Google的Notebooklm

petrel · 2025 年3 月 7 日 13:59

没懂，gpt和Claude不是都可以看懂pdf吗

Citus · 2025 年3 月 7 日 14:00

cherry studio应该可以，不过我还没试过

Carlxlx · 2025 年3 月 7 日 14:00

没有Gemini会员

Houyinx · 2025 年3 月 7 日 14:02

我也想问这个问题，麻烦有答案了踢一下我

Carlxlx · 2025 年3 月 7 日 14:03

Claude确实能，不过有的AI，比如o1和Deepseek就不能读取PDF，很头疼

Hanhai · 2025 年3 月 7 日 14:03

不需要会员呀

leioukupo · 2025 年3 月 7 日 14:50

自己想办法转md吧，然后搭建知识库

huanghe1223 · 2025 年3 月 7 日 14:54

推荐用zerox
getomni-ai/zerox: OCR & Document Extraction using vision models
视觉模型OCR，刚好最近nebius又能白嫖25刀了，用里面的Qwen72b的视觉模型，多白嫖几个号，感觉能用好久

_w1 · 2025 年3 月 7 日 14:57

先用gpt4o对话读取，让他提取主要过程和公司，再让o1思考回答

sosososo · 2025 年3 月 7 日 15:00

试下Zerox，最近还有免费资源。

imdoge · 2025 年3 月 7 日 15:12

都是转markdown和提取图片识别表格公式的啊，太长就rag
目前转换效果好的有minerU olmOCR，docling可能也还好

Yuanhao · 2025 年3 月 7 日 15:21

发给deepresearch（）

onz · 2025 年3 月 7 日 15:28

刚发现,Google竟然有自己的顶级域名

Qiner · 2025 年3 月 7 日 16:11

世界第一行列的公司

Theigrams · 2025 年3 月 7 日 16:51

现在还有不支持 PDF 的客户端吗？
无论是 ChatGPT 还是 Claude 的网页端都支持上传 PDF，而且是原生多模态。
DeepSeek 官网是先 OCR 成文本，再传给 LLM。

cohen8s · 2025 年3 月 7 日 19:30

claude好像不能读取pdf图片？

handsome · 2025 年3 月 8 日 02:12

这个还是用谷歌吧，上下文长

Xndown · 2025 年3 月 8 日 02:18

千问也支持pdf，现在不支持pdf的大模型少吧

话题		回复	浏览量
如何调用大模型api分析pdf 搞七捻三人工智能 , 快问快答	20	533	2025 年3 月 10 日
打算開發個gemini 批量pdf處理公開徵集提示詞！！！开发调优纯水	41	483	2025 年3 月 19 日
PDF转Markdown神器：OCR+GPT-4，让复杂公式轻松转换！资源荟萃 ChatGPT , 人工智能	53	2258	2025 年1 月 18 日
关于 PDF 有什么好的方式转成成文字发给 AI 模型开发调优快问快答	24	430	2025 年3 月 17 日
一个基于GPT-4o-mini的零样本PDF OCR 工具，将PDF文档转化为Markdown格式文本。资源荟萃	15	756	2025 年3 月 25 日