【瞎折腾】自建免费PDF转Markdown工具

Yez · 2025 年2 月 19 日 04:04

之前测试Gemini2.0正式版的多模态能力，尝试了文档转录的demo

最近利用业余时间在demo的基础上做了一些代码和提示词优化，同时撸了一个简易的前端页面，自己测试了一些特殊的PDF文档（多栏/公式/表格等），准确度都还比较理想，同时添加了一个基础的双语对照翻译功能

实现思路大概是利用工具切分PDF，然后直接将文档丢给大模型进行初步处理，处理完成后，对返回数据基于正则等相关内容进行二次处理

由于用了gemini2.0模型，所以对用量基于授权码做了一下限制，每个授权码至多转录100页

有需要的佬欢迎试用，目前图片插入原文位置的坑还没填，但已经有实现思路，后续如果有时间会来填坑，同时会增加自定义大模型key

临时折腾的小玩意，希望大家多提意见和建议

站点地址：pdf2md.aitranspdf.com（纯公益，无推广性质，上传的文档数据2小时后过期）

希望佬友们善意使用，如果扛不住成本或者其它压力时，我不保证随时跑路

Yez · 2025 年2 月 19 日 04:06

e2e2333869ce462ea34b2df3838e2424

65e5649b96c9472584f4ab2bd3f5cd4f

7461d35434d74d44917e45b562a32843

先放三个授权码，每个转录额度100页，可共用

cursor · 2025 年2 月 19 日 04:08

感谢佬友分享。能OCR处理图片pdf吗，很多资料只有图片版

Yez · 2025 年2 月 19 日 04:09

可以，图文混排的会提取图片

你可以试试

angelmake · 2025 年2 月 19 日 04:11

没做页面自适应吗？移动端…一塌糊涂

cursor · 2025 年2 月 19 日 04:11

下午试试能不能处理标准文件。
谢谢佬友

Yez · 2025 年2 月 19 日 04:15

哈哈，因为是业余随手撸的小工具，确实没有考虑移动端使用的问题

等我后面有空时做一下适配

zzq · 2025 年2 月 19 日 05:01

虽然是个好项目，但是想做大的话这么搞成本压不下去啊。

Yez · 2025 年2 月 19 日 05:12

目前在gemini2.0flash下测试来看，平均6000页PDF的提取成本在1刀左右，成本我个人感觉应该还能接受

PRO-2684 · 2025 年2 月 19 日 05:14

我记得 M$ 好像也做过一个类似的

找到了

zzq · 2025 年2 月 19 日 05:29

啊，这么便宜，完全没想到。

Yez · 2025 年2 月 19 日 05:44

感谢佬的分享，我来研究（借鉴）一下

baipiaodang · 2025 年2 月 19 日 05:55

太有实力啦

acloudee · 2025 年2 月 19 日 06:04

Yez · 2025 年2 月 19 日 06:21

佬，挂一下梯子呢，域名应该是被墙了

kyc · 2025 年2 月 19 日 06:25

可以求个实现思路吗～想自己也搭一个

Yez · 2025 年2 月 19 日 06:26

可以的佬，我一会把核心代码贴出来

handsome · 2025 年2 月 19 日 06:28

太强了，大佬！

daxia031126 · 2025 年2 月 19 日 07:10

太强了！

Yez · 2025 年2 月 19 日 07:21

51b265e08b3c4e74be56b057f2090e76

260b0c11650b4a598f15c3a3d5e2c836

5a0a624351ec472b83a69cb4dbe5c1ba

前面放的三个授权key已经用完了，这里再放3个，后续有需要的佬友可以留言获取，我看到之后回复

大家轻点薅

话题		回复	浏览量
PDF转Markdown神器：OCR+GPT-4，让复杂公式轻松转换！资源荟萃 ChatGPT , 人工智能	53	2156	2025 年1 月 18 日
推薦一下非常好用的pdf 2 md工具搞七捻三快问快答	55	1134	2025 年2 月 28 日
🔥【实践向】(๑•̀ㅂ•́)و✧ 用 Document AI 成功转录 403 页纯图扫描 PDF！开发调优 Gemini , 人工智能	18	591	2025 年2 月 28 日
【求助】佬们数据调查类pdf提取用什么工具最优啊开发调优人工智能 , 快问快答	14	235	2025 年2 月 16 日
保留格式的 PDF 翻译工具（GitHub 猛涨 🌟 & 兼容始皇接口）资源荟萃 OpenAI , 人工智能	165	6222	2025 年2 月 19 日