你是否还在使用公式乱码、排版混乱的“牛皮藓”式 PDF 翻译工具?收费太贵,翻译效果不好?PDFMathTranslate is ALL YOU NEED!
简介
PDFMathTranslate 是一种很新的开源科学文献 PDF 翻译引擎,它好就好在对于原始 PDF 格式的保留十分精准,其输入的中文 PDF 排版精美,公式完美保留,能达到接近原生 LaTeX 编译的效果。用户可以填自己的 API Key,用大模型减轻机翻味。虽然项目已经 18k star 了,但在站内的讨论很少,所以花点时间写篇文章宣传一下,让更多佬友能用上 SOTA 的翻译工具。
在线 Demo 与自部署
官方提供以下 Demo 服务:
- 公共免费服务 在线使用,无需安装 (推荐)。
- 沉浸式翻译 - BabelDOC 每月免费 1000 页。(推荐)
- HuggingFace 托管演示
- ModelScope 托管演示 在线使用,无需安装。
但需要指出的是,BabelDOC 只能使用免费的 Bing 翻译引擎,且上传的 PDF 会被用作训练之用。因此,有条件的可以自己部署,参考部署教程以及站内帖子:
注意,本项目只支持 3.10 <= python <= 3.12。如果自部署了最新版本,可以点击开启 BabelDOC 引擎,支持原生输出左右中英文对照的 PDF,如下图:
这对于快速阅读文献非常有用,中文翻译不精确的地方可以快速查看对应的英文。
Zotero 插件一键翻译
可以参考官方教程,配置好之后的效果是右键文献就会在子目录下自动新建对应的翻译文件,省去了【打开 PDF 位置 → 上传 pdf2zh 网站 → 下载翻译好的文件 → 拖回来】的繁琐操作,非常适合那些需要反复阅读的文献。
插件安装过程中需要注意:
- 教程里没有说怎么安装插件。直接到 Release 页面下载 zotero-pdf-2-zh.xpi,然后点击工具-插件-Install Plugin From File,安装即可。
- 更新到 Zotero7 最新版,否则无法安装插件。
【原创】如何在 Zotero 插件中,用 BabelDOC 引擎一键生成中英文对照的 PDF。
Zotero 插件并不支持 BebelDOC 实验性引擎,也无法生成左右中英文对照的 PDF(官方只支持把页面纵向切成两半然后拼起来的“中英对照”,效果很抽象我不太能理解)。我作了一些小改动,把“Translate PDF”选项覆写为了“用 BabelDOC 引擎生成中英对照的 PDF”。具体操作:
- 安装 BabelDOC:
uv tool install --python 3.12 BabelDOC
- 在同一文件夹下,放置 server.py、config.toml,然后在安装 babeldoc 的同一 python 环境下启动服务(最好用 tmux/screen 守护):
python server.py
其他的配置和官方教程一致。这样,就可以一键生成左右对照的 PDF 了。