PDFMathTranslate:效果惊艳的开源 PDF 翻译工具,含 Zotero 一键中英对照教程


你是否还在使用公式乱码、排版混乱的“牛皮藓”式 PDF 翻译工具?收费太贵,翻译效果不好?PDFMathTranslate is ALL YOU NEED!

简介

PDFMathTranslate 是一种很新的开源科学文献 PDF 翻译引擎,它好就好在对于原始 PDF 格式的保留十分精准,其输入的中文 PDF 排版精美,公式完美保留,能达到接近原生 LaTeX 编译的效果。用户可以填自己的 API Key,用大模型减轻机翻味。虽然项目已经 18k star 了,但在站内的讨论很少,所以花点时间写篇文章宣传一下,让更多佬友能用上 SOTA 的翻译工具。

在线 Demo 与自部署

官方提供以下 Demo 服务:

但需要指出的是,BabelDOC 只能使用免费的 Bing 翻译引擎,且上传的 PDF 会被用作训练之用。因此,有条件的可以自己部署,参考部署教程以及站内帖子:

注意,本项目只支持 3.10 <= python <= 3.12。如果自部署了最新版本,可以点击开启 BabelDOC 引擎,支持原生输出左右中英文对照的 PDF,如下图:


这对于快速阅读文献非常有用,中文翻译不精确的地方可以快速查看对应的英文。

Zotero 插件一键翻译

可以参考官方教程,配置好之后的效果是右键文献就会在子目录下自动新建对应的翻译文件,省去了【打开 PDF 位置 → 上传 pdf2zh 网站 → 下载翻译好的文件 → 拖回来】的繁琐操作,非常适合那些需要反复阅读的文献。

插件安装过程中需要注意:

  • 教程里没有说怎么安装插件。直接到 Release 页面下载 zotero-pdf-2-zh.xpi,然后点击工具-插件-Install Plugin From File,安装即可。
  • 更新到 Zotero7 最新版,否则无法安装插件。

【原创】如何在 Zotero 插件中,用 BabelDOC 引擎一键生成中英文对照的 PDF。
Zotero 插件并不支持 BebelDOC 实验性引擎,也无法生成左右中英文对照的 PDF(官方只支持把页面纵向切成两半然后拼起来的“中英对照”,效果很抽象我不太能理解)。我作了一些小改动,把“Translate PDF”选项覆写为了“用 BabelDOC 引擎生成中英对照的 PDF”。具体操作:

  1. 安装 BabelDOC:
uv tool install --python 3.12 BabelDOC
  1. 在同一文件夹下,放置 server.pyconfig.toml,然后在安装 babeldoc 的同一 python 环境下启动服务(最好用 tmux/screen 守护):
python server.py

其他的配置和官方教程一致。这样,就可以一键生成左右对照的 PDF 了。

97 个赞

有点意思,晚点自己部署一下

5 个赞

佬友NB!!!我这种读paper老要翻译的起飞了

2 个赞

对比沉浸式翻译使用deeplx的文档翻译咋样?

1 个赞

最大的优势在于美学,对公式的支持几乎完美。至于翻译文本的质量,取决于你调用的大模型的能力。

2 个赞

soga,现在在zotero的选种翻译感觉基本上就够用

感谢分享~~~

装好之后老是提示网络超时怎么办,而且用命令一直无法更新 pdf2zh 到最新版本,佬们知道咋弄吗

2 个赞

真的是太好了

1 个赞

感谢推荐

感谢分享 mark一下

感谢分享

牛逼,支持

谢谢分享

1 个赞

只支持 3.10 <= python <= 3.12

感谢佬的分享

牛逼,支持

gork2一百多刀的:clown_face:api有用武之地了

谢谢大佬推荐,这就部署

1 个赞

Grok API 的 rpm 不够吧