以前开过gcp,但是早就过期了。如果想用多个号的API轮询来翻译pdf,可以支持翻译完一个pdf吗。
Azure edu也有,但是国内似乎开不了gpt。
可以肯定是可以的
可以哇,谷歌api好像只有每分钟限制多少次,你在轮询时,单个key不超过这个次数就行了
免费的来翻译应该挺容易报错的
肯定是可以的。
需要格式可以使用 PDFMathTranslate
不强求格式,可以先转为md,再用 gpt_acdemic 翻译。
没有数学公式,我看的是一些文学、哲学之类的书。
我以前用沉浸式翻译,需要浏览器页面一直打开,而且API出错了还要手动重试。不知道有没有翻译工具可以挂在vps上的,并且可以限制API频率,这样就算等几天才翻译完也没有什么影响。
付费服务里, Doc2X 操作比较简便,价格也还算合理,缺点是翻译只能使用一些便宜的模型,而且不支持自定义prompt,可能影响翻译质量。
开源服务的话,可以考虑 Mineru 将pdf转为md文件(PS:虽然可以本地部署,但是也可以在 MinerU白嫖);
然后部署 gpt_academic 翻译(PS:gpt_academic 修改prompt 要到插件代码里面改,图方便的话可以使用 NEKOparapa/AiNiee)
站里不是推荐过一个pdf ai翻译开源软件
就是PDFMathTranslate
怎么样?问题解决了没?
感谢佬推荐的这几个项目,第一次听说,不过我应该用不到这么高端的。
我看的不是理工科学术论文,也没有公式,对格式需求不大。而且我测试PDFMathTranslate识别pdf好像有问题。
用到ocr的时候,不联网的用Umi-OCR_Paddle就足够;如果需要更准确的,用夸克扫描王等国产工具也够了。
我的需求其实是,限制调用API速度防止被封号。要么在翻译工具处限制,要么在API处限制。
我在论坛里搜了搜多号Gemini翻译,似乎没有好的解决方案。有new-api限流也会报错。
现有的翻译工具中,最好的AiNiee也会遇到429。可以调低任务数量,但就慢了。
可能自己写一个翻译程序,挂在vps上控制速率调用API最好。
然后觉得还是用沉浸式翻译+deeplx算了(
找了很多PDF转md的项目,之前只知道一个marker,但是效果不理想,现在看这个Mineru似乎效果不错。
这个公式识别不如其他的付费服务;但是ocr直接用的paddle,所以成功率还不错。
类似的项目除了 marker 还有 docling、markitdown。
这里推荐 mineru 主要是因为有体验网页,600页以内都可以,能给楼主省点功夫(笑)。
谢谢佬的总结,回头试试mineru
ainiee 应该有相关的功能才对啊。
在接口管理-新增自定义接口-编辑接口-编辑限额,是可以调整rpm的。
基础设置-翻译流程的最大轮次,可以一轮后重新尝试失败的翻译。
才发现确实有“编辑限额”。我不熟悉这个软件,用的是Google,而不是自定义接口。
谢谢推荐,多模型多 KEY 聚合 + 限额的功能我自己写了个,但准备看看这个项目是如何实现的。
看了它的源代码,很不优雅,甚至不如 sonnet 自己写的。不过我短时间也没空做改进,现有的满足自己用了。
项目的作者应该不是专职的程序员……
这个项目的初衷是翻译galgame和日本轻小说,大概是业余爱好者出于自己的需求开发的,功能已经挺全面的,对代码质量就不能苛求了。