关于翻译OCR的各种问题，OCR的API调用相关的咨询

zcelan · 2024 年11 月 18 日 06:44

各位好，最近在弄漫画和图片翻译相关的东西，大大小小都买了好几个OCR翻译软件，每个都是别人有的好处，他这边没有，发现很多都是OCR造成的，后来下载了一个免费的需要自己调试和调用API的软件，才发现这东西还是需要自己动手。。。

首先遇到的问题当然就是哪个OCR更好，我自己用过非常多OCR
本地OCR

在线OCR
这是我不太了解的，也是目前希望大家给出意见的

百度OCR，这个我用过，但是很久之前的事情了，感觉也就那样

Google Lens：这个非常好用，但是会不稳定，不太清楚能用多少次，扫描内容特别准确，很强大。

希望了解的:
Google Cloud Vision AI这个也是谷歌的，但具体怎么使用不太清楚，请问效果如何

Gemini 和 GPT 这个应该是调用识图接口填上api，然后设置相应的prompt进行翻译吧，请问那个效果比较好，这个估计会很费token，而且好像就gpt4才能识图。

目前的话还不知道其他OCR的效果，个人感觉腾讯，火山那些也大差不差，所以暂时不考虑，除非各位佬友推荐，还有那些OCR比较好用，按道理说manga-ocr是最好的，不但时本地的，而且不花钱，问题是不知道怎么搭建，安装老是出错。不知道是不是python 版本不兼容还是怎样，pip 安装一直失败。

Zeus1 · 2024 年11 月 18 日 07:25

zcelan · 2024 年11 月 18 日 07:42

我看到GitHub release 已经两年没更新了，所以没有看，看了下discord确实好像还有人在用，可以去了解下。

Zeus1 · 2024 年11 月 18 日 07:53

这库我昨晚还在跑呢

话题		回复	浏览量
家人们谁懂啊，死了12个gemini 搞七捻三人工智能 , 纯水	46	1504	2024 年12 月 15 日
LaTeX公式图片识别工具/网站求推荐搞七捻三快问快答	41	1112	2024 年12 月 17 日
Latex公式OCR软件资源荟萃快问快答	8	543	2024 年12 月 9 日
OCR程序对接Deeplx接口 Code 开发调优 DeepLX , API , 沉浸式翻译 , 纯水	13	534	2024 年12 月 2 日
STranslate 翻译软件推荐，支持API 资源荟萃人工智能	29	1410	2024 年11 月 26 日