网页漫画翻译方案? ocr? 这是一个迫在眉睫的需求?

现成的在线漫画翻译都很差

如果你是mac可以使用safari
请务必体验一下 safari自带的翻译服务,对于多图片的ocr支持非常迅速
仍有的缺点:

  1. 排版不够智能: zoom浏览器缩放修改后 识别到的文本框位置还卡在老位置
  2. 比如日语漫画 翻译之后文字是很逆天的竖版排布(直接将文字旋转90度)

思路:
目前 沉浸式翻译 等很多插件似乎实现是靠上传图片到服务器-ocr翻译-下载到本地
这样实现的速度非常慢 远远不及safari调用苹果视觉api的速度

如何将苹果视觉api调用到其他浏览器(chrome)上 然后自定义翻译所用api(针对某些漫画特化的翻译模型想必已经存在 ) 以及翻译后的文字效果呢

12 个赞

@elfmaid

觉得safari好的话建议试试chrome自带的Google lens,一样是文字转90度,ocr准确度完爆苹果,翻译也比苹果好

有没有开源的方案 可以自定义翻译api和css效果的

我们需要的是看漫画这种多图片流时 需要一键快速无感的ocr并且翻译

谷歌的是不是需要手动上传 然后等待识别
这就背离初衷了

chrome就是一键的,你要的那种整合方案没人做,但chrome原版也比苹果强多了,你的例图的翻译效果一言难尽

以这个网页为例,safari的图片内ocr和翻译 是集成到浏览器自带的翻译功能里的

chrome怎么使用这个一键翻译 自带的翻译插件似乎只能翻译文本


使用Google智能镜头搜索,才发现pc是不会90度转字的,手机会转

翻译的效果和排版都是很棒的 试试https://mangaplus.shueisha.co.jp/viewer/1020788这种多图翻译速度

具体的翻译交互是怎么样的 safari的优点仅仅是交互
在这个网页上右键 点击翻译 然后多图几乎五秒内就全部翻译完成

1 个赞

可怕 我在线看漫画和楼主的方式不一样

之前我也用iPad上Safari也试过看漫画,效果还不如瞬译,识别和翻译:expressionless:

现在的外语漫画我都是下载 用开源的ocr翻译整好再看到 记得是个叫气球漫画翻译的

本质不是翻译 是快速实时ocr,这一步做好后翻译可以gpt

这还得手动一个一个粘贴翻译结果多累啊

我需要录屏展示safari的多图一键式ocr 翻译了 这个交互很重要 不是我手动一个个粘贴的啊

这个的效果还行。

3 个赞

这种?

这种,之前用起来效果不错,基本都是用opencv实现的

真的好!

WebSocket实现的 挺好的 w

我看了 半天,也没看懂他怎么用谷歌翻译来翻译漫画图片的,谷歌智能镜头不是手机应用吗?