🔥【实践向】(๑•̀ㅂ•́)و✧ 追番自由!竖版日漫 OCR 速翻!生肉炸至六成熟

(\ _ /)
( ・-・)
/っ :coffee: 就是,前两天刨了个新玩意 Document AI :arrow_lower_left:

:fire:【实践向】(๑•̀ㅂ•́)و✧ 用 Document AI 成功转录 403 页纯图扫描 PDF!
:volcano:【GCP刨土系列】Document AI 带坐标的 OCR 识别

然后发现好像还有别的用途。

于是就拿今天(东京时间 2025/02/28 12:00)更新的 《見える子ちゃん》 试试。

① 首先去 JP 网站把生肉顺下来:

② 然后用上面帖子提到的脚本批量转录一下:

pā 的一下就好了,很快 á!

然后得到一堆 html 文件

③ 双击打开是这样的,自带坐标

我在原贴脚本基础上加了:

  • DIV 可编辑
  • 拖拽 DIV 重叠合并
  • 拖拽缩放文本
  • 横竖版切换

少量识别断开的拖动一下合并就好 :arrow_lower_left:

④ 然后上膛 —— 沉浸式翻译走起。。

⑤ 然后逐一右键导出画布就好

↺ 重复上述步骤。


成品:見える子ちゃん 64 机翻.zip (3.6 MB)

为了提高文本可读性把底图透明度调低了,高清版就留给真汉化组吧。

24 个赞

前排围观大佬

好东西啊,不过要一页一页来翻译还是效率低了点,要是能批量自动处理就舒服了tieba_003

那个是杀猪价啊。。。

就算有300刀也觉得肉疼

300刀账号多少钱一个来着?

:bili_040: 要求不高的话一已经是批处理了,到一键导出 html 那步就可以一键沉浸式翻译了自己追番的话。后面的修正导出是导给群友的

不知道价格的说,反正那 403 页的 PDF 处理完大概 $1 左右。

你也太强了!

我在想 能不能用glm 4v免费额度来识别定位文字 这玩意额度贼大

:bili_040: @Lush @xdh211985 上班呢 bro。尽量别发私信我把论坛私聊功能都关了,我不是热佬我是水逼,有空看到就回现在闭关工作。

2 个赞

太强了黛玉 :tieba_087:好的

Google 在多模态普及之前就已经有物体标注了,常规多模态应该没训练过这方面。

太强了:+1:

我勒个豆 你也追看得见的女孩啊

你可以看看昨天更新生肉后,我做的熟肉的tieba_087

【图片】64话 嵌字汉化熟肉【看得见的女孩吧】_百度贴吧

3 个赞

:tieba_087: 你有在狗群主(吧主)那个傻逼群吗?

1 个赞

啊 没有啊, 我从不加群
我汉化纯粹是因为喜欢这部作品,为啥加群 :tieba_087:

我之前已经汉化了62,63话了,我都是发在贴吧,热度还可以。。

我上个月做的63话熟肉,我看别人上传到拷贝漫画去了(我甚至还在禁漫看到我做的熟肉) :tieba_087:

1 个赞

:tieba_087: 哦哦,我是单行本还没发售之前看到贴吧有发【猎奇向】贴开始入局的,但没怎么追,就随缘看群友什么时候搬运过来了就看看

1 个赞

:tieba_087: 原来是汉化巨佬

2 个赞

牛牛牛!!!

你追的话 我后面每次更新都踢你一下 :tieba_087:

看得见的女孩,这几个月这几话,我都是最快出熟肉的(现在都没人汉化了不知道为什么)

:tieba_087:

2 个赞

:tieba_087: 从猎奇回归日常就没热度了,最开始是吧主汉化后来被举报到封 Q 好久就怂了后来就不发汉化了。

:tieba_087:

2 个赞