有没有好用的基于大模型的OCR

主要用于扫描版PDF可编辑PDF,求推荐
最好可以利用本地电脑使用,主要是没有像GPT等大模型这样的api

1 Like

用大模型OCR有点浪费了,速度也是个问题。如果只需要处理PDF就可以的话,可以考虑umi-ocr。

好的,我试试

好的,我瞅瞅

LayoutLMv3,极吧湾拿这个做过自动写作业机器人的OCR