🚀 开源项目:基于 Qwen-VL 模型的智能图片识别工具,支持数学公式 OCR!

最近大家都在“玩”Qwen chat,我用 Cloudflare Worker 整了个开源 OCR 工具,基于 qwen-vl-max-latest 模型,不仅能识别普通图片,还支持数学公式提取!

欢迎体验!

体验地址智能图片识别 (doublefenzhuan.me)


Token 获取:

为了方便大家快速体验,这里直接提供一个 Token。

eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjcwZGM2ZmQyLWM2NTMtNDgyYS1iYWI0LTE4NGM1YWFiNDBjYyIsImV4cCI6MTczOTE1ODQ0NH0._CpVz3glD25axK2YgWB9El-rKxx3AJ4zjQ6YHylel8U


项目介绍

这是一个基于 Qwen-VL 模型的开源智能图片识别工具,通过逆向 Qwen Chat 的 OCR 功能实现。项目部署在 Cloudflare Worker 上,支持快速、高效的图片识别,特别优化了对数学公式的提取

功能特点

  • 基于 qwen-vl-max-latest 模型,识别精度高;
  • 支持数学公式识别,轻松提取 LaTeX 格式;
  • 部署简单,依托 Cloudflare Worker,响应速度快;
  • 支持多种图片格式,满足日常 OCR 需求。

GitHub 仓库

项目已完全开源,欢迎 Star、Fork 和贡献代码!

仓库地址Cunninger/ocr-based-qwen

如果觉得项目不错,求求点个 :star: 支持一下!助力梦想,你的支持是我持续更新的动力!


后续计划

  • 优化数学公式识别精度;

快来体验吧!如果有任何问题或建议,欢迎在 GitHub 上提 Issue 或直接联系我!

更新

2025/01/13 应佬友需求,优化了对数学公式的识别,效果如下图

  • 原图:


识别效果图:

2025/01/13 18点34分 支持curl接口调用

  • 支持base64
curl --location 'https://ocr.doublefenzhuan.me/api/recognize/base64' \
--header 'Content-Type: application/json' \
--data '{
    "token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
    "base64Image": "xxx"
}'
curl --location 'https://ocr.doublefenzhuan.me/api/recognize/url' \
--header 'Content-Type: application/json' \
--data '{
    "token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
    
     "imageUrl": "xxxx"
}'

2025年1月14日17:52 增加了对验证码的特殊处理

需改进

  • 部分图片在识别历史中仅显示识别结果(待优化)
59 Likes

佬,给个源码看看

3 Likes

稍等,我挂个仓库

2 Likes

重新编辑帖子了,你看看

1 Like

太强了大佬

2 Likes

太强了!立刻使用

2 Likes

太强了佬。。感觉后面还会有各种2api出来

3 Likes

大佬牛叉,部署起来

2 Likes

太强了太强了

2 Likes

多一种OCR应用:+1:

3 Likes

为什么qvq不行,这个模型可以识别

1 Like

感谢 Mark 一下

你可以去试试,就改个模型名

试过了,qvq读不到图

1 Like

要不开个一级,现在这样外部可以抓到你的token

2 Likes

大佬太强了

2 Likes

什么意思,怎么抓到我的token?

2 Likes

不是,就是说你放在这里的那个token无需权限就可以看到 :thinking:

3 Likes

没事的,我随便创的号,token 一大堆

1 Like

还是CF部署方便些

2 Likes