最近大家都在“玩”Qwen chat,我用 Cloudflare Worker 整了个开源 OCR 工具,基于 qwen-vl-max-latest
模型,不仅能识别普通图片,还支持数学公式提取!
欢迎体验!
体验地址:智能图片识别 (doublefenzhuan.me)
Token 获取:
为了方便大家快速体验,这里直接提供一个 Token。
eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjcwZGM2ZmQyLWM2NTMtNDgyYS1iYWI0LTE4NGM1YWFiNDBjYyIsImV4cCI6MTczOTE1ODQ0NH0._CpVz3glD25axK2YgWB9El-rKxx3AJ4zjQ6YHylel8U
项目介绍
这是一个基于 Qwen-VL 模型的开源智能图片识别工具,通过逆向 Qwen Chat 的 OCR 功能实现。项目部署在 Cloudflare Worker 上,支持快速、高效的图片识别,特别优化了对数学公式的提取!
功能特点:
- 基于
qwen-vl-max-latest
模型,识别精度高; - 支持数学公式识别,轻松提取 LaTeX 格式;
- 部署简单,依托 Cloudflare Worker,响应速度快;
- 支持多种图片格式,满足日常 OCR 需求。
GitHub 仓库
项目已完全开源,欢迎 Star、Fork 和贡献代码!
如果觉得项目不错,求求点个 支持一下!助力梦想,你的支持是我持续更新的动力!
后续计划
- 优化数学公式识别精度;
快来体验吧!如果有任何问题或建议,欢迎在 GitHub 上提 Issue 或直接联系我!
更新
2025/01/13 应佬友需求,优化了对数学公式的识别,效果如下图
- 原图:
识别效果图:
2025/01/13 18点34分 支持curl
接口调用
- 支持base64:
curl --location 'https://ocr.doublefenzhuan.me/api/recognize/base64' \
--header 'Content-Type: application/json' \
--data '{
"token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
"base64Image": "xxx"
}'
- 效果图:
- 支持图片URL:
curl --location 'https://ocr.doublefenzhuan.me/api/recognize/url' \
--header 'Content-Type: application/json' \
--data '{
"token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
"imageUrl": "xxxx"
}'
-
效果图:
-
优化识别历史UI
2025年1月14日17:52 增加了对验证码的特殊处理
需改进
- 部分图片在识别历史中仅显示识别结果(待优化)