🚀 【自定义Prompt |API调用已修复 | 需获取Cookie 】开源项目:基于Qwen2.5-vl-72b-instruct 模型的智能图片识别工具,支持数学公式 OCR!

最近大家都在“玩”Qwen chat,我用 Cloudflare Worker 整了个开源 OCR 工具,基于 qwen-vl-max-latest 模型,不仅能识别普通图片,还支持数学公式提取!

欢迎体验!

体验地址智能图片识别 (doublefenzhuan.me)


Cookie 获取:

为了方便大家快速体验,这里直接提供一个 Token。

cna=LI8HIAirQyACAWrg3cNOjH8F; _gcl_au=1.1.1200556497.1736728490; xlly_s=1; acw_tc=c2b96feb4d2929a1649ea96dc00590956477696933f61783d23e6c95429ecf74; x-ap=ap-southeast-1; token=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTc0MTE0ODM0MX0.-2hF4l1iJf8r5U6UzoXyc-TFqx0i5luWmtJk0kk8T5o; ssxmod_itna=Yq+hqIxjx=AKi7eitD8IDCWBfbxxl4BtGRDeq7tDRDFqApxDHmLWxoDUxxu2hE80DD0ADnG3BUxGN4tDxiNDAg40iDC4mL37ezTxthtQQhgDCTYCu2rpTCGGE7P3rnTE0M25BA6w3KxxGLDY=DCqhxl4eD4R3Dt4DIDAYDDxDWFeGIDGYD7hb=ymbDm44aYxGy3nbDA3TDbhb5xitYDDUAKeG2igbhDDNheFY49GG7yC0OorHDAqh==GbDjqPD/RxLP+bkXtkh/CTA=BapCeaWxBQD7we3xYE4c=IdqZawfiEwDELx0De/iGKGxdYmPlvzYKGlpVGGoWDqjqQlXnlvnnPDDc=Y9=buiDrP3KYtvS85lmHQDxPoGb0rz0THimDgri0i8B0=nxNCDtYDb30eDBeIG4/g8BvDD; ssxmod_itna2=Yq+hqIxjx=AKi7eitD8IDCWBfbxxl4BtGRDeq7tDRDFqApxDHmLWxoDUxxu2hE80DD0ADnG3BDxDfk7K7e5xDLiARWCTe9A4D/9o1+WeqlSGSWe4dTPhBUq4kzjyE41MPvWM=BtDwWHWiQ4B+GVChGZYlDDoA6gCj2VGnQeqqxeBSiqeT69Cg2Q6qrEGqv/DTQR8MRo3m3E7Gd7mf42Re2lYpNic=beSRp3tCDgWT7khOXGqf2lBpre5BtExlRw6cUwWwDxNSFUl/8Un/RGZz8/jLk2t1XZC79Eb7iRTPTMPn5MTHW2fs1DlsH0z9RxCLW1Rdb2QFhd9biugr+2aTW1oeYAbtORQNMW43+m2Gcb=TuFtQGqhiTqrNfdwSOe8WHSWTr7cRaw833Yzw31d4iN+Q9OO7izUj1uSdYrh4dIvx5CwYD45Vji4EbkiaNQQGbt1hDa8Ymmda3r3lThChY8Nm2IscznS+mS43izuLzUYN94syC3tQi03=u3Q6az931moHSOLY3OFPKoMjqMUDbtebxw=rT2rBAv08uRkWHzFtGp2lUSSb3z41pTZcx/8NB3jD+XnIpLFEw8bv4r58wRLLwubFTQ9cPDv+9k36tvoCYXlso4qGA44E3y737YNBDmUct2Iahxq76iTrlGotG1NBBN=Tx4hkA2Zp887gfc4Tp8V1wGCf49XeA=0Xu3uIKqYQADh0ABmqlQ4w=YVlDPjO9KH2xaG3C8ID5DeY41AxMxR2NIGhSD+5q0UQGx0Ue4dAi0DwbY+f7n1Gwz014LQ2DY+42xI2zG5TmhfDtXehC40aWxfDi0xIGNQ3gGkYeu2fAfADwY31mkAooDxD; SERVERID=da7472215188c88fe194f138f1242089|1738557149|1738556339; SERVERCORSID=da7472215188c88fe194f138f1242089|1738557149|1738556339; isg=BBcXHLltPM7zv7hi-FnT0HW6pothXOu-LIccEmlG4eZGmDrabS7mDq_--ziGPsM2; tfstk=gxYniE986HSQfEpYpd7Icypow5otjW_5cLUReaBrbOW6JLnCehbygKjRyBdPr4XN8gtde9BlrQ9m6x3xkBOCPgkxHqIXCrTVlurzY8QNb_blTz_06LRCPaktd3lv5B9qU3M64alG7_fz8aWFTPlGZsXPz9SzQl5VQT7yU9SaQ617YJzUzRlGNOWPzaJP7jQ8r9CV1FkgVOPK4CrD_6jh3BWH9KLadGrBiO4zzFjfxtuAIzzyS6Ot3kbuo0B2c9IACduT-aANZKfDKRkGzCYBoG8ECzvDIn7G1hMuqtxy9ntPjXueswXhmFI0Zk7H4pTlAHVSGC7eCn6fYcM1seLAqtsgQvR9s9SDqpH_z9KD_djvWRUA7I-GSgozbo5IVz1ZwFr7VM51stK4FEPS3FZLvfcg0MIF16r-sfq7VM51sthisoJlY11U2


项目介绍

这是一个基于 Qwen-VL 模型的开源智能图片识别工具,通过逆向 Qwen Chat 的 OCR 功能实现。项目部署在 Cloudflare Worker 上,支持快速、高效的图片识别,特别优化了对数学公式的提取

功能特点

  • 基于 qwen-vl-max-latest 模型,识别精度高;
  • 支持数学公式识别,轻松提取 LaTeX 格式;
  • 部署简单,依托 Cloudflare Worker,响应速度快;
  • 支持多种图片格式,满足日常 OCR 需求。

GitHub 仓库

项目已完全开源,欢迎 Star、Fork 和贡献代码!

仓库地址Cunninger/ocr-based-qwen

如果觉得项目不错,求求点个 :star: 支持一下!助力梦想,你的支持是我持续更新的动力!


后续计划

  • 优化数学公式识别精度;

快来体验吧!如果有任何问题或建议,欢迎在 GitHub 上提 Issue 或直接联系我!

更新

2025/01/13 应佬友需求,优化了对数学公式的识别,效果如下图

  • 原图:


识别效果图:

2025/01/13 18点34分 支持curl接口调用

  • 支持base64
curl --location 'https://ocr.doublefenzhuan.me/api/recognize/base64' \
--header 'Content-Type: application/json' \
--data '{
    "token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
    "base64Image": "xxx"
}'
curl --location 'https://ocr.doublefenzhuan.me/api/recognize/url' \
--header 'Content-Type: application/json' \
--data '{
    "token": "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjUzZTk0Nzg4LWMwM2QtNDY4Mi05OTNhLWE0ZDNjNGUyZDY0OSIsImV4cCI6MTczOTA3NTE0MX0.FtwG6xDLYd2rngWUhuldg56WXCiLSTL0RI6xJJQ4vHM",
    
     "imageUrl": "xxxx"
}'

2025年1月14日17:52 增加了对验证码的特殊处理

2025年1月24日21:18:47

貌似qwen目标服务器更新了 CORS 策略
上传图片出现如下问题:
image
问题已修复,修复代码已开源,服务正常。

2025年2月3日14:49:42

qwen 接口请求字段发生变动,补充cookie
重构(api): 更新身份验证和请求参数以提高兼容性

  • 将基于令牌的身份验证替换为基于cookie的身份验证
  • 在请求体和内容对象中添加对chat_type字段的支持,
  • 确保提示内容保持不变,同时适应新的接口规范
  • 更新前端界面,在Token管理下包含一个用于输入cookie的专用字段
101 个赞

佬,给个源码看看

3 个赞

稍等,我挂个仓库

2 个赞

重新编辑帖子了,你看看

1 个赞

太强了大佬

2 个赞

太强了!立刻使用

2 个赞

太强了佬。。感觉后面还会有各种2api出来

3 个赞

大佬牛叉,部署起来

2 个赞

太强了太强了

2 个赞

多一种OCR应用:+1:

3 个赞

为什么qvq不行,这个模型可以识别

1 个赞

感谢 Mark 一下

你可以去试试,就改个模型名

1 个赞

试过了,qvq读不到图

2 个赞

要不开个一级,现在这样外部可以抓到你的token

3 个赞

大佬太强了

3 个赞

什么意思,怎么抓到我的token?

3 个赞

不是,就是说你放在这里的那个token无需权限就可以看到 :thinking:

4 个赞

没事的,我随便创的号,token 一大堆

3 个赞

还是CF部署方便些

4 个赞