【Qwen OCR 接力】基于佬友的QwenLM OCR开源项目实现的openwebui函数,轻松实现一键OCR的效果(支持最新的api 2025.3.12更新)

基于佬友的 :rocket: 开源项目:基于 Qwen-VL 模型的智能图片识别工具,支持数学公式 OCR! - 开发调优 - LINUX DO 的帖子,简单的搓了个openwebui的pipe函数,可以实现直接图片上传识别文本的效果

原帖
【Qwen OCR 接力】基于佬友的QwenLM OCR开源项目实现的openwebui函数,轻松实现一键OCR的效果(支持最新的api 2025.2.10更新) - 开发调优 - LINUX DO

解决无法请求的报错,需要更新 worker.js,代码太长了大家去大佬的仓库复制替换即可

代码链接:
ocr-based-qwen/worker.js at main · Cunninger/ocr-based-qwen

最好使用自己的Cookie

1.设置 Cookie

33 个赞

没写完?

3 个赞

我再加一个吧,这个就是获取cookie的,在pipe里面用就行了

2 个赞

太强了,大佬!

2 个赞

终于修好了,昨天我老是报错500,我还以为是我的网络问题,pipe不用更新吗

2 个赞

不用更新,只需要更新worker.js重新部署就行

1 个赞

欢迎佬友二创 :grinning_face:

好东西感谢大佬 :smiling_face_with_three_hearts:

多谢分享

感谢分享,好用!

OCR 方面,全世界做的最好的应该是谷歌吧,我手写字体很乱它也可以检测。

请教大家,我复制的是下面主题中的代码

【Qwen OCR 接力】基于佬友的QwenLM OCR开源项目实现的openwebui函数,轻松实现一键OCR的效果(支持最新的api 2025.2.10更新)

复制到OpenWebUI 的函数,然后获取了cookis,没有改 base api url.

应该没有哪步错了吧,但就是不能用?

(哦,对了,我的OpenWebUI在抱脸上)

hf和cf worker之间是有防火墙的,之前帖子下面有人遇到过,可以试试在deno上跑worker

1 个赞

谢谢佬指点,我去试试 :tieba_025: