大家都用什么验证码识别库(识别软件)

大家目前都在用什么验证码识别库或者识别软件啊?
我目前在用的是ddddocr,对于综合性验证码挺好用,但是对于纯数字的,识别率反而低了一些。
谁有对于纯数字识别更好的,麻烦推荐一下。

7 Likes

现在这个年代训练小模型,大力出奇迹就好了。

4 Likes

训练需要准备数据,这个系统是个内网生产系统,一个很核心还很脆弱的系统,不敢频繁刷新获取验证码,怕把生产系统给搞崩了 :joy:

37 Likes

写个脚本 收集个几天的数据应该就够了吧

1 Like

服务型:http://www.ttshitu.com/
软件型:Pkav HTTP Fuzzer、Codex 更推荐codex

2 Likes

你不用刷的很快啊,写个工具边拉验证码图片边打tag,这样你也刷不多快。这种纯数字的样本也不需要太多。

2 Likes

请问这种模型是怎么训练出来的,需要做什么,想了解下

1 Like

python的ddddocr

1 Like

这个我用着还行啊,都能过(所以再次推荐

1 Like

目前我所知道的,就是用TensorFlow或者pytorch这些模型框架去构建一个模型进行训练,也可以找一些已经训练好的模型,做一下强化训练。

40 Likes

mark

dddd +1

看看验证码的样式和使用的字体是什么,完全可以模拟生成训练集图片,纯数字的随随跑跑就行了

mark

mark

之前微软邮箱的注册机就用的这个过验证码,新用户注册可以白嫖1刀

这方面知识是盲区.有没有简单的科普帖子之类的?

内网部署一套ocr模型,收集历史数据持续训练,效果还可以,资源要求也不高。

mark

mark