大家目前都在用什么验证码识别库或者识别软件啊?
我目前在用的是ddddocr,对于综合性验证码挺好用,但是对于纯数字的,识别率反而低了一些。
谁有对于纯数字识别更好的,麻烦推荐一下。
7 Likes
现在这个年代训练小模型,大力出奇迹就好了。
4 Likes
训练需要准备数据,这个系统是个内网生产系统,一个很核心还很脆弱的系统,不敢频繁刷新获取验证码,怕把生产系统给搞崩了
37 Likes
写个脚本 收集个几天的数据应该就够了吧
1 Like
服务型:http://www.ttshitu.com/
软件型:Pkav HTTP Fuzzer、Codex 更推荐codex
2 Likes
你不用刷的很快啊,写个工具边拉验证码图片边打tag,这样你也刷不多快。这种纯数字的样本也不需要太多。
2 Likes
请问这种模型是怎么训练出来的,需要做什么,想了解下
1 Like
python的ddddocr
1 Like
这个我用着还行啊,都能过(所以再次推荐
1 Like
目前我所知道的,就是用TensorFlow或者pytorch这些模型框架去构建一个模型进行训练,也可以找一些已经训练好的模型,做一下强化训练。
40 Likes
mark
dddd +1
看看验证码的样式和使用的字体是什么,完全可以模拟生成训练集图片,纯数字的随随跑跑就行了
mark
mark
之前微软邮箱的注册机就用的这个过验证码,新用户注册可以白嫖1刀
这方面知识是盲区.有没有简单的科普帖子之类的?
内网部署一套ocr模型,收集历史数据持续训练,效果还可以,资源要求也不高。
mark
mark