Python免费验证码识别之ddddocr识别OCR自动库实现

在Python爬虫过程中,有些网站需要验证码通过后方可进入网页,目的很简单,就是区分是人阅读访问还是机器爬虫,下面这篇文章主要给大家介绍了关于Python免费验证码识别之ddddocr识别OCR自动库实现的相关资料,需要的朋友可以参考下

需要ocr识别,推荐一个Python免费的验证码识别-ddddocr

安装过程:

1、镜像安装:pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple 

2.python.exe -m pip install --upgrade pip

注意升级pip库,,动不动升级就很麻烦。

Collecting pip Downloading https://pypi.tuna.tsinghua.edu.cn/packages/ca/31/b88ef447d595963c01060998cb329251648acf4a067721b0452c45527eb8/pip-21.2.4-py3-none-any.whl (1.6 MB) |████████████████████████████████| 1.6 MB 939 kB/s Installing collected packages: pip Attempting uninstall: pip Found existing installation: pip 21.2.1 Uninstalling pip-21.2.1: Successfully uninstalled pip-21.2.1 Successfully installed pip-21.2.4 

完成之后,找个参考图片

import ddddocr ocr = ddddocr.DdddOcr() with open('1.png-600', 'rb') as f: img_bytes = f.read() res = ocr.classification(img_bytes) print(res) 

对比效果图:

效果不是太好,有的图片,例如:

哈哈哈,自个玩吧。

附ddddocr-验证码识别案例

import ddddocr ocr=ddddocr.DdddOcr() with open('test_img.png-600', 'rb') as f: img_bytes=f.read() res=ocr.classification(img_bytes) print(res) 

普通干扰较弱的验证码均可识别通过

总结

到此这篇关于Python免费验证码识别之ddddocr识别OCR自动库实现的文章就介绍到这了,更多相关ddddocr识别OCR自动库内容请搜索0133技术站以前的文章或继续浏览下面的相关文章希望大家以后多多支持0133技术站!

以上就是Python免费验证码识别之ddddocr识别OCR自动库实现的详细内容,更多请关注0133技术站其它相关文章!

赞(0) 打赏
未经允许不得转载:0133技术站首页 » python