第8章 验证码的识别

本章设计的验证码有普通图形验证码,极验滑动验证码、点触验证码、微博宫格验证码。

8.1 图形验证码的识别

8.1.1 本节目标

以知网的验证码为例,讲解利用OCR技术识别图形验证码。

8.1.2 准备工作

tesserocr

8.1.3 获取验证码

获得验证码图片

8.1.4 识别测试

new project

import tesserocr
from PIL import Image
result = tesserocr.image_to_text(image)
print(result)

8.1.5 验证码处理

8.1.6 本节代码

8.1.7 结语

8.2 极验滑动验证码的识别

8.3 点触验证码的识别

8.3.1 本节目标

程序识别并通过点触验证码的验证。

8.3.2 准备工作

Selenium + Chrome

8.3.4 识别思路

8.4 微博宫格验证码的识别

微博宫格验证码是一种新型交互式验证码,每个宫格之间会有一条指示线,指示了应该的滑动轨迹。

准备工作
使用Selenium, 使用浏览器是Chrome,请确保已经正确安装好 Selenium库、