python用百度文字识别功能识别验证码登陆网站

时间：2026-04-22 07:24:52

1、导入本例所需要的模块，

from aip import AipOcr

import time

from selenium import webdriver

import json

from configparser import ConfigParser

其中第一行代码为百度文字识别用模块，第3行为本例的重点，它可以像人一样自动操作浏览器，安装方法是pip install selenium

python用百度文字识别功能识别验证码登陆网站

2、建立一个浏览器实例driver，并用它打开需要登陆的页面。首先运行看是否能打开网站。

driver=webdriver.Chrome()

driver.get('需要登陆页面地址')

python用百度文字识别功能识别验证码登陆网站

3、运上面的代码就打开了该网站的登陆页面。

python用百度文字识别功能识别验证码登陆网站

4、利用selenium的find_element_by_xpath方法获得用户名输入框并向其传入用户名，方法是send.keys('用户名字符串')。

python用百度文字识别功能识别验证码登陆网站

5、将上面的代码运和看结果。已经正确填入了账号。

python用百度文字识别功能识别验证码登陆网站

6、同账号一样作出填入密码的方法。

python用百度文字识别功能识别验证码登陆网站

7、获得验证码区域，本例的验证码需要验证码输入框获得焦点才会显示，所以需要在验证码输入框中发送一个单击（click（））的方法。获得验证码区域，本例未精确截取验证码，截的一个大区域。

python用百度文字识别功能识别验证码登陆网站

8、运行截屏程序，看验证码情况。将整个画面截屏保存，

python用百度文字识别功能识别验证码登陆网站

9、有验证码的页面被截展保存成功。

python用百度文字识别功能识别验证码登陆网站

10、对保存的图片进行文字识别，并返回结果存于text字典中。

python用百度文字识别功能识别验证码登陆网站

11、再次运行，可以看出已分析出验码证返回在text字典中的words_result键中，处于第6个位置，值为words

可以通过code=text['words_result'][6]['words']代码将验证码存入变量code中。

因为这个登陆页面始终是不变的，所以验证码在字典中始终是第6位上。通过这文自动识别出了验证码。

python用百度文字识别功能识别验证码登陆网站

12、将识别后的验证码code通过selenium的send.keys（）方法输入到验证码框。再向登陆按纽发送click（）方法实现登陆。

python用百度文字识别功能识别验证码登陆网站

13、成功登陆，整个过程完全无需要人工干预，全自动进行。

python用百度文字识别功能识别验证码登陆网站