手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

python用百度文字识别功能识别验证码登陆网站

时间:2024-11-10 12:37:36

1、导入本例所需要的模块,from aip import AipOcrimport timefrom selenium import webdriverimport jsonfrom configparser import ConfigParser其中第一行代码为百度文字识别用模块,第3行为本例的重点,它可以像人一样自动操作浏览器,安装方法是pip install selenium

python用百度文字识别功能识别验证码登陆网站

2、建立一个浏览器实例driver,并用它打开需要登陆的页面。首先运行看是否能打开网站。driver=webdriver.Chrome()driver.get('需要登陆页面地址')

python用百度文字识别功能识别验证码登陆网站

3、运上面的代码就打开了该网站的登陆页面。

python用百度文字识别功能识别验证码登陆网站

4、利用selenium的find_element_by_xpath方法获得用户名输入框并向其传入用户名,方法是send.keys('用户名字符串')。

python用百度文字识别功能识别验证码登陆网站

5、将上面的代码运和看结果。已经正确填入了账号。

python用百度文字识别功能识别验证码登陆网站

6、同账号一样作出填入密码的方法。

python用百度文字识别功能识别验证码登陆网站

7、获得验证码区域,本例的验证码需要验证码输入框获得焦点才会显示,所以需要在验证码输入框中发送一个单击(click())的方法。获得验证码区域,本例未精确截取验证码,截的一个大区域。

python用百度文字识别功能识别验证码登陆网站

8、运行截屏程序,看验证码情况。将整个画面截屏保存,

python用百度文字识别功能识别验证码登陆网站

9、有验证码的页面被截展保存成功。

python用百度文字识别功能识别验证码登陆网站

10、对保存的图片进行文字识别,并返回结果存于text字典中。

python用百度文字识别功能识别验证码登陆网站

11、再次运行,可以看出已分析出验码证返回在text字典中的words_result键中,处于第6个位置,值为words可以通过code=text['words_result'][6]['words']代码将验证码存入变量code中。因为这个登陆页面始终是不变的,所以验证码在字典中始终是第6位上。通过这文自动识别出了验证码。

python用百度文字识别功能识别验证码登陆网站

12、将识别后的验证码code通过selenium的send.keys()方法输入到验证码框。再向登陆按纽发送click()方法实现登陆。

python用百度文字识别功能识别验证码登陆网站

13、成功登陆,整个过程完全无需要人工干预,全自动进行。

python用百度文字识别功能识别验证码登陆网站
© 手抄报圈