爬虫的过程中会遇到很多反爬的网站,今天就来讲讲字节系下抖店的滑块验证码的破解流程,谷歌驱动chromedriver路径此处忽略,自己可以去配置,希望对有疑问的同学有帮助,仅作参考。
一、使用Python+selenium实现此功能
1.既然用到selenium,第一步就要先配置初始化selenium
代码模块如下:
这样我们就可以实现使用谷歌浏览器自动登录
2.登录
登录网址我们要知道网站链接,让后输入你的账号和密码
这里点击登录后需要通过页面元素来判断是否存在滑块验证码
3.处理滑块验证码
出现滑块验证码,我们就要进行下一步处理。首先我们需要下载页面上的大图与小图,如图两个红框部分,然后对图片进行灰度化及二值化处理,最火计算滑块需要移动的距离
下载图片模块
图片灰度化与二值化处理
4.模拟鼠标移动滑块
得到滑块需要移动的距离后就需要移动鼠标
这里还需要移动轨迹方程,因为需要最大化的模拟人为移动滑块,所以这里进行了正反向移动,就是模拟滑块滑过的情况。
5.验证滑块是否通过
最后一步就是验证滑块验证码是否通过,主要是通过登录后的页面链接来进行判断,同时还要处理验证失败的情况,我这里用到while循环,出现失败就要重新获取滑块信息,获取移动的距离,移动鼠标滑动,直到滑块验证码通过。我这里没有限制次数,这里也可以限制一下失败次数。
6.拿到cookie,获取数据
登录成功后直接获取cookie,将cookie传入到请求数据的headers里,就可直接拿到你想要的的数据了。
二。总结
其实滑块验证码都是大同小异,通过抖店的滑块验证码案例,我又破解了京东平台登录的滑块验证码。主要的难点在于图片需要移动的距离,以及轨迹方程,需要多去试试找到合适的就OK了。文章来源:https://www.toymoban.com/news/detail-401129.html
第一次发文,希望各位大佬多多支持,有疑问可留言,也可加本人微信:wx1031867153文章来源地址https://www.toymoban.com/news/detail-401129.html
到了这里,关于最新Python 实现自动登录抖音(京东),实现滑块自动滑过的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!