采集极验4滑块验证码图片数据

这篇具有很好参考价值的文章主要介绍了采集极验4滑块验证码图片数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在网络安全领域,验证码是一种常见的用于验证用户身份或防止恶意机器人攻击的技术。而极验4滑块验证码作为一种广泛应用的验证码形式,其具有较高的安全性和防御能力。本文将以获取极验4滑块验证码图片数据为主题,介绍相关技术和方法。

一、极验4滑块验证码简介

极验4滑块验证码是一种基于用户滑动操作来验证的验证码形式。用户需要通过滑动滑块至指定位置,以证明自己是真实用户而非机器人。这种验证码形式采用了机器学习和行为分析等先进技术,难以被自动化工具或脚本破解,因而广受网站开发者的青睐。

二、采集极验4滑块验证码图片的必要性

在研究极验4滑块验证码自动化通过的过程中,我们需要获取大量的验证码图片数据,以便进行训练和分析。这些数据对于算法的优化和改进非常重要。因此,我们需要利用爬虫技术来采集这些极验4滑块验证码图片。

三、使用爬虫技术采集极验4滑块验证码图片

1、确定目标网站:选择一个包含极验4滑块验证码的目标网站作为爬取对象。

2、分析网页结构:通过查看目标网页的源代码和开发者工具,了解滑块验证码的位置、样式和相关参数。

这里用火狐浏览器为例,浏览器按下F12,选择【网络】选项卡,清空里面的请求。然后点击刷新验证码按钮,就可以获得新的图片,这样就可以得到获取图片的链接。

采集极验4滑块验证码图片数据,验证码识别,安全,web安全,python,图像处理,深度学习,ai,机器学习

 3、分析请求参数

通过浏览器抓包,得到的信息如下,其中bg参数包含的就是大图的链接,通过链接就可以直接下载图片了。

采集极验4滑块验证码图片数据,验证码识别,安全,web安全,python,图像处理,深度学习,ai,机器学习

4、编写爬虫代码:使用Python编写爬虫代码,模拟浏览器行为,访问目标网站并获取验证码图片的URL。

这个链接具有一定的时效性,可能十分钟后就会失效吧,所以失效后可以再通过浏览器抓包方式获取最新的链接继续采集。下面的代码链接就已经失效了,请替换为自己最新的链接。

import time
import json
import requests
from io import BytesIO
from PIL import Image


for i in range(100):
    url = "https://gcaptcha4.geetest.com/load?callback=geetest_1689421548194&captcha_id=cdb27a1d9a634fd518f2fa445d6f1c1f&client_type=web&lot_number=ec23b49f8bcd45c38dce44d5f116ad3f&pt=1&lang=zho&payload=xSJqOy81RFro17RrPzpVayZp14MU2h0xs_RHbIGG757niUjQE6Ce0diVZJvowhabG0LPg9JW7et3ANw6hHB7IA1y7g3utf3RrKEkasazsNcVDYmbIlNPNhrST81ZJr8XaQOwaOj68ZMIsYFNiO5IoUqAP4vu-i9Vn2CK1JMq4n_JPLRl6hFK5Tl013_x-r9eB27gl7t1HShpy75zQ3xBusi0YGsKj9GF_aEWNrxtXZUrahjeaHtaOZdKo1NilEb4tPAdQXbual7aHpLHSaBIxsvu1PJrIEHNUDdxaxS1c17896OaRu5hKQHGS4170jTjhO4rPFoB4ffmugcTpV3DjWDheCt1UuVfme2f8bl96gAUno_f4Trv3ZZiAy4W3mqSik_gVvDtOMrgJrz2CWad1R3pdGOwI-XaLDrTbK4UIMmoZutjQX077m5IJLTMbSYlJwvstO9la0NcbmPK68dcojaABgIkbGvbCS97GPlubQyV_DYGSVCVGH3TmB2sETmQaDj3bkwWFtJ3YHbkL8RxI8sgid3ho4jQVgErUW0eoNgGOB1tzxnKV8RAbDvoT7YXXnVEGCzdve7ySPFrGqpdvbJ95PL3bmoptX4TgKvvPGJZBRXxXAIaYyC1KgUOFpe5YBWAMhcgkEQqQIC2Akb5cXTU6ETwvUz_m7Bufq0n2xnXTi3-pCtXJ5uxQxRVkwzwRc80sj63DnYvdDfu20V7vkJ-C766-TOlsuMOeFMIqHk%3D&process_token=5b752f9db61a493103c23ece058cc115fab03cb5f0e69d1cbd22c36ec24622bc&payload_protocol=1"
    header = {
        "Host": "gcaptcha4.geetest.com",
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:72.0) Gecko/20100101 Firefox/72.0",
        "Accept": "*/*",
        "Accept-Language": "zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2",
        # "Accept-Encoding": "gzip, deflate, br",
        "Connection": "keep-alive",
        "Referer": "https://monica.im/login",
        "Cookie": "gt_captcha_v4_user=4c5398c023e1401695cd2cbd3e52aba2; sensorsdata2015jssdkcross=%7B%22distinct_id%22%3A%2218875ab69c7441-060783d3e4bfe08-4c302978-1327104-18875ab69c94db%22%2C%22first_id%22%3A%22%22%2C%22props%22%3A%7B%22%24latest_traffic_source_type%22%3A%22%E7%9B%B4%E6%8E%A5%E6%B5%81%E9%87%8F%22%2C%22%24latest_search_keyword%22%3A%22%E6%9C%AA%E5%8F%96%E5%88%B0%E5%80%BC_%E7%9B%B4%E6%8E%A5%E6%89%93%E5%BC%80%22%2C%22%24latest_referrer%22%3A%22%22%2C%22%24latest_landing_page%22%3A%22https%3A%2F%2Fwww.geetest.com%2Fshow%22%7D%2C%22%24device_id%22%3A%2218875ab69c7441-060783d3e4bfe08-4c302978-1327104-18875ab69c94db%22%7D; Hm_lvt_25b04a5e7a64668b9b88e2711fb5f0c4=1685601348; _uetvid=ca611c60004611ee8d41855bd2dec21b",
    }
    # 请求获取大图链接
    response = requests.get(url=url, headers=header)
    # 解析响应,转成字典
    data = json.loads(response.text[22:-1])
    # 获取大图链接
    bg_url = 'https://static.geetest.com/' + data['data']['bg']
    # 下载大图
    response = requests.get(url=bg_url)
    # 保存大图
    img = Image.open(BytesIO(response.content))
    img.save('train_img/{}.jpg'.format(int(time.time() * 1000)))

    time.sleep(2)

5、下载验证码图片:利用爬虫代码发送请求,下载验证码图片并保存到本地。

采集极验4滑块验证码图片数据,验证码识别,安全,web安全,python,图像处理,深度学习,ai,机器学习

6、数据清洗和整理:对下载的验证码图片进行清洗和整理,确保数据的准确性和完整性。

四、总结

1、和极验3相比,极验4大图反爬能力变弱了。因为极验3图片链接很快就会失效。

2、和极验3相比,极验4图片的解析难度变小了。因为极验3的图片是打乱的,还需要拼图。文章来源地址https://www.toymoban.com/news/detail-575860.html

到了这里,关于采集极验4滑块验证码图片数据的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • FPGA 68013 USB2.0 多通道数据采集,工程验证过

    FPGA 68013  USB2.0  多通道数据采集,工程验证过 FPGA 68013 USB2.0 多通道数据采集,工程验证过 随着科技的发展和信息技术的不断进步,数据采集技术在各个领域的应用越来越广泛,其中,多通道数据采集技术尤为重要。在这种技术领域中,FPGA 68013 USB2.0 多通道数据采集技术成为

    2024年02月21日
    浏览(48)
  • Python爬虫之极验滑动验证码的识别

    上节我们了解了可以直接利用 tesserocr 来识别简单的图形验证码。近几年出现了一些新型验证码,其中比较有代表性的就是极验验证码,它需要拖动拼合滑块才可以完成验证,相对图形验证码来说识别难度上升了几个等级。本节将讲解极验验证码的识别过程。 1. 本节目标 我们

    2024年02月22日
    浏览(53)
  • 基于Qt、PYTHON智能校园防御系统应用程序,实现了摄像头数据采集、人脸识别、口罩识别、 数据统计等功能

    完整项目地址:https://download.csdn.net/download/lijunhcn/88453470 项目结构 环境选型 语言:Python 操作系统:Windows 数据库:MySQL 窗口界面:PyQT API接口:百度AI接口,用以实现人脸登陆与注册 远程MySQL表结构 远程表结构sql脚本 项目背景 智能校园防御软件是实现了一款基于摄像头数据

    2024年02月03日
    浏览(53)
  • 毕设项目——基于Qt、PYTHON智能校园防御系统应用程序,实现了摄像头数据采集、人脸识别、口罩识别、 数据统计等功能

    完整项目地址:https://download.csdn.net/download/lijunhcn/88453470 项目结构 环境选型 语言:Python 操作系统:Windows 数据库:MySQL 窗口界面:PyQT API接口:百度AI接口,用以实现人脸登陆与注册 远程MySQL表结构 远程表结构sql脚本 项目背景 智能校园防御软件是实现了一款基于摄像头数据

    2024年02月04日
    浏览(44)
  • 基于FPGA的数据采集、编码、通讯和存储系统设计(即FPGA+RTL8211千兆以太网+SD卡存储+RTC+Uart+AD7606数模转换+电流放大采集等硬件设计与程序验证)

    介绍一个小项目,加强对FPGA相关接口的整体把握。 硬件及软件代码梳理: 硬件系统的主要功能框图,其中FPGA作为处理单元,实现了包括电流和电压的采集、千兆以太网通讯、SD卡本地数据存储和串口通讯等。已经过板级测试,测试包含:千兆网通讯收发测试、AD采集的数据

    2024年04月13日
    浏览(56)
  • 使用opencv识别滑块验证

    对于某些简单的滑块,无需进行模型训练,可以使用opencv就能识别,比如: 有一种常用方法cv2.matchTemplate,可以将滑动的图案与背景图案进行模板匹配,这种方法适用于滑动图案与背景图片中目标位置有相同图案的情况。 但是本文想介绍的是另一种:背景中目标位置是空白的

    2024年03月10日
    浏览(40)
  • 〖Python网络爬虫实战㊶〗- 极验滑块介绍(三)

    订阅:新手可以订阅我的其他专栏。免费阶段订阅量1000+ python项目实战 Python编程基础教程系列(零基础小白搬砖逆袭) 说明:本专栏持续更新中,订阅本专栏前必读关于专栏〖Python网络爬虫实战〗转为付费专栏的订阅说明 作者:爱吃饼干的小白鼠。Python领域优质创作者,20

    2024年02月04日
    浏览(64)
  • Selenium图片滑块验证码

    因为种种原因没能实现愿景的目标,在这里记录一下中间结果,也算是一个收场吧。这篇文章主要是用selenium解决滑块验证码的个别案列。 思路: 用selenium打开浏览器指定网站 将残缺块图片和背景图片下载到本地 对比两张图片的相似地方,计算要滑动的距离 规划路线,移动

    2024年02月13日
    浏览(53)
  • OpenCV滑块验证码图像缺口位置识别

    在使用Selenium完成自动化爬虫时,许多网站为了防止机器人爬取数据会使用验证码(例如滑块验证码)。通过Selenium动作操作,爬虫可以模拟用户输入验证码或使用鼠标移动一定距离来处理验证码验证过程 完成这一流程的关键步骤有两步:识别出目标图像缺口的位置,操作滑

    2024年02月03日
    浏览(48)
  • Python如何解决“滑块验证码”登录识别(3)

    前言 本文是该专栏的第24篇,后面会持续分享python的干货知识,记得关注。 做爬虫项目的时候,总是会遇到我们的冤家老朋友——验证码(图文验证码,点选验证码,滑块验证码)等。前面我有介绍过图文验证码和点选验证码,针对验证码这块, 后面我会持续更新这些 验证码

    2023年04月08日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包