selenium破解滑块验证码自动查询+获取后续表单数据

这篇具有很好参考价值的文章主要介绍了selenium破解滑块验证码自动查询+获取后续表单数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、装载好chromedriver之后,运行命令行 "chrome.exe"(路径) --remote-debugging-port=9222 打开谷歌浏览器。

二、使用selenium打开网页:

def opendriver(url, domainlist):
    """
    打开网站
    """
    chrome_options = Options()
    chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")
    driver = webdriver.Chrome(options=chrome_options)
    driver.get(url)
    time.sleep(5)
    # driver.maximize_window()
    # # 获取打开滑块验证码页面的元素
    formdf = icp_query(driver, url, domainlist)
    return formdf

 三、获取输入框批量输入数据,并破解验证码:

使用 driver.find_element_by_xpath 获取element时,xpath可通过浏览器打开网站,使用检查功能,找到element所对应行,右键复制xpath。

def icp_query(driver, url, domainlist):
    """
    破解验证码并批量查询数据
    """
    formdf = pd.DataFrame()
    for ind in range(len(domainlist)):
        while True:
            try:
                input = driver.find_element_by_css_selector("input.el-input__inner")
                # print(input)
                # # 输入查询网站
                input.clear()
                time.sleep(0.5)
                inputtext = domainlist[ind]
                input.send_keys(inputtext)
                while True:
                    try:
                        time.sleep(2)
                        getcheck = driver.find_element_by_xpath("/html/body/div[1]/div/header/div[3]/div/button")
                        # getcheck = driver.find_element_by_css_selector("button.el-button.el-button--primary")
                        ActionChains(driver).move_to_element(getcheck).perform()  # 悬停鼠标
                        # # 点击进入滑块验证码页面
                        getcheck.click()
                        print("click button")
                        time.sleep(1.5)
                        # 保存图片
                        html = etree.HTML(driver.page_source)
                        print(html.xpath('/html/body/div/div/div/div/div/div//img/@src'))
                        imgbases = list(filter(None, html.xpath('/html/body/div/div/div/div/div/div//img/@src')))
                        big_base = imgbases[1].split('base64,')[-1]
                        print('bg: ' + big_base)
                    except Exception as e:
                        print(e)
                        if input.text=='' or input.text==None:
                            alertcheck = driver.find_element_by_xpath("/html/body/div[4]/ul/li[3]/input")
                            ActionChains(driver).move_to_element(alertcheck).perform()
                            alertcheck.click()
                            driver.refresh()
                            continue
                    if big_base != '':
                        save_picture('bg.jpg', base64.b64decode(big_base))
                        # 保存缺口图
                        small_base = imgbases[2].replace('data:text/javascript;base64,', '')
                        print('tp: ' + big_base)
                        save_picture('tp.png', base64.b64decode(small_base))
                        # 计算距离
                        distance = identify_gap('bg.jpg', 'tp.png')
                        # 滑动滑块
                        slide_block(driver, distance)
                        try:
                            formdict = getform(driver, inputtext)
                            print(formdict)
                            break
                        except Exception as e:
                            print(e)
                    else:
                        print('没保存成功,重试')
                        driver.refresh()
                if ind==0:
                    formdf = pd.DataFrame([formdict])
                    print('add first line to dataframe')
                else:
                    formdf = formdf.append(formdict, ignore_index=True)
                    print('append to dataframe')
                break
            except Exception as e:
                print(e)
                driver.get(url)
                time.sleep(4)
    if len(domainlist)>0:
        return formdf
    else:
        return 'no query list!'

 其中,弹出滑动验证码后,保存图片并计算图片左端到缺口的距离

def save_picture(file_name, avatar_bytes):
    """
    保存图片
    """
    with open(file_name, 'wb+') as f:
        f.write(avatar_bytes)
        f.close()
    print('图片保存成功')

def identify_gap(bg, tp):
    """
    bg: 背景图片
    tp: 缺口图片
    计算滑块距离
    """
    target_rgb = cv.imread(bg)
    target_gray = cv.cvtColor(target_rgb, cv.COLOR_BGR2GRAY)
    template_rgb = cv.imread(tp, 0)
    res = cv.matchTemplate(target_gray, template_rgb, cv.TM_CCOEFF_NORMED)
    value = cv.minMaxLoc(res)
    print(value)
    imgx = value[3][0]
    return imgx

之后 ,为模拟人工滑动效果,计算滑动轨迹,滑动滑块

def get_track(distance):
    """
    计算滑块移动轨迹
    """
    track=[]
    current=0
    mid=distance*3/4.5
    t=random.randint(2,3)/4.5
    v=0
    while current<distance:
          if current<mid:
             a=random.uniform(7, 8)
          else:
             a=random.uniform(-11,-9)
             if move<3:
                 v=10
                 a=2
          v0=v
          v=v0+a*t
          move=v0*t+1/2*a*t*t
          current+=move
          track.append(round(move))
    track.append(distance-current)
    return track

def slide_block(driver, distance):
    """
    滑动滑块
    """
    # 确定滑块
    slider_button = driver.find_element_by_id('sildeBox')
    # 鼠标操作
    action_chains = ActionChains(driver)
    # 点击该元素并且不放开
    action_chains.click_and_hold(on_element=slider_button).perform()
    # distance = distance / 2.6153846153846154
    print('distance: ' + str(distance))
    # 生成拖拽移动轨迹,加3是为了模拟滑过缺口位置后返回缺口的情况
    track_list = get_track(distance + random.randint(0, 3))
    # 根据轨迹拖拽圆球
    sum = 0
    for track in track_list:
        sum += track
        ActionChains(driver).move_by_offset(xoffset=track, yoffset=0).perform()
    print('track: %d'%(sum))
    # 模拟人工滑动超过缺口位置返回至缺口的情况,数据来源于人工滑动轨迹,同时还加入了随机数,都是为了更贴近人工滑动轨迹
    ActionChains(driver).move_by_offset(xoffset=-1, yoffset=0).perform()
    time.sleep(random.uniform(0.2, 0.8) / 10)
    # imitate.perform()
    # time.sleep(0.012)
    ActionChains(driver).move_by_offset(xoffset=1, yoffset=0).perform()
    # 放开圆球
    action_chains.pause(random.uniform(5, 9) / 10).release().perform()
    time.sleep(1.5)

四、破解完成后跳转,获取表单数据(根据实际网站代码调整dict)文章来源地址https://www.toymoban.com/news/detail-522515.html

def getform(driver, inputtext):
    """
    获取表单数据
    """
    time.sleep(1)
    formdata = {}
    formdata['input'] = inputtext
    heading = driver.find_element_by_xpath('/html/body/div[1]/div/section/div/div/div[1]/div/div[1]/div[2]/table')
    try:
        formdata['name'] = driver.find_element_by_xpath('/html/body/div[1]/div/section/div/div/div[1]/div/div[1]/div[3]/table/tbody/tr/td[2]/div').text
        formdata['filingnum'] = driver.find_element_by_xpath('/html/body/div[1]/div/section/div/div/div[1]/div/div[1]/div[3]/table/tbody/tr/td[3]/div').text
        formdata['checkdate'] = driver.find_element_by_xpath('/html/body/div[1]/div/section/div/div/div[1]/div/div[1]/div[3]/table/tbody/tr/td[4]/div').text
        formdata['ifretrict'] = driver.find_element_by_xpath('/html/body/div[1]/div/section/div/div/div[1]/div/div[1]/div[3]/table/tbody/tr/td[5]/div/span').text
    except Exception as e:
        print('find no item!')
    return formdata

到了这里,关于selenium破解滑块验证码自动查询+获取后续表单数据的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Python从入门到进阶】39、使用Selenium自动验证滑块登录

    接上篇《38、selenium关于Chrome handless的基本使用》 上一篇我们介绍了selenium中有关Chrome的无头版浏览器Chrome Handless的使用。本篇我们使用selenium做一些常见的复杂验证功能,首先我们来讲解如何进行滑块自动验证的操作。 我们要通过selenium来实现目前常见的滑块验证码的验证,

    2024年02月08日
    浏览(57)
  • java爬虫破解滑块验证码

    使用技术:java+Selenium 废话:         有爬虫,自然就有反爬虫,就像病毒和杀毒软件一样,有攻就有防,两者彼此推进发展。而目前最流行的反爬技术验证码,为了防止爬虫自动注册,批量生成垃圾账号,几乎所有网站的注册页面都会用到验证码技术。其实验证码的英文

    2023年04月09日
    浏览(51)
  • 教你python破解滑块验证码!记得收藏

    有小伙伴们私信反馈说,在web自动化的过程中,经常会被登录的验证码给卡住,不知道如何去通过验证码的验证。今天专门给大家来聊聊验证码的问题,一般的情况下遇到验证码我们可以都可以找开发去帮忙解决,关闭验证码!我们自己有没有办法来处理这些验证码的问题呢

    2024年01月24日
    浏览(54)
  • 教你python破解滑块验证码!记得收藏!

    有小伙伴们私信反馈说,在web自动化的过程中,经常会被登录的验证码给卡住,不知道如何去通过验证码的验证。今天专门给大家来聊聊验证码的问题,一般的情况下遇到验证码我们可以都可以找开发去帮忙解决,关闭验证码!我们自己有没有办法来处理这些验证码的问题呢

    2024年02月16日
    浏览(60)
  • Selenium图片滑块验证码

    因为种种原因没能实现愿景的目标,在这里记录一下中间结果,也算是一个收场吧。这篇文章主要是用selenium解决滑块验证码的个别案列。 思路: 用selenium打开浏览器指定网站 将残缺块图片和背景图片下载到本地 对比两张图片的相似地方,计算要滑动的距离 规划路线,移动

    2024年02月13日
    浏览(52)
  • Python 自动获取大批量excel数据并填写到网页表单(pandas;selenium)

    自动获取大批量excel数据并填写到网页表单 部分网页获取下拉列表点击的方式有所差异 这个请根据网页源码自做选择 一定要学会使用IPDB调试工具 太好用了!!!! 可能需要pip update一下 看提示 很好解决 没有报错最好啦 Python真是太好用了 办公利器啊!!!!

    2024年02月12日
    浏览(50)
  • selenium处理各类滑块验证码

    这种只要用鼠标点击并移动指定距离就可以完成验证(x轴) 这种是点击滑块会弹出白色方块和暗灰色方块,只要将白色方块移动覆盖暗灰色方块便能通过,白色方块是一张图片,暗灰色方块是通过style样式设计的,我们可以根据它们之间style的left计算差异值从而得到滑块滑动

    2024年02月16日
    浏览(51)
  • JAVA+Selenium实现滑块验证

    原文链接https://blog.csdn.net/lj606/article/details/115003131 selenium IDE结合浏览器提供脚本的录制、回放以、编辑脚本功能、以及元素的定位,可以使用selenium IDE将录制的脚本生成相应的带单元测试框架的自动化测试脚本。 自动登录某带有人机验证网站,并获取cookie

    2024年02月06日
    浏览(42)
  • 用selenium解决滑块验证码

    因为种种原因没能实现愿景的目标,在这里记录一下中间结果,也算是一个收场吧。这篇博客主要是用selenium解决滑块验证码的个别案列。 思路: 用selenium打开浏览器指定网站 将残缺块图片和背景图片下载到本地 对比两张图片的相似地方,计算要滑动的距离 规划路线,移动

    2024年02月01日
    浏览(47)
  • 用Selenium实现滑块验证码登录

    现在很多网站的登录,都采用了拖动图片滑块的验证码方式来进行验证登录,比如哔哩哔哩和京东等。在使用爬虫等自动化程序时,如何通过滑块验证,就成了需要解决的问题。 这里通过大名鼎鼎的ddddocr图片识别库,和模拟浏览器操作的selenium库来实现 安装浏览器driver 首先

    2024年01月22日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包