selenium+ocr 破解验证码

10月前作者：fenjijue 分类：Toy博客阅读(55) 违法举报

这篇具有很好参考价值的文章主要介绍了selenium+ocr 破解验证码。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

最近想用python做一个爬虫，但目标网站需要输入信息以及验证码才能进行信息查询，然后才能爬取相应信息，于是就想到了使用selenium进行信息输入，先爬取验证码图片，然后利用OCR技术来识别验证码，接着爬取目标信息，思路很清晰，但做起来就出现一堆问题，于是想在这里记录一下

一、selenium获取验证码图片

目标网站页面大概如下：
selenium+ocr 破解验证码

1、信息输入

（1）selenium传入信息比较容易，定位目标元素后使用send_keys()方法即可：driver.find_element_by_xpath('//*[@id="haha"]').send_keys('nihao')

（2）当需要重复进行输入时，我们需要先把输入框的内容清空，这需要使用.clear()方法：driver.find_element_by_xpath('//*[@id="haha"]').clear()

2、获取验证码图片

根据图片链接下载图片-----走不通
（1）对于网页上的图片，其一般是把图片链接藏在网页标签中的属性内(常见为src)，我们可以定位到标签，然后使用get_attribute()方法获取其值也就是图片链接

driver.find_element_by_xpath('//*[@id="J_Reviews"]/div/div[6]/table/tbody/tr[1]/ul/li[1]').get_attribute("src")

（2）接下来是图片的保存，我们可以使用如下代码把图片保存到本地文件中文章来源地址https://www.toymoban.com/news/detail-440322.html

import requests
# 复制图片地址
url1 = 'https://pic.qiushibaike.com/system/pictures/12468/124687700/medium/K6KDSRPLBG3BRKPK.jpg'
image = requests.get(url = url1).content
with open('./糗事百科图片.jpg',

到了这里，关于selenium+ocr 破解验证码的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

15.网络爬虫—selenium验证码破解

前言： 🏘️🏘️个人简介：以山河作礼。 🎖️🎖️:Python领域新星创作者，CSDN实力新星认证 📝📝第一篇文章《1.认识网络爬虫》获得全站热榜第一，python领域热榜第一。 🧾 🧾第四篇文章《4.网络爬虫—Post请求(实战演示)》全站热榜第八。 🧾 🧾第八篇文章《8.网

2023年04月16日
浏览(107)
Selenium破解滑动验证码的原理及解决思路

🍅 视频学习：文末有免费的配套视频可观看 🍅 点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快 1、获取页面元素信息：使用Selenium打开目标网页，并通过相关方法获取滑块、背景图等元素的位置和属性信息。可以使用Selenium提供的定位方法（如xpa

2024年02月20日
浏览(56)
selenium爬虫|破解滑动验证码以极验为例

爬虫访问一些网站遇到滑动验证码解决方案这里是用selenium做模拟，如果是requests可以封装这个登录方法来获取登录后的cookies也是可以用的。 1 先讲思路，分析流程我们输入账号密码后点击登录，出现的是第一张图的状态。我们要做的是模拟滑动到缺口处。首先我们要

2024年02月14日
浏览(56)
使用Selenium破解滑动验证码的原理及解决思路

1、获取页面元素信息：使用Selenium打开目标网页，并通过相关方法获取滑块、背景图等元素的位置和属性信息。可以使用Selenium提供的定位方法（如xpath、CSS选择器等）来找到这些元素。可以使用find_element_by_xpath或find_element_by_css_selector等方法来获取滑块和背景图元素的位置和

2024年02月09日
浏览(58)
selenium破解滑块验证码自动查询+获取后续表单数据

一、装载好chromedriver之后，运行命令行 \\\"chrome.exe\\\"（路径） --remote-debugging-port=9222 打开谷歌浏览器。二、使用selenium打开网页：三、获取输入框批量输入数据，并破解验证码：使用 driver.find_element_by_xpath 获取element时，xpath可通过浏览器打开网站，使用检查功能，找到element所

2024年02月12日
浏览(62)
Selenium滑动验证码破解（缺口对应却无法通过，需要做鼠标轨迹模拟）

平台：所涉及内容：滑动验证码破解原理：解决场景：正常情况下，滑动验证码都是在canvas画出来的（残图一般是JS通过对后台返回的完整图片剪裁而来），在网页代码中可以找到对应信息残图直接画在Canvas上，因此需要通过js代码将其导出，获取图片的base64数据(错存在直

2024年02月12日
浏览(94)
一个完整Python实战项目：selenium识别验证码实现自动登录，自动操作浏览器获取某东数据

最近都没啥时间，很久没更新了。今天分享一下，如何用selenium识别验证码，实现自动登录以及获取数据。目标：某东话不多说直接开始环境 Python 3.10 Pycharm 模块使用 import random import time from selenium import webdriver import pyautogui import base64 import ddddocr import csv win + R 输入cmd 输入安

2024年02月04日
浏览(48)
〖Python网络爬虫实战㉞〗- 图形验证码OCR识别

订阅：新手可以订阅我的其他专栏。免费阶段订阅量1000+ python项目实战 Python编程基础教程系列（零基础小白搬砖逆袭) 说明：本专栏持续更新中，订阅本专栏前必读关于专栏〖Python网络爬虫实战〗转为付费专栏的订阅说明作者：爱吃饼干的小白鼠。Python领域优质创作者，20

2024年02月10日
浏览(39)
python模拟登入某平台+破解验证码

python模拟登录平台，遇见验证码识别！用最简单的方法selenium+da破解验证码，来自动登录平台先随便找个小说平台用户登陆 - 书海小说网用户登陆 - 书海小说网用户登陆 - 书海小说网 selenium这个模块要用到驱动浏览器，我的是火狐浏览器，win10x64位的，所以我下载了最新版本

2024年02月11日
浏览(31)
Python通用验证码识别OCR库ddddocr的安装使用

之前写了一篇关于java使用tess4j进行图片文字识别.md的，对于应付简单的数字识别还是能应付，但总体效果、识别率很一般，后来同事找到了这一篇写的，(亲测好用便捷)Python通用验证码识别OCR库ddddocr的安装使用教程，试用了下确实效果要好很多，因此也记录一下，算是白嫖了

2024年02月05日
浏览(52)