Python Selenium 的基本使用方法

这篇具有很好参考价值的文章主要介绍了Python Selenium 的基本使用方法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


1. 概述

Selenium 是一个用于自动化 web 浏览器的工具,它提供了一套用于测试 web 应用程序的工具和库。Selenium 最初是用于测试 web 应用程序的,但它也被广泛用于进行网络数据采集、自动化任务和网页操作等。

Selenium 支持多种编程语言,包括 Python、Java、JavaScript、C# 等,但最为常用的是使用 Python 进行 Selenium 测试和自动化。使用 Selenium,您可以编写代码来模拟用户在 web 浏览器中的操作,例如打开网页、填写表单、点击按钮、提取网页内容等。

Selenium 提供了多个工具和库,其中最常用的是 Selenium WebDriver,它允许您控制各种不同的 web 浏览器,如 Chrome、Firefox、Edge 等。通过 Selenium WebDriver,您可以编写代码来与浏览器进行交互,模拟用户在浏览器中的行为,并对 web 应用程序进行测试、数据采集和自动化任务。

2. 安装Chrome及ChromeDriver

2.1 安装Chrome

(1)linux 安装 Chrome 方法:

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb

# 如果这一步报错,直接执行下一步
sudo dpkg -i ./google-chrome*.deb

sudo apt-get install -f

判断是否安装成功

google-chrome --version

(2)Windows 和 Mac,安装Chrome 浏览器即可

2.2 安装ChromeDriver

ChromeDriver 的下载方式参考这里,注意 ChromeDriver 和 Chrome 内核的版本匹配即可。

3. 安装Selenium

pip install selenium

4. 常见用法

4.1 启动

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.chrome.service import Service

WEB_DRIVER_PATH = "/xxx/xx/chromedriver"
chrome_options = Options()
driver = webdriver.Chrome(service=Service(WEB_DRIVER_PATH), options=chrome_options)

以下是启动一些常见应用场景的 ChromeOptions 配置示例:

from selenium import webdriver
from selenium.webdriver.chrome.options import Options

# 创建ChromeOptions实例
chrome_options = Options()

# 1. 隐身模式启动
chrome_options.add_argument("--incognito")

# 2. 大窗口启动
chrome_options.add_argument("--start-maximized")

# 3. 禁用GPU渲染
chrome_options.add_argument('--disable-gpu')

# 4. 添加浏览器启动参数,例如禁用安全警告
chrome_options.add_argument('--unsafely-treat-insecure-origin-as-secure="http://example.com"')
chrome_options.add_argument('--ignore-certificate-errors')

# 5. 添加扩展程序
# 注意:extension_path应指向本地的.crx扩展程序文件
extension_path = '/path/to/your/extension.crx'
chrome_options.add_extension(extension_path)

# 6. 更改下载目录
prefs = {
    "download.default_directory": "/path/to/download/folder",
    "download.prompt_for_download": False,
    "plugins.always_open_pdf_externally": True  # 例如,总是外部打开PDF文件
}
chrome_options.add_experimental_option("prefs", prefs)

# 7. 启动无头模式(无界面运行)
chrome_options.add_argument('--headless')

# 创建Chrome浏览器实例,使用上述配置
driver = webdriver.Chrome(options=chrome_options)

# 执行网页导航或者其他操作...
driver.get('http://example.com')

# 使用完毕后关闭浏览器
driver.quit()

4.2 查找元素

(1)用 id 查找

from selenium.webdriver.common.by import By
try:
	ele = driver.find_element(By.ID, "id name")
except Exception as e:
	pass

(2)用 class 查找

from selenium.webdriver.common.by import By
try:
	# 查找第一个class名字匹配的元素
	ele = driver.find_element(By.CLASS_NAME, "class name")  # 替换 "class_name" 为实际Class名
	
	# 查找所有class名字匹配的元素
	eles = driver.find_elements(By.CLASS_NAME, "class name")
except Exception as e:
	pass

(3)用 css 查找

from selenium.webdriver.common.by import By
try:
	# 通过CSS选择器定位单个元素
	element = driver.find_element(By.CSS_SELECTOR, "#element_id" or ".class_name" or "tag_name[attr=value]"...)  # 使用实际的CSS选择器
	
	# 通过CSS选择器定位一组元素
	elements = driver.find_elements(By.CSS_SELECTOR, "your_css_selector")
except Exception as e:
	pass

(4)查找其他元素

from selenium.webdriver.common.by import By
try:
	# 查找所有div标签
	ele = driver.find_elements(By.TAG_NAME, "div")
	
	# 查找第一个a标签
	ele = driver.find_element(By.TAG_NAME, "a")
	
	# 查找第一个span标签
	ele = driver.find_element(By.TAG_NAME, "span")
except Exception as e:
	pass

4.3 等待页面加载元素

有时页面加载需要等待一定时间,如果显式的 sleep,不够灵活,可以借助selenium 的 WebDriverWait。

WebDriverWait 是 Selenium WebDriver 中用于实现隐式等待和显式等待的一种机制,它能够根据提供的条件等待元素变为可用或满足特定条件。显式等待允许你在执行下一步操作之前强制等待某个条件成立,这样可以避免因为页面元素加载不完全而导致的找不到元素或操作元素失败的问题。

使用 WebDriverWait 的基本步骤如下:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 初始化WebDriver对象,这里以Chrome为例
driver = webdriver.Chrome()

# 访问某个URL
driver.get("http://www.example.com")

# 创建WebDriverWait对象,通常需要传入WebDriver实例和超时时长
wait = WebDriverWait(driver, 10)  # 这里的10表示最长等待10秒

# 使用WebDriverWait等待某个条件满足
# 例如,等待页面上某个id为'element_id'的元素可见
element = wait.until(EC.presence_of_element_located((By.ID, 'element_id')))

# 此时,element变量已经被赋值为找到的元素,可以对其进行后续操作
element.click()

# 或者等待页面标题包含特定文字
wait.until(EC.title_contains("Example"))

# 最后,关闭浏览器
driver.quit()

expected_conditions模块提供了多种内置条件:

  • presence_of_element_located((By.ID, 'element_id')):等待元素存在
  • visibility_of_element_located((By.ID, 'element_id')):等待元素可见
  • element_to_be_clickable((By.ID, 'element_id')):等待元素可见且可点击
  • title_is("Page Title"):等待页面标题为特定值
  • title_contains("Partial Title"):等待页面标题包含特定部分

通过这种方式,WebDriverWait 可以帮助我们在执行自动化脚本时更加稳定可靠,确保在进行操作之前目标元素已经准备好。文章来源地址https://www.toymoban.com/news/detail-860741.html

到了这里,关于Python Selenium 的基本使用方法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python中的cnn:介绍和基本使用方法

    python中的cnn:介绍和基本使用方法 卷积神经网络(Convolutional Neural Networks,简称CNN)是一种在图像识别、语音识别、自然语言处理等许多领域取得显著成功的深度学习模型。CNN的设计灵感来源于生物的视觉系统,由多个卷积层、池化层和全连接层组成。 在Python中,我们通常使

    2024年02月12日
    浏览(29)
  • python中的svm:介绍和基本使用方法

    python中的svm:介绍和基本使用方法 支持向量机(Support Vector Machine,简称SVM)是一种常用的分类算法,可以用于解决分类和回归问题。SVM通过构建一个超平面,将不同类别的数据分隔开,使得正负样本之间的间隔(也称为边缘)最大化。 在Python中,可以使用scikit-learn库来使用

    2024年02月12日
    浏览(34)
  • python中的lstm:介绍和基本使用方法

    python中的lstm:介绍和基本使用方法 未使用插件 LSTM(Long Short-Term Memory)是一种循环神经网络(RNN)的变体,专门用于处理序列数据。LSTM 可以记忆序列中的长期依赖关系,这使得它非常适合于各种自然语言处理(NLP)和时间序列预测任务。 在 Python 中,你可以使用深度学习框

    2024年02月12日
    浏览(31)
  • chatgpt赋能python:python中的iloc:介绍和基本使用方法

    在Python中,Dataframe是数据分析中最常用的数据结构。iloc是Python Pandas库中用于简化数据切片和子集操作的一种方法。 本文将介绍iloc的基础概念和基本使用方法,并且通过实际的示例来演示如何使用iloc来快速选择和操作数据集。 iloc是“integer location”的缩写,意为“整数位置

    2024年02月04日
    浏览(36)
  • Python中os.environ基本介绍及使用方法

    os.environ简介 os.environ 是Python中的一个字典对象,它包含了当前进程的环境变量。通过使用 os.environ ,可以获取和设置环境变量的值。 下面是给给定的Python代码添加注释说明的示例 在上述代码中,我们首先导入了 os 模块,然后使用 os.environ.get() 方法获取名为 PATH 的环境变量的

    2024年04月12日
    浏览(28)
  • Selenium介绍及基本使用方法

    Selenium是一个开源、免费、简单、灵活,对Web浏览器支持良好的自动化测试工具,在UI自动化、爬虫等场景下是十分实用的,能够熟练掌握并使用Selenium工具可以大大的提高效率。 Selenium简介 Selenium支持多平台、多浏览器、多语言去实现自动化测试,是一个开源和可移植的Web测

    2024年02月04日
    浏览(33)
  • 【python】关于openpyxl的基本使用方法-看这篇就够了

    目录 ​编辑 一、下载安装与引用 二、创建工作簿并写入数据 创建工作簿 创建工作表 写入数据 保存数据 三、读取表格并查找数据 读取表格 读取指定工作表 重命名指定工作表 获取单元格数据 四、其他操作  多个工作表之间的切换 处理行和列 格式化单元格 修改工作表标题

    2024年02月10日
    浏览(30)
  • selenium+python自动化测试之使用webdriver操作浏览器的方法

    WebDriver简介 selenium从2.0开始集成了webdriver的API,提供了更简单,更简洁的编程接口。selenium webdriver的目标是提供一个设计良好的面向对象的API,提供了更好的支持进行web-app测试。从这篇博客开始,将学习使用如何使用python调用webdriver框架对浏览器进行一系列的操作 打开浏览

    2024年01月25日
    浏览(41)
  • 详解--Postman基本使用方法+接口关联+[Python,如何成为杰出的程序员

    安装方法:双击exe文件可以完成安装,简称傻瓜式安装,这里并是说各位,而是指安装方式很简单,直接下一步下一步就好。 进来之后就是这样的了, 这里暂做简介,后续我们也会慢慢讲到其他的功能点。 工具使用 ==== 步骤: 1、复制链接,百度搜索天气,这里只是建议哈

    2024年04月10日
    浏览(34)
  • Python中py2neo库的基本使用方法

    因为需要将处理好的csv文件用neo4j存储,因此想到使用python将数据导入neo4j,就需要用到py2neo库。 安装py2neo库: 首先是建立连接: 注意:这里传入用户名和密码使用的auth元组形式 Node和Relationship可以定义对应的实例,Node第一个参数是label, 再利用graph.create()创建。打开neo4j可以

    2024年02月16日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包