selenium 使用及定位

这篇具有很好参考价值的文章主要介绍了selenium 使用及定位。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

使用find_element_by_*() 方法只需导入 from selenium import webdriver,使用 find_element() 方法除了导入 from selenium import webdriver ,还要导入 from selenium.webdriver.common.by import By。

Selenium4 提供了 8 种定位(单)节点的方法,如下表所示:

方法说明

find_element(By.ID) 通过 id 属性值定位节点

find_element(By.NAME) 通过 name 属性值定位节点

find_element(By.CLASS_NAME) 通过 class 属性值定位节点

find_element(By.TAG_NAME) 通过 tag 标签名定位节点

find_element(By.LINK_TEXT) 通过<a>标签内文本定位节点,即精准定位。

find_element(By.PARTIAL_LINK_TEXT)通过<a>标签内部分文本定位节点,即模糊定位。

find_element(By.XPATH) 通过 xpath 表达式定位节点

find_element(By.CSS_SELECTOR) 通过 css 选择器定位节点

find_element 找的是第一个符合条件的节点,

如果要查找所有符合条件的标签,需要用 find_elements,find_elements 的返回值是列表类型,可以用for循环遍历里面的节点。

一、定位


from selenium import webdriver
from selenium.webdriver.common.by import By

# 创建浏览器对象并访问网站
browser = webdriver.Chrome()
url = "https://www.baidu.com"
browser.get(url)

# 根据 id 定位
browser.find_element(By.ID,'su')

# 根据 name 定位
# 返回第一个元素
browser.find_element(By.CLASS_NAME,'fenlei')
# 返回所有元素
browser.find_elements(By.CLASS_NAME,'fenlei')

# 根据 class 定位
browser.find_element(By.NAME,'title-text c-font-medium c-color-t')
browser.find_elements(By.NAME,'title-text c-font-medium c-color-t')

# 根据标签名称定位
browser.find_element(By.TAG_NAME,'input')
browser.find_elements(By.TAG_NAME,'input')

# 使用链接文本定位超链接
browser.find_element(By.LINK_TEXT,'index')
browser.find_elements(By.LINK_TEXT,'index')
browser.find_element(By.PARTIAL_LINK_TEXT,'index')
browser.find_elements(By.PARTIAL_LINK_TEXT,'index')

# 使用 xpath 定位
browser.find_element(By.XPATH,'//input[@id="su"]')
browser.find_elements(By.XPATH,'//input[@id="su"]')

# 使用 CSS 选择器定位
browser.find_element(By.CSS_SELECTOR,'#su')
browser.find_elements(By.CSS_SELECTOR,'#su')

# 关闭浏览器
browser.close()

# 父找子
# 1.串联寻找
print driver.find_element_by_id('B').find_element_by_tag_name('div').text

# 2.xpath父子关系寻找
print driver.find_element_by_xpath("//div[@id='B']/div").text

# 3.css selector父子关系寻找
print driver.find_element_by_css_selector('div#B>div').text

# 4.css selector nth-child
print driver.find_element_by_css_selector('div#B div:nth-child(1)').text

# 5.css selector nth-of-type
print driver.find_element_by_css_selector('div#B div:nth-of-type(1)').text

# 6.xpath轴 child
print driver.find_element_by_xpath("//div[@id='B']/child::div").text
driver.quit()

# 子找父
# 1.xpath: `.`代表当前节点; '..'代表父节点
print driver.find_element_by_xpath("//div[@id='C']/../..").text

# 2.xpath轴 parent
print driver.find_element_by_xpath("//div[@id='C']/parent::*/parent::div").text

# 哥哥节点
# 1.xpath,通过父节点获取其哥哥节点
print driver.find_element_by_xpath("//div[@id='D']/../div[1]").text

# 2.xpath轴 preceding-sibling
print driver.find_element_by_xpath("//div[@id='D']/preceding-sibling::div[1]").text

# 弟弟节点
# 1.xpath,通过父节点获取其弟弟节点
print driver.find_element_by_xpath("//div[@id='D']/../div[3]").text

# 2.xpath轴 following-sibling
print driver.find_element_by_xpath("//div[@id='D']/following-sibling::div[1]").text

# 3.xpath轴 following
print driver.find_element_by_xpath("//div[@id='D']/following::*").text

# 4.css selector +
print driver.find_element_by_css_selector('div#D + div').text

# 5.css selector ~
print driver.find_element_by_css_selector('div#D ~ div').text

二、获取节点数据


from selenium import webdriver
from selenium.webdriver.common.by import By

browser = webdriver.Chrome()
url = "https://www.baidu.com"
browser.get(url)

# 定位节点
element = browser.find_element(By.ID,'su')

# 获取class的属性值
print(element.get_attribute('class'))
# 获取id的属性值
print(element.get_attribute('id'))
# 获取type的属性值
print(element.get_attribute('type'))
# 获取value的属性值
print(element.get_attribute('value'))

browser.close()
element1 = browser.find_element_by_link_text("地图")
# 获取节点的宽高
print(element1.size)

三、特殊节点处理(shadow dom)

此节点为动态加载的html标签,需要特殊处理(嵌入js语句切换到shadow dom节点里面获取相关数据,特别注意在shadow dom里面不可以使用xpath寻找元素,会报错显示找不到该元素)文章来源地址https://www.toymoban.com/news/detail-721809.html


def expand_shadow_element(element):
    shadow_root = self.driver.execute_script('return arguments[0].shadowRoot', element)
    return shadow_root


root1 = self.driver.find_element(By.XPATH, '/html/body/gradio-app')

shadow_root1 = expand_shadow_element(root1)
a = shadow_root1.find_element(By.ID, 'txt2img_prompt').find_element(By.TAG_NAME, 'textarea')
a.click()
a.clear()
a.send_keys(self.in_word if self.in_word else 'sea')

到了这里,关于selenium 使用及定位的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • selenium之By定位

    导入By类 导包: from selenium.webdriver.common.by import By By类的方法: 1. find_element(By.ID, ‘userA’) 2.需要两个参数,第一个参数为定位的类型,由By提供,第二个参数为定位的具体方式。

    2024年01月21日
    浏览(106)
  • Selenium:定位(二:By模块定位,简单无基础)

    目录 一、简介: 二、BY模块 三、find_element方法和find_elements方法 1)、find_element方法和find_elements方法的区别 2)、find_element方法和find_elements方法搭配BY模块使用         (1)find_element方法:         (2)find_elements方法: 三、测试用例 1)、定位逻辑 2)、实际用例 测试代码

    2024年01月15日
    浏览(70)
  • Selenium 4.+.+ 标签定位8种方法详解

    Selenium4使用find_element(by=By.**, value=*)来替换了原来的find_element_by_* 的方法,使用find_elements(by=By.*, value=*)来替换了原来的find_elements_by_* 的方法。 By类定义在 site-packagesseleniumwebdrivercommonby.py中: 元素本身是什么:HTML静态页面中的的一个标签 元素定位一般而言是基于元素自身所

    2024年02月07日
    浏览(36)
  • Selenium 4.2.0 标签定位8种方法

    Selenium4使用find_element(by=By.**, value=*)来替换了原来的find_element_by_* 的方法,使用find_elements(by=By.*, value=*)来替换了原来的find_elements_by_* 的方法。 By类定义在 site-packagesseleniumwebdrivercommonby.py中: 这就是Selenium4的8种定位方法 元素本身是什么:HTML静态页面中的的一个标签 元素定位

    2023年04月08日
    浏览(35)
  • Python---selenium 使用及定位

    使用find_element_by_*() 方法只需导入 from selenium import webdriver,使用 find_element() 方法除了导入 from selenium import webdriver ,还要导入 from selenium.webdriver.common.by import By。 Selenium4 提供了 8 种定位(单)节点的方法,如下表所示: 方法说明 find_element(By.ID) 通过 id 属性值定位节点 find_

    2024年02月03日
    浏览(45)
  • Selenium WebDriver提供By.CSS_SELECTOR定位元素方法

    `By.CSS_SELECTOR` 是 Selenium WebDriver 提供的一种定位元素的方法,它允许使用 CSS 选择器来定位页面上的元素。 以下是常见的 CSS 选择器语法: 1. **标签选择器(Tag Selector)**:通过元素的标签名选择元素。    - 示例:`p` 选取所有 p 标签的元素。 2. **类选择器(Class Selector)**:通

    2024年04月24日
    浏览(43)
  • Discuz论坛网站标题栏Powered by Discuz!版权信息如何去除或是修改?

    当我们搭建好DZ论坛网站后,为了美化网站,想把标题栏的Powered by Discuz!去除或是修改,应该如何操作呢?今天飞飞和你分享,在操作前务必把网站源码和数据库都备份到本地或是网盘。   Discuz的版权信息存在两处地方,一个是标题栏,一个是底部。一般为了美化修改个标

    2024年02月08日
    浏览(78)
  • python+selenium使用xpath定位的问题

    python用selenium调chrome爬取网页信息遇到报错: 1.InvalidSelectorException: Message: invalid selector: The result of the xpath expression is [object Attr]. It should be an element 原因是selenium不支持从xpath中直接获取text文本信息。 xpath表达式修改为: 2.Message: no such element: Unable to locate element: xpath表达式一直

    2024年02月12日
    浏览(42)
  • 关于Python中使用selenium八大定位方法

    1.通过id元素定位                             .find_element_by_id(\\\"id\\\") 2.通过name元素定位                       .find_element_by_name(\\\"name\\\")     3.通过路径导航定位                         .find_element_by_xpath(\\\"xpath\\\")          说明 :右键所选的网页元素,点击copy,点击copy ,x

    2023年04月23日
    浏览(47)
  • selenium定位非select标签的下拉框(div/ul/li)

    1.定位下拉框,如果开发者选项是select标签的,我们一般会使用以下方法进行定位:  2.针对不是select属性的下拉框,如果再使用以上方法进行定位并选择可选项,就会报错,例如下拉框是在div标签,div标签下有ul,ul下有li可选项,这时候再使用1中的方法进行定位并选择,就

    2024年02月11日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包