selenium获取html元素中的文本内容

这篇具有很好参考价值的文章主要介绍了selenium获取html元素中的文本内容。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

方法1:.text

直接定位元素

直接使用xpath路径定位元素,最后使用.text获取元素中文本

  • 注意!!: 此时text_translation取.text 之前 类型为WebElement
from selenium import webdriver

driver = webdriver.Chrome(executable_path='你的chromedriver.exe所在路径')

text_translation = driver.find_element_by_xpath('//span[@class="VIiyi"]/span/span').text
方法2:text()

使用etree.HTML (提前导入模块from lxml import etree)

etree.HTML先解析当前页面资源,再路径定位元素时,路径最后添加/text()获取文本,取文本列表中第一个元素[0]文章来源地址https://www.toymoban.com/news/detail-590250.html

  • 注意!!: 此时text_translation取[0] 之前 类型为list,list输出为[‘hello’]
from selenium import webdriver
from lxml import etree

driver = webdriver.Chrome(executable_path='你的chromedriver.exe所在路径')

source = etree.HTML(driver.page_source)
text_translation = source.xpath('//span[@class="VIiyi"]/span/span/text()')[0]  

到了这里,关于selenium获取html元素中的文本内容的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Selenium教程__获取元素文本、属性值、尺寸(8)

    本文将介绍如何使用Selenium来获取元素的文本内容、属性值和尺寸,并展示一些实际应用场景。 学习本文内容将能够轻松地获取并利用元素的相关信息,从而更好地进行元素的验证、操作和断言。  -事必有法,然后有成-  最后祝大家早日达到测试的天花板! 以下是我收集到

    2024年02月11日
    浏览(33)
  • 4.正则提取html中的img标签的src内容

    我们以百度贴吧的1吧举例 目录 1  把网页搞下来 2  收集url 3  处理url 4  空的src 5  容错 6  不使用数字作为文件名 7  并不是所有的图片都用img标签表示 8  img标签中src请求下来不一定正确 9  分页   搞下来之后,双击打开是这样的 我们实际拿的就是 img标签中src的内

    2024年02月09日
    浏览(37)
  • selenium无法获取到标签的文本内容(text)的解决方法

    在我们使用selenium进行抓取网页的时候,可能有的时候会抓取不到内容。 例如:driver.find_element_by_xxx().text() 为空的解决办法    在用driver.find_element_by_xxx().text()获取文本的时候,得到的文本为空, 那么当前定位的元素可能被隐藏了。 我们先查看当前的元素的原始代码   我们

    2023年04月11日
    浏览(30)
  • 【正则表达式】获取html代码文本内所有<script>标签内容

    一. 背景 之前要对学生提交的html代码进行检查,在获取了学生提交的html代码文本后,需要使用正则去截取内部的script标签内容做进一步的检查。 假设得到html文本如下(不是代码),我们要得到全部的script标签内容并提取出来。 看上去不难,但是实际操作起来有一定的坑,

    2024年01月17日
    浏览(35)
  • 用python提取PDF中各类文本内容的方法

    从PDF文档中提取信息,是很多类似RAG这样的应用第一步要处理的事情,这里需要做好三件事: 提取出来的文本要保持信息完整性,也就是准确性 提出的结果需要有附加信息,也就是要保存元数据 提取过程要完成自动化,也就是流程化 然而,在我们开始之前,我们需要指定目

    2024年02月01日
    浏览(30)
  • javaScript:如何获取html中的元素对象

    目录 前言: 方法 1.通过id获取元素 2.通过标签名获取元素 3.通过类名class获取元素  获取body的方法 1.document.getElementsByTagName(\\\'body\\\')[0] 2.document.body 相关代码          通过获取HTML中的元素对象,JavaScript可以对网页进行动态交互、更新、响应用户操作、处理表单数据、动态加载

    2024年02月13日
    浏览(29)
  • Python selenium获取元素信息

    视频版教程:一天掌握python爬虫【基础篇】 涵盖 requests、beautifulsoup、selenium 主要text属性和三个方法get_attribute(),get_property(),get_dom_attribute() text属性获取元素的文本信息; get_attribute(),get_property(),get_dom_attribute()三个方法都是获取元素的属性值 区别是property是DOM中的属性,

    2024年02月06日
    浏览(32)
  • chatgpt赋能python:Python如何只提取文本中的数字?

    随着数字化时代的到来,数字成为了我们生活中不可或缺的一部分。我们每天都需要处理大量的数字,比如账单、统计数据等等,这些数字都散落在各个文本中。如果我们需要将这些数字提取出来,该怎么办呢? Python提供了一种非常简单和高效的方法,可以帮助我们快速地从

    2024年02月07日
    浏览(31)
  • Python正则表达式提取文本中的IP地址

    Python正则表达式提取文本中的IP地址 在Python中,使用正则表达式可以方便地从文本中抽取符合规则的字符串。其中,IP地址是一个常见的需要抽取的内容之一。IP地址通常由四段数字组成,每段数字的取值范围是0~255。下面将演示如何在Python中使用正则表达式抽取文本中的IP地

    2024年02月16日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包