selenium获取html元素中的文本内容

1年前作者：Jane-8分类：Toy博客阅读(13)违法举报

这篇具有很好参考价值的文章主要介绍了selenium获取html元素中的文本内容。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

方法1：`.text`

直接定位元素

直接使用xpath路径定位元素，最后使用.text获取元素中文本

注意！！： 此时text_translation取.text 之前类型为WebElement

from selenium import webdriver

driver = webdriver.Chrome(executable_path='你的chromedriver.exe所在路径')

text_translation = driver.find_element_by_xpath('//span[@class="VIiyi"]/span/span').text

方法2：`text()`

使用etree.HTML (提前导入模块from lxml import etree)

etree.HTML先解析当前页面资源，再路径定位元素时，路径最后添加/text()获取文本，取文本列表中第一个元素[0]文章来源地址https://www.toymoban.com/news/detail-590250.html

注意！！： 此时text_translation取[0] 之前类型为list，list输出为[‘hello’]

from selenium import webdriver
from lxml import etree

driver = webdriver.Chrome(executable_path='你的chromedriver.exe所在路径')

source = etree.HTML(driver.page_source)
text_translation = source.xpath('//span[@class="VIiyi"]/span/span/text()')[0]

到了这里，关于selenium获取html元素中的文本内容的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Selenium教程__获取元素文本、属性值、尺寸（8）
本文将介绍如何使用Selenium来获取元素的文本内容、属性值和尺寸，并展示一些实际应用场景。学习本文内容将能够轻松地获取并利用元素的相关信息，从而更好地进行元素的验证、操作和断言。 -事必有法，然后有成- 最后祝大家早日达到测试的天花板！以下是我收集到
2024年02月11日
浏览(8)
前端基础知识学习——获取dom对象、获取html属性、获取内容、更改样式、创建dom元素、删除元素、代替元素（十）
2024年02月09日
浏览(9)
4.正则提取html中的img标签的src内容
我们以百度贴吧的1吧举例目录 1 把网页搞下来 2 收集url 3 处理url 4 空的src 5 容错 6 不使用数字作为文件名 7 并不是所有的图片都用img标签表示 8 img标签中src请求下来不一定正确 9 分页搞下来之后，双击打开是这样的我们实际拿的就是 img标签中src的内
2024年02月09日
浏览(15)
selenium无法获取到标签的文本内容(text)的解决方法
在我们使用selenium进行抓取网页的时候，可能有的时候会抓取不到内容。例如：driver.find_element_by_xxx().text() 为空的解决办法在用driver.find_element_by_xxx().text()获取文本的时候，得到的文本为空，那么当前定位的元素可能被隐藏了。我们先查看当前的元素的原始代码我们
2023年04月11日
浏览(10)
【正则表达式】获取html代码文本内所有＜script＞标签内容
一. 背景之前要对学生提交的html代码进行检查，在获取了学生提交的html代码文本后，需要使用正则去截取内部的script标签内容做进一步的检查。假设得到html文本如下（不是代码），我们要得到全部的script标签内容并提取出来。看上去不难，但是实际操作起来有一定的坑，
2024年01月17日
浏览(9)
用python提取PDF中各类文本内容的方法
从PDF文档中提取信息，是很多类似RAG这样的应用第一步要处理的事情，这里需要做好三件事：提取出来的文本要保持信息完整性，也就是准确性提出的结果需要有附加信息，也就是要保存元数据提取过程要完成自动化，也就是流程化然而，在我们开始之前，我们需要指定目
2024年02月01日
浏览(10)
javaScript：如何获取html中的元素对象
目录前言：方法 1.通过id获取元素 2.通过标签名获取元素 3.通过类名class获取元素获取body的方法 1.document.getElementsByTagName(\\\'body\\\')[0] 2.document.body 相关代码通过获取HTML中的元素对象，JavaScript可以对网页进行动态交互、更新、响应用户操作、处理表单数据、动态加载
2024年02月13日
浏览(10)
Python selenium获取元素信息
视频版教程：一天掌握python爬虫【基础篇】涵盖 requests、beautifulsoup、selenium 主要text属性和三个方法get_attribute()，get_property()，get_dom_attribute() text属性获取元素的文本信息； get_attribute()，get_property()，get_dom_attribute()三个方法都是获取元素的属性值区别是property是DOM中的属性，
2024年02月06日
浏览(10)
chatgpt赋能python：Python如何只提取文本中的数字？
随着数字化时代的到来，数字成为了我们生活中不可或缺的一部分。我们每天都需要处理大量的数字，比如账单、统计数据等等，这些数字都散落在各个文本中。如果我们需要将这些数字提取出来，该怎么办呢？ Python提供了一种非常简单和高效的方法，可以帮助我们快速地从
2024年02月07日
浏览(7)
Python正则表达式提取文本中的IP地址
Python正则表达式提取文本中的IP地址在Python中，使用正则表达式可以方便地从文本中抽取符合规则的字符串。其中，IP地址是一个常见的需要抽取的内容之一。IP地址通常由四段数字组成，每段数字的取值范围是0~255。下面将演示如何在Python中使用正则表达式抽取文本中的IP地
2024年02月16日
浏览(13)