Beautiful Soup的使用例子

这篇具有很好参考价值的文章主要介绍了Beautiful Soup的使用例子。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Beautiful Soup是Python中常用的HTML/XML解析库,它可以将HTML/XML文档解析为树形结构,方便用户进行各种操作。

以下是Beautiful Soup库的一些主要功能和示例:

1、解析HTML/XML文档

使用Beautiful Soup解析HTML/XML文档非常简单,只需使用BeautifulSoup类即可。例如,以下代码演示了如何使用Beautiful Soup解析HTML文档:

from bs4 import BeautifulSoup

html_doc = """
<html>
<head>
    <title>Example HTML Document</title>
</head>
<body>
    <h1>Example HTML Document</h1>
    <p>This is an example HTML document.</p>
    <ul>
        <li>Item 1</li>
        <li>Item 2</li>
        <li>Item 3</li>
    </ul>
</body>
</html>
"""

soup = BeautifulSoup(html_doc, 'html.parser')
print(soup.prettify())

输出结果为:

<html>
 <head>
  <title>
   Example HTML Document
  </title>
 </head>
 <body>
  <h1>
   Example HTML Document
  </h1>
  <p>
   This is an example HTML document.
  </p>
  <ul>
   <li>
    Item 1
   </li>
   <li>
    Item 2
   </li>
   <li>
    Item 3
   </li>
  </ul>
 </body>
</html>

2、查找元素

使用Beautiful Soup查找HTML/XML文档中的元素非常方便。可以使用find()find_all()方法进行查找。例如,以下代码演示了如何查找HTML文档中的<h1>元素:

from bs4 import BeautifulSoup

html_doc = """
<html>
<head>
    <title>Example HTML Document</title>
</head>
<body>
    <h1>Example HTML Document</h1>
    <p>This is an example HTML document.</p>
    <ul>
        <li>Item 1</li>
        <li>Item 2</li>
        <li>Item 3</li>
    </ul>
</body>
</html>
"""

soup = BeautifulSoup(html_doc, 'html.parser')
h1 = soup.find('h1')
print(h1.text)

输出结果为:Example HTML Document

3、修改元素

使用Beautiful Soup修改HTML/XML文档中的元素非常简单。例如,以下代码演示了如何修改HTML文档中的<h1>元素:

from bs4 import BeautifulSoup

html_doc = """
<html>
<head>
    <title>Example HTML Document</title>
</head>
<body>
    <h1>Example HTML Document</h1>
    <p>This is an example HTML document.</p>
    <ul>
        <li>Item 1</li>
        <li>Item 2</li>
        <li>Item 3</li>
    </ul>
</body>
</html>
"""

soup = BeautifulSoup(html_doc, 'html.parser')
h1 = soup.find('h1')
h1.string = 'New Title'
print(soup.prettify())

输出结果为:

<html>
 <head>
  <title>
   Example HTML Document
  </title>
 </head>
 <body>
<h1>New Title</h1>
<p>This is an example HTML document.</p>
<ul>
 <li>
  Item 1
 </li>
 <li>
  Item 2
 </li>
 <li>
  Item 3
 </li>
</ul>

</body> </html> ```

4、删除元素

使用Beautiful Soup删除HTML/XML文档中的元素也非常简单。例如,以下代码演示了如何删除HTML文档中的<p>元素:

from bs4 import BeautifulSoup

html_doc = """
<html>
<head>
    <title>Example HTML Document</title>
</head>
<body>
    <h1>Example HTML Document</h1>
    <p>This is an example HTML document.</p>
    <ul>
        <li>Item 1</li>
        <li>Item 2</li>
        <li>Item 3</li>
    </ul>
</body>
</html>
"""

soup = BeautifulSoup(html_doc, 'html.parser')
p = soup.find('p')
p.extract()
print(soup.prettify())

输出结果为:

<html>
 <head>
  <title>
   Example HTML Document
  </title>
 </head>
 <body>
  <h1>
   Example HTML Document
  </h1>
  <ul>
   <li>
    Item 1
   </li>
   <li>
    Item 2
   </li>
   <li>
    Item 3
   </li>
  </ul>
 </body>
</html>

以上就是Beautiful Soup库的主要功能和示例。Beautiful Soup还有许多其他功能,例如修改元素属性、处理字符串、遍历树形结构等。文章来源地址https://www.toymoban.com/news/detail-448269.html

到了这里,关于Beautiful Soup的使用例子的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 爬虫利器 Beautiful Soup 之遍历文档

    Beautiful Soup 是一个可以从 HTML 或 XML 文件中提取数据的 Python 库,它提供了一些简单的操作方式来帮助你处理文档导航,查找,修改文档等繁琐的工作。因为使用简单,所以 Beautiful Soup 会帮你节省不少的工作时间。 你可以使用如下命令安装 Beautiful Soup。二选一即可。 Beautifu

    2024年02月09日
    浏览(29)
  • Python中bs4的soup.find()和soup.find_all()用法

    我们在使用python对网页爬虫的时候,经常会得到一些html数据,因此我们就会利用soup.find()和soup.find_all()方法来筛选出想要的数据。  1.1利用name来查找 代码如下:  结果如下: h1 class=\\\"item\\\" id=\\\"x1\\\"蔡x坤/h1 1.2利用属性attrs来寻找 代码如下: 结果如下:  div class=\\\"item\\\" id=\\\"x3\\\" span你干

    2024年03月20日
    浏览(42)
  • Python random模块(获取随机数)常用方法和使用例子

    嗨喽,大家好呀~这里是爱看美女的茜茜呐 random.random random.random()用于生成一个0到1的随机符点数: 0 = n 1.0 random.uniform random.uniform(a, b),用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下限。 如果a b,则生成的随机数n: a = n = b。如果 a b, 则 b = n = a

    2024年01月24日
    浏览(62)
  • Maven中常用命令以及idea中使用maven指南

    compile compile 是maven 工程的编译命令,作用是将src/main/java 下的文件编译为class 文件输出到target 目录下。 test test 是maven 工程的测试命令 mvn test,会执行src/test/java 下的单元测试类。 clean clean 是maven 工程的清理命令,执行clean 会删除target 目录及内容。 package package 是maven 工程的

    2024年02月05日
    浏览(47)
  • Python使用pytorch深度学习框架构造Transformer神经网络模型预测红酒分类例子

    经典的红酒分类数据集是指UCI机器学习库中的Wine数据集。该数据集包含178个样本,每个样本有13个特征,可以用于分类任务。 具体每个字段的含义如下: alcohol:酒精含量百分比 malic_acid:苹果酸含量(克/升) ash:灰分含量(克/升) alcalinity_of_ash:灰分碱度(以mEq/L为单位)

    2024年02月02日
    浏览(41)
  • python socket编程7 - 使用PyQt6 开发UI界面新增实现UDP server和client单机通讯的例子

    在第五篇中,简单实现了命令行下的 TCP/UDP server和client的单机通讯。 在第六篇中,实现了PyQt6开发界面,TCP协议实现的单机server和client的通讯功能。 这一篇,在第六篇的基础上,增加了UDP server和client的单机通讯功能。 1、UDP Server 界面实现服务配置和数据提供 2、UDP Server封装

    2024年02月19日
    浏览(46)
  • Android-高级-UI-进阶之路-(七)-SVG-基础使用-+-绘制中国地图,Android面试中常问的MMAP到底是啥东东

    iv.setImageDrawable(animatedVectorDrawable) val animatable = iv.drawable as Animatable animatable.start() } } 输入搜索动画 利用在线绘制 SVG 图标网站 制作搜索图标 可以自己随意捣鼓绘制,绘制好了之后点击视图-源代码,将 SVG 代码复制出来保存成 search_svg.xml 在线转换 svg2vector 点击空白或者直接将

    2024年04月25日
    浏览(47)
  • python实现爬虫例子2

    网络爬虫是一个可以自动抓取互联网内容的程序。Python有很多库可以用来实现网络爬虫,其中最常用的是 requests (用于发送HTTP请求)和 BeautifulSoup (用于解析HTML)。 以下是一个简单的Python网络爬虫示例,该爬虫会抓取指定网页的所有标题( title 标签)并打印出来:

    2024年04月25日
    浏览(33)
  • python基础运用例子

    **操作符 函数形参汇聚 —— 打包 *args 和 **kwargs 常作为 魔法变量 出现于函数定义中,用于将不定量实参传递给函数。其中: * args 的本质是将 位置形参 汇集为 tuple 然后由变量 args 接收,: ** kwargs 的本质则是将 形参 汇集为 dict 然后由变量 kwargs 接收: 注意,单星操

    2024年02月09日
    浏览(21)
  • 手机上可以python编程的软件,手机上可以用的python

    大家好,小编来为大家解答以下问题,手机上可以python编程的软件,手机上可以用的python,现在让我们一起来看看吧! 推荐一款手机Python编程软件 最近网友问我有没有手机上运行Python代码的编程软件,所以根据网友们的需求,我介绍一款手机Python编程软件。 具体步骤如下

    2024年02月02日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包