利用python读取xml中的数据

这篇具有很好参考价值的文章主要介绍了利用python读取xml中的数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

xml例子

方法一:利用cElementTree

方法二:利用read_xml()

方法三:利用pd.json_normalize()


xml例子

xml = '''<?xml version='1.0' encoding='utf-8'?>
<data>
 <row>
   <shape>square</shape>
   <degrees>360</degrees>
   <sides>4.0</sides>
 </row>
 <row>
   <shape>circle</shape>
   <degrees>360</degrees>
 </row>
 <row>
   <shape>triangle</shape>
   <degrees>180</degrees>
   <sides>3.0</sides>
 </row>
</data>'''

方法一:利用cElementTree

from xml.etree import cElementTree as ET
import pandas as pd
​
# 读取xml字符串
root = ET.fromstring(text=xml)
# 读取xml文件
# tree = ET.ElementTree(file="text.xml")  
# root = tree.getroot() 
data = list()
for child in root:
    data1 = list()
    for son in child:
        data1.append(son.text)
    data.append(data1)
​
df = pd.DataFrame(data, columns=['shape', 'degrees', 'sides'])
print(df)
输出结果:
    shape  degrees  sides
0    square      360    4.0
1    circle      360    NaN
2  triangle      180    3.0

如果 shape 、degrees、sides 不是按照一定规律排列,这样取数据容易出错。

比如将最后一组 degrees、 shape 、sides ,

输出结果便会变成:

    shape   degrees sides
0  square       360   4.0
1  circle       360  None
2     180  triangle   3.0

方法二:利用read_xml()

import pandas as pd
df = pd.read_xml(xml)
print(df)
输出结果:
    shape  degrees  sides
0    square      360    4.0
1    circle      360    NaN
2  triangle      180    3.0

方法三:利用pd.json_normalize()

  • 将xml转为类似json的格式

  • 利用pd.json_normalize() 读到dataframe文章来源地址https://www.toymoban.com/news/detail-456752.html

def fun1(root):
    dic1 = dict()
    for child in root:
        if bool(child) is True:  # 有下一层
            print(child.tag)
            dic2 = fun1(child)  # 自己调用自己
            value = dic1.get(child.tag)  # 存在返回,不存在返回None
            if value:  # 存在
                value.append(dic2)
                dic1[child.tag] = value
            else:
                dic1[child.tag] = [dic2]
        else:
            dic1[child.tag] = child.text
    return dic1

if __name__ == '__main__':
    from xml.etree import cElementTree as ET
    import pandas as pd

    root = ET.fromstring(text=xml)

    dic1 = fun1(root)
    df = pd.json_normalize(dic1['row'])
    print(df)
输出结果:
    shape  degrees  sides
0    square      360    4.0
1    circle      360    NaN
2  triangle      180    3.0

到了这里,关于利用python读取xml中的数据的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python读取Excel中的数据

     1、用xlrd包读取excel数据 2、用pandas包读取excel数据 先熟悉以下read_excel函数中常用的几个参数,想要看完整的参数解释可以参考Pandas read_excel()参数详解_leenuxcore的博客-CSDN博客_read_excel pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,squeeze=False,dtype=None,engine=None

    2024年02月16日
    浏览(44)
  • 【Python系列】Python中的YAML数据读取与解析

    💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老 导航 檀越剑指大厂系列:全面总

    2024年04月08日
    浏览(31)
  • Python操作XML教程:读取、写入、修改和保存XML文档

    XML是一种常见的数据交换格式,在许多应用中都被广泛使用。通过掌握Python操作XML的基础知识,您将能够轻松地处理XML数据,从而实现数据的提取、修改和存储。 内容包括以下主要部分: 解析XML文档:学习如何使用Python解析XML文档,获取根元素和遍历子元素。 访问元素的内

    2024年02月13日
    浏览(45)
  • Python爬虫之读取数据库中的数据

    之前几篇我们一直在研究如何从网站上快速、方便的获取数据,并将获取到的数据存储在数据库中。但是将数据存储在数据中并不是我们的目的,获取和存储数据的目的是为了更好的利用这些数据,利用这些数据的前提首先需要从数据库按一定的格式来读取数据,这一篇主要

    2023年04月13日
    浏览(50)
  • python 读取xml从入门到精通

      XML (Extensible Markup Language),可扩展标记语言,是一种被广泛应用于网络上的文件格式。在互联网上,网页里的信息都以 XML格式存储,例如 HTML、 CSV、 JSON等。随着电子商务的发展,人们需要在 Web页面上传递各种信息,因而需要一个简单的 XML文件来承载这些信息。由于

    2024年02月06日
    浏览(30)
  • Opencv将数据保存到xml、yaml / 从xml、yaml读取数据

    Opencv提供了读写 xml、yaml 的类实现: 本文重点参考:https://blog.csdn.net/cd_yourheart/article/details/122705776?spm=1001.2014.3001.5506,并将给出文件读写的具体使用实例。 1.1 写数据 output : 1.2 读数据 将数据写入到xml文件后,打开查看一下 格式是自动生成的,只是将数据填充了进去。可以看

    2024年02月13日
    浏览(43)
  • python实现读取文件中的视频数据并实时展示

    要实现读取文件中的视频数据并实时展示,可以使用OpenCV库。以下是一个简单的示例代码: 在这个示例中,我们首先使用`cv2.VideoCapture()`函数打开视频文件。然后,我们使用一个无限循环来逐帧读取视频,并在窗口中显示当前帧。最后,我们释放资源并关闭窗口。注意,在循

    2024年02月12日
    浏览(48)
  • PHP中的魔术方法并给出一些例子

    PHP中的魔术方法并给出一些例子 在PHP中,魔术方法(Magic Methods)是一类具有特殊名称的方法,它们会在特定的情况下自动被PHP调用。这些方法的名称都是以两个下划线(__)开头的,因此它们也被称为双下划线方法。魔术方法提供了许多高级的面向对象编程功能,使得开发者

    2024年04月26日
    浏览(32)
  • 用Python的pandas读取excel文件中的数据

    hello呀!各位铁子们大家好呀,今天呢来和大家聊一聊用Python的pandas读取excel文件中的数据。 使用pandas的 read_excel() 方法,可通过文件路径直接读取。注意到,在一个excel文件中有多个sheet,因此,对excel文件的读取实际上是读取指定文件、并同时指定sheet下的数据。可以一次读

    2024年02月02日
    浏览(55)
  • Python封装tvdi算法为exe并读取xml

    代码主要看最后if name == ‘ main ’:的部分 解析了xml中对应的输入输出路径,最后再读取输入文件运行自己的算法部分,xml文件见下面

    2024年01月22日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包