统计XML标注文件中各标注类别的标签数量

这篇具有很好参考价值的文章主要介绍了统计XML标注文件中各标注类别的标签数量。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

        目标检测任务重,担心数据集中各标签类别不均衡,想统计XML标注文件中各标注类别的标签数量,可以使用以下脚本:

import os
import glob
import xml.etree.ElementTree as et

def count_labels(source_dir):
    file_list = glob.glob(os.path.join(source_dir,"*.xml"))

    labels = {}
    for file in file_list:
        tree = et.ElementTree()
        tree.parse(file)
        objects = tree.findall(".//object")
        for object in objects:
            name = object.find(".//name")
            label = name.text
            if label in labels.keys():
                labels[label] += 1
            else:
                labels[label] = 1

    count_all = 0
    print(source_dir)
    for i in labels.keys():
        print(i,labels[i])
        count_all += labels[i]
    print("all_labels : ", count_all)
    print("all_images : ", len(file_list))

if __name__ == '__main__':
    count_labels("/disk/test_xml")

         文章来源地址https://www.toymoban.com/news/detail-653250.html

到了这里,关于统计XML标注文件中各标注类别的标签数量的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python批量修改、删除、替换xml文件内容(labelimg标注)

    使用模型训练自定义数据集之前,在用在网上搜索得到的图片制作数据集时,即使批量修改图片名称后,在使用labelimg标注得到的xml文件中,图片名称还是网络上图片原本的名称,这时需要对其进行批量修改。 然后先修改路径,将xml文件对应图片的真实路径替换。这里图片的

    2023年04月15日
    浏览(91)
  • 更换xml文件的标签

    import glob import xml.etree.ElementTree as ET path = r\\\'./data_pro/xml/val\\\'    # xml文件夹路径 i = 0 for xml_file in glob.glob(path + \\\'/*.xml\\\'):     # print(xml_file)     tree = ET.parse(xml_file)      obj_list = tree.getroot().findall(\\\'object\\\')      for per_obj in obj_list:         if per_obj[0].text == \\\'clothes\\\':    # 错误的标签“

    2023年04月14日
    浏览(25)
  • 【3D 图像分割】基于 Pytorch 的 3D 图像分割6(数据预处理之LIDC-IDRI 标签 xml 标签转储及标记次数统计 )

    由于之前哔站作者整理的 LUNA16 数据处理方式过于的繁琐,于是,本文就对 LUNA16 数据做一个新的整理,最终得到的数据和形式是差不多的。但是,主要不同的是代码逻辑比较的简单,便于理解。 对于 LUNA16 数据集的学习,可以去参考这里:【3D 图像分类】基于 Pytorch 的 3D 立

    2024年02月04日
    浏览(53)
  • 目标检测任务数据集的数据增强中,图像垂直翻转和xml标注文件坐标调整

     使用以上代码需要修改原图像和标注文件所在文件夹路径(source_dir)。亲测可用。 

    2024年02月11日
    浏览(43)
  • logback-spring.xml配置文件标签(超详解)

    市面上的日志框架; JUL、JCL、Jboss-logging、logback、log4j、log4j2、slf4j… 日志门面 (日志的抽象层) 日志实现 JCL(Jakarta Commons Logging) SLF4j(Simple Logging Facade for Java) jboss-logging Log4j JUL(java.util.logging) Log4j2 Logback SpringBoot选用 SLF4j(日志抽象层)和logback(日志实现) 官方图:

    2023年04月09日
    浏览(255)
  • Spring源码之XML文件中Bean标签的解析1

    xml文件里包含Bean的信息,为了避免多次IO,需要一次性读取xml文件中所有bean信息,加入到Spring工厂。 读取配置文件 ClassPathResource是Spring封装的一个类型; Resource接口 :可以读取相关资源文件的内容 获得输入流;可读取的类型,不仅包括本地的xml、 properties、txt 等文件,还包

    2024年02月13日
    浏览(53)
  • Spring源码(五)— 解析XML配置文件(二) 定制化标签解析流程

    上一篇以bean标签为例,介绍了属于defaultNamesapce标签的解析流程,但是defaultNamespace中默认的标签只有bean、beans、alias、import这四个,而我们平时在xml中配置的标签有很多。那其余的标签是如何解析? 在这篇文章会详细介绍定制化标签的解析流程。 注:除defaultNamesapce所属的4个

    2024年02月15日
    浏览(65)
  • 【表面缺陷检测】铝型材表面缺陷检测数据集介绍(含xml标签文件)

    铝型材是一种由铝合金材料制成的,具有固定截面形状和尺寸的条形建材。由于其优良的物理性能和广泛的应用领域,铝型材在现代工业和生活中发挥着重要的作用。 根据截面形状的不同,铝型材可分为角铝、槽铝、工字铝、方管铝等多种类型。每种类型的铝型材都有其独特

    2024年02月08日
    浏览(41)
  • Repo manifests默认default.xml清单文件中的各个标签详解

    Repo简介 “Repo” 是一个用于管理多个Git存储库的工具,通常与Google的Android开发项目一起使用。它允许您在一个命令下轻松地进行多个Git存储库的同步、下载和管理。 repo下载安装 从清华镜像源下载 其实下载下来的repo文件只是一个使用Python编写的引导脚本(Google 称之为 Rep

    2024年02月11日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包