【最全教程】VOC格式转YOLO格式数据

这篇具有很好参考价值的文章主要介绍了【最全教程】VOC格式转YOLO格式数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

        在做目标检测时候,都会通过一些方法获得大量的数据集,或是网上下载,或是自己用软件一个一个的打标签。

        不会打标签的可以看下这个文章

Win10下安装LabelImg及使用技巧--全网最快最简单Win10下安装LabelImg及使用--全网最快最简单https://blog.csdn.net/Thebest_jack/article/details/124260693?spm=1001.2014.3001.5501        综合来说,网上的数据集绝大部分也是VOC数据文件

        这是为了标签数据的最大化。在日常生活中,我们也通常会打VOC格式的标签(xml文件),因为它所包含的数据最多。例如下图:

【最全教程】VOC格式转YOLO格式数据        而在使用YOLO算法的时候,我们需要使用YOLO格式的数据才可以运行代码,训练自己模型。那么什么是YOLO格式的数据呢?可以看下下面图:【最全教程】VOC格式转YOLO格式数据

        那么接下来,就跟我一起来做这些那个伟大的工作吧!

        代码已经放在了GitHub上,可以去这个【GitHub网址】下载,使用办法看ReadMe.md~

        接下来说下大体怎么使用

        在所有事情之前,你需要将XML数据的标签和图片放置到对应文件下        

        首先,需要给XML文件按照一定的比例分成train、val、test三个数据集。trainval_percent和train_percent 代表trainval和train的占比率,trainval_percent表示的是train+val之和。若不需要test集则改为1。train_percent 代表拿来训练的比例。这里我设置了trainval_percent = 0.9,
train_percent = 0.7。
        修改的话只需要修改这三部分的占比率。运行【images_tag.py】,代码如下:

# 该脚本文件需要修改第11-12行,设置train、val、test的切分的比率
import os
import random
import argparse

parser = argparse.ArgumentParser()
parser.add_argument('--xml_path', default='F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/Annotations', type=str, help='input xml label path')
parser.add_argument('--txt_path', default='F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/Imagesets', type=str, help='output txt label path')
opt = parser.parse_args()

trainval_percent = 0.9
train_percent = 0.7  #这里的train_percent 是指占trainval_percent中的
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
    os.makedirs(txtsavepath)

num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)

file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')

for i in list_index:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        file_trainval.write(name)
        if i in train:
            file_train.write(name)
        else:
            file_val.write(name)
    else:
        file_test.write(name)

file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

        运行成功之后,会出现这个效果:红圈的就是生成的分类txt

【最全教程】VOC格式转YOLO格式数据

        然后,将xml格式标签转换为txt格式标签。运行【voc_to_yolo.py】,代码如下:        

#该脚本文件需要修改第10行(classes)即可
# -*- coding: utf-8 -*-
import xml.etree.ElementTree as ET
from tqdm import tqdm
import os
from os import getcwd

sets = ['train', 'test','val']
#这里使用要改成自己的类别
classes = ['glass', 'metal', 'paper','plastic']


def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0 - 1
    y = (box[2] + box[3]) / 2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    x = round(x,6)
    w = round(w,6)
    y = round(y,6)
    h = round(h,6)
    return x, y, w, h

#后面只用修改各个文件夹的位置
def convert_annotation(image_id):
     #try:
        in_file = open('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/Annotations/%s.xml' % (image_id), encoding='utf-8')
        out_file = open('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/labels/%s.txt' % (image_id), 'w', encoding='utf-8')
        tree = ET.parse(in_file)
        root = tree.getroot()
        size = root.find('size')
        w = int(size.find('width').text)
        h = int(size.find('height').text)
        for obj in root.iter('object'):
            difficult = obj.find('difficult').text
            cls = obj.find('name').text
            if cls not in classes or int(difficult) == 1:
                continue
            cls_id = classes.index(cls)
            xmlbox = obj.find('bndbox')
            b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
                 float(xmlbox.find('ymax').text))
            b1, b2, b3, b4 = b
            # 标注越界修正
            if b2 > w:
                b2 = w
            if b4 > h:
                b4 = h
            b = (b1, b2, b3, b4)
            bb = convert((w, h), b)
            out_file.write(str(cls_id) + " " +
                           " ".join([str(a) for a in bb]) + '\n')
     #except Exception as e:
         #print(e, image_id)

#这一步生成的txt文件写在data.yaml文件里
wd = getcwd()
for image_set in sets:
    if not os.path.exists('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/labels/'):
        os.makedirs('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/labels/')
    image_ids = open('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/Imagesets/%s.txt' %
                     (image_set)).read().strip().split()
    list_file = open('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/%s.txt' % (image_set), 'w')
    for image_id in tqdm(image_ids):
        list_file.write('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/JPEGImages/%s.jpg\n' % (image_id))
        convert_annotation(image_id)
    list_file.close()

然后你会看到你的项目里多了个【labels】文件(用来存放转换后的yolo的标签)和三个txt文件。【最全教程】VOC格式转YOLO格式数据

        是不是该很简单?不会的留言评论加关注吧~~~ 文章来源地址https://www.toymoban.com/news/detail-455326.html

到了这里,关于【最全教程】VOC格式转YOLO格式数据的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • [数据集][目标检测]牛羊检测数据集VOC+YOLO格式3393张2类别

    数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):3393 标注数量(xml文件个数):3393 标注数量(txt文件个数):3393 标注类别数:2 标注类别名称:[\\\"cow\\\",\\\"sheep\\\"] 每个类别标注的框数: cow

    2024年03月19日
    浏览(44)
  • 目标检测任务中常用的数据集格式(voc、coco、yolo)

    VOC数据集(Annotation的格式是xmI) Pascal VOC数据集是目标检测的常用的大规模数据集之一,从05年到12年都会举办比赛,比赛任务task: 分类Classification 目标检测Object Detection 语义分割Class Segmentation 实例分割Object Segmentation Action Classification(专注于人体动作的一种分类) Person Layout(

    2024年02月14日
    浏览(47)
  • [数据集][目标检测]茶叶病害数据集VOC+YOLO格式883张8类别

    数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):883 标注数量(xml文件个数):883 标注数量(txt文件个数):883 标注类别数:8 标注类别名称:[\\\"algalleaf\\\",\\\"Anthracnose\\\",\\\"birdeyespot\\\",\\\"brownblight

    2024年01月16日
    浏览(43)
  • 100种目标检测数据集【voc格式yolo格式json格式coco格式】+YOLO系列算法源码及训练好的模型

    提示:本文介绍并分享了应用于 各行业 、 各领域 非常有用的 目标检测数据集 (感谢您的关注+三连, 数据集持续更新中… ),其中绝大部分数据集作者 已应用于各种实际落地项目 ,数据集 整体质量好 , 标注精确 ,数据的 多样性充分 , 训练 模型拟合较好 ,具有较高

    2023年04月09日
    浏览(46)
  • YOLO目标检测——无人机航拍行人检测数据集下载分享【含对应voc、coc和yolo三种格式标签】

    实际项目应用 :智能交通管理、城市安防监控、公共安全救援等领域 数据集说明 :无人机航拍行人检测数据集,真实场景的高质量图片数据,数据场景丰富 标签说明 :使用lableimg标注软件标注,标注框质量高,含voc(xml)、coco(json)和yolo(txt)三种格式标签,分别存放在不同文件

    2024年01月18日
    浏览(48)
  • [数据集][VOC][目标检测]河道垃圾水面漂浮物数据集目标检测可用yolo训练-1304张介绍

    数据集格式:Pascal VOC格式(不包含分割路径的txt文件和yolo格式的txt文件,仅仅包含jpg图片和对应的xml) 图片数量(jpg文件个数):1304 标注数量(xml文件个数):1304 标注类别数:1 标注类别名称:[\\\"trash\\\"] 每个类别标注的框数: trash count = 1386 数据集详细介绍: [数据集介绍][目标检测

    2024年02月05日
    浏览(58)
  • [数据集][目标检测]垃圾目标检测数据集VOC格式14963张44类别

    数据集格式:Pascal VOC格式(不包含分割的txt文件,仅仅包含jpg图片和对应的xml) 图片数量(jpg文件个数):14963 标注数量(xml文件个数):14963 标注类别数:44 标注类别名称:[\\\"toiletries\\\",\\\"plastic utensils\\\",\\\"seasoning bottles\\\",\\\"leftovers\\\",\\\"chopsticks\\\",\\\"ceramic utensils\\\",\\\"pots\\\",\\\"metal utensils\\\",\\\"cutting boards\\\",\\\"ol

    2024年02月11日
    浏览(41)
  • [数据集][目标检测]道路坑洼目标检测数据集VOC格式1510张2类别

    数据集格式:Pascal VOC格式(不包含分割路径的txt文件和yolo格式的txt文件,仅仅包含jpg图片和对应的xml) 图片数量(jpg文件个数):1510 标注数量(xml文件个数):1510 标注类别数:2 标注类别名称:[\\\"keng\\\",\\\"jingai\\\"] 每个类别标注的框数: keng count = 3166 jingai count = 442 使用标注工具:labelI

    2024年02月12日
    浏览(38)
  • 深度学习目标检测数据VisDrone2019(to yolo / voc / coco)---MMDetection数据篇

    配备摄像头的无人机(或通用无人机)已被快速部署到广泛的应用领域,包括农业、航空摄影、快速交付和监视。因此,从这些平台上收集的视觉数据的自动理解要求越来越高,这使得计算机视觉与无人机的关系越来越密切。我们很高兴为各种重要的计算机视觉任务展示一个大

    2024年02月04日
    浏览(55)
  • [数据集][目标检测]钢材表面缺陷目标检测数据集VOC格式2279张10类别

    数据集格式:Pascal VOC格式(不包含分割路径的txt文件和yolo格式的txt文件,仅仅包含jpg图片和对应的xml) 图片数量(jpg文件个数):2279 标注数量(xml文件个数):2279 标注类别数:10 标注类别名称:[\\\"yueyawan\\\",\\\"siban\\\",\\\"hanfeng\\\",\\\"chongkong\\\",\\\"shuiban\\\",\\\"yahen\\\",\\\"youban\\\",\\\"yaozhe\\\",\\\"zhehen\\\",\\\"yiwu\\\"] 每个类别标注的

    2024年02月12日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包