yolov5输出检测框的中心位置,框的长宽,框的位置,以及输出对应标签格式的输出。 模型读取每个图片,并将上述的信息依此输出到同名的txt文件中保存,具体需要哪些坐标可以自己选。
更改信息在detect.py文件中,需要更改的第一个地方在如下地方,输出位置在runs/detect/exp中
# 自己改的部分
location_center_dir = str(save_dir) + '/detect_location'
if not os.path.exists(location_center_dir):
os.makedirs(location_center_dir)
location_center_path = location_center_dir + '\\' + str(p.stem) + (
'' if dataset.mode == 'image' else f'_{frame}') #
flocation = open(location_center_path + '.txt', 'a')
第二个需要更改的地方:
# 自己改的部分
x0 = (int(xyxy[0].item()) + int(xyxy[2].item())) / 2
y0 = (int(xyxy[1].item()) + int(xyxy[3].item())) / 2 # 中心点坐标(x0, y0)
chang = int(xyxy[2].item()) - int(xyxy[0].item())
kuan = int(xyxy[3].item()) - int(xyxy[1].item())
# class_index = cls # 获取属性
# object_name = names[int(cls)] # 获取标签名如:person
label = int(cls) # 对应每个物体的标签对应的数字label,如person:0
x0 = format(x0/2448, '.6f') #此处我要保存和训练标注的txt一样的格式,故保留六位小数
y0 = format(y0/2048, '.6f')
chang = format(chang/2448, '.6f') # 2448和2048为我的图片长和宽
kuan = format(kuan/2048, '.6f')
if label==0: # 在这里我只需要保存person的信息,可以删去,也可以自己更改
flocation.write(str(label) + ' ' + str(x0) + ' ' + str(y0) + ' '+str(chang)+' ' +str(kuan)+'\n')
注释应该很清楚了,int(xyxy[0].item()) 为左边的X坐标,int(xyxy[0].item(2))为右边的x坐标,int(xyxy[1].item()) 为上面的y坐标,int(xyxy[3].item()) 为下面的y坐标。文章来源:https://www.toymoban.com/news/detail-523162.html
我的坐标信息除以2048和2448,是为了获得labelimg标注工具同类型的坐标信息(用于训练或者var的label标签),即比例。需要用可通过img.shape()获得。文章来源地址https://www.toymoban.com/news/detail-523162.html
到了这里,关于yolov5输出检测框的中心位置,框的长宽,框的位置,以及输出对应标签格式的输出的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!