ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

yolov3中生成网络输入数据格式的voc_lable.py文件代码解读(笔记)

2019-03-20 09:53:53  阅读:278  来源: 互联网

标签:文件 yolov3 lable image train 2007 数据格式 txt find


voc_lable.py文件代码解读

下载python脚本:

wget https://pjreddie.com/media/files/voc_label.py

代码解读:

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join

#数据集
sets=[('2012', 'train'), ('2012', 'val'), ('2007', 'train'), ('2007', 'val'), ('2007', 'test')]
#要检测的类别
classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]

def convert(size, box):
    #box中存的是框的xmin,xmax,ymin,ymax
    dw = 1./(size[0])#size[0]是图片的宽度
    dh = 1./(size[1])#size[1]是图片的高度
    #x,y框的中心坐标
    x = (box[0] + box[1])/2.0 - 1
    y = (box[2] + box[3])/2.0 - 1
    #w,h框的宽度和高度
    w = box[1] - box[0]
    h = box[3] - box[2]
    #把相关值进行等比例转换,或者说归一化
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)

def convert_annotation(year, image_id):#从XML文件中读出数据,到上面的函数中归一化,然后将信息写到txt标注文件中
    in_file = open('VOCdevkit/VOC%s/Annotations/%s.xml'%(year, image_id))#要读取的数据集中的注释文件,是XML格式
    out_file = open('VOCdevkit/VOC%s/labels/%s.txt'%(year, image_id), 'w')#要生成的标注文件,是txt格式
    tree=ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')#图片大小的节点
    w = int(size.find('width').text)#从注释文件中获得图片的“宽”和“高”
    h = int(size.find('height').text)

    for obj in root.iter('object'):#检测到的对象节点
        difficult = obj.find('difficult').text#从注释文件中获得difficult
        cls = obj.find('name').text#从注释文件中获得“类别名”
        if cls not in classes or int(difficult)==1:
            continue
        cls_id = classes.index(cls)#获得这个类别名,在上面的classes中的位置序号
        xmlbox = obj.find('bndbox')#检测框节点
        #b中是框的xmin,xmax,ymin,ymax
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)#bb中是归一化后的,框的中心坐标,宽,高
        #[fun(a) for a in [...]] 
        #>>> [a+1 for a in [2,3,4,5,6]]
        #[3, 4, 5, 6, 7]
        #'内容'.join([string array])
        #>>> '.'.join(['2','3','4','5','6']) 
        #'2.3.4.5.6'
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')#向标注文件中写入:类别序号 框中心坐标x 框中心坐标y 框宽 框高

  wd = getcwd()
 #sets=[('2012', 'train'), ('2012', 'val'), ('2007', 'train'), ('2007', 'val'), ('2007', 'test')]
 for year, image_set in sets:
    if not os.path.exists('VOCdevkit/VOC%s/labels/'%(year)):#不存在labels路径,就新建这个路径
        os.makedirs('VOCdevkit/VOC%s/labels/'%(year))
    #.read() 每次读取整个文件,它通常将读取到底文件内容放到一个字符串变量中,也就是说 .read() 生成文件内容是一个字符串类型
    #.readline()每只读取文件的一行,通常也是读取到的一行内容放到一个字符串变量中,返回str类型
    #.readlines()每次按行读取整个文件内容,将读取到的内容放到一个列表中,返回list类型
    #strip('a')会把前后两端的字符a删除,而不会删除中间的a。括号没东西时,删除转义字符和空白字符
    #split('a')就是将字符串中包含a的部分,将a删除,并从此处分割字符串为多个字符串。无参数时,以空格分
    image_ids = open('VOCdevkit/VOC%s/ImageSets/Main/%s.txt'%(year, image_set)).read().strip().split()#这个Main文件夹中的:train.txt;val.txt;test.txt三个文件,看了一下都是数据图片文件名
    list_file = open('%s_%s.txt'%(year, image_set), 'w')#生成一个txt文件
    for image_id in image_ids:
        list_file.write('%s/VOCdevkit/VOC%s/JPEGImages/%s.jpg\n'%(wd, year, image_id))#向txt文件中写入:当前目录/VOCdevkit/VOC年/JPEGImages/(Main文件夹中各文件读出的图片文件名).jpg\n
        convert_annotation(year, image_id)#调用函数生成对应图片的,标注文件
    list_file.close()

os.system("cat 2007_train.txt 2007_val.txt 2012_train.txt 2012_val.txt > train.txt")#将多个文件内容写入一个文件中
os.system("cat 2007_train.txt 2007_val.txt 2007_test.txt 2012_train.txt 2012_val.txt > train.all.txt")


标签:文件,yolov3,lable,image,train,2007,数据格式,txt,find
来源: https://blog.csdn.net/qq_43211132/article/details/88680273

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有