准备maskrcnn的数据集，labelme版的

2022-02-10 18:04:28 阅读：197 来源： 互联网

标签：name maskrcnn label json 准备 labelme os dir out

先用labelme标注好自己的数据后，
step1:
将标注好的原始图片和json文件分别放置在不同的文件夹，例如：
在这里插入图片描述
step2:批量转换
D:\anaconda\envs\tensorflow2\Lib\site-packages\labelme\cli在这个类似的路径下找到json_to_dataset.py，可能需要稍加改动，改后代码如下：

import argparse
import base64
import json
import os
import os.path as osp
import yaml

import imgviz
import PIL.Image

from labelme.logger import logger
from labelme import utils


def main():
    logger.warning(
        "This script is aimed to demonstrate how to convert the "
        "JSON file to a single image dataset."
    )
    logger.warning(
        "It won't handle multiple JSON files to generate a "
        "real-use dataset."
    )

    parser = argparse.ArgumentParser()
    parser.add_argument("json_file")
    parser.add_argument("-o", "--out", default=None)
    args = parser.parse_args()

    json_file = args.json_file

    if args.out is None:
        out_dir = osp.basename(json_file).replace(".", "_")
        out_dir = osp.join(osp.dirname(json_file), out_dir)
    else:
        out_dir = args.out
    if not osp.exists(out_dir):
        os.mkdir(out_dir)

    count = os.listdir(json_file)
    for i in range(0, len(count)):
        path = os.path.join(json_file, count[i])

        if os.path.isfile(path):
            data = json.load(open(path))
            imageData = data.get("imageData")

            if not imageData:
                imagePath = os.path.join(os.path.dirname(json_file), data["imagePath"])
                with open(imagePath, "rb") as f:
                    imageData = f.read()
                    imageData = base64.b64encode(imageData).decode("utf-8")
            img = utils.img_b64_to_arr(imageData)

            label_name_to_value = {"_background_": 0}
            for shape in sorted(data["shapes"], key=lambda x: x["label"]):
                label_name = shape["label"]
                if label_name in label_name_to_value:
                    label_value = label_name_to_value[label_name]
                else:
                    label_value = len(label_name_to_value)
                    label_name_to_value[label_name] = label_value
            lbl, _ = utils.shapes_to_label(
                img.shape, data["shapes"], label_name_to_value
            )

            label_names = [None] * (max(label_name_to_value.values()) + 1)
            for name, value in label_name_to_value.items():
                label_names[value] = name

            lbl_viz = imgviz.label2rgb(
                label=lbl, image=imgviz.asgray(img), label_names=label_names, loc="rb"
            )

            out_dir = osp.basename(count[i]).replace('.', '_')
            out_dir = osp.join(osp.dirname(count[i]), out_dir)
            if not osp.exists(out_dir):
                os.mkdir(out_dir)
                print(out_dir)

            PIL.Image.fromarray(img).save(osp.join(out_dir, "img.png"))
            utils.lblsave(osp.join(out_dir, "label.png"), lbl)
            PIL.Image.fromarray(lbl_viz).save(osp.join(out_dir, "label_viz.png"))

            with open(osp.join(out_dir, "label_names.txt"), "w") as f:
                for lbl_name in label_names:
                    f.write(lbl_name + "\n")

            logger.warning('info.yaml is being replaced by label_names.txt')
            info = dict(label_names=label_names)
            with open(osp.join(out_dir, 'info.yaml'), 'w') as f:
                yaml.safe_dump(info, f, default_flow_style=False)

            logger.info("Saved to: {}".format(out_dir))


if __name__ == "__main__":
    main()

在控制台的的对于环境中进到json_to_dataset.py所在目录，我的就是上文中的D:\anaconda\envs\tensorflow2\Lib\site-packages\labelme\cli然后运行：

python json_to_dataset.py json文件夹的路径

然后就能得到很多个文件夹，每个文件夹中都有这些图片
在这里插入图片描述
step3：在train_data文件夹下新建两个文件夹，cv2_mask, labelme_json

将step2所得文件夹（不指定输出文件夹去，就在和json_to_dataset.py同一目录），移动到 labelme_json文件夹下。
step4:提取所有的mask到cv2_mask

import os
path='labelme_json'
files=os.listdir(path)
for file in files:
    jpath=os.listdir(os.path.join(path,file))
    new=file[:-5]
    newnames=os.path.join('cv2_mask',new)
    filename=os.path.join(path,file,jpath[2])
    print(filename)
    print(newnames)
    os.rename(filename,newnames+'.png')

在train_data文件夹下运行以上代码即可批量抽取mask文件

标签：name,maskrcnn,label,json,准备,labelme,os,dir,out
来源： https://blog.csdn.net/qq_45724346/article/details/122862327

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

准备maskrcnn的数据集，labelme版的