ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

最详细的语义分割---预测图像染色

2021-06-28 14:03:53  阅读:344  来源: 互联网

标签:seg palette img 染色 语义 mask --- 64 128


对于语义分割来说,网络输出的图像为HxW的二维矩阵,其上面每个像素点的值是这个像素点的类别(如,像素点值为1 ,表示这个像素点属于第一类)。然而,对于一个二维矩阵,生成的图像是一个灰度图,并且灰度值很低,非常不利于人观察(如下图为voc2007的标签,图中白色为人为标记的,真正的网络预测并没有这一部分)
在这里插入图片描述
那么我们就需要对其进行染色处理,使其变成利于人观察的图像(如下图这样)
在这里插入图片描述
对图像染色有很多方法,下面介绍一种最简单的一种方法:

def cam_mask(mask,palette,n):
    seg_img = np.zeros((np.shape(mask)[0], np.shape(mask)[1], 3))
    for c in range(n):
        seg_img[:, :, 0] += ((mask[:, :] == c) * (palette[c][0])).astype('uint8')
        seg_img[:, :, 1] += ((mask[:, :] == c) * (palette[c][1])).astype('uint8')
        seg_img[:, :, 2] += ((mask[:, :] == c) * (palette[c][2])).astype('uint8')
    colorized_mask = Image.fromarray(np.uint8(seg_img))
    return colorized_mask

利用这个函数就可以将网络预测结果生成彩色图像,其中mask为预测结果,palette为染色版,即你需要用什么颜色进行染色,是一个列表加元组的形式,n为网络预测的类别。
下面拿voc数据集举例,它的染色板为:

palette = [(0, 0, 0), (128, 0, 0), (0, 128, 0), (128, 128, 0), (0, 0, 128), (128, 0, 128), (0, 128, 128),
                    (128, 128, 128), (64, 0, 0), (192, 0, 0), (64, 128, 0), (192, 128, 0), (64, 0, 128), (192, 0, 128),
                    (64, 128, 128), (192, 128, 128), (0, 64, 0), (128, 64, 0), (0, 192, 0), (128, 192, 0), (0, 64, 128),
                        (128, 64, 12)]

下面简单解释一下这个代码的含义:
对于输入HxW二维预测结果,我们先生成一个HxWx3的全零矩阵seg_img。
然后从0到类别数(21)开始循环,如果预测结果中有与类别数c相同的值,那么这个位置的值为1,否在为0。这样会生成一个掩码,这个掩码的对应为1的位置就是预测结果中属于第c个类别的位置。然后,我们将染色板的三个值分别加到之前的seg_img的三个通道上,这样就形成了HxWxC的RGB三个通道的彩色图像。

标签:seg,palette,img,染色,语义,mask,---,64,128
来源: https://blog.csdn.net/weixin_47142735/article/details/118293836

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有