ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

BackgroundV2(2020,background)

2021-04-06 12:31:18  阅读:186  来源: 互联网

标签:误差 卷积 网络 损失 base 2020 background BackgroundV2 alpha


BackgroundV2(2020,background)

在这里插入图片描述

  • 网络结构:网络是两部分组成,一个粗分割base网络,一个精细分割refiner网络,其中预测的时alpha与一个前景残差,Fr = F-I组成,研究人员说这对于网络有好处
    • base网络:全卷积的encoder-decoder网络,类似于deeplabv3与deeplabv3+结构,主干网是resnet50,或者其他mobilenetv2,最后添加ASPP模块,其中有多种尺度的膨胀卷积核,解码encoder网络使用双线性差值,与主干网的跳层进行连接,其他为正常卷积与bn、relu操作,解码输出有四类,一个alpha matte,一个前景残差,一个误差图,一个32通道的隐藏特征图,
    • refiner网络:输入是patch,将误差图分块,计算每块的误差进行排序,取前几个误差较大小块在原始高分辨率图的一半获取,与预测的alpha matte上获取alpa,同时将隐藏特征图输入,进行过几个卷积采样之后在将原始图像的对应获取来增强细节指导,最终将输出的patch结果 alpha与前景残差存入base预测的对应位置,
    • 损失函数:
      包括一个alpha L1损失与一个梯度损失,还有一个前景的L1损失。 base网络的时候误差损失,首先定义误差图的gt为alpha-预测的alpha。最终误差图E使用的是L2损失,
      因此base的损失函数为在这里插入图片描述
      refine的损失函数为在这里插入图片描述
  • 训练方式:
    数据库:自己整理了视频数据库videoMatte240k与photoMatte13K数据库。
    训练:先单独训练base,之后在添加数据base与refine一同训练保证轮棒,之后在添加数据训练保证高分辨率鲁班,之后在添加数据一同训练保证实际鲁棒。
  • 实验结果:在这里插入图片描述
    实验结果表明,该方法比BMG的好,但是跟使用trimap的方法接近。但是FBA需要有一个较为精确的trimap才能有一个好的效果,粗糙的不准确的trimap效果也会降低。

标签:误差,卷积,网络,损失,base,2020,background,BackgroundV2,alpha
来源: https://blog.csdn.net/weixin_38832460/article/details/115458155

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有