ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Incremental Learning Techniques for Semantic Segmentation 论文阅读笔记

2022-09-08 20:31:05  阅读:162  来源: 互联网

标签:冻结 Segmentation Semantic 蒸馏 模型 损失 Encoder 学习 Incremental


Incremental Learning Techniques for Semantic Segmentation 论文阅读笔记

摘要

当需要增量学习新任务时,由于灾难性的遗忘,深度学习架构表现出严重的性能下降。 之前增量学习框架专注于图像分类和对象检测,本文正式提出了语义分割的增量学习任务。作者设计了方法提取先前模型的知识以保留有关先前学习的类的信息,同时更新当前模型以学习新的模型。 与最近的一些框架相反,本文方法不存储来自先前学习的类的任何图像,并且只需要最后一个模型来保持这些类的高精度。

方法

在输出层进行蒸馏

截屏2022-09-08 19.53.56

仅使用该损失函数的模型作为baseline,一个改进是针对模型的Encoder:

截屏2022-09-08 20.02.32

即训练时冻结Encoder,只训练Decoder以保持在之前steps中学习到的特征提取能力。上一个step的模型参数也进行冻结,仅用于知识蒸馏。(这里有一个疑问是如果当前这一步一直冻结Encoder,那么Encoder在什么时候训练当前这一步的提取能力呢?等有时间看看代码!)

在中间特征空间进行蒸馏

作者指出在中间特征空间进行蒸馏时不应用交叉熵损失而是应该用L2损失,这是因为这些层并非分类层而仅仅是中间的阶段,参数应该紧靠上一个step的参数。蒸馏项计算如下:

截屏2022-09-08 19.37.17

模型\(M_k\)可以被解耦为编码器\(E_k\)和解码器,上式中是用编码器的输出计算蒸馏损失。其中\(D_k^{tr}\)是第k步的数据集。

标签:冻结,Segmentation,Semantic,蒸馏,模型,损失,Encoder,学习,Incremental
来源: https://www.cnblogs.com/lipoicyclic/p/16670772.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有