ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Image Super-Resolution Using Deep Convolutional Networks SRCNN 论文解析

2022-08-07 11:01:06  阅读:191  来源: 互联网

标签:Convolutional 本文 卷积 Super Image 论文 图像 方法 分辨率


Image Super-Resolution Using Deep Convolutional Networks SRCNN 论文解析

Q1:论文试图解决的问题

本文试图解决从低分辨率图片重建高分辨率图片的问题。传统上已有许多解决办法,但存在诸多弊端,传统方法上存在的一部分问题被本文提出的方法解决。

  1. 传统的稀疏编码方法运行速度慢,且需要将图片进行切割,每一部分单独还原。本文提出的轻量级模型能够快速重建图像,无需将图片进行切割处理,并能达到SOTA。
  2. 传统超分辨率方法重建图像需要众多步骤(pipeline),且每个步骤需要单独优化,本文提出的模型能够同时对所有层次同时进行优化。
  3. 传统超分辨率重建方法大多数仅能用于单一通道(灰度图像),本文提供的方法能够用于多个通道(RGB)。

Q2:这是否是一个新的问题?

并非新问题。在早期已有很多关于超分辨率的研究,包括通过数值计算的插值重建法、通过传统机器学习的稀疏编码、随机森林等方法。本文的意义在于对传统方法的重大改进。

Q3:这篇文章要验证一个什么科学假设?

  1. 新提出的SRCNN模型,在精度、速度上都能达到SOTA。
  2. 传统的稀疏编码模型,本质上和卷积神经网络等价。

Q4 有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?

在本文提出的时间段之前,相关研究主要分为四种

  1. prediction model
  2. edge based methods
  3. image statistical methods(基于统计的方法 如图像插值等)
  4. example-based methods(基于样本的方法 机器学习 如稀疏编码超分辨率 在本文提出前是SOTA)
  5. 本文提出的基于卷积神经网络的方法(开创性论文)

值得关注的研究员:

​ 高新波

​ Ming-Hsuan Yang

汤晓鸥

Q5 论文中提到的解决方案之关键是什么?

​ 论文中SRCNN模型主要分为四个步骤,首先输入原始低分辨率图像,对低分辨率图像进行bicubic (双立方插值),得到目标大小的图像,接下来将图像传入卷积层。第一个卷积层用于提取低分辨率的图像特征,第二个卷积层使用1x1卷积核,进行非线性映射,最后一个卷积层将映射后的特征图进行重建,得到目标图像。

Q6论文中的实验是如何设计的?

首先实验不同数据集对模型的影响,接下来,改变网络的架构、滤波器数量、滤波器大小等因素,探究对性能的影响,并与传统的SOTA方法对比。由于传统方法只处理单通道,因此对比实验也仅使用单通道。最后,将模型应用于彩色图片上,评估性能。

Q7用于定量评估的数据集是什么?代码有没有开源?

使用的数据集为“ILSVRC 2013 ImageNet”(395,909 张图片),及来自"Image super-resolution via sparse representation "论文中提出的小数据集(91张图片)。

Q8论文中的实验及结果有没有很好地支持需要验证的科学假设?

​ 本文的实验结果证明,使用CNN的方法进行超分辨率重建,效果和速度要远好传统的几种方法。

Q9这篇论文到底有什么贡献?

主要的贡献在如下三个方面:

  1. 提出了端到端的、基于卷积神经网络的超分辨率重建方法,该方法基本不需要任何的图像预处理。
  2. 建立了卷积神经网络和稀疏编码超分辨率方法之间的联系,解释了SRCNN各层的含义,这种解释为SRCNN层次设计提供了依据。
  3. 揭示了卷积神经网络在处理传统计算机视觉问题(超分辨率重建)上的有效性,并且可以达到很高的质量和速度。

Q10下一步呢?有什么工作可以继续深入?

  1. 损失函数可以加以改进,作者在文中提出,使用MSE并不能准确表达出图片在结构上的相似性,在有些情况下,图片复原效果不佳,但MSE反而更低。
  2. 文中指出使用更深的网络、更复杂的网络结构可以提高图像重建表现。但受限于当时的算力没有继续改进。

标签:Convolutional,本文,卷积,Super,Image,论文,图像,方法,分辨率
来源: https://www.cnblogs.com/alex101/p/16558636.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有