首页 > 其他分享> 文章详细

两阶段目标检测的开山奠基之作：R-CNN

2022-02-05 19:31:48 阅读：194 来源： 互联网

标签：分割候选框卷积检测语义奠基开山 CNN

首次将深度学习和卷积神经网络用于目标检测并取得显著性能提升。

图像分类、定位、目标检测、语义分割、实例分割、关键点检测（关节等等输出点的坐标）

图像分类（输入图像输出类别）目标检测（识别物体类别）语义分割（识别每个像素的类别）实例分割（在语义分割基础上识别多个物体）

表现形式：目标检测->画框语义分割和实例分割是抠图

目标检测分为两阶段和但阶段

两阶段：预选框可能变为预测框

（红色：图像分类绿色：目标检测）

（参考文献）

R-CNN 基本原理

输入图像->某种方法获得候选框（2k）（本文用到的是selective search）->将候选框缩放成227*227的正方形->将这些正方形逐一喂入卷积神经网络中->提取一个4096维的全连接层的特征->用线性支持向量机进行分类或者用于Bbox reg

每个步骤都需要单独优化

每个类别都需要训练一个svm

提取候选框

利用聚类的方法在图像中找到一些初始的大小颜色相似度一致的区域，再加权合并

缩放

原始范围乘卷积核

总结：

1，训练了一个高表达能力的卷积神经网络，以及这个网络提供了自底向上的候选框特征，用其进行定位和语义分割。2，在VOC的目标检测数据集上数据较少，我们现在ImageNet这个大规模辅助系统上预训练一个模型，再把它拿到指定任务上微调，这样在小数据集上也能达到很好的性能。因为我们这个方法包含了候选框提取（region proposal），所以我们把这个算法称为R-CNN: Regions with CNN features.

标签：分割,候选框,卷积,检测,语义,奠基,开山,CNN
来源： https://blog.csdn.net/qq_44608327/article/details/122792252

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

两阶段目标检测的开山奠基之作：R-CNN