首页 > 其他分享> 文章详细

3_GoogLeNetV1

2021-05-16 15:30:33 阅读：239 来源： 互联网

标签：卷积矩阵 GoogLeNet GoogLeNetV1 Inception 256 pool

Going deeper with convolutions

更深的卷积网络

简介

Inception v1-GoogLeNet（论文阅读总结） - 知乎 (zhihu.com)

在这里插入图片描述

开启多尺度卷积时代
拉开1*1卷积广泛应用序幕
为GoogLeNet系列开辟道路

在这里插入图片描述

GoogLeNet结构

Inception Module

在这里插入图片描述

特点:

1．多尺度
2.1*1卷积降维，信息融合
3.3*3 max pooling保留了特征图数量

在这里插入图片描述

3*3 pool可让特征图通道数增加,且用较少计算量
缺点:
数据量激增计算量大
解决方法:引入1*1卷积压缩厚度

在这里插入图片描述

3 * 3 * 256 * 192 = 442,368‬ -> 1 * 1 *256 * 64 + 3 * 3 * 64 * 192 = 16,384 + 110,592‬

在这里插入图片描述

三阶段:conv-pool-conv-pool 快速降低分辨率输入224 * 224 * 3 经过卷积、池化、卷积、卷积、池化后下降到 28 * 28;:堆叠I nception; FC层分类输出
堆叠使用Inception Module，达22层
增加两个辅助损失，缓解梯度消失（中间层特征具有分类能力)

在这里插入图片描述

总体上可以分为五个模块

训炼技巧

辅助分类层

增加loss回传
充当正则约束，迫使中间层特征也能具备分类能力

在这里插入图片描述

- 平均池化层：大小5×5，步幅 3，(4a)为4×4×512输出，(4d)为4×4×528输出
- 1×1卷积层+ReLU：128个卷积核，降维
- 全连接层+ReLU：1024维
- dropout：70%
- A linear layer with softmax loss：预测1000类

LR下降策略

论文中没有提到具体采用了多少个epoch

每8个epoch下降4%: fixed learning rate schedule (decreasina the learning rate biy A k cvery epochs)

0.96^100 =0.016 , 800个epochs，才下降不到100倍

数据增强

图像尺寸均匀分布在8%-100%之间
长宽比在[3/4，4/3]之间
Photometric distortions(光度畸变)，如亮度、饱和度和对比度等，有效减轻过拟合

测试技巧

Multi crop

1 * 4 * 3 * 6 * 2 = 144

等比例缩放短边至256,288,320,352，四种尺寸。
在长边上裁剪出3个正方形，左中右或者上中下，三个位置。
左上、右上，左下，右下，中心，全局resize，六个位置。
水平镜像。

模型融合

七个模型训练差异仅在图像采样方式和顺序的差异

在这里插入图片描述

实验结果及分析

分类结果

在这里插入图片描述

目标检测结果

在这里插入图片描述

稀疏结构

稀疏矩阵

稀疏矩阵:数值为0的元素数目远远多于非0元素的数目，且无规律
稠密矩阵:数值非0的元素数目远远多于为0元素的数目，且无规律
稀疏矩阵优点是，可分解成密集矩阵计算来加快收敛速度

在这里插入图片描述

特征图通道的分解

在这里插入图片描述

总结

关键点、创新点

大量使用1*1卷积，可降低维度，减少计算量，总参数是AlexNet的十二分之一
多尺度卷积核，实现多尺度特征提取
辅助损失层，增加梯度回传，相当于增加正则项，减轻过拟合

标签：卷积,矩阵,GoogLeNet,GoogLeNetV1,Inception,256,pool
来源： https://blog.csdn.net/Code_Haruka/article/details/116892848

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

3_GoogLeNetV1

Going deeper with convolutions

更深的卷积网络

简介

GoogLeNet结构

Inception Module

训炼技巧

辅助分类层

LR下降策略

数据增强

测试技巧

Multi crop

模型融合

实验结果及分析

稀疏结构

稀疏矩阵

特征图通道的分解

总结

关键点、创新点