ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Pytorch_net_深度学习的网络结构

2022-01-11 10:04:41  阅读:201  来源: 互联网

标签:Transformer neck 检测 backbone head 网络 Pytorch net 网络结构


关键词

 目标检测用bbox,实例分割用mask,姿态估计用keypoint
   bbox 用一个anchor点和指向极值点的四根向量就能确定目标框
   mask 一个anchor点和指向轮廓点的n个向量确定mask
   keypoint  用一个anchor点和指向17个关键点点的17个向量确定pose。heatmap预测关键点的方式 	 
  
   face landmark 人脸特征点检测 人脸72个关键点, 主要分布在五官和人脸轮廓,对眼、鼻、嘴唇、及脸型轮廓的描绘。
    现在升级为150个关键点,更加细腻了
    人脸标定 Face Landmark
    车牌识别 License Plate Recognition
    手势识别 Hand Gesture Recognition
	
  数据标注--数据采集-数据筛选-预处理-规整	
  模型训练、评测、调整、修剪和导出模型,以进行部署	
  训练、剪枝、再训练+
    training  inference 

目标检测

###detector=backbone + neck + head
 backbone部分的网络就是负责从图像中提取特征。
 neck是放在backbone和head之间的,是为了更好的利用backbone提取的特征。
 head这一部分的作用就是用于分类+定位
    backbone - 骨干
    目标检测和图像分类这两个任务具有一定的相似性,
         可以将分类的网络,比如VGG、ResNet等,用来做特征提取器称其为backbone。
    	 也许他们对图像中目标的位置不够敏感,但至少他们能够提取出图片中目标的类别特征。
    neck:
        neck这部分的作用就是更好地融合/提取backbone所给出的feature,然后再交由后续的head去检测,从而提高网络的性能。	
    	
    head
        分类+定位  检测头,用于预测目标的类和Box
    	 head才是决定能否将这些特征转换为我们真正需要的bbox参数和class参数
    	
YOLOv4
    输入端   采用mosaic数据增强,
    Backbone 采用了CSPDarknet53、Mish激活函数、Dropblock等方式,
    Neck     采用了SPP、FPN+PAN的结构,
    输出端   采用CIOU_Loss、DIOU_nms操作  
数据增强:
	Mosaic数据增强方法是YOLOV4论文中提出来的,主要思想是将四张图片进行随机裁剪,再拼接到一张图上作为训练数据。
	这样做的好处是丰富了图片的背景,并且四张图片拼接在一起变相地提高了batch_size
	 Mixup  Cutout  CutMix
YOLOv5 分别使用 CSPDarknet53+SPP为Backbone,PANet为Neck, YOLO检测Head。
    Yolov5代码中给出的网络文件是yaml格式,原本Yolov3、Yolov4中的cfg 
 	Yolov5s网络是Yolov5系列中深度最小,特征图的宽度最小的网络

Vision Transformer(ViT)

 视觉 Transformer (ViT)-- 构建图像到矢量的转换并保持图像的特征	
    detector= CNN骨干网+编码器-解码器transformer+一个简单的前馈网络
    作为颈部(neck)的 Transformer 
    作为主干(backbone)的 Transformer
    
   Transformer Prediction Heads(TPH)

分割:

 基于 patch 的 Transformer (patch-based Transformer)和基于查询的 Transformer (query-based Transformer)

参考

  目标检测中的数据增强、backbone、head、neck、损失函数	 https://blog.csdn.net/qq_34437210/article/details/106932193?spm=1001.2014.3001.5501

标签:Transformer,neck,检测,backbone,head,网络,Pytorch,net,网络结构
来源: https://www.cnblogs.com/ytwang/p/15787030.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有