ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

a

2021-12-03 04:31:07  阅读:134  来源: 互联网

标签: 特征 网格 times Delta 2017 3D


萌芽期

Det相关的算法最早都起步于CV领域,CV领域经典算法层出不穷,出现了R-CNN,Faster R-CNN,YOLO,以及衍生出许多当前SOTA的CenterNet

VeloFCN[1]

将3D点云转换到正视图(Front View)再套用图像det,不过因为造成了信息缺失,丢失了深度信息,效果很差

MV3D[2]

17年的MV3D增加了一个新的视角:鸟瞰图 BEV(Bird's Eye View),加上VeloFCN的正视图,与2D数据进行融合,一同进行检测(R-CNN)
image

起步期 2017年

VoxelNet[3]

CVPR 2018的一篇文章,作者是苹果公司的两位研究员。
步骤:

  1. Grouping: 将点云量化到一个均匀的3D网格中
  2. Random Sampling: 每个网格中随机采样固定数量的点(不足就重复),输入点坐标为 \((x,y,z,R,\Delta X,\Delta Y,\Delta Z)\)
  3. Stacked Voxel Feature Encoding:
    全连接层被用来提取点的特征,然后每个点的特征再与网格内所有点的特征均值进行拼接,得到新的点特征。这种特征的优点在于同时保留了单个点的特性和该点周围一个局部小区域(网格)的特性。这个点特征提取的过程可以重复多次,以增强特征的描述能力
  4. 最终网格内的所有点进行最大池化操作(Max Pooling),以得到一个固定长度的特征向量
  5. 输出为4D Tensor,\((x,y,z,f)\),f为feature map。为了套用3D的检测算法,本文使用多次3D卷积压缩z维度的大小至2: \((H\times W \times 2 \times C')\),然后将最后连个维度合并\((H\times W \times 2C')\)。然后使用RPN(Region Proposal Network)进行 3D BBox 生成。
    从上面的介绍可以看出,VoxelNet的框架非常简洁,也是第一个可以真正进行端对端的学习的点云物体检测网络。实验结果表明,这种端对端的方式可以自动地从点云中学习到可用的信息,比手工设计特征的方式更为高效
    image

PointNet++[4]


  1. Qian et al., 3D Object Detection for Autonomous Driving: A Survey, 2021 ↩︎

  2. Chen, et al., Multi-view 3d object detection network for autonomous driving, CVPR, 2017 ↩︎

  3. Zhou and Tuzel, Voxelnet: End-to-end learning for point cloud based 3d object detection, CVPR, 2018. ↩︎

  4. Qi et al., Pointnet++: Deep hierarchical feature learning on point sets in a metric space, NeurIPS, 2017. ↩︎

标签:,特征,网格,times,Delta,2017,3D
来源: https://www.cnblogs.com/kangshuaibo/p/15636352.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有