正在加载图片...
得到包含更多点云信息的特征向量,本文提出一种新的提取全局特征的方法。受 network in network[15]的启发,我们认为全局平均池化操作可以保证对点云顺序的不变性,且包含了 更多的点云信息。因此,将全局最大池化结果与全局平均池化结果相串联,再进行分类,相 对于直接做最大池化,可有效避免一些极端情况的发生,提升模型的稳定性。与其他点云处 理方法相比,我们这种方法在保证一定的准确度的基础上,计算量大大减少,有着很大的竞 争力 我们的模型最主要的部分是在提取点云特征后,分别对特征做全局最大池化和全局平均 池化,然后将两种池化结果相串联,再通过多层感知机进行分类。我们主要的目标任务是点 云数据分类,在自动驾驶场景下,通过点云数据,我们能够分辨出车辆运行中障碍物的种类, 从而方便进一步的决策。相对于摄像头,激光雷达的感知视野范围更大,获取信息更加丰富, 所以该课题有着十分重要的意义。我们在 ShapeNetcore公开数据集上进行了大量的实验,有 效地提高了分类结果的平均准确率,并减小了准确率方差。 二、相关研究工作 (一)激光雷达点云数据 激光雷达,即 LIDAR( Light Detection and ranging),是目前自动驾驶汽车应用最广 泛的传感器之一,在自动驾驶中有两个核心功能:3D环境感知和SLAM加强定位。在3D环境感 知方面,激光雷达通过扫描周围环境得到点云数据,包含丰富的信息,通过处理激光雷达点 云数据我们能够得到目标物体的种类、距离、方位等信息。 点云数据实际上是一个由无序的、无结构的数据点组成的集合,因此我们在处理点云数 据的时候,既要保证对点云的不同排列保持不变性,又要保证对一些空间变换保持不变性 [8][9]。 (二)深度学习在3D点云数据上的应用 1.多视角化投影 多视角化即将3D点云数据投影到一些固定的2D视角,从而应用一些2D视角下的卷积神经 网络的处理方法。MV3D[1]先将点云数据投影到鸟瞰图和前视图,通过鸟瞰图得到目标物体 位置,并与前视图和RGB图像信息这些不同视角下的数据想结合。AVOD[6]同样将点云数据投 影到鸟瞰视角,并结合摄像头提供的图像信息,实现在3D点云数据的认知任务。但是,这种 方法丢弃了一些3D视角下的优势,使得辨别空间几何关系时有所损失,比如2D上图片的遮挡 问题会影响对全局和局部信息的理解 2体素化网格 目前,很多工作是将点云数据划分为在空间上具有依赖关系的体素化网格,这种排布事 由一定空间结构的,类比于2维图像处理,可以进行三维卷积处理。如[3][5][7]将3D数据量 化为常规的体素网格,[12]将整个场景下的点云转化成体素网格,然后使用3D体素卷积神经 (c)1994-2019ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.net得到包含更多点云信息的特征向量,本文提出一种新的提取全局特征的方法。受network in network[15]的启发,我们认为全局平均池化操作可以保证对点云顺序的不变性,且包含了 更多的点云信息。因此,将全局最大池化结果与全局平均池化结果相串联,再进行分类,相 对于直接做最大池化,可有效避免一些极端情况的发生,提升模型的稳定性。与其他点云处 理方法相比,我们这种方法在保证一定的准确度的基础上,计算量大大减少,有着很大的竞 争力。 我们的模型最主要的部分是在提取点云特征后,分别对特征做全局最大池化和全局平均 池化,然后将两种池化结果相串联,再通过多层感知机进行分类。我们主要的目标任务是点 云数据分类,在自动驾驶场景下,通过点云数据,我们能够分辨出车辆运行中障碍物的种类, 从而方便进一步的决策。相对于摄像头,激光雷达的感知视野范围更大,获取信息更加丰富, 所以该课题有着十分重要的意义。我们在ShapeNetCore公开数据集上进行了大量的实验,有 效地提高了分类结果的平均准确率,并减小了准确率方差。 二、相关研究工作 (一)激光雷达点云数据 激光雷达,即LIDAR(Light Detection and Ranging),是目前自动驾驶汽车应用最广 泛的传感器之一,在自动驾驶中有两个核心功能:3D环境感知和SLAM加强定位。在3D环境感 知方面,激光雷达通过扫描周围环境得到点云数据,包含丰富的信息,通过处理激光雷达点 云数据我们能够得到目标物体的种类、距离、方位等信息。 点云数据实际上是一个由无序的、无结构的数据点组成的集合,因此我们在处理点云数 据的时候,既要保证对点云的不同排列保持不变性,又要保证对一些空间变换保持不变性 [8][9]。 (二)深度学习在3D点云数据上的应用 1.多视角化投影 多视角化即将3D点云数据投影到一些固定的2D视角,从而应用一些2D视角下的卷积神经 网络的处理方法。MV3D[1]先将点云数据投影到鸟瞰图和前视图,通过鸟瞰图得到目标物体 位置,并与前视图和RGB图像信息这些不同视角下的数据想结合。AVOD[6]同样将点云数据投 影到鸟瞰视角,并结合摄像头提供的图像信息,实现在3D点云数据的认知任务。但是,这种 方法丢弃了一些3D视角下的优势,使得辨别空间几何关系时有所损失,比如2D上图片的遮挡 问题会影响对全局和局部信息的理解。 2.体素化网格 目前,很多工作是将点云数据划分为在空间上具有依赖关系的体素化网格,这种排布事 由一定空间结构的,类比于2维图像处理,可以进行三维卷积处理。如[3][5][7]将3D数据量 化为常规的体素网格,[12]将整个场景下的点云转化成体素网格,然后使用3D体素卷积神经
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有