正在加载图片...
etc, but have various defects. PointNet has opened up a new way to deal with point clouds, which is to apply the deep learning model directly on the point cloud, and solve the problem of disorder and non-structurality of point cloud data. However, the maxpooling symmetric function of its application discards too much information, and the variance is large in practical applications. Aiming at solving this problem, this paper proposes a new method to solve the disorder of point cloud data and ensure the invariance of spatial variation. When solving the disorder problem, the global maxpooling and the global average pooling are used to process the point cloud data of each dimension separately, and then the obtained two vectors are connected in series to obtain global features. While ensuring the spatial variation invariance, the global maximum pooling and global average pooling methods are also introduced in the feature extraction of the learning transformation matrix to obtain a transformation matrix that f improves the average accuracy of classification results and reduces the accuracy variance %. more closely matches the dataset. Experiments show that the proposed method effectively ey words: autonomous driving; point cloud; deep learning 引言 近年来,随着人工智能技术的迅速发展,传统汽车行业与信息技术结合,在自动驾驶技 术方面的研究取得了长足进步。自动驾驶技术飞速发展,在工业界和学术界都掀起了巨大的 研发热潮,现有的技术多以高级辅助驾驶系统的形式出现,这些技术的目的是减少交通事故 的数量和严重性,提高残疾人和老年人的活动性,减少排放,以及提高交通基础设施的使用 效率。加速无人驾驶技术发展的一个重要的动机是避免人为因素造成的错误,如注意力分散、 疲劳驾驶等。对我中国而言,随着国内经济的持续增长,居民的生活水平不断提高,终端消 费市场活跃加速了汽车科技进步,未来市场巨大吸引大量资本进入,加速了产业发展和升级 国内汽车保有量大量增加,交通事故频发,城市道路通行效率低,自动驾驶被认为是解决上 述问题的重要途径。发展自动驾驶技术的必要性和潜力巨大,可以预见,自动驾驶汽车将成 为继手机之后又一个大有可为的移动终端。其中,环境感知作为自动驾驶汽车中的一环发挥 着不可替代的作用,而激光雷达作为环境感知模块中最为重要的传感器之一,可以通过扫描 汽车周围环境,获得点云数据。通过对点云数据的处理可以获得丰富的信息,如物体的距离 方位、高度、姿态等等。因此,如何处理点云数据实现感知功能越来越成为当下的一个热点 问题。 随着图形处理器GPU计算性能飞速増长,使得计算机硬件计算能力的大大提高,使用深 度学习网络处理图像,实现分类、检测等任务已取得了十分理想的成果。因为点云数据是 个由无序的数据点的集合,所以要将深度学习网络模型处理点云数据前,需要对点云数据进 行处理。现在的方法主要有:将点云投影到一定视角下的二维空间,如MV3D[1]将点云数据 投影到鸟瞰图和前视图;将点云数据划分为具有空间依赖关系的体素网格,如[3][5][7]将 3D点云量化为常规的体素网格。而2017年, Charles提出了全新的点云处理模型-,即使用数 据点级别的深度学习模型直接在点云数据集上进行处理,并且在3D点云分类和场景分割任务 上有着十分显著的表现。 然而, Pointnet中在提取点云特征后,为了解决点云数据集无序性、无结构的问题,使 用最大池化的方法处理每一维特征信息,直接丢弃了除了最大值以外的所有输入信息。为了 (c)1994-2019ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.netetc., but have various defects. PointNet has opened up a new way to deal with point clouds, which is to apply the deep learning model directly on the point cloud, and solve the problem of disorder and non-structurality of point cloud data. However, the maxpooling symmetric function of its application discards too much information, and the variance is large in practical applications. Aiming at solving this problem, this paper proposes a new method to solve the disorder of point cloud data and ensure the invariance of spatial variation. When solving the disorder problem, the global maxpooling and the global average pooling are used to process the point cloud data of each dimension separately, and then the obtained two vectors are connected in series to obtain global features. While ensuring the spatial variation invariance, the global maximum pooling and global average pooling methods are also introduced in the feature extraction of the learning transformation matrix to obtain a transformation matrix that more closely matches the dataset. Experiments show that the proposed method effectively improves the average accuracy of classification results and reduces the accuracy variance. key words: autonomous driving; point cloud; deep learning 一、引言 近年来,随着人工智能技术的迅速发展,传统汽车行业与信息技术结合,在自动驾驶技 术方面的研究取得了长足进步。自动驾驶技术飞速发展,在工业界和学术界都掀起了巨大的 研发热潮,现有的技术多以高级辅助驾驶系统的形式出现,这些技术的目的是减少交通事故 的数量和严重性,提高残疾人和老年人的活动性,减少排放,以及提高交通基础设施的使用 效率。加速无人驾驶技术发展的一个重要的动机是避免人为因素造成的错误,如注意力分散、 疲劳驾驶等。对我中国而言,随着国内经济的持续增长,居民的生活水平不断提高,终端消 费市场活跃加速了汽车科技进步,未来市场巨大吸引大量资本进入,加速了产业发展和升级。 国内汽车保有量大量增加,交通事故频发,城市道路通行效率低,自动驾驶被认为是解决上 述问题的重要途径。发展自动驾驶技术的必要性和潜力巨大,可以预见,自动驾驶汽车将成 为继手机之后又一个大有可为的移动终端。其中,环境感知作为自动驾驶汽车中的一环发挥 着不可替代的作用,而激光雷达作为环境感知模块中最为重要的传感器之一,可以通过扫描 汽车周围环境,获得点云数据。通过对点云数据的处理可以获得丰富的信息,如物体的距离、 方位、高度、姿态等等。因此,如何处理点云数据实现感知功能越来越成为当下的一个热点 问题。 随着图形处理器GPU计算性能飞速增长,使得计算机硬件计算能力的大大提高,使用深 度学习网络处理图像,实现分类、检测等任务已取得了十分理想的成果。因为点云数据是一 个由无序的数据点的集合,所以要将深度学习网络模型处理点云数据前,需要对点云数据进 行处理。现在的方法主要有:将点云投影到一定视角下的二维空间,如MV3D[1]将点云数据 投影到鸟瞰图和前视图;将点云数据划分为具有空间依赖关系的体素网格,如[3][5][7]将 3D点云量化为常规的体素网格。而2017年,Charles提出了全新的点云处理模型-,即使用数 据点级别的深度学习模型直接在点云数据集上进行处理,并且在3D点云分类和场景分割任务 上有着十分显著的表现。 然而,PointNet中在提取点云特征后,为了解决点云数据集无序性、无结构的问题,使 用最大池化的方法处理每一维特征信息,直接丢弃了除了最大值以外的所有输入信息。为了
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有