构建高精度的语义地图. 因此，部分学者基于目标检测算法和点云分割算法提出

正在加载图片...

李小倩等：基于环境语义信息的同步定位与地图构建方法综述 761 构建高精度的语义地图.因此，部分学者基于目标时采用目标检测算法和实例分割算法提取环境语检测算法和点云分割算法提出了面向对象的语义义信息，并在面元上基于贝叶斯融合和更新语义地图构建算法信息.相比Object-RPE,Panoptic-.MOPE的实时性 3.2面向对象的语义地图提升了大约3倍，主要是后者提出的语义分割算面向对象的语义地图是指语义地图中仅包含法Fast-RGBD-SSWP,解决了RGB-D数据的实时部分实例的语义信息，语义信息以聚类的方式独语义标注问题.Li等直接利用体素和像素之间立于地图.因此，可以允许机器人对地图中每一个的映射关系获取体素的语义类别，从而降低了语实体的语义信息进行操作和维护.对机器人来说，义融合中的计算量，一定程度上提高了算法的实这种以聚类方式存储环境中实体信息的地图形式时性，但是语义地图的精度略差.上述面向对象的更利于机器人感知环境，并与环境的中的实体进语义方法也关联了三维点云与2D语义分割结果，行互动，提高了地图的实用性在原理上基本与面向场景的语义地图构建方法类经典的SLAM算法大多只构建纯几何形式的似，忽视了三维地图与物体模型之间存在的几何地图，如度量地图、拓扑地图等，语义信息的添加联系.Hosseinzadeh等[o提出了一种将空间物体仅限于部分先验已知的物体，需要预先构建物体表示为二次曲面的方法，并整合了空间物体与平模型库，降低了语义地图的普适性，限制了语义面存在的约束，利用CNN进行目标检测，搭建了地图的发展.Sunderhauf等四提出了基于ORB- 一套面向对象的语义地图构建系统.但是，该算法 SLAM221和SSD算法I的语义地图构建方法，在在二次曲面生成时依赖深度图像进行平面分割和线实时分割点云中的实体，在数据处理的过程中参数回归，而且存在轴对称假设，导致算法的二次将实体与非实体分开进行，对于实体维护更新点重构鲁棒性降低，在实时性方面完全依赖于CNN 云和类别信息，而对于非实体仅维护更新点云信网络的运行速度，实时性相对较差.针对上述问息.实验表明，这种先进行实体分割，后进行语义题，Hosseinzadeh等8提出了一种改进算法，使用融合的方法，语义精度更高，错误匹配较少，但遗两个CNN分别进行平面分割和参数回归，并集成漏的语义类别较多.一方面，该算法使用的SSD 了目标检测算法，实现了对象实时检测和跟踪，提算法在室外数据集上训练，而在实验室内环境中升了语义地图的精度.面向对象的语义地图构建进行实验：另一方面，语义分割精度、深度图的噪需要检测环境的实体，而通过目标检测算法可以声、相机的分辨率等因素都对语义地图的效果判别环境中物体是否为动态物体，从而优化系统有较大影响.类似的，MeCormac等w基于MASK- 鲁棒性 RCNN阿和KinectFusion算法I6提出了一种在线早期面向对象的语义地图构建算法大多只关的基于体素的语义SLAM系统，使用MASK-RCNN 注了地图构建问题，而忽略了利用动态物体属性算法检测物体，基于体素前景(voxel foreground)原优化系统性能.Rnz等6]提出了动态场景中基于理将目标检测结果与TSDF模型进行融合，以构建实例分割的语义地图构建算法MaskFusion,对于面向对象的语义地图.但是，该系统设置了较高的场景中的动态刚体，追踪其在地图中的位置，仅别目标检测阈值，虽然保证了检测的准确性，但是漏除场景中的非刚体，减少了场景信息的缺失.算法检较多，算法的实时性较差.Hoang等a针对环境使用Co-Fusion算法21根据物体的运动一致性和中物体存在遮挡，难以估计物体位姿的问题，提出是否与人接触判断物体是否为动态物体，并基于了Object-RPE系统，解决了环境中存在遮挡、环境图像的像素强度和CP深度点云配准跟踪动态物杂乱时的语义地图构建问题，具有较好的鲁棒性. 体.其次，该算法结合语义分割和几何分割结果对但是，Object-RPE系统基于ElasticFusion!和MASK- 环境进行实例分割，并引入基于深度不连续性和 RCNNI751算法开发，亦受到计算资源的限制，实时表面法向量的几何分割方法，既满足了实时性要性较差求，又解决了语义分割边缘较粗糙的问题.最后，基于此，部分学者针对语义地图构建算法中在语义融合部分使用了类似文献[83]和ElasticFusion! 的目标检测算法和数据关联方法展开研究· 的方法，即用surfel的方式表示环境模型，通过物 Hoang等7I针对Object-RPE系统的实时性问题进体标签将表面元素与正确的模型相关联，使每个行研究，提出了一种全景映射和物体姿态估计系物体的几何体随时间融合.Xù等8则针对语义地图统(Panoptic-MOPE),这里的“全景”是指该系统同大多采用面元的方式构建，难以在机器人上进行构建高精度的语义地图. 因此，部分学者基于目标检测算法和点云分割算法提出了面向对象的语义地图构建算法. 3.2 面向对象的语义地图面向对象的语义地图是指语义地图中仅包含部分实例的语义信息，语义信息以聚类的方式独立于地图. 因此，可以允许机器人对地图中每一个实体的语义信息进行操作和维护. 对机器人来说，这种以聚类方式存储环境中实体信息的地图形式更利于机器人感知环境，并与环境的中的实体进行互动，提高了地图的实用性. 经典的 SLAM 算法大多只构建纯几何形式的地图，如度量地图、拓扑地图等，语义信息的添加仅限于部分先验已知的物体，需要预先构建物体模型库，降低了语义地图的普适性，限制了语义地图的发展. Sunderhauf 等[72] 提出了基于 ORBSLAM2[23] 和 SSD 算法[73] 的语义地图构建方法，在线实时分割点云中的实体，在数据处理的过程中将实体与非实体分开进行，对于实体维护更新点云和类别信息，而对于非实体仅维护更新点云信息. 实验表明，这种先进行实体分割，后进行语义融合的方法，语义精度更高，错误匹配较少，但遗漏的语义类别较多. 一方面，该算法使用的 SSD 算法在室外数据集上训练，而在实验室内环境中进行实验；另一方面，语义分割精度、深度图的噪声、相机的分辨率等因素都对语义地图的效果有较大影响. 类似的，McCormac 等[74] 基于 MASKRCNN[75] 和 KinectFusion 算法[64] 提出了一种在线的基于体素的语义 SLAM 系统，使用 MASK-RCNN 算法检测物体，基于体素前景（voxel foreground）原理将目标检测结果与 TSDF 模型进行融合，以构建面向对象的语义地图. 但是，该系统设置了较高的目标检测阈值，虽然保证了检测的准确性，但是漏检较多，算法的实时性较差. Hoang 等[76] 针对环境中物体存在遮挡，难以估计物体位姿的问题，提出了 Object-RPE 系统，解决了环境中存在遮挡、环境杂乱时的语义地图构建问题，具有较好的鲁棒性. 但是，Object-RPE 系统基于ElasticFusion[77] 和MASKRCNN[75] 算法开发，亦受到计算资源的限制，实时性较差. 基于此，部分学者针对语义地图构建算法中的目标检测算法和数据关联方法展开研究 . Hoang 等[78] 针对 Object-RPE 系统的实时性问题进行研究，提出了一种全景映射和物体姿态估计系统（Panoptic-MOPE），这里的“全景”是指该系统同时采用目标检测算法和实例分割算法提取环境语义信息，并在面元上基于贝叶斯融合和更新语义信息. 相比 Object-RPE，Panoptic-MOPE 的实时性提升了大约 3 倍，主要是后者提出的语义分割算法 Fast-RGBD-SSWP，解决了 RGB-D 数据的实时语义标注问题. Li 等[79] 直接利用体素和像素之间的映射关系获取体素的语义类别，从而降低了语义融合中的计算量，一定程度上提高了算法的实时性，但是语义地图的精度略差. 上述面向对象的语义方法也关联了三维点云与 2D 语义分割结果，在原理上基本与面向场景的语义地图构建方法类似，忽视了三维地图与物体模型之间存在的几何联系. Hosseinzadeh 等[80] 提出了一种将空间物体表示为二次曲面的方法，并整合了空间物体与平面存在的约束，利用 CNN 进行目标检测，搭建了一套面向对象的语义地图构建系统. 但是，该算法在二次曲面生成时依赖深度图像进行平面分割和参数回归，而且存在轴对称假设，导致算法的二次重构鲁棒性降低，在实时性方面完全依赖于 CNN 网络的运行速度，实时性相对较差. 针对上述问题，Hosseinzadeh 等[81] 提出了一种改进算法，使用两个 CNN 分别进行平面分割和参数回归，并集成了目标检测算法，实现了对象实时检测和跟踪，提升了语义地图的精度. 面向对象的语义地图构建需要检测环境的实体，而通过目标检测算法可以判别环境中物体是否为动态物体，从而优化系统鲁棒性. 早期面向对象的语义地图构建算法大多只关注了地图构建问题，而忽略了利用动态物体属性优化系统性能. Rünz 等[61] 提出了动态场景中基于实例分割的语义地图构建算法 MaskFusion，对于场景中的动态刚体，追踪其在地图中的位置，仅剔除场景中的非刚体，减少了场景信息的缺失. 算法使用 Co-Fusion 算法[82] 根据物体的运动一致性和是否与人接触判断物体是否为动态物体，并基于图像的像素强度和 ICP 深度点云配准跟踪动态物体. 其次，该算法结合语义分割和几何分割结果对环境进行实例分割，并引入基于深度不连续性和表面法向量的几何分割方法，既满足了实时性要求，又解决了语义分割边缘较粗糙的问题. 最后，在语义融合部分使用了类似文献[83] 和ElasticFusion[77] 的方法，即用 surfel 的方式表示环境模型，通过物体标签将表面元素与正确的模型相关联，使每个物体的几何体随时间融合. Xu 等[84] 针对语义地图大多采用面元的方式构建，难以在机器人上进行李小倩等：基于环境语义信息的同步定位与地图构建方法综述 · 761 ·

<<向上翻页向下翻页>>

点击下载：《工程科学学报》：基于环境语义信息的同步定位与地图构建方法综述