正在加载图片...
.758 工程科学学报,第43卷.第6期 挤且没有GPS信号的停车场环境中,环境结构相 略,通过在图像上的感兴趣区域上选取点(感兴趣 似,纹理特征不足,传统V-SLAM方法容易发生跟 区域即显著性图),并利用语义分割的结果对显著 踪丢失的问题,作者首先利用深度学习将地面上 性图进行滤波,调整每个像素点的显著性得分,从 的指路标志、停车线以及减速带等信息分割出来, 而降低了无信息区域(例如墙,天花板和地板等) 再根据里程计的信息,将语义特征映射到全局的 的显著性得分.实验结果表明显著性区域的点对 坐标系下,建立停车场的地图,然后通过将语义特 于光照和视角的变化更加鲁棒 征与先前的构建出来的地图进行匹配来对车辆进 (3)面向动态场景 行定位,最后采用扩展卡尔曼滤波器将视觉定位 传统的V-SLAM系统大多基于静态环境假 结果与里程计融合,保证在缺少纹理信息的停车 设,在处理动态环境的定位问题时,容易发生错误 场环境中,系统能够输出稳定的定位结果 匹配.近年来,针对动态场景的语义SLAM系统逐 (2)面向光照变化 渐受到越来越多的关注3州,通过引入环境语义 在传统V-SLAM系统中,特征描述子(如SIFT, 信息有效地对静态和动态特征点进行划分,移除 ORB等)对于光照变化较敏感,光照的变化容易导 动态特征点,从而减少动态干扰,以提高SLAM系 致目标表面颜色等特征的变化,对系统定位鲁棒 统的鲁棒性 性造成干扰.而环境中的物体类别与光照和时间 Yu等4阿基于ORB-SLAM2提出了一种动态环 变化无关,可利用环境语义信息构造新的特征描 境下鲁棒的语义SLAM系统(DS-SLAM),该系统 述子,从而有效降低由于光照变化对定位鲁棒性 基于光流金字塔算法进行运动一致性校验,并结 造成的不利影响 合语义分割网络获取物体轮廓,剔除位于移动物 2018年,瑞典查尔姆斯理工大学信号处理研 体上的特征点,减少动态对象对姿态估计的影响, 究小组的Stenborg等B提出了一种在已有的 提升了系统定位鲁棒性.在TUM RGB-D数据集 3D地图上,将语义类别作为地图点描述子的定位 以及真实环境下测试结果表明,该系统的绝对轨 算法,有效解决了长时间跨季度定位系统中环境 迹精度比ORB-SLAM2提高了一个数量级.但是, 光照变化等对定位系统的影响.Schonberger等IB9 该算法能识别的语义类别较少,且只定义人为动 提出了一种基于3D几何和语义信息进行视觉定 态物体,另外,该地图在回环失败时需要重新建 位的新方法,通过训练语义场景完备化作为辅助 图,地图的可移植能力不足.Bescos等s也在 任务,学习出鲁棒的局部描述符,以此建立查询和 ORB-SLAM2系统上,提出了一种面向动态物体检 数据库映射之间3D-2D的匹配,将匹配结果用于 测和背景修复的V-SLAM系统(DynaSLAM),通过 位姿估计与矫正,成功解决了大范围观测条件下 使用多视几何和深度学习的方法实现移动物体的 的鲁棒性视觉定位问题.在KITTI和NCLT数据 检测,并通过对动态物体遮挡的背景帧进行修复, 集上运行结果表明,所提方法在极端视角、照明和 生成静态场景地图.实验结果表明,DynaSLAM提 几何变化情况下,表现出了系统的高可靠性.此类 供的单目、双目和RGB-D3种运行状态在动态场 方法相较于基于传统描述子的方法节省了大量的 景中均有较好的鲁棒性,并能输出场景的静态地 存储空间,但语义描述子的应用也有一定的局限 图,更符合机器人长时间运行的使用需要 性,如在较单一类别的场景中容易产生误差 目前大多数语义信息用于动态场景都是将所 此外,还可通过优化特征选择策略,结合语义 有潜在运动的物体直接去除,但如若动态目标物 信息进行过滤,使得所关注目标对于光照变化更 体并没有发生运动,且占据相机视角的大部分,那 加鲁棒.Naseer等o提出了一种判别整体图像内 么将目标物体上的点都去除会对位姿估计产生很 容的方法,能够根据图像语义信息生成一个密集 严重的影响.Brasch等7针对此类现象提出了一 的场景显著性描述.通过训练感知环境变化大的 种改进方案,其引人对于地图点是否为静态点的 数据集学习显著性描述,保证能够在图片上分割 概率估计“静态率”(Inlier ratio),实现地图点在动 出更加稳定的区域,别除易随时间变化的区域,并 静态之间的平滑过渡.首先,根据语义分割网络的 将显著区域的特征和现有的整体图像上的特征进 输出赋予静态率一个先验值,例如车具有较低的 行融合,从而得到了一个更加鲁棒的场景描述 静态率,建筑具有较高的静态率等,然后根据不断 Liang等在稀疏直接法里程计(Direct sparse 地引入新的观测数据来更新该地图点的静态率, odometry,.DSO)基础上,改变了跟踪点的选取策 以在具有挑战性的条件下实现定位鲁棒性.Cu挤且没有 GPS 信号的停车场环境中,环境结构相 似,纹理特征不足,传统 V-SLAM 方法容易发生跟 踪丢失的问题,作者首先利用深度学习将地面上 的指路标志、停车线以及减速带等信息分割出来, 再根据里程计的信息,将语义特征映射到全局的 坐标系下,建立停车场的地图,然后通过将语义特 征与先前的构建出来的地图进行匹配来对车辆进 行定位,最后采用扩展卡尔曼滤波器将视觉定位 结果与里程计融合,保证在缺少纹理信息的停车 场环境中,系统能够输出稳定的定位结果. (2)面向光照变化. 在传统 V-SLAM 系统中,特征描述子(如 SIFT, ORB 等)对于光照变化较敏感,光照的变化容易导 致目标表面颜色等特征的变化,对系统定位鲁棒 性造成干扰. 而环境中的物体类别与光照和时间 变化无关,可利用环境语义信息构造新的特征描 述子,从而有效降低由于光照变化对定位鲁棒性 造成的不利影响. 2018 年,瑞典查尔姆斯理工大学信号处理研 究 小 组 的 Stenborg 等 [38] 提 出 了 一 种 在 已 有 的 3D 地图上,将语义类别作为地图点描述子的定位 算法,有效解决了长时间跨季度定位系统中环境 光照变化等对定位系统的影响. Schönberger 等[39] 提出了一种基于 3D 几何和语义信息进行视觉定 位的新方法,通过训练语义场景完备化作为辅助 任务,学习出鲁棒的局部描述符,以此建立查询和 数据库映射之间 3D-2D 的匹配,将匹配结果用于 位姿估计与矫正,成功解决了大范围观测条件下 的鲁棒性视觉定位问题. 在 KITTI 和 NCLT 数据 集上运行结果表明,所提方法在极端视角、照明和 几何变化情况下,表现出了系统的高可靠性. 此类 方法相较于基于传统描述子的方法节省了大量的 存储空间,但语义描述子的应用也有一定的局限 性,如在较单一类别的场景中容易产生误差. 此外,还可通过优化特征选择策略,结合语义 信息进行过滤,使得所关注目标对于光照变化更 加鲁棒. Naseer 等[40] 提出了一种判别整体图像内 容的方法,能够根据图像语义信息生成一个密集 的场景显著性描述. 通过训练感知环境变化大的 数据集学习显著性描述,保证能够在图片上分割 出更加稳定的区域,剔除易随时间变化的区域,并 将显著区域的特征和现有的整体图像上的特征进 行融合,从而得到了一个更加鲁棒的场景描述. Liang 等 [41] 在 稀 疏 直 接 法 里 程 计 ( Direct  sparse odometry, DSO) [42] 基础上,改变了跟踪点的选取策 略,通过在图像上的感兴趣区域上选取点(感兴趣 区域即显著性图),并利用语义分割的结果对显著 性图进行滤波,调整每个像素点的显著性得分,从 而降低了无信息区域(例如墙,天花板和地板等) 的显著性得分. 实验结果表明显著性区域的点对 于光照和视角的变化更加鲁棒. (3)面向动态场景. 传统的 V-SLAM 系统大多基于静态环境假 设,在处理动态环境的定位问题时,容易发生错误 匹配. 近年来,针对动态场景的语义 SLAM 系统逐 渐受到越来越多的关注[43−44] ,通过引入环境语义 信息有效地对静态和动态特征点进行划分,移除 动态特征点,从而减少动态干扰,以提高 SLAM 系 统的鲁棒性. Yu 等[45] 基于 ORB-SLAM2 提出了一种动态环 境下鲁棒的语义 SLAM 系统(DS-SLAM),该系统 基于光流金字塔算法进行运动一致性校验,并结 合语义分割网络获取物体轮廓,剔除位于移动物 体上的特征点,减少动态对象对姿态估计的影响, 提升了系统定位鲁棒性. 在 TUM RGB-D 数据集 以及真实环境下测试结果表明,该系统的绝对轨 迹精度比 ORB-SLAM2 提高了一个数量级. 但是, 该算法能识别的语义类别较少,且只定义人为动 态物体,另外,该地图在回环失败时需要重新建 图 ,地图的可移植能力不足 . Bescos 等 [46] 也 在 ORB-SLAM2 系统上,提出了一种面向动态物体检 测和背景修复的 V-SLAM 系统(DynaSLAM),通过 使用多视几何和深度学习的方法实现移动物体的 检测,并通过对动态物体遮挡的背景帧进行修复, 生成静态场景地图. 实验结果表明,DynaSLAM 提 供的单目、双目和 RGB-D 3 种运行状态在动态场 景中均有较好的鲁棒性,并能输出场景的静态地 图,更符合机器人长时间运行的使用需要. 目前大多数语义信息用于动态场景都是将所 有潜在运动的物体直接去除,但如若动态目标物 体并没有发生运动,且占据相机视角的大部分,那 么将目标物体上的点都去除会对位姿估计产生很 严重的影响. Brasch 等[47] 针对此类现象提出了一 种改进方案,其引入对于地图点是否为静态点的 概率估计“静态率”(Inlier ratio),实现地图点在动 静态之间的平滑过渡. 首先,根据语义分割网络的 输出赋予静态率一个先验值,例如车具有较低的 静态率,建筑具有较高的静态率等,然后根据不断 地引入新的观测数据来更新该地图点的静态率, 以在具有挑战性的条件下实现定位鲁棒性. Cui · 758 · 工程科学学报,第 43 卷,第 6 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有