正在加载图片...
·1040· 智能系统学报 第16卷 人虽然做不到人类这样,但这种视觉注意力机制 动状态的相互关联性而产生的特征效用,引入预 是值得机器人自主定位导航借鉴的。 测机制,利用注意力和预测选择特征来减少跟踪 国内外学者开展了很多通过主动特征选择提 特征的丢失,通过滤去那些将丢失在视野中的特 高视觉SLAM和视觉里程计性能的研究。Ouer- 征点,增加SLAM系统的稳定性,特征选择器知 hani等)利用注意的路标点构建拓扑地图,在导 道机器人的意图(未来的运动),并相应地选择更 航过程中,利用相同的视觉注意模型检测最突出 有可能出现在未来视野中的特征,可以用更少的 的视觉特征,与注意的路标点相匹配获取特征 含信息多的特征点来提高优化效率。 点。Newman等,考虑一个装备了相机和激光测 距仪的机器人,并利用基于外观的视觉显著性概 1注意力和预测机制 念进行特征选择,提高SLAM回环检测的稳定 本文提出的注意力和预测机制是从当前帧检 性,在室内环境中可以很好地检测到回环(大约 测到的特征F中选择子集S传递给SLAM后端 100m)。Sola等指出尽管许多特征可能在机器 进行非线性优化,整体流程如图1所示。 人环境的给定视图中可见,只有少数这样的特征 传感器 特征选择 后端非线 是估计机器人的位置和方向所必需的。它们利用 建图 数据 性优化 共视性作为标准,自动选择特征最优集。Frintrop 等)使用注意力框架进行特征选择和主动视角控 回环检测 制,能够克服使用相对较小视野的单目视觉SLAM 系统的一些限制,提高姿态估计的准确性。该特 图1整体流程 征选择系统是基于VOCUS模型的,其包含一个 Fig.1 Whole process 自底向上的注意力系统(根据特征外观计算显著 为了最大限度地提高运动估计的性能,特征 性),还包含一个自顶向下的机制(考虑任务性能)。 子集应该最多具有k个特征,这些特征对于减少 Hochdorfer等提出了一种基于区域覆盖的特征 基于视觉状态估计的不确定性是最有效的。可以 点评级和选择机制,解决了随着特征数量不断增 把这个问题先简单地表述为 加,运算资源占用率越来越高的问题,为SLAM fS),≤k (1) 算法在服务机器人整个生命周期中的应用,甚至 这个问题的解决依赖于度量方程∫的选择, 在不同的环境中的应用做出了贡献。Strasdat等m 它将量化特征子集的可行性。特征选择与控制理 提出了一种基于强化学习方法的特征选择,减轻 论中的传感器布置问题有着密切的联系,尽管由 了机器人在SLAM建图中的计算负担。Shi等例 于二元选择变量的引入,传感器选择问题已被证 提出了一种特征选择方法来提高SLAM中数据关 明是NP-hard问题,如著名的旅行商问题,但最 联的鲁棒性,防止了不好的特征被初始化,更好 近的研究结果表明利用子模块代价函数、贪婪算 地保证了SLAM估计的一致性。Cvisic等9通过 法能够近似地找到式(1)的解,同时保证其次优 稳定的特征选择加速了立体视觉里程计的计算, 性。本文确定了度量方程,该度量可以表示子 减少了SLAM轨迹漂移,该特征选择是基于统分 模块性,可以量化状态估计的不确定性。更重要 的(将特征均匀地分布在整个图像中)和基于外观 的是,通过它应该能得到最相关的特征点。1)该 的排名。最近在计算机视觉领域的研究表明利用 度量必须鼓励选择最显著的特征,因为这些特征 注意力机制可以减少神经网络的计算负担。Mih 更有可能在连续帧中被重新观察到。2)度量必须 等通过引入瞥见的概念,减少了使用递归神经 奖励那些在视场中停留较长时间的特征。因此 网络进行目标检测和跟踪的步骤,可以在图像感 预测是一个关键的方面:利用度量必须知道,在一 兴趣的区域提供更高的分辨率。文献[1]是最早 定的运动下,哪些特征更有可能留在相机的视场 使用信息理论结构来推理视觉特征的论文之一,提 中。3)度量必须奖励提供更多信息的特征,以减 出了一个基于模型的跟踪问题,在该问题中,运 少不确定性。 动相机的状态必须通过对已知特征的观察来估计。 本文的方法受Carlone等1的启发,文中提出 视觉SLAM在面对快速变动场景时,由于缺 了两种量化特征子集可行性的度量,最小特征值入n 乏可跟踪特征,基于视觉的感知技术往往会失败。 度量和行列式logdet度量,并且通过严谨的数学 这是一个众所周知的问题,在文献中经常被讨论 证明,证明了logdet度量的可行性。在式(I)之 (例如,见文献[12-13)。本文基于环境和相机运 后,使用logdet度量16来计算状态估计不确定人虽然做不到人类这样,但这种视觉注意力机制 是值得机器人自主定位导航借鉴的。 国内外学者开展了很多通过主动特征选择提 高视觉 SLAM 和视觉里程计性能的研究。Ouer￾hani 等 [2] 利用注意的路标点构建拓扑地图,在导 航过程中,利用相同的视觉注意模型检测最突出 的视觉特征,与注意的路标点相匹配获取特征 点。Newman 等 [3] 考虑一个装备了相机和激光测 距仪的机器人,并利用基于外观的视觉显著性概 念进行特征选择,提高 SLAM 回环检测的稳定 性,在室内环境中可以很好地检测到回环 (大约 100 m)。Sola 等 [4] 指出尽管许多特征可能在机器 人环境的给定视图中可见,只有少数这样的特征 是估计机器人的位置和方向所必需的。它们利用 共视性作为标准,自动选择特征最优集。Frintrop 等 [5] 使用注意力框架进行特征选择和主动视角控 制,能够克服使用相对较小视野的单目视觉 SLAM 系统的一些限制,提高姿态估计的准确性。该特 征选择系统是基于 VOCUS 模型的[5] ,其包含一个 自底向上的注意力系统 (根据特征外观计算显著 性),还包含一个自顶向下的机制 (考虑任务性能)。 Hochdorfer 等 [6] 提出了一种基于区域覆盖的特征 点评级和选择机制,解决了随着特征数量不断增 加,运算资源占用率越来越高的问题,为 SLAM 算法在服务机器人整个生命周期中的应用,甚至 在不同的环境中的应用做出了贡献。Strasdat 等 [7] 提出了一种基于强化学习方法的特征选择,减轻 了机器人在 SLAM 建图中的计算负担。Shi 等 [8] 提出了一种特征选择方法来提高 SLAM 中数据关 联的鲁棒性,防止了不好的特征被初始化,更好 地保证了 SLAM 估计的一致性。Cvisic 等 [9] 通过 稳定的特征选择加速了立体视觉里程计的计算, 减少了 SLAM 轨迹漂移,该特征选择是基于统分 的 (将特征均匀地分布在整个图像中) 和基于外观 的排名。最近在计算机视觉领域的研究表明利用 注意力机制可以减少神经网络的计算负担。Mnih 等 [10] 通过引入瞥见的概念,减少了使用递归神经 网络进行目标检测和跟踪的步骤,可以在图像感 兴趣的区域提供更高的分辨率。文献 [11] 是最早 使用信息理论结构来推理视觉特征的论文之一,提 出了一个基于模型的跟踪问题,在该问题中,运 动相机的状态必须通过对已知特征的观察来估计。 视觉 SLAM 在面对快速变动场景时,由于缺 乏可跟踪特征,基于视觉的感知技术往往会失败。 这是一个众所周知的问题,在文献中经常被讨论 (例如,见文献 [12-13])。本文基于环境和相机运 动状态的相互关联性而产生的特征效用,引入预 测机制,利用注意力和预测选择特征来减少跟踪 特征的丢失,通过滤去那些将丢失在视野中的特 征点,增加 SLAM 系统的稳定性,特征选择器知 道机器人的意图 (未来的运动),并相应地选择更 有可能出现在未来视野中的特征,可以用更少的 含信息多的特征点来提高优化效率。 1 注意力和预测机制 F S 本文提出的注意力和预测机制是从当前帧检 测到的特征 中选择子集 传递给 SLAM 后端 进行非线性优化,整体流程如图 1 所示。 传感器 数据 前端视觉 里程计 特征选择 后端非线 性优化 建图 回环检测 图 1 整体流程 Fig. 1 Whole process κ 为了最大限度地提高运动估计的性能,特征 子集应该最多具有 个特征,这些特征对于减少 基于视觉状态估计的不确定性是最有效的。可以 把这个问题先简单地表述为 max S⊂F f(S), |S| ⩽ κ (1) 这个问题的解决依赖于度量方程 f 的选择, 它将量化特征子集的可行性。特征选择与控制理 论中的传感器布置问题有着密切的联系,尽管由 于二元选择变量的引入,传感器选择问题已被证 明是 NP-hard 问题[14] ,如著名的旅行商问题,但最 近的研究结果表明利用子模块代价函数、贪婪算 法能够近似地找到式 (1) 的解,同时保证其次优 性 [15]。本文确定了度量方程,该度量可以表示子 模块性,可以量化状态估计的不确定性。更重要 的是,通过它应该能得到最相关的特征点。1) 该 度量必须鼓励选择最显著的特征,因为这些特征 更有可能在连续帧中被重新观察到。2) 度量必须 奖励那些在视场中停留较长时间的特征。因此, 预测是一个关键的方面:利用度量必须知道,在一 定的运动下,哪些特征更有可能留在相机的视场 中。3) 度量必须奖励提供更多信息的特征,以减 少不确定性。 λmin 本文的方法受 Carlone 等 [16] 的启发,文中提出 了两种量化特征子集可行性的度量,最小特征值 度量和行列式 logdet 度量,并且通过严谨的数学 证明,证明了 logdet 度量的可行性。在式 (1) 之 后,使用 logdet 度量[16] 来计算状态估计不确定 ·1040· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有