正在加载图片...
·770 智能系统学报 第11卷 被提出[2-25]。文献[22]的相机定位方法依赖图像 SLAM26]是直接的单目SLAM方法,即直接对图像 的每个像素点,即用稠密的图像对准来进行自身定 的像素点进行处理,相比于之前的基于直接法的单 位,并构建出稠密的3-D地图。文献[23]对当前图 目视觉里程计,不仅能计算出自身的位姿,还能构建 像构建半稠密inverse深度地图,并使用稠密图像配 出全局的半稠密且精确的环境地图。其中的追踪方 准(dense image alignment)法计算相机位姿。构建 法,直接在sim3上进行操作,从而能够准确地检测 半稠密地图即估计图像中梯度较大的所有像素的深 尺度漂移,可在CPU上实时运行。ORB_SLAM] 度值,该深度值被表示为高斯分布,且当新的图像到 是2015年出的比较完整的基于关键帧的单目 来时,该深度值被更新。文献[24]对每个像素点进 SLAM算法,将整个系统分为追踪、地图创建、闭环 行概率的深度测量,有效降低了位姿估计的不确定 控制3个线程进行处理,且特征的提取与匹配、稀疏 性。文献[25]提出了一种半直接的单目视觉里程 地图的创建、位置识别都是基于ORB特征,其定位 计方法,该方法相比于直接法不是对整幅图像进行 精确度很高,且可以实时运行。 直接匹配从而获得相机位姿,而是通过在整幅图像 1.4SLAM的主要研究实验室 中提取的图像块来进行位姿的获取,这样能够增强 SLAM的主要研究实验室有: 算法的鲁棒性。为了构建稠密的三维环境地图,E- 1)苏黎世联邦理工学院的Autonomous System gel等26提出了LSD-SLAM算法(large-scale direct Lab,该实验室在tango项目上与谷歌合作,负责视觉一 SLAM),相比之前的直接的视觉里程计方法,该方 惯导的里程计,基于视觉的定位和深度重建算法。 法在估计高准确性的相机位姿的同时能够创建大规 2)明尼苏达大学的Multiple Autonomous Robotic 模的三维环境地图。 Systems Laboratory,主要研究四轴飞行器导航,合作 文献[27提出了Kinect融合的方法,该方法通 建图,基于地图的定位,半稠密地图创建等。 过Kinect获取的深度图像对每帧图像中的每个像 3)慕尼黑理工大学的The Computer Vision 素进行最小化距离测量而获得相机位姿,且融合所 Group,主要研究基于图像的3-D重建,机器人视觉, 有深度图像,从而获得全局地图信息。文献[28]使 视觉SLAM等。 用图像像素点的光度信息和几何信息来构造误差函 2视觉SLAM关键性问题 数,通过最小化误差函数而获得相机位姿,且地图问 题被处理为位姿图表示。文献[29]是较好的直接 2.1特征检测与匹配 RGB_D SLAM方法,该方法结合像素点的强度误差 目前,点特征的使用最多,最常用的点特征有 与深度误差作为误差函数,通过最小化代价函数,从 SlFT(scale invariant feature transform)[3o]特征,SURT 而求出最优相机位姿,该过程由g2o实现,并提出了 (speeded up robust features)[3)特征和ORB(oriented 基于熵的关键帧提取及闭环检方法,从而大大降低 fast and rotated BRIEF)[3]特征。SIFT特征已发展l0 了路径的误差。 多年,且获得了巨大的成功。SFT特征具有可辨别 1.3视觉SLAM主要标志性成果 性,由于其描述符用高维向量(128维)表示,且具有 视觉SLAM的标志性成果有Andrew Davison提 旋转不变性、尺度不变性、放射变换不变性,对噪声和 出的MonoSLAM3],是第1个基于EKF方法的单目 光照变化也有鲁棒性。[-]在视觉SLAM里使用了 SLAM,能够达到实时但是不能确定漂移多少,能够 SFT特征,但是由于SFT特征的向量维数太高,导致 在概率框架下在线创建稀疏地图。DTAM2]是 时间复杂度高。SURF特征具有尺度不变性、旋转不 2011年提出的基于直接法的单目SLAM算法,该方 变性,且相对于ST特征的算法速度提高了3到7 法通过帧率的整幅图像对准来获得相对于稠密地图 倍。在文献[37-39]SURF被作为视觉SLAM的特征 的相机的6个自由度位姿,能够在GPU上达到实时 提取方法,与SFT特征相比,时间复杂度有所降低。 的效果。PTAMI0是由Georg Klein提出的第1个 对两幅图像的SFT和SURF特征进行匹配时通常是 用多线程处理SLAM的算法,将跟踪和建图分为两 计算两个特征向量之间的欧氏距离,并以此作为特征 个单独的任务并在两个平行的线程进行处理。K- 点的相似性判断度量。ORB特征是FASTt4]特征检 nectFusion是第1个基于Kinect的能在GPU上实 测算子与BREF4描述符的结合,并在其基础上做 时构建稠密三维地图的算法,该方法仅使用Kinect 了一些改进。ORB特征最大的优点是计算速度快, 相机获取的深度信息去计算传感器的位姿以及构建 是SFT特征的1O0倍,SURF特征的10倍,其原因是 精确的环境3-D地图模型。2014年提出的LSD- FAST特征检测速度就很快,再加上BRIEF描述符是被提出[22-25] 。 文献[22]的相机定位方法依赖图像 的每个像素点,即用稠密的图像对准来进行自身定 位,并构建出稠密的 3⁃D 地图。 文献[23]对当前图 像构建半稠密 inverse 深度地图,并使用稠密图像配 准(dense image alignment) 法计算相机位姿。 构建 半稠密地图即估计图像中梯度较大的所有像素的深 度值,该深度值被表示为高斯分布,且当新的图像到 来时,该深度值被更新。 文献[24]对每个像素点进 行概率的深度测量,有效降低了位姿估计的不确定 性。 文献[25]提出了一种半直接的单目视觉里程 计方法,该方法相比于直接法不是对整幅图像进行 直接匹配从而获得相机位姿,而是通过在整幅图像 中提取的图像块来进行位姿的获取,这样能够增强 算法的鲁棒性。 为了构建稠密的三维环境地图,En⁃ gel 等[26] 提出了 LSD⁃SLAM 算法( large⁃scale direct SLAM),相比之前的直接的视觉里程计方法,该方 法在估计高准确性的相机位姿的同时能够创建大规 模的三维环境地图。 文献[27]提出了 Kinect 融合的方法,该方法通 过 Kinect 获取的深度图像对每帧图像中的每个像 素进行最小化距离测量而获得相机位姿,且融合所 有深度图像,从而获得全局地图信息。 文献[28]使 用图像像素点的光度信息和几何信息来构造误差函 数,通过最小化误差函数而获得相机位姿,且地图问 题被处理为位姿图表示。 文献[29] 是较好的直接 RGB_D SLAM 方法,该方法结合像素点的强度误差 与深度误差作为误差函数,通过最小化代价函数,从 而求出最优相机位姿,该过程由 g2o 实现,并提出了 基于熵的关键帧提取及闭环检方法,从而大大降低 了路径的误差。 1.3 视觉 SLAM 主要标志性成果 视觉 SLAM 的标志性成果有 Andrew Davison 提 出的 MonoSLAM [3] ,是第 1 个基于 EKF 方法的单目 SLAM,能够达到实时但是不能确定漂移多少,能够 在概率框架下在 线 创 建 稀 疏 地 图。 DTAM [24] 是 2011 年提出的基于直接法的单目 SLAM 算法,该方 法通过帧率的整幅图像对准来获得相对于稠密地图 的相机的 6 个自由度位姿,能够在 GPU 上达到实时 的效果。 PTAM [10]是由 Georg Klein 提出的第 1 个 用多线程处理 SLAM 的算法,将跟踪和建图分为两 个单独的任务并在两个平行的线程进行处理。 Ki⁃ nectFusion [27]是第 1 个基于 Kinect 的能在 GPU 上实 时构建稠密三维地图的算法,该方法仅使用 Kinect 相机获取的深度信息去计算传感器的位姿以及构建 精确的环境 3⁃D 地图模型。 2014 年提出的 LSD- SLAM [26]是直接的单目 SLAM 方法,即直接对图像 的像素点进行处理,相比于之前的基于直接法的单 目视觉里程计,不仅能计算出自身的位姿,还能构建 出全局的半稠密且精确的环境地图。 其中的追踪方 法,直接在 sim3 上进行操作,从而能够准确地检测 尺度漂移,可在 CPU 上实时运行。 ORB_SLAM [13] 是 2015 年 出 的 比 较 完 整 的 基 于 关 键 帧 的 单 目 SLAM 算法,将整个系统分为追踪、地图创建、闭环 控制 3 个线程进行处理,且特征的提取与匹配、稀疏 地图的创建、位置识别都是基于 ORB 特征,其定位 精确度很高,且可以实时运行。 1.4 SLAM 的主要研究实验室 SLAM 的主要研究实验室有: 1) 苏黎世联邦理工学院的 Autonomous System Lab,该实验室在 tango 项目上与谷歌合作,负责视觉— 惯导的里程计,基于视觉的定位和深度重建算法。 2)明尼苏达大学的 Multiple Autonomous Robotic Systems Laboratory,主要研究四轴飞行器导航,合作 建图,基于地图的定位,半稠密地图创建等。 3) 慕 尼 黑 理 工 大 学 的 The Computer Vision Group,主要研究基于图像的 3⁃D 重建,机器人视觉, 视觉 SLAM 等。 2 视觉 SLAM 关键性问题 2.1 特征检测与匹配 目前,点特征的使用最多,最常用的点特征有 SIFT(scale invariant feature transform) [30] 特征,SURT (speeded up robust features) [31] 特征和 ORB(oriented fast and rotated BRIEF) [32]特征。 SIFT 特征已发展 10 多年,且获得了巨大的成功。 SIFT 特征具有可辨别 性,由于其描述符用高维向量(128 维)表示,且具有 旋转不变性、尺度不变性、放射变换不变性,对噪声和 光照变化也有鲁棒性。 [33-36] 在视觉 SLAM 里使用了 SIFT 特征,但是由于 SIFT 特征的向量维数太高,导致 时间复杂度高。 SURF 特征具有尺度不变性、旋转不 变性,且相对于 SIFT 特征的算法速度提高了 3 到 7 倍。 在文献[37-39]SURF 被作为视觉 SLAM 的特征 提取方法,与 SIFT 特征相比,时间复杂度有所降低。 对两幅图像的 SIFT 和 SURF 特征进行匹配时通常是 计算两个特征向量之间的欧氏距离,并以此作为特征 点的相似性判断度量。 ORB 特征是 FAST [40] 特征检 测算子与 BRIEF [41] 描述符的结合,并在其基础上做 了一些改进。 ORB 特征最大的优点是计算速度快, 是 SIFT 特征的 100 倍,SURF 特征的 10 倍,其原因是 FAST 特征检测速度就很快,再加上 BRIEF 描述符是 ·770· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有