正在加载图片...
第6期 权美香,等:视觉SLAM综述 .771. 二进制串,大大缩减了匹配速度,而且具有旋转不变 方法,它们使用基于16维的SFT特征的词典方法 性,但不具备尺度不变性。文献[12-13,42-44]的 不断地搜索已访问过的位置。文献[61-62]使用基 SLAM算法中采用了ORB特征,大大加快了算法速 于SURF描述符的词典方法去进行闭环检测SURF 度。ORB特征匹配是以BRIEF二进制描述符的汉明 特征,SURF特征提取需要花费4O0ms去进行。文 距离为相似性度量的。 献[63]使用SFT特征执行全局定位,且用KD树来 在大量包含直线和曲线的环境下,使用点特征 排列地图点。文献[59]提出了一种使用基于FAST 时,环境中很多信息都将被遗弃,为了弥补这个缺 特征检测与BRIEF二进制描述符词典,且添加了直 陷,从而也提出了基于边特征的视觉SLAM45-6]和 接索引(direct index),直接索引的引入使得能够有 基于区域特征的视觉SLAM]方法。 效地获得图像之间的匹配点,从而加快闭环检测的 2.2关键帧的选择 几何验证。文献[12]用基于ORB特征的词典方法 帧对帧的对准方法会造成大的累积漂浮,由于 进行位置识别,由于ORB特征具有旋转不变性且能 位姿估计过程中总会产生误差。为了减少帧对帧的 处理尺度变化,该方法能识别位置从不同的视角。 对准方法带来的误差,基于关键帧的 文献[13]的位置识别方法建于文献[12]的主要思 SLAM10-13,19,29]方法被提出。 想上,即使用基于ORB特征的词典方法选出候选闭 目前有几种选择关键帧的方法。文献[10,13] 环,再通过相似性计算进行闭环的几何验证。 里当满足以下全部条件时该帧作为关键帧插入到地 图里:从上一个关键帧经过了n个帧:当前帧至少能 看到n个地图点,位姿估计准确性较高。文献[19] 是当两幅图像看到的共同特征点数低于一定阈值 时,创建一个新的关键帧。文献[29]提出了一种基 于熵的相似性的选择关键帧的方法,由于简单的阈 值不适用于不同的场景,对每一帧计算一个熵的相 似性比,如果该值小于一个预先定义的阈值,则前一 帧被选为新的关键帧,并插入地图里,该方法大大减 少了位姿漂浮。 2.3闭环检测(1 loop closing)方法 闭环检测及位置识别,判断当前位置是否是以 前已访问过的环境区域。三维重建过程中必然会产 图2K中心点聚类方法 生误差累积,实现闭环是消除的一种手段。在位置 Fig.2 Method of k medians clustering 识别算法中,视觉是主要的传感器3,4s-0]。文献 2.4地图优化 [51]对闭环检测方法进行了比较,且得出图像对图 对于一个在复杂且动态的环境下工作的机器 像[s2-s)的匹配性能优于地图对地图[s,图像对地 人,3-D地图的快速生成是非常重要的,且创建的环 图约的匹配方法。 境地图对之后的定位、路径规划及壁障的性能起到 图像对图像的匹配方法中,词袋(bag of 一个关键性的作用,从而精确的地图创建也是非常 words)[s6]方法由于其有效性得到了广泛的应 重要的。 用[2-3,7-9]。词袋指的是使用视觉词典树(visual 闭环检测成功后,往地图里添加闭环约束,执行 vocabulary tree)将一幅图像的内容转换为数字向量 闭环校正。闭环问题可以描述为大规模的光束平差 的技术。对训练图像集进行特征提取,并将其特征 法(bundle adjustment)[64-]问题,即对相机位姿及 描述符空间通过K中心点聚类(k medians cluste- 所有的地图点3-D坐标进行优化,但是该优化计算 ing)方法离散化为个簇,由此,词典树的第一节点 复杂度太高,从而很难实现实时。 层被创建。下面的层通过对每个簇重复执行这个操 一种可执行方法为通过位姿图优化(pose graph 作而获得,直到共获得层。最终获得W个叶子节 optimization)方法来对闭环进行优化,顶点为相机位 点,即视觉词汇。每层到每层的K中心聚类过程如 图2所示[6]」 姿,边表示位姿之间相对变换的图称为位姿图,位姿 图优化即将闭环误差沿着图进行分配,即均匀分配 文献「60对重定位和闭环检测提出了统一的 到图上的所有位姿上。图优化通常由图优化框架二进制串,大大缩减了匹配速度,而且具有旋转不变 性,但不具备尺度不变性。 文献[12-13,42-44]的 SLAM 算法中采用了 ORB 特征,大大加快了算法速 度。 ORB 特征匹配是以 BRIEF 二进制描述符的汉明 距离为相似性度量的。 在大量包含直线和曲线的环境下,使用点特征 时,环境中很多信息都将被遗弃,为了弥补这个缺 陷,从而也提出了基于边特征的视觉 SLAM [45-46] 和 基于区域特征的视觉 SLAM [47]方法。 2.2 关键帧的选择 帧对帧的对准方法会造成大的累积漂浮,由于 位姿估计过程中总会产生误差。 为了减少帧对帧的 对 准 方 法 带 来 的 误 差, 基 于 关 键 帧 的 SLAM [10-13,19,29]方法被提出。 目前有几种选择关键帧的方法。 文献[10,13] 里当满足以下全部条件时该帧作为关键帧插入到地 图里:从上一个关键帧经过了 n 个帧;当前帧至少能 看到 n 个地图点,位姿估计准确性较高。 文献[19] 是当两幅图像看到的共同特征点数低于一定阈值 时,创建一个新的关键帧。 文献[29]提出了一种基 于熵的相似性的选择关键帧的方法,由于简单的阈 值不适用于不同的场景,对每一帧计算一个熵的相 似性比,如果该值小于一个预先定义的阈值,则前一 帧被选为新的关键帧,并插入地图里,该方法大大减 少了位姿漂浮。 2.3 闭环检测(loop closing)方法 闭环检测及位置识别,判断当前位置是否是以 前已访问过的环境区域。 三维重建过程中必然会产 生误差累积,实现闭环是消除的一种手段。 在位置 识别算法中, 视觉是主要的传感器[3,48-50] 。 文献 [51]对闭环检测方法进行了比较,且得出图像对图 像[52-53]的匹配性能优于地图对地图[54] ,图像对地 图[55]的匹配方法。 图像 对 图 像 的 匹 配 方 法 中, 词 袋 ( bag of words) [56] 方 法 由 于 其 有 效 性 得 到 了 广 泛 的 应 用[12-13,57-59] 。 词袋指的是使用视觉词典树( visual vocabulary tree)将一幅图像的内容转换为数字向量 的技术。 对训练图像集进行特征提取,并将其特征 描述符空间通过 K 中心点聚类( k medians cluste⁃ ring)方法离散化为个簇,由此,词典树的第一节点 层被创建。 下面的层通过对每个簇重复执行这个操 作而获得,直到共获得层。 最终获得 W 个叶子节 点,即视觉词汇。 每层到每层的 K 中心聚类过程如 图 2 所示[56] 。 文献[60]对重定位和闭环检测提出了统一的 方法,它们使用基于 16 维的 SIFT 特征的词典方法 不断地搜索已访问过的位置。 文献[61-62]使用基 于 SURF 描述符的词典方法去进行闭环检测 SURF 特征,SURF 特征提取需要花费 400 ms 去进行。 文 献[63]使用 SIFT 特征执行全局定位,且用 KD 树来 排列地图点。 文献[59]提出了一种使用基于 FAST 特征检测与 BRIEF 二进制描述符词典,且添加了直 接索引(direct index),直接索引的引入使得能够有 效地获得图像之间的匹配点,从而加快闭环检测的 几何验证。 文献[12]用基于 ORB 特征的词典方法 进行位置识别,由于 ORB 特征具有旋转不变性且能 处理尺度变化,该方法能识别位置从不同的视角。 文献[13]的位置识别方法建于文献[12]的主要思 想上,即使用基于 ORB 特征的词典方法选出候选闭 环,再通过相似性计算进行闭环的几何验证。 图 2 K 中心点聚类方法 Fig.2 Method of k medians clustering 2.4 地图优化 对于一个在复杂且动态的环境下工作的机器 人,3⁃D 地图的快速生成是非常重要的,且创建的环 境地图对之后的定位、路径规划及壁障的性能起到 一个关键性的作用,从而精确的地图创建也是非常 重要的。 闭环检测成功后,往地图里添加闭环约束,执行 闭环校正。 闭环问题可以描述为大规模的光束平差 法(bundle adjustment) [64-65] 问题,即对相机位姿及 所有的地图点 3⁃D 坐标进行优化,但是该优化计算 复杂度太高,从而很难实现实时。 一种可执行方法为通过位姿图优化(pose graph optimization)方法来对闭环进行优化,顶点为相机位 姿,边表示位姿之间相对变换的图称为位姿图,位姿 图优化即将闭环误差沿着图进行分配,即均匀分配 到图上的所有位姿上。 图优化通常由图优化框架 第 6 期 权美香,等:视觉 SLAM 综述 ·771·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有