二进制串，大大缩减了匹配速度，而且具有旋转不变性，但不具备尺度不变性。

点击下载：《智能系统学报》：视觉SLAM综述（哈尔滨工业大学：权美香、朴松昊、李国）

正在加载图片...

第6期权美香，等：视觉SLAM综述 .771. 二进制串，大大缩减了匹配速度，而且具有旋转不变方法，它们使用基于16维的SFT特征的词典方法性，但不具备尺度不变性。文献[12-13,42-44]的不断地搜索已访问过的位置。文献[61-62]使用基 SLAM算法中采用了ORB特征，大大加快了算法速于SURF描述符的词典方法去进行闭环检测SURF 度。ORB特征匹配是以BRIEF二进制描述符的汉明特征，SURF特征提取需要花费4O0ms去进行。文距离为相似性度量的。献[63]使用SFT特征执行全局定位，且用KD树来在大量包含直线和曲线的环境下，使用点特征排列地图点。文献[59]提出了一种使用基于FAST 时，环境中很多信息都将被遗弃，为了弥补这个缺特征检测与BRIEF二进制描述符词典，且添加了直陷，从而也提出了基于边特征的视觉SLAM45-6]和接索引(direct index),直接索引的引入使得能够有基于区域特征的视觉SLAM]方法。效地获得图像之间的匹配点，从而加快闭环检测的 2.2关键帧的选择几何验证。文献[12]用基于ORB特征的词典方法帧对帧的对准方法会造成大的累积漂浮，由于进行位置识别，由于ORB特征具有旋转不变性且能位姿估计过程中总会产生误差。为了减少帧对帧的处理尺度变化，该方法能识别位置从不同的视角。对准方法带来的误差，基于关键帧的文献[13]的位置识别方法建于文献[12]的主要思 SLAM10-13,19,29]方法被提出。想上，即使用基于ORB特征的词典方法选出候选闭目前有几种选择关键帧的方法。文献[10,13] 环，再通过相似性计算进行闭环的几何验证。里当满足以下全部条件时该帧作为关键帧插入到地图里：从上一个关键帧经过了n个帧：当前帧至少能看到n个地图点，位姿估计准确性较高。文献[19] 是当两幅图像看到的共同特征点数低于一定阈值时，创建一个新的关键帧。文献[29]提出了一种基于熵的相似性的选择关键帧的方法，由于简单的阈值不适用于不同的场景，对每一帧计算一个熵的相似性比，如果该值小于一个预先定义的阈值，则前一帧被选为新的关键帧，并插入地图里，该方法大大减少了位姿漂浮。 2.3闭环检测(1 loop closing)方法闭环检测及位置识别，判断当前位置是否是以前已访问过的环境区域。三维重建过程中必然会产图2K中心点聚类方法生误差累积，实现闭环是消除的一种手段。在位置 Fig.2 Method of k medians clustering 识别算法中，视觉是主要的传感器3,4s-0]。文献 2.4地图优化 [51]对闭环检测方法进行了比较，且得出图像对图对于一个在复杂且动态的环境下工作的机器像[s2-s)的匹配性能优于地图对地图[s,图像对地人，3-D地图的快速生成是非常重要的，且创建的环图约的匹配方法。境地图对之后的定位、路径规划及壁障的性能起到图像对图像的匹配方法中，词袋(bag of 一个关键性的作用，从而精确的地图创建也是非常 words)[s6]方法由于其有效性得到了广泛的应重要的。用[2-3,7-9]。词袋指的是使用视觉词典树(visual 闭环检测成功后，往地图里添加闭环约束，执行 vocabulary tree)将一幅图像的内容转换为数字向量闭环校正。闭环问题可以描述为大规模的光束平差的技术。对训练图像集进行特征提取，并将其特征法(bundle adjustment)[64-]问题，即对相机位姿及描述符空间通过K中心点聚类(k medians cluste- 所有的地图点3-D坐标进行优化，但是该优化计算 ing)方法离散化为个簇，由此，词典树的第一节点复杂度太高，从而很难实现实时。层被创建。下面的层通过对每个簇重复执行这个操一种可执行方法为通过位姿图优化(pose graph 作而获得，直到共获得层。最终获得W个叶子节 optimization)方法来对闭环进行优化，顶点为相机位点，即视觉词汇。每层到每层的K中心聚类过程如图2所示[6]」姿，边表示位姿之间相对变换的图称为位姿图，位姿图优化即将闭环误差沿着图进行分配，即均匀分配文献「60对重定位和闭环检测提出了统一的到图上的所有位姿上。图优化通常由图优化框架二进制串，大大缩减了匹配速度，而且具有旋转不变性，但不具备尺度不变性。文献［１２－１３，４２－４４］的ＳＬＡＭ算法中采用了ＯＲＢ特征，大大加快了算法速度。ＯＲＢ特征匹配是以ＢＲＩＥＦ二进制描述符的汉明距离为相似性度量的。在大量包含直线和曲线的环境下，使用点特征时，环境中很多信息都将被遗弃，为了弥补这个缺陷，从而也提出了基于边特征的视觉ＳＬＡＭ［４５－４６］和基于区域特征的视觉ＳＬＡＭ［４７］方法。２．２关键帧的选择帧对帧的对准方法会造成大的累积漂浮，由于位姿估计过程中总会产生误差。为了减少帧对帧的对准方法带来的误差，基于关键帧的ＳＬＡＭ［１０－１３，１９，２９］方法被提出。目前有几种选择关键帧的方法。文献［１０，１３］里当满足以下全部条件时该帧作为关键帧插入到地图里：从上一个关键帧经过了ｎ个帧；当前帧至少能看到ｎ个地图点，位姿估计准确性较高。文献［１９］是当两幅图像看到的共同特征点数低于一定阈值时，创建一个新的关键帧。文献［２９］提出了一种基于熵的相似性的选择关键帧的方法，由于简单的阈值不适用于不同的场景，对每一帧计算一个熵的相似性比，如果该值小于一个预先定义的阈值，则前一帧被选为新的关键帧，并插入地图里，该方法大大减少了位姿漂浮。２．３闭环检测（ｌｏｏｐｃｌｏｓｉｎｇ）方法闭环检测及位置识别，判断当前位置是否是以前已访问过的环境区域。三维重建过程中必然会产生误差累积，实现闭环是消除的一种手段。在位置识别算法中，视觉是主要的传感器［３，４８－５０］。文献［５１］对闭环检测方法进行了比较，且得出图像对图像［５２－５３］的匹配性能优于地图对地图［５４］，图像对地图［５５］的匹配方法。图像对图像的匹配方法中，词袋（ｂａｇｏｆｗｏｒｄｓ）［５６］方法由于其有效性得到了广泛的应用［１２－１３，５７－５９］。词袋指的是使用视觉词典树（ｖｉｓｕａｌｖｏｃａｂｕｌａｒｙｔｒｅｅ）将一幅图像的内容转换为数字向量的技术。对训练图像集进行特征提取，并将其特征描述符空间通过Ｋ中心点聚类（ｋｍｅｄｉａｎｓｃｌｕｓｔｅ⁃ ｒｉｎｇ）方法离散化为个簇，由此，词典树的第一节点层被创建。下面的层通过对每个簇重复执行这个操作而获得，直到共获得层。最终获得Ｗ个叶子节点，即视觉词汇。每层到每层的Ｋ中心聚类过程如图２所示［５６］。文献［６０］对重定位和闭环检测提出了统一的方法，它们使用基于１６维的ＳＩＦＴ特征的词典方法不断地搜索已访问过的位置。文献［６１－６２］使用基于ＳＵＲＦ描述符的词典方法去进行闭环检测ＳＵＲＦ特征，ＳＵＲＦ特征提取需要花费４００ｍｓ去进行。文献［６３］使用ＳＩＦＴ特征执行全局定位，且用ＫＤ树来排列地图点。文献［５９］提出了一种使用基于ＦＡＳＴ特征检测与ＢＲＩＥＦ二进制描述符词典，且添加了直接索引（ｄｉｒｅｃｔｉｎｄｅｘ），直接索引的引入使得能够有效地获得图像之间的匹配点，从而加快闭环检测的几何验证。文献［１２］用基于ＯＲＢ特征的词典方法进行位置识别，由于ＯＲＢ特征具有旋转不变性且能处理尺度变化，该方法能识别位置从不同的视角。文献［１３］的位置识别方法建于文献［１２］的主要思想上，即使用基于ＯＲＢ特征的词典方法选出候选闭环，再通过相似性计算进行闭环的几何验证。图２Ｋ中心点聚类方法Ｆｉｇ．２Ｍｅｔｈｏｄｏｆｋｍｅｄｉａｎｓｃｌｕｓｔｅｒｉｎｇ２．４地图优化对于一个在复杂且动态的环境下工作的机器人，３⁃Ｄ地图的快速生成是非常重要的，且创建的环境地图对之后的定位、路径规划及壁障的性能起到一个关键性的作用，从而精确的地图创建也是非常重要的。闭环检测成功后，往地图里添加闭环约束，执行闭环校正。闭环问题可以描述为大规模的光束平差法（ｂｕｎｄｌｅａｄｊｕｓｔｍｅｎｔ）［６４－６５］问题，即对相机位姿及所有的地图点３⁃Ｄ坐标进行优化，但是该优化计算复杂度太高，从而很难实现实时。一种可执行方法为通过位姿图优化（ｐｏｓｅｇｒａｐｈｏｐｔｉｍｉｚａｔｉｏｎ）方法来对闭环进行优化，顶点为相机位姿，边表示位姿之间相对变换的图称为位姿图，位姿图优化即将闭环误差沿着图进行分配，即均匀分配到图上的所有位姿上。图优化通常由图优化框架第６期权美香，等：视觉ＳＬＡＭ综述 ·７７１·

<<向上翻页向下翻页>>

点击下载：《智能系统学报》：视觉SLAM综述（哈尔滨工业大学：权美香、朴松昊、李国）