正在加载图片...
·678· 智能系统学报 第16卷 为强烈。NC数据集同样是由左右两边搭载相机 PR曲线,为方便量化对比,AUC值列于表3。 的移动设备所拍摄的,和CC数据集不同的是, 下面将分析比较不同方法的性能和差异。 NC数据集的拍摄环境为校园,且含有较多的重 1.0 复元素,例如墙壁等。KAIST)数据集是由韩国 0.8 科学技术院发布的公开数据集,该数据集是通过 0.6 SURF 配备在车辆上的摄像头以及传感器于一天中不同 ORB BRIEF 时段在同一条街道所拍摄的。KAIST数据集中又 0.4 本文方法(二进制) 本文方法非二进制 包括3个子数据集:North、West、East。 0.2 AlexN mos et 以上3个数据集都有不同程度的视角及外观 HybirdNet 0.2 0.40.6 0.8 10 变化,具体可见表2。对于传统手工提取特征的 召回率 方法来说,强烈的视角及外观变化对回环检测是 图4CC数据集下各方法的PR曲线 一个巨大的挑战,因此使用以上数据集可以有效 Fig.4 AUC under PR curves on the CC dataset 验证本文所提出的方法相对于传统方法的优势, 1.0 以及在大规模开放场景下的适应性。 0.8 表2数据集描述 SURF 蓝0.6 Table 2 Dataset description ORB BRIEF 数据集 视角变化 0.4 拍摄环境 外观变化 本制 0.2 AlexNet NC 校园 强烈 中等 mos. -HvbirdNe CC 市中心 强烈 强烈 0.2 0.4 0.6 0.8 1.0 召回率 KAIST 街道 中等 强烈 图5NC数据集下各方法的PR曲线 3.2实验结果 Fig.5 AUC under PR curves on the NC dataset 作为对比,本文选取ORB、BRIEF和SURF 1.0 3个手工提取的特征描述符方法,以及基于有监 0.8 督学习的AlexNet'2a、AMOSNet和HybridNet2深 00.6 SURF 度学习方法,在3个测试集上进行对比。除此之 ORB BRIEF 本文方法二进制) 外,为了验证二进制描述符相对于非二进制描述 元0.4 本文方法非二进制) 符的优势,本文还将对比二进制描述符与非二进 0.2 AlexNet A HybirdNet 制描述符之间的性能差异。 0 0.2 0.40.6 0.8 10 为了对比各类方法的性能,本文绘制了不同 召回率 方法的准确率-回召率曲线,即PR(precision-re- 图6 Kaist(East)数据集下各方法的PR曲线 cal)曲线241,并按照学术研究的常规做法,将 Fig.6 AUC under PR curves on the Kaist(East)dataset PR曲线与横纵坐标围成的面积,即AUC作为评 从图48及表3中可以得出如下结论: 判标准9。AUC的计算公式为 1)相比于人工提取特征的传统方法,基于深 Ac-月+y 度学习的方法性能有较大的提升。无论是基于有 ×(r+1-r) 2 (9) 监督学习的AlexNet、AMOSNet和HybridNet,.还 式中:M为图片序列的数量;P,代表在点i时的准 是本文所提出的基于二进制生成对抗网络的方法 确率;而r,则为回召率。AUC越大则表明该方法 都要比传统SIFT、ORB、BRIEF等人工特征描述 的性能越好。 符有更突出的表现,主要原因在于深度学习的方 为了对比不同参数对于模型性能的影响,调 法可以在复杂的环境下自动且精准地提取图像的 整op与BE的数值,并计算不同数值下的各个数 深层特征。 据集的AUC。同时绘制了在模型中加入与不加 2)相比于有监督方法,本文所提出的无监督 入距离传播损失函数的情况下高维与低维空间特 回环检测方法在性能上略有下降,AlexNet和Hy- 征海明距离之间的距离关系图。 bridNet相对最优,本文所述方法与AMOSNet性 3.2.1不同方法的结果对比 能相近。由于有监督学习方法利用了大量的有标 图48绘制了各方法在3个测试数据集上的 签数据,可以通过已知的训练样本训练出最优模为强烈。NC 数据集同样是由左右两边搭载相机 的移动设备所拍摄的,和 CC 数据集不同的是, NC 数据集的拍摄环境为校园,且含有较多的重 复元素,例如墙壁等。KAIST[21] 数据集是由韩国 科学技术院发布的公开数据集,该数据集是通过 配备在车辆上的摄像头以及传感器于一天中不同 时段在同一条街道所拍摄的。KAIST数据集中又 包括 3 个子数据集:North、West、East。 以上 3 个数据集都有不同程度的视角及外观 变化,具体可见表 2。对于传统手工提取特征的 方法来说,强烈的视角及外观变化对回环检测是 一个巨大的挑战,因此使用以上数据集可以有效 验证本文所提出的方法相对于传统方法的优势, 以及在大规模开放场景下的适应性。 表 2 数据集描述 Table 2 Dataset description 数据集 拍摄环境 视角变化 外观变化 NC 校园 强烈 中等 CC 市中心 强烈 强烈 KAIST 街道 中等 强烈 3.2 实验结果 作为对比,本文选取 ORB、BRIEF 和 SURF 3 个手工提取的特征描述符方法,以及基于有监 督学习的 AlexNet[22] 、AMOSNet 和 HybridNet[23] 深 度学习方法,在 3 个测试集上进行对比。除此之 外,为了验证二进制描述符相对于非二进制描述 符的优势,本文还将对比二进制描述符与非二进 制描述符之间的性能差异。 为了对比各类方法的性能,本文绘制了不同 方法的准确率−回召率曲线,即 PR(precision-re￾call) 曲线[ 2 4 ] ,并按照学术研究的常规做法,将 PR 曲线与横纵坐标围成的面积,即 AUC 作为评 判标准[19]。AUC 的计算公式为 AUC = ∑M−1 i=1 (pi + pi+1) 2 ×(ri+1 −ri) (9) 式中:M 为图片序列的数量;pi 代表在点 i 时的准 确率;而 ri 则为回召率。AUC 越大则表明该方法 的性能越好。 为了对比不同参数对于模型性能的影响,调 整 λDP 与 λBRE 的数值,并计算不同数值下的各个数 据集的 AUC。同时绘制了在模型中加入与不加 入距离传播损失函数的情况下高维与低维空间特 征海明距离之间的距离关系图。 3.2.1 不同方法的结果对比 图 4~8 绘制了各方法在 3 个测试数据集上的 PR 曲线,为方便量化对比, AUC 值列于表 3。 下面将分析比较不同方法的性能和差异。 召回率 1.0 0.8 0.6 0.4 0.2 准确率 SURF ORB BRIEF 本文方法 (二进制) 本文方法 (非二进制) AlexNet AmosNet HybirdNet 0 0.2 0.4 0.6 0.8 1.0 图 4 CC 数据集下各方法的 PR 曲线 Fig. 4 AUC under PR curves on the CC dataset 召回率 1.0 0.8 0.6 0.4 0.2 准确率 0 0.2 0.4 0.6 0.8 1.0 SURF ORB BRIEF 本文方法 (二进制) 本文方法 (非二进制) AlexNet AmosNet HybirdNet 图 5 NC 数据集下各方法的 PR 曲线 Fig. 5 AUC under PR curves on the NC dataset 召回率 1.0 0.8 0.6 0.4 0.2 准确率 0 0.2 0.4 0.6 0.8 1.0 SURF ORB BRIEF 本文方法 (二进制) 本文方法 (非二进制) AlexNet AmosNet HybirdNet 图 6 Kaist(East) 数据集下各方法的 PR 曲线 Fig. 6 AUC under PR curves on the Kaist(East) dataset 从图 4~8 及表 3 中可以得出如下结论: 1) 相比于人工提取特征的传统方法,基于深 度学习的方法性能有较大的提升。无论是基于有 监督学习的 AlexNet、AMOSNet 和 HybridNet,还 是本文所提出的基于二进制生成对抗网络的方法 都要比传统 SIFT、ORB、BRIEF 等人工特征描述 符有更突出的表现,主要原因在于深度学习的方 法可以在复杂的环境下自动且精准地提取图像的 深层特征。 2) 相比于有监督方法,本文所提出的无监督 回环检测方法在性能上略有下降,AlexNet 和 Hy￾bridNet 相对最优,本文所述方法与 AMOSNet 性 能相近。由于有监督学习方法利用了大量的有标 签数据,可以通过已知的训练样本训练出最优模 ·678· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有