正在加载图片...
·398 智能系统学报 第11卷 著:结合前面的实验中TQ-VC一直有最好的性能 1.0 -e-LSH-VC SH-VC 表现,可以得知基于人工特征的性能较好的编码策 0.9 SKLSH-VC ITO-VC 略在深层卷积特征下依旧能够获得较好的性能。 PCA-RR-VC 0.7 DSH-VC 0.6 。 6 0.5 0.4 0.4 03 2 0.3 eLSH 0.2 一SH 0.2 0.40.6 0.8 1.0 -SKLSH Recall ★一1TO -PCA-RR (c)l28位编码时Precision-Recall曲线 -e-DSH 16 32 64 128 256 编码长度 1.0 0.9 (a)Gist特征下不同编码位数时mAP值 0.8 0.7 0.9 0.6 08 0.5 0 0.4 -e-LSH-VC 0.3 一SH-VC SKLSH-VC 0.2 ITO-VC 0.1 PCA-RR-VC 0.4 -DSH-VC 0 0.3 -e-LSH-VC 0.2 SH-VC 0.40.6 0.8 1.0 02 -0-SKLSH-VO Recall ◆ITQ-VC 0.1 PCA-RR-VC (d)256位编码时Precision-Recall曲线 --DSH-VC 图5本文方法6种策略在Caltech256上的Precision- 16 32 64 28 256 Recall曲线 编码长度 Fig.5 The Precision-Recall curve of the six strategies (b)cnn特征下不同编码位数时mAP值 on Caltech 256 图6所有策略在Caltech.256上的mAP值 对比图4、5,可以看到本文方法的5种策略相 Fig.6 The mean Average Precision of all strategies on 比于以前最好水准的对应策略具有更好的Preci- Caltech 256 sion-Recall曲线(SKLSH-VC除外)。随着编码位数 在Caltech101和Caltech256数据集上的两组实 增加,TQ-VC、PCA-RR-VC和SH-VC似乎达到了性 验充分说明了使用CNN的卷积特征进行哈希编码 能的上限,而LSH-VC在CNN特征下却不受这个限 检索能够获得一定程度的性能提升。 制,性能提升迅速。同时,可以清楚地看到结合 4结束语 CNN特征的TQ-VC检索策略在4种不同的编码位 数下都具有最优的Precision-Recall曲线。 在图像检索上,本文提出一种结合CNN和以前 2)在mean Average Precision-Number of bits标 最好水准的哈希编码策略的有效方法。首先,采用 准上的实验结果如图6。分析图6,相比以前最好水 VGGNet-D网络模型对目标图像集提取图像的深层 准的对应策略,使用CNN特征的本文5种策略获得 特征表示,再使用以前最好水准的哈希编码策略把 了更高的mAP值(SKLSH-VC除外)。ITQ-VC在所 这些特征编码成二进制码。实验结果显示,本文方 有编码位数下一直有最高的mAP值,分别为0.401、 法的LSH-VC、SH-VC、ITQ-VC、PCA-RR-VC和DSH 0.665、0.785、0.849和0.886,在TQ上提高了 VC策略相比于以前最好水准的对应策略获得了更 74.2%、116.8%、109.5%、107.4%和103.3%,效果显 高的性能。同时本文方法表明,当CNN这种最先进(c)128 位编码时 Precision⁃Recall 曲线 (d)256 位编码时 Precision⁃Recall 曲线 图 5 本文方法 6 种策略在 Caltech256 上的 Precision- Recall 曲线 Fig.5 The Precision⁃Recall curve of the six strategies on Caltech 256 对比图 4、5,可以看到本文方法的 5 种策略相 比于以前最好水准的对应策略具有更好的 Preci⁃ sion⁃Recall 曲线( SKLSH⁃VC 除外)。 随着编码位数 增加,ITQ⁃VC、PCA⁃RR⁃VC 和 SH⁃VC 似乎达到了性 能的上限,而 LSH⁃VC 在 CNN 特征下却不受这个限 制,性能提升迅速。 同时, 可以清楚地看到结合 CNN 特征的 ITQ⁃VC 检索策略在 4 种不同的编码位 数下都具有最优的 Precision⁃Recall 曲线。 2) 在 mean Average Precision⁃Number of bits 标 准上的实验结果如图 6。 分析图 6,相比以前最好水 准的对应策略,使用 CNN 特征的本文 5 种策略获得 了更高的 mAP 值(SKLSH⁃VC 除外)。 ITQ⁃VC 在所 有编码位数下一直有最高的 mAP 值,分别为 0.401、 0.665、 0.785、 0. 849 和 0. 886, 在 ITQ 上 提 高 了 74.2%、116.8%、109.5%、107.4%和 103.3%,效果显 著;结合前面的实验中 ITQ⁃VC 一直有最好的性能 表现,可以得知基于人工特征的性能较好的编码策 略在深层卷积特征下依旧能够获得较好的性能。 (a)Gist 特征下不同编码位数时 mAP 值 (b)cnn 特征下不同编码位数时 mAP 值 图 6 所有策略在 Caltech256 上的 mAP 值 Fig.6 The mean Average Precision of all strategies on Caltech 256 在 Caltech101 和 Caltech256 数据集上的两组实 验充分说明了使用 CNN 的卷积特征进行哈希编码 检索能够获得一定程度的性能提升。 4 结束语 在图像检索上,本文提出一种结合 CNN 和以前 最好水准的哈希编码策略的有效方法。 首先,采用 VGGNet⁃D 网络模型对目标图像集提取图像的深层 特征表示,再使用以前最好水准的哈希编码策略把 这些特征编码成二进制码。 实验结果显示,本文方 法的 LSH⁃VC、SH⁃VC、ITQ⁃VC、PCA⁃RR⁃VC 和 DSH⁃ VC 策略相比于以前最好水准的对应策略获得了更 高的性能。 同时本文方法表明,当 CNN 这种最先进 ·398· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有