【机器学习】基于卷积神经网络和哈希编码的图像检索方法编辑部

团购合买资源类别：文库，文档格式：PDF，文档页数：10，文件大小：3.72MB

第11卷第3期智能系统学报 Vol.11 No.3 2016年6月 CAAI Transactions on Intelligent Systems Jun.2016 D0I:10.11992/is.201603028 网络出版地址：http://www.enki..net/kcms/detail/23.1538.TP.20160513.0926.030.html 基于卷积神经网络和哈希编码的图像检索方法龚震霆2，陈光喜12，任夏荔12，曹建收12 (1柱林电子科技大学计算机与信息安全学院，广西桂林541004：2.广西高校图像图形智能处理重点实验室，广西桂林541004) 摘要：在图像检索中，传统的基于人工特征的检索方法并不能取得很好的效果。为此提出一种结合卷积神经网络和以前最好水准的哈希编码策略的图像检索方法。鉴于近几年卷积神经网络在大量的计算机视觉任务上的巨大进步，该方法首先使用在ILSVRC数据集上预训练过的VGGNet--D网络模型对实验图像数据集提取卷积特征来得到图像的深层表示，再采用以前最好水准的哈希策略将这些深层表示进行编码，从而得到图像的二进制码，最后再进行快速图像检索。在两个常用的数据集Caltech101和Caltech256上的实验结果表明，本文方法的5个策略相比于以前最好水准的相应的图像检索策略在“精度-召回率”和“平均正确率值-编码位数”两个指标上能获得更优异的性能，证明了本文方法在图像检索上的有效性。关键词：图像检索；人工特征：卷积神经网络：卷积特征：哈希编码中图分类号：TP391文献标志码：A文章编号：1673-4785(2016)03-0391-10 中文引用格式：龚震霆，陈光喜，任夏荔，等.基于卷积神经网络和哈希编码的图像检索方法[J].智能系统学报，2016,11(3)：391- 400. 英文引用格式：GONG Zhenting,CHEN Guangxi,REN Xiali,etal.An image retrieval method based on a convolutional neural net- work and hash coding[J].CAAI transactions on intelligent Systems,2016,11(3):391-400. An image retrieval method based on a convolutional neural network and hash coding GONG Zhenting'2,CHEN Guangxi'2,REN Xiali',CAO Jianshou'2 (1.School of Computer and Information Security,Guilin University of Electronic Technology,Guilin 541004,China;2.Guangxi Colle- ges and Universities Key Laboratory of Intelligent Processing of Computer Images and Graphics,Guilin 541004,China) Abstract:For image retrieval,traditional retrieval methods based on artificial features are not effective enough. Hence,we propose an image retrieval method,which combines a convolutional neural network and previous state- of-the-art hash coding strategies.In view of the great progress that convolutional neural networks have made in a large number of computer vision tasks in recent years,this method first uses the model "VGGNet-D"pre-trained on the ILSVRC's dataset to extract the convolutional features from experimental image datasets to get the deep repre- sentations of images,then adopts previous state-of-the-art hash coding strategies to encode the deep representations to obtain the binary codes,and,finally,performs a quick image retrieval.The experimental results on the common- ly used Caltech101 and Caltech256 datasets show that this method's five strategies,compared with the previous state-of-the-art image retrieval strategies,can obtain better,indeed excellent,performance in both the "Precision- Recall"and "mean Average Precision-Number of bits"metrics,proving the effectiveness of the proposed method in image retrieval. Keywords:image retrieval;artificial features;convolutional neural network;convolutional features;hash coding 基于内容的图像检索是通过对图像内容的分析收稿日期：2016-03-17.网络出版日期：2016-05-13. 基金项目：国家自然科学基金项目(61462018)：广西学位与研究生教育来搜索相似的图像，近些年一直被多媒体研究者广改革和发展专项课题(JGY2014060):广西数字传播与文化软泛地研究。随着该研究领域的发展，虽然出现了许实力中心开放项目(ZFZD1408008):广西高校图像图形智能处理重点实验室开放基金项目(LD15042X). 多新技术，但由于机器获得的低水平图像像素和人通信作者：龚震霆.E-mail:gongxs7@163.com

第１１卷第３期智能系统学报Ｖｏｌ．１１ №．３２０１６年６月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＪｕｎ．２０１６ＤＯＩ：１０．１１９９２／ｔｉｓ．２０１６０３０２８网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１６０５１３．０９２６．０３０．ｈｔｍｌ基于卷积神经网络和哈希编码的图像检索方法龚震霆１，２，陈光喜１，２，任夏荔１，２，曹建收１，２（１．桂林电子科技大学计算机与信息安全学院，广西桂林５４１００４；２．广西高校图像图形智能处理重点实验室，广西桂林５４１００４）摘要：在图像检索中，传统的基于人工特征的检索方法并不能取得很好的效果。为此提出一种结合卷积神经网络和以前最好水准的哈希编码策略的图像检索方法。鉴于近几年卷积神经网络在大量的计算机视觉任务上的巨大进步，该方法首先使用在ＩＬＳＶＲＣ数据集上预训练过的ＶＧＧＮｅｔ－Ｄ网络模型对实验图像数据集提取卷积特征来得到图像的深层表示，再采用以前最好水准的哈希策略将这些深层表示进行编码，从而得到图像的二进制码，最后再进行快速图像检索。在两个常用的数据集Ｃａｌｔｅｃｈ１０１和Ｃａｌｔｅｃｈ２５６上的实验结果表明，本文方法的５个策略相比于以前最好水准的相应的图像检索策略在“精度－召回率”和“平均正确率值－编码位数”两个指标上能获得更优异的性能，证明了本文方法在图像检索上的有效性。关键词：图像检索；人工特征；卷积神经网络；卷积特征；哈希编码中图分类号：ＴＰ３９１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１６）０３⁃０３９１⁃１０中文引用格式：龚震霆，陈光喜，任夏荔，等．基于卷积神经网络和哈希编码的图像检索方法［Ｊ］．智能系统学报，２０１６，１１（３）：３９１⁃ ４００．英文引用格式：ＧＯＮＧＺｈｅｎｔｉｎｇ，ＣＨＥＮＧｕａｎｇｘｉ，ＲＥＮＸｉａｌｉ，ｅｔａｌ．Ａｎｉｍａｇｅｒｅｔｒｉｅｖａｌｍｅｔｈｏｄｂａｓｅｄｏｎａｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔ⁃ ｗｏｒｋａｎｄｈａｓｈｃｏｄｉｎｇ［Ｊ］．ＣＡＡＩｔｒａｎｓａｃｔｉｏｎｓｏｎｉｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１６，１１（３）：３９１⁃４００．ＡｎｉｍａｇｅｒｅｔｒｉｅｖａｌｍｅｔｈｏｄｂａｓｅｄｏｎａｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋａｎｄｈａｓｈｃｏｄｉｎｇＧＯＮＧＺｈｅｎｔｉｎｇ１，２，ＣＨＥＮＧｕａｎｇｘｉ１，２，ＲＥＮＸｉａｌｉ１，２，ＣＡＯＪｉａｎｓｈｏｕ１，２（１．ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒａｎｄＩｎｆｏｒｍａｔｉｏｎＳｅｃｕｒｉｔｙ，ＧｕｉｌｉｎＵｎｉｖｅｒｓｉｔｙｏｆＥｌｅｃｔｒｏｎｉｃＴｅｃｈｎｏｌｏｇｙ，Ｇｕｉｌｉｎ５４１００４，Ｃｈｉｎａ；２．ＧｕａｎｇｘｉＣｏｌｌｅ⁃ ｇｅｓａｎｄＵｎｉｖｅｒｓｉｔｉｅｓＫｅｙＬａｂｏｒａｔｏｒｙｏｆＩｎｔｅｌｌｉｇｅｎｔＰｒｏｃｅｓｓｉｎｇｏｆＣｏｍｐｕｔｅｒＩｍａｇｅｓａｎｄＧｒａｐｈｉｃｓ，Ｇｕｉｌｉｎ５４１００４，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｆｏｒｉｍａｇｅｒｅｔｒｉｅｖａｌ，ｔｒａｄｉｔｉｏｎａｌｒｅｔｒｉｅｖａｌｍｅｔｈｏｄｓｂａｓｅｄｏｎａｒｔｉｆｉｃｉａｌｆｅａｔｕｒｅｓａｒｅｎｏｔｅｆｆｅｃｔｉｖｅｅｎｏｕｇｈ．Ｈｅｎｃｅ，ｗｅｐｒｏｐｏｓｅａｎｉｍａｇｅｒｅｔｒｉｅｖａｌｍｅｔｈｏｄ，ｗｈｉｃｈｃｏｍｂｉｎｅｓａｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋａｎｄｐｒｅｖｉｏｕｓｓｔａｔｅ⁃ ｏｆ⁃ｔｈｅ⁃ａｒｔｈａｓｈｃｏｄｉｎｇｓｔｒａｔｅｇｉｅｓ．Ｉｎｖｉｅｗｏｆｔｈｅｇｒｅａｔｐｒｏｇｒｅｓｓｔｈａｔｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓｈａｖｅｍａｄｅｉｎａｌａｒｇｅｎｕｍｂｅｒｏｆｃｏｍｐｕｔｅｒｖｉｓｉｏｎｔａｓｋｓｉｎｒｅｃｅｎｔｙｅａｒｓ，ｔｈｉｓｍｅｔｈｏｄｆｉｒｓｔｕｓｅｓｔｈｅｍｏｄｅｌ＂ＶＧＧＮｅｔ⁃Ｄ＂ｐｒｅ⁃ｔｒａｉｎｅｄｏｎｔｈｅＩＬＳＶＲＣ′ｓｄａｔａｓｅｔｔｏｅｘｔｒａｃｔｔｈｅｃｏｎｖｏｌｕｔｉｏｎａｌｆｅａｔｕｒｅｓｆｒｏｍｅｘｐｅｒｉｍｅｎｔａｌｉｍａｇｅｄａｔａｓｅｔｓｔｏｇｅｔｔｈｅｄｅｅｐｒｅｐｒｅ⁃ ｓｅｎｔａｔｉｏｎｓｏｆｉｍａｇｅｓ，ｔｈｅｎａｄｏｐｔｓｐｒｅｖｉｏｕｓｓｔａｔｅ⁃ｏｆ⁃ｔｈｅ⁃ａｒｔｈａｓｈｃｏｄｉｎｇｓｔｒａｔｅｇｉｅｓｔｏｅｎｃｏｄｅｔｈｅｄｅｅｐｒｅｐｒｅｓｅｎｔａｔｉｏｎｓｔｏｏｂｔａｉｎｔｈｅｂｉｎａｒｙｃｏｄｅｓ，ａｎｄ，ｆｉｎａｌｌｙ，ｐｅｒｆｏｒｍｓａｑｕｉｃｋｉｍａｇｅｒｅｔｒｉｅｖａｌ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｏｎｔｈｅｃｏｍｍｏｎ⁃ ｌｙｕｓｅｄＣａｌｔｅｃｈ１０１ａｎｄＣａｌｔｅｃｈ２５６ｄａｔａｓｅｔｓｓｈｏｗｔｈａｔｔｈｉｓｍｅｔｈｏｄ′ｓｆｉｖｅｓｔｒａｔｅｇｉｅｓ，ｃｏｍｐａｒｅｄｗｉｔｈｔｈｅｐｒｅｖｉｏｕｓｓｔａｔｅ⁃ｏｆ⁃ｔｈｅ⁃ａｒｔｉｍａｇｅｒｅｔｒｉｅｖａｌｓｔｒａｔｅｇｉｅｓ，ｃａｎｏｂｔａｉｎｂｅｔｔｅｒ，ｉｎｄｅｅｄｅｘｃｅｌｌｅｎｔ，ｐｅｒｆｏｒｍａｎｃｅｉｎｂｏｔｈｔｈｅ＂Ｐｒｅｃｉｓｉｏｎ⁃ Ｒｅｃａｌｌ＂ａｎｄ＂ｍｅａｎＡｖｅｒａｇｅＰｒｅｃｉｓｉｏｎ⁃Ｎｕｍｂｅｒｏｆｂｉｔｓ＂ｍｅｔｒｉｃｓ，ｐｒｏｖｉｎｇｔｈｅｅｆｆｅｃｔｉｖｅｎｅｓｓｏｆｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄｉｎｉｍａｇｅｒｅｔｒｉｅｖａｌ．Ｋｅｙｗｏｒｄｓ：ｉｍａｇｅｒｅｔｒｉｅｖａｌ；ａｒｔｉｆｉｃｉａｌｆｅａｔｕｒｅｓ；ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ；ｃｏｎｖｏｌｕｔｉｏｎａｌｆｅａｔｕｒｅｓ；ｈａｓｈｃｏｄｉｎｇ收稿日期：２０１６⁃０３⁃１７．网络出版日期：２０１６⁃０５⁃１３．基金项目：国家自然科学基金项目（６１４６２０１８）；广西学位与研究生教育改革和发展专项课题（ＪＧＹ２０１４０６０）；广西数字传播与文化软实力中心开放项目（ＺＦＺＤ１４０８００８）；广西高校图像图形智能处理重点实验室开放基金项目（ＬＤ１５０４２Ｘ）．通信作者：龚震霆．Ｅ⁃ｍａｉｌ：ｇｏｎｇｘｓ７＠１６３．ｃｏｍ．基于内容的图像检索是通过对图像内容的分析来搜索相似的图像，近些年一直被多媒体研究者广泛地研究。随着该研究领域的发展，虽然出现了许多新技术，但由于机器获得的低水平图像像素和人

·392· 智能系统学报第11卷类接受的高水平语义概念之间存在语义鸿沟问题，是另外一个具有代表性的方法，其利用非线性函数因此在当前基于内容的图像检索研究中从人类的感沿着数据的主成分分析(principal component analy- 知方面把像素水平的信息和语义信息联系起来仍然 sis,PCA)方向通过设定阈值来产生二进制编码。是最具有挑战的问题。近些年，研究者们使用之后，大量的研究证明，使用监督信息可以提高了一些人工视觉特征去表示图像3，但基于这些哈希编码的学习性能。特别的，文献[14,16,18]在人工特征的图像检索方法的性能一直不是很好。学习中利用数据的标签信息来生成有效的哈希这些挑战来源于人工智能的根本难题。而机器函数。学习是一个很有前景的技术，可以解决这个长期的但是，图像检索中的这些哈希方法都是首先对挑战。深度学习作为机器学习发展的一个分支，其图像提取人工视觉特征，而人工特征不需要获得图动机在于建立模拟人脑进行分析学习的神经网络，像的相似性，因此这通常可能影响这些哈希方法的通过组合低层特征形成更加抽象的高层特征，模仿效果，从而降低了图像检索的性能。人脑的机制来解释数据，如图像、声音、信号和文本，随着2012年Alex等f19的CNN模型在ILSVRC 近些年已得到广泛应用s) 数据集上训练120万数量的带标签图像获得了更高卷积神经网络(convolutional neural network, 的图像分类准确率，最近几年深度卷积特征得到广 CNN)是人工神经网络的一种，由于它的权值共享结泛研究，并在计算机视觉工作上取得了很大的突构和生物神经网络更类似，可以减少权值的数量，从破[20-23]。2014年，Xia等2提出一种监督哈希方法而降低网络模型的复杂度，现已成为深度学习中的 CNNH和CNNH+,该方法首先把训练图像数据成对一个研究热点。目前，CNN已经应用到视频中的人的语义相似度矩阵因式分解成近似哈希编码，然后体动作识别信号重构、人脸等目标检测识别、图像分利用这些近似哈希编码和图像标签训练一个深度卷类等各个领域[8 积网络，取得了更好的性能，但是，CNNH和CNNH+ 鉴于CNN的这些进步，我们可以在图像检索中中的矩阵分解会带来额外的错误，使得训练目标偏利用它的优点来提高检索性能。离。2015年，Guo等2]提出一种直接基于CNN的哈希方法CNNBH,利用阈值O把一个全连接层的激 1 相关工作活值二值化为二进制结果，从而得到哈希编码。同最近邻搜索是机器学习算法的一个基本步骤。时，文献[26]提出一种简单但是非常有效的深度学近些年，网上可使用的数据快速增加，而且数据很容习框架，该框架在文献[19]的深度CNN模型基础易就达到几百或几千维度，因此，在这样一个巨大的上添加一个隐藏层来同时学习特定领域的图像特征数据集上进行穷极线性搜索是不可行的。但是，在表示和一组类哈希函数，并取得了最好的检索性能。一些应用中，寻找近似最近邻(approximate nearest 如今这些优秀的基于CNN的检索方法虽然获 neighbor,ANN)却是十分有效的，其中基于树的方法得了巨大的进展，但是它们并没有把以前最好水准和哈希方法是两个流行的框架。而哈希方法由于在的哈希编码策略联系起来。速度和存储方面的优势，它作为一种ANN方法广泛 2CNN和哈希编码相结合的方法用于大规模图像的检索中。哈希学习是学习一种保持图像相似性的紧密位表示，使得相似的图像能够在图像检索中，如果开始对图像提取的特征不匹配到相近的二进制哈希编码。出色的话，那么后面采用很高水准的哈希编码策略目前，主要流行一些非监督和监督的哈希方进行编码检索也不一定能取得很好的效果。因此法[121]。非监督的哈希方法使用非标签数据来学本文提出一种CNN和以前最好水准的哈希策略相习一组哈希函数[213，)]。其中，最具有代表性的是结合的方法。我们采用文献[28]在MAGENET 使用随机映射构造哈希函数的局部感知哈希(local- Large-scale visual recognition challenge IISVRC ity sensitive Hashing,LSH)2],它意在把相似的数据据集上预训练过的VGGNet-D网络模型对目标图像匹配到相近的二进制编码的概率最大化。然而，集进行特征提取，获得图像的深层卷积特征表示，然 LSH通常需要使用较长的哈希编码才能达到令人满后对这些表示分别采用LSH]、SH)、SKLSHI51 意的精度，这导致了较大的存储空间需求和召回率 ITO!6]、PCA-RR[I6]、DSH18]6种哈希编码策略进行普遍偏低的问题。谱哈希(spectral Hashing,SH)[] 编码得到哈希码，最后进行快速检索。将这些结合

类接受的高水平语义概念之间存在语义鸿沟问题，因此在当前基于内容的图像检索研究中从人类的感知方面把像素水平的信息和语义信息联系起来仍然是最具有挑战的问题［１⁃２］。近些年，研究者们使用了一些人工视觉特征去表示图像［３⁃４］，但基于这些人工特征的图像检索方法的性能一直不是很好。这些挑战来源于人工智能的根本难题。而机器学习是一个很有前景的技术，可以解决这个长期的挑战。深度学习作为机器学习发展的一个分支，其动机在于建立模拟人脑进行分析学习的神经网络，通过组合低层特征形成更加抽象的高层特征，模仿人脑的机制来解释数据，如图像、声音、信号和文本，近些年已得到广泛应用［５⁃７］。卷积神经网络（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ，ＣＮＮ）是人工神经网络的一种，由于它的权值共享结构和生物神经网络更类似，可以减少权值的数量，从而降低网络模型的复杂度，现已成为深度学习中的一个研究热点。目前，ＣＮＮ已经应用到视频中的人体动作识别信号重构、人脸等目标检测识别、图像分类等各个领域［８⁃１１］。鉴于ＣＮＮ的这些进步，我们可以在图像检索中利用它的优点来提高检索性能。１相关工作最近邻搜索是机器学习算法的一个基本步骤。近些年，网上可使用的数据快速增加，而且数据很容易就达到几百或几千维度，因此，在这样一个巨大的数据集上进行穷极线性搜索是不可行的。但是，在一些应用中，寻找近似最近邻（ａｐｐｒｏｘｉｍａｔｅｎｅａｒｅｓｔｎｅｉｇｈｂｏｒ，ＡＮＮ）却是十分有效的，其中基于树的方法和哈希方法是两个流行的框架。而哈希方法由于在速度和存储方面的优势，它作为一种ＡＮＮ方法广泛用于大规模图像的检索中。哈希学习是学习一种保持图像相似性的紧密位表示，使得相似的图像能够匹配到相近的二进制哈希编码。目前，主要流行一些非监督和监督的哈希方法［１２⁃１８］。非监督的哈希方法使用非标签数据来学习一组哈希函数［１２⁃１３，１７］。其中，最具有代表性的是使用随机映射构造哈希函数的局部感知哈希（ｌｏｃａｌ⁃ ｉｔｙｓｅｎｓｉｔｉｖｅＨａｓｈｉｎｇ，ＬＳＨ）［１２］，它意在把相似的数据匹配到相近的二进制编码的概率最大化。然而，ＬＳＨ通常需要使用较长的哈希编码才能达到令人满意的精度，这导致了较大的存储空间需求和召回率普遍偏低的问题。谱哈希（ｓｐｅｃｔｒａｌＨａｓｈｉｎｇ，ＳＨ）［１３］是另外一个具有代表性的方法，其利用非线性函数沿着数据的主成分分析（ｐｒｉｎｃｉｐａｌｃｏｍｐｏｎｅｎｔａｎａｌｙ⁃ ｓｉｓ，ＰＣＡ）方向通过设定阈值来产生二进制编码。之后，大量的研究证明，使用监督信息可以提高哈希编码的学习性能。特别的，文献［１４，１６，１８］在学习中利用数据的标签信息来生成有效的哈希函数。但是，图像检索中的这些哈希方法都是首先对图像提取人工视觉特征，而人工特征不需要获得图像的相似性，因此这通常可能影响这些哈希方法的效果，从而降低了图像检索的性能。随着２０１２年Ａｌｅｘ等［１９］的ＣＮＮ模型在ＩＬＳＶＲＣ数据集上训练１２０万数量的带标签图像获得了更高的图像分类准确率，最近几年深度卷积特征得到广泛研究，并在计算机视觉工作上取得了很大的突破［２０⁃２３］。２０１４年，Ｘｉａ等［２４］提出一种监督哈希方法ＣＮＮＨ和ＣＮＮＨ＋，该方法首先把训练图像数据成对的语义相似度矩阵因式分解成近似哈希编码，然后利用这些近似哈希编码和图像标签训练一个深度卷积网络，取得了更好的性能，但是，ＣＮＮＨ和ＣＮＮＨ＋中的矩阵分解会带来额外的错误，使得训练目标偏离。２０１５年，Ｇｕｏ等［２５］提出一种直接基于ＣＮＮ的哈希方法ＣＮＮＢＨ，利用阈值０把一个全连接层的激活值二值化为二进制结果，从而得到哈希编码。同时，文献［２６］提出一种简单但是非常有效的深度学习框架，该框架在文献［１９］的深度ＣＮＮ模型基础上添加一个隐藏层来同时学习特定领域的图像特征表示和一组类哈希函数，并取得了最好的检索性能。如今这些优秀的基于ＣＮＮ的检索方法虽然获得了巨大的进展，但是它们并没有把以前最好水准的哈希编码策略联系起来。２ＣＮＮ和哈希编码相结合的方法在图像检索中，如果开始对图像提取的特征不出色的话，那么后面采用很高水准的哈希编码策略进行编码检索也不一定能取得很好的效果。因此，本文提出一种ＣＮＮ和以前最好水准的哈希策略相结合的方法。我们采用文献［２８］在ＩＭＡＧＥＮＥＴＬａｒｇｅ⁃ｓｃａｌｅｖｉｓｕａｌｒｅｃｏｇｎｉｔｉｏｎｃｈａｌｌｅｎｇｅ（ＩＬＳＶＲＣ）数据集上预训练过的ＶＧＧＮｅｔ⁃Ｄ网络模型对目标图像集进行特征提取，获得图像的深层卷积特征表示，然后对这些表示分别采用ＬＳＨ［１２］、ＳＨ［１３］、ＳＫＬＳＨ［１５］、ＩＴＱ［１６］、ＰＣＡ⁃ＲＲ［１６］、ＤＳＨ［１８］６种哈希编码策略进行编码得到哈希码，最后进行快速检索。将这些结合 ·３９２· 智能系统学报第１１卷

第3期龚震霆，等：基于卷积神经网络和哈希编码的图像检索方法 ·393. 策略分别命名为LSH-VC、SH-VC、SKLSH-VC、TQ- 2.2 VGGNet-D模型的训练学习 VC、PCA-RR-VC和DSH-VC。和文献[I9]一致，VGGNet-D网络模型使用批 2.1 VGGNet-D网络模型量梯度下降法在ILSVRC数据集上进行训练学习：最近几年，CNN模型在一些目标检测和图像识使用的超参数：批量大小、动量、权重衰减的L,惩罚别中已经获得了令人印象深刻的结果。文献[28] 系数、dropout比率和初始学习率分别设置为256 使用很小卷积核的网络架构，对增加深度进行了全 0.9、0.0005、0.5和0.01，而学习率在验证准确率停面的评估：实验表明，把网络的卷积层深度增加到止增加时减小为原来值的十分之一：网络的每一层 16~19层时可以显著提升性能，设计的网络在ma- 的权重由均值为0和方差为0.01的高斯分布来初 geNet Challenge2014的定位和分类项目上分别获得始化。具体的，该模型的训练学习是最小化其整体代了第一名和第二名的成绩。此外，文献[28]的模型价函数。这里假定有一组数量为m的训练样本集特征对许多不同的计算机视觉任务和数据集有很强 {(x0,y0）,…,(x),y))},对于整体样本，的泛化能力，能够相比或者超过建立在较浅图像特网络整体代价函数可表示为式(1)：征上的更复杂的识别方法。 (W,b) 本文选用文献[28]中优异的VGGNet-D网络模 [2w)-o] 型。VGGNet-D的结构及每层参数设置如表l。表1 VGGNet--D网络模型结构及参数 (1) Tablel VGGNet-D model's structure and parameters 式中：h6(x)是神经网络模型，WD是第1层第j conv1 conv2 conv3 conv4 单元与第l+1层第i单元之间的连接权重，b是隐藏 64×3×3 128×3×3 128×3×3 层神经元的偏置项：式(1)右边是一个减小权重幅 64×3×3 st.1,pad1×st.1,pad1 st.1,pad1× 度的规则化项，可以起到防止过拟合的作用，入来调 st.1,pad I 2 pooling 3 pooling 整代价函数中前后两项的相对重要性。求解式(1) conv5 conv6 conv7 conv8 最小值采用著名的批量梯度下降法最优化算法，而计算J(W,b)对W和b的偏导数时，使用反向传导 256×3×3 256×3×3 256×3×3 512×3×3 算法。 st.1,pad 1 st.1,pad 1 st.1,padl× st.1,pad I 2 pooling 2.3本文策略和以前最好水准的哈希策略针对图像检索中重要的哈希编码部分，下面我 conv9 conv10 convll conv12 们介绍本文方法的6种策略的核心技术。 512×3×3 512×3×3 512×3×3 512×3×3 1)LSH-VC:和LSH)一样，首先使用高斯随机 st.1,pad 1x st.1,pad 1 st.1,pad 1 st.1,pad 1 矩阵将实数输入空间R中的数据点随机映射到一 2 pooling 个R空间中，其中t是一个很小的超常量，接着使 conv13 FC14 FC15 FC16 用球分割方法把这个t维实数空间分割成多个单 512×3×3 4096×7×7 4096×1×1 1000×1×1 元，然后用哈希函数返回含有数据映射点的球单元 st.1,pad1× dropout dropout softmax 的索引，度量标准选用，范数。 2 pooling 2)SH-VC:和SH)一样，基于量化沿着数据 VGGNet-D模型由13卷积层(convI~13)和3 PCA方向计算得到的解析特征函数值。个全连接层(FC14~16)构成。表1中，卷积层的第假设数据集中样本点x:,x属于输人特征空间一行参数表示卷积滤波器的数量和局部感受野的大 R,{y表示n个样本点的长度为k的哈希码，W 小；“st”表示卷积的步幅，“pad”表示空间填充：“x2 是一个关联矩阵，由于输入空间数据之间的欧式距离 pooling”表示max-pooling下采样。接着，FCl4和和相似度相关，那么输入特征空间用高斯核度量相似 FCl5使用dropout!19]方法来调整某些隐含层节点的度W(i)=exp(-lx,-x,2/e2),参数e规定空间权重不工作，最后的FCl6是多路softmax分类器。 R中相似数据的距离，相似的近邻间的平均汉明距其中，VGGNet--D的激活函数使用矫正线性单元 rectification linear unit,ReLU) 离为∑。y:-y己，这样对图像特征向量的哈希编码过程可以表示为式(2)的优化问题：

策略分别命名为ＬＳＨ⁃ＶＣ、ＳＨ⁃ＶＣ、ＳＫＬＳＨ⁃ＶＣ、ＩＴＱ⁃ ＶＣ、ＰＣＡ⁃ＲＲ⁃ＶＣ和ＤＳＨ⁃ＶＣ。２．１ＶＧＧＮｅｔ⁃Ｄ网络模型最近几年，ＣＮＮ模型在一些目标检测和图像识别中已经获得了令人印象深刻的结果。文献［２８］使用很小卷积核的网络架构，对增加深度进行了全面的评估；实验表明，把网络的卷积层深度增加到１６～１９层时可以显著提升性能，设计的网络在Ｉｍａ⁃ ｇｅＮｅｔＣｈａｌｌｅｎｇｅ２０１４的定位和分类项目上分别获得了第一名和第二名的成绩。此外，文献［２８］的模型特征对许多不同的计算机视觉任务和数据集有很强的泛化能力，能够相比或者超过建立在较浅图像特征上的更复杂的识别方法。本文选用文献［２８］中优异的ＶＧＧＮｅｔ⁃Ｄ网络模型。ＶＧＧＮｅｔ⁃Ｄ的结构及每层参数设置如表１。表１ＶＧＧＮｅｔ⁃Ｄ网络模型结构及参数Ｔａｂｌｅ１ＶＧＧＮｅｔ⁃Ｄｍｏｄｅｌ’ｓｓｔｒｕｃｔｕｒｅａｎｄｐａｒａｍｅｔｅｒｓｃｏｎｖ１ｃｏｎｖ２ｃｏｎｖ３ｃｏｎｖ４６４×３×３ｓｔ．１，ｐａｄ１６４×３×３ｓｔ．１，ｐａｄ１× ２ｐｏｏｌｉｎｇ１２８×３×３ｓｔ．１，ｐａｄ１１２８×３×３ｓｔ．１，ｐａｄ１× ３ｐｏｏｌｉｎｇｃｏｎｖ５ｃｏｎｖ６ｃｏｎｖ７ｃｏｎｖ８２５６×３×３ｓｔ．１，ｐａｄ１２５６×３×３ｓｔ．１，ｐａｄ１２５６×３×３ｓｔ．１，ｐａｄ１× ２ｐｏｏｌｉｎｇ５１２×３×３ｓｔ．１，ｐａｄ１ｃｏｎｖ９ｃｏｎｖ１０ｃｏｎｖ１１ｃｏｎｖ１２５１２×３×３ｓｔ．１，ｐａｄ１５１２×３×３ｓｔ．１，ｐａｄ１× ２ｐｏｏｌｉｎｇ５１２×３×３ｓｔ．１，ｐａｄ１５１２×３×３ｓｔ．１，ｐａｄ１ｃｏｎｖ１３ＦＣ１４ＦＣ１５ＦＣ１６５１２×３×３ｓｔ．１，ｐａｄ１× ２ｐｏｏｌｉｎｇ４０９６×７×７ｄｒｏｐｏｕｔ４０９６×１×１ｄｒｏｐｏｕｔ１０００×１×１ｓｏｆｔｍａｘＶＧＧＮｅｔ⁃Ｄ模型由１３卷积层（ｃｏｎｖ１～１３）和３个全连接层（ＦＣ１４～１６）构成。表１中，卷积层的第一行参数表示卷积滤波器的数量和局部感受野的大小；“ｓｔ．”表示卷积的步幅，“ｐａｄ”表示空间填充；“ｘ２ｐｏｏｌｉｎｇ” 表示ｍａｘ⁃ｐｏｏｌｉｎｇ下采样。接着，ＦＣ１４和ＦＣ１５使用ｄｒｏｐｏｕｔ［１９］方法来调整某些隐含层节点的权重不工作，最后的ＦＣ１６是多路ｓｏｆｔｍａｘ分类器。其中，ＶＧＧＮｅｔ⁃Ｄ的激活函数使用矫正线性单元（ｒｅｃｔｉｆｉｃａｔｉｏｎｌｉｎｅａｒｕｎｉｔ，ＲｅＬＵ）。２．２ＶＧＧＮｅｔ⁃Ｄ模型的训练学习和文献［１９］一致，ＶＧＧＮｅｔ⁃Ｄ网络模型使用批量梯度下降法在ＩＬＳＶＲＣ数据集上进行训练学习；使用的超参数：批量大小、动量、权重衰减的ｌ２惩罚系数、ｄｒｏｐｏｕｔ比率和初始学习率分别设置为２５６、０．９、０．０００５、０．５和０．０１，而学习率在验证准确率停止增加时减小为原来值的十分之一；网络的每一层的权重由均值为０和方差为０．０１的高斯分布来初始化。具体的，该模型的训练学习是最小化其整体代价函数。这里假定有一组数量为ｍ的训练样本集ｘ (ｌ) ，ｙ (ｌ) ( ) ，…，ｘ (ｍ ) ，ｙ (ｍ ) { ( ) } ，对于整体样本，网络整体代价函数可表示为式（１）：Ｊ (Ｗ，ｂ) ＝１ｍ ∑ ｍｉ＝１１２ ‖ｈＷ，ｂｘ (ｉ) ( ) －ｙ æ (ｉ) ‖２ è ç ö ø ÷ é ë ê ê ù û ú ú ＋ λ ２ ∑ ｎｌ－１ｌ＝１ ∑ ｓｌｉ＝１ ∑ ｓｌ＋１ｊ＝１Ｗｊｉ (ｌ) ( ) ２（１）式中：ｈＷ，ｂ (ｘ) 是神经网络模型，Ｗｉ，ｊ (ｌ) 是第ｌ层第ｊ单元与第ｌ＋１层第ｉ单元之间的连接权重，ｂ是隐藏层神经元的偏置项；式（１）右边是一个减小权重幅度的规则化项，可以起到防止过拟合的作用，λ 来调整代价函数中前后两项的相对重要性。求解式（１）最小值采用著名的批量梯度下降法最优化算法，而计算Ｊ (Ｗ，ｂ) 对Ｗ和ｂ的偏导数时，使用反向传导算法。２．３本文策略和以前最好水准的哈希策略针对图像检索中重要的哈希编码部分，下面我们介绍本文方法的６种策略的核心技术。１）ＬＳＨ⁃ＶＣ：和ＬＳＨ［２７］一样，首先使用高斯随机矩阵将实数输入空间Ｒｄ中的数据点随机映射到一个Ｒｔ空间中，其中ｔ是一个很小的超常量，接着使用球分割方法把这个ｔ维实数空间分割成多个单元，然后用哈希函数返回含有数据映射点的球单元的索引，度量标准选用ｌ１范数。２）ＳＨ⁃ＶＣ：和ＳＨ［１３］一样，基于量化沿着数据ＰＣＡ方向计算得到的解析特征函数值。假设数据集中样本点ｘｉ，ｘｊ属于输入特征空间Ｒｄ，{ｙ} ｎｉ＝１表示ｎ个样本点的长度为ｋ的哈希码，Ｗｎ×ｎ是一个关联矩阵，由于输入空间数据之间的欧式距离和相似度相关，那么输入特征空间用高斯核度量相似度Ｗ(ｉ，ｊ) ＝ｅｘｐ－‖ｘｉ－ｘｊ‖２／ ε ２ ( ) ，参数 ε 规定空间Ｒｄ中相似数据的距离，相似的近邻间的平均汉明距离为 ∑ｉｊＷｉ，ｊ ‖ｙｉ－ｙｊ‖２，这样对图像特征向量的哈希编码过程可以表示为式（２）的优化问题：第３期龚震霆，等：基于卷积神经网络和哈希编码的图像检索方法 ·３９３·

·394. 智能系统学报第11卷 minimize: ∑wy:-y2 阵来初始化旋转矩阵R,W是数据PCA方向的矩 st.y》:∈{-1,1}4 阵，PCA-RR-VC策略采用映射矩阵W=WR,将经过 PCA处理后的数据集V乘以随机正交矩阵R进行 ∑y:=0 (2) 旋转变换；而TQ-VC策略中使用的映射矩阵市中 Σw=1 的R是经过优化的量化误差最低的正交矩阵，这个优化问题，即找出最优的正交旋转矩阵R和与之对式中：约束条件∑y:=0要求哈希码的每一位有应的哈希编码矩阵B,采用交替迭代的求解方法来 50%的概率是0或1，同时约束条件∑yy=1要解决。 5)DSH-VC:和DSH[18]一样，通过k均值聚类求哈希码每位之间不相关。这个优化问题等价于一的量化结果，寻找r-adjacent组，即利用数据的几何个平衡图分割问题，是一个NP-hard问题，对相似图结构来指导哈希函数映射的选择。的拉普拉斯矩阵的特征向量特征值的分析可为该问假设有n个训练数据样本x1,2,…,xn∈R,L 题提供一个松弛解。首先，使用PCA找出数据的主是数据哈希编码的长度，参数α控制样本被分组的成分，然后沿着每一个PCA方向使用矩形近似来计数量。首先使用k均值算法迭代p次生成中心点分算k个最小的单维度解析特征函数，最后在0处阈值别为4142，…u的aL个分组S={S,S2,…,S}, 化解析特征函数，从而获得二进制编码。 3)SKLSH-VC:和SKLSH15]一样，基于随机映其中k,区，=1,2，…，4，定义分组的r最射，适应任意分布的样本数据，在映射过程中不仅保近邻矩阵W为式(3)：留了原始数据之间的位置关系，而且考虑了生成的 E=,“EN,)or4eN,4)( 3) 哈希码之间归一化的汉明距离的上下限。考虑D维实数空间R上的一个核函数K 式中：N,()表示中心4：的最近邻集合。当且仅当 (·,·)对于所有数据点x,y∈R满足下列条件： W=1时，组S:和组S,为r-adjacent组（相比于随机 ①K(·,·)具有平移不变性，例如K(x,y)=K 映射，选取能够很好分开两个adjacent组的映射)，在生成所有的r-adjacent组后，对每一对adjacent组 (x-y)。产生映射心和截距t,接着利用带有权值的中心计 ②K(·,·)是归一化的，例如K(x-y)≤1，而且K(x-x)=K(0)=1。算所有候选映射的嫡，按降序对嫡值进行排序，最后 ③对于任何实数a≥1，K(ax,ay)≤K(x-y）。使用前L个映射并根据哈希映射函数式(4)来生成二进制编码：高斯核函数K(x,y)=exp(-yIx-yI2/2)或者拉普拉斯核函数K(x,y)=exp(-y‖x-y‖)是满足上面条件的两个著名样例，我们构建一个映射函数 h()=0, 1, w'x≥t (4) 否则 ,先将原始R空间中的数据映射到低维空间，得式中h(x)是样本空间R中样本x的哈希函数。到数据的随机傅里叶特征，确保平移不变核值没有 3实验结果与分析变化，再对随机傅里叶特征映进行随机二值量化，从而得到二进制哈希码。本文将在Caltech101]和Caltech2568]2个著 4)ITQ-VC、PCA-RR-VC:和ITQ、PCA-RR[I6]一名的图像集上对LSH-VC、SH-VC、SKLSH-VC、TQ- 样，对数据集进行PCA降维处理，问题转化为将该 VC、PCA-RR-VC、DSH-VC等6种策略和LSH、SH、数据集中的数据样本点映射到一个以零为中心的二 SKLSH、TQ、PCA-RR、DSH这些以前最好水准的图进制超立方体的顶点上，不同的量化误差得到对应像哈希检索策略进行对比实验。该数据集的不同的二进制编码。我们通过精度-召回率(Precision-Recall)和平假设有一组数据点{x1,x2,…,xn},x:∈R形成均正确率值-编码位数(mAP-Number of bits)两种标数据集矩阵X∈R,且以0为中心，目标是学习二准对本文方法进行性能评估。实验中，本文使用数据集第50个最近邻的平均距离作为阈值来判断一进制哈希编码矩阵Be{-1,1}x,c是编码长度，这个查询到的数据是否和查询数据属于同一类。样整个编码过程可以表示为B=sgm(XW),W是映实验环境：64位Win8系统，CPU主频射矩阵。 2.50GHz,8 Gbyte内存，MATLAB2014a。对随机生成的矩阵进行奇异值分解(singular 3.1 Caltech101 value decomposition,SVD)得到对应的cxc的正交矩 Caltechl01数据集包含8677张图片，共101个

ｍｉｎｉｍｉｚｅ：∑ｉｊＷｉ，ｊ ‖ｙｉ－ｙｊ‖２ｓ．ｔ．ｙｉ ∈ { －１，１} ｋ ∑ｉｙｉ＝０１ｎ ∑ｉｙｉｙｉＴ＝Ｉ（２）式中：约束条件∑ｉｙｉ＝０要求哈希码的每一位有５０％的概率是０或１，同时约束条件１ｎ ∑ｉｙｉｙＴｉ＝Ｉ要求哈希码每位之间不相关。这个优化问题等价于一个平衡图分割问题，是一个ＮＰ⁃ｈａｒｄ问题，对相似图的拉普拉斯矩阵的特征向量特征值的分析可为该问题提供一个松弛解。首先，使用ＰＣＡ找出数据的主成分，然后沿着每一个ＰＣＡ方向使用矩形近似来计算ｋ个最小的单维度解析特征函数，最后在０处阈值化解析特征函数，从而获得二进制编码。３）ＳＫＬＳＨ⁃ＶＣ：和ＳＫＬＳＨ［１５］一样，基于随机映射，适应任意分布的样本数据，在映射过程中不仅保留了原始数据之间的位置关系，而且考虑了生成的哈希码之间归一化的汉明距离的上下限。考虑Ｄ维实数空间ＲＤ上的一个核函数Ｋ (·，·) 对于所有数据点ｘ，ｙ∈ＲＤ满足下列条件： ①Ｋ (·，·) 具有平移不变性，例如Ｋ (ｘ，ｙ) ＝Ｋ（ｘ－ｙ）。 ②Ｋ(·，·) 是归一化的，例如Ｋ (ｘ－ｙ) ≤１，而且Ｋ(ｘ－ｘ) ≡Ｋ(０) ＝１。 ③对于任何实数 α≥１，Ｋ(αｘ，αｙ) ≤Ｋ（ｘ－ｙ）。高斯核函数Ｋ(ｘ，ｙ) ＝ｅｘｐ－γ ‖ｘ－ｙ‖２ ( ／２) 或者拉普拉斯核函数Ｋ(ｘ，ｙ) ＝ｅｘｐ－γ ‖ｘ－ｙ‖１ ( ) 是满足上面条件的两个著名样例，我们构建一个映射函数Ｆｎ，先将原始ＲＤ空间中的数据映射到低维空间，得到数据的随机傅里叶特征，确保平移不变核值没有变化，再对随机傅里叶特征映进行随机二值量化，从而得到二进制哈希码。４）ＩＴＱ⁃ＶＣ、ＰＣＡ⁃ＲＲ⁃ＶＣ：和ＩＴＱ、ＰＣＡ⁃ＲＲ［１６］一样，对数据集进行ＰＣＡ降维处理，问题转化为将该数据集中的数据样本点映射到一个以零为中心的二进制超立方体的顶点上，不同的量化误差得到对应该数据集的不同的二进制编码。假设有一组数据点｛ｘ１，ｘ２，…，ｘｎ｝，ｘｉ∈Ｒｄ形成数据集矩阵Ｘ∈Ｒｎ×ｄ，且以０为中心，目标是学习二进制哈希编码矩阵Ｂ∈{－１，１} ｎ×ｃ，ｃ是编码长度，这样整个编码过程可以表示为Ｂ＝ｓｇｎ（ＸＷ），Ｗ是映射矩阵。对随机生成的矩阵进行奇异值分解（ｓｉｎｇｕｌａｒｖａｌｕｅｄｅｃｏｍｐｏｓｉｔｉｏｎ，ＳＶＤ）得到对应的ｃ×ｃ的正交矩阵来初始化旋转矩阵Ｒ，Ｗ是数据ＰＣＡ方向的矩阵，ＰＣＡ⁃ＲＲ⁃ＶＣ策略采用映射矩阵Ｗ＝ＷＲ，将经过ＰＣＡ处理后的数据集Ｖ乘以随机正交矩阵Ｒ进行旋转变换；而ＩＴＱ⁃ＶＣ策略中使用的映射矩阵Ｗ中的Ｒ是经过优化的量化误差最低的正交矩阵，这个优化问题，即找出最优的正交旋转矩阵Ｒ和与之对应的哈希编码矩阵Ｂ，采用交替迭代的求解方法来解决。５）ＤＳＨ⁃ＶＣ：和ＤＳＨ［１８］一样，通过ｋ均值聚类的量化结果，寻找ｒ⁃ａｄｊａｃｅｎｔ组，即利用数据的几何结构来指导哈希函数映射的选择。假设有ｎ个训练数据样本ｘ１，ｘ２，…，ｘｎ∈Ｒｄ，Ｌ是数据哈希编码的长度，参数 α 控制样本被分组的数量。首先使用ｋ均值算法迭代ｐ次生成中心点分别为 μ１，μ２，…，μαＬ的 αＬ个分组Ｓ＝Ｓ１，Ｓ２，…，ＳαＬ { } ，其中 μｉ＝１Ｓｉ ∑ｘ∈Ｓｉｘ，ｌｉ＝１，２，…，αＬ，定义分组的ｒ最近邻矩阵Ｗ为式（３）：Ｗｉ，ｊ＝１， μｉ ∈ Ｎｒ μｊ ( ) ｏｒ μｊ ∈ Ｎｒ μｉ ( ) {０，否则（３）式中：Ｎｒ μｉ ( ) 表示中心 μｉ的最近邻集合。当且仅当Ｗｉｊ＝１时，组Ｓｉ和组Ｓｊ为ｒ⁃ａｄｊａｃｅｎｔ组（相比于随机映射，选取能够很好分开两个ａｄｊａｃｅｎｔ组的映射），在生成所有的ｒ⁃ａｄｊａｃｅｎｔ组后，对每一对ａｄｊａｃｅｎｔ组产生映射ｗ和截距ｔ，接着利用带有权值的中心计算所有候选映射的熵，按降序对熵值进行排序，最后使用前Ｌ个映射并根据哈希映射函数式（４）来生成二进制编码：ｈ(ｘ) ＝１，ｗＴｘ ≥ ｔ {０，否则（４）式中ｈ(ｘ) 是样本空间Ｒｄ中样本ｘ的哈希函数。３实验结果与分析本文将在Ｃａｌｔｅｃｈ１０１［１７］和Ｃａｌｔｅｃｈ２５６［１８］２个著名的图像集上对ＬＳＨ⁃ＶＣ、ＳＨ⁃ＶＣ、ＳＫＬＳＨ⁃ＶＣ、ＩＴＱ⁃ ＶＣ、ＰＣＡ⁃ＲＲ⁃ＶＣ、ＤＳＨ⁃ＶＣ等６种策略和ＬＳＨ、ＳＨ、ＳＫＬＳＨ、ＩＴＱ、ＰＣＡ⁃ＲＲ、ＤＳＨ这些以前最好水准的图像哈希检索策略进行对比实验。我们通过精度－召回率（Ｐｒｅｃｉｓｉｏｎ⁃Ｒｅｃａｌｌ）和平均正确率值－编码位数（ｍＡＰ⁃Ｎｕｍｂｅｒｏｆｂｉｔｓ）两种标准对本文方法进行性能评估。实验中，本文使用数据集第５０个最近邻的平均距离作为阈值来判断一个查询到的数据是否和查询数据属于同一类。实验环境：６４位Ｗｉｎ８系统，ＣＰＵ主频２．５０ＧＨｚ，８Ｇｂｙｔｅ内存，ＭＡＴＬＡＢ２０１４ａ。３．１Ｃａｌｔｅｃｈ１０１Ｃａｌｔｅｃｈ１０１数据集包含８６７７张图片，共１０１个 ·３９４· 智能系统学报第１１卷

·396· 智能系统学报第11卷图3中，使用CNN特征的本文6种策略的mAP 1.0 值明显高于以前最好水准的对应的使用gst特征的 0.9 e 检索策略(16和64位编码时SKLSH-VC略差于 0 SKLSH):同样的，LSH-VC、ITQ-VC、PCA-RR-VC和 05 DSH-VC的优势更明显。其中TQ-VC在不同的编 0.5 码位数时一直拥有最高的mAP值，相比于TQ策略 0.4 -LSH-VC 分别提升了103.0%、105.7%、97.2%、93.4%、89.3%， 0.3 SH-VC SKLSH-VC 效果显著。 02 ◆-ITQ-VC 01 PCA-RR-VC -DSH-VC 0.6 02 0.4 0.6 0.8 1.0 0.5 Recall 04 (c)l28位编码时Precision-Recall曲线 E 0.31 1.0 -e-LSH 0.9 0.2 -SH --SKLSH 0.1 ★一TQ 0.7 PCA-RR -e-DSH 0.6 0.5 16 32 64 128 256 % 编码长度 -eLSH-VC 0.3 SH-VC (a)gist特征下不同编码位数时mPA值 SKLSH-VC 02 ITQ-VC PCA-RR-VC e-DSH-V℃ 1.0 0 0.2 0.40.6 0.8 1.0 Recall 0.8 (d)256位编码时Precision-Recall曲线图2本文方法6种策略在Caltech101上的Precision- 0.6 Recall曲线 0.5 Fig.2 The Precision-Recall curve of the six strategies 04 -LSH-VC on Caltech 101 03 SH-VC SKLSH-VC 对比图1和图2，我们清楚地看到，本文的6种 02 ITO-VC PCA-RR-VC 0.1 图像检索策略相比于以前最好水准的对应的策略有 --DSH-VC 更优的Precision-Recall曲线(64位编码时SKLSH 32 64 128 256 编码长度 VC略差于SKLSH);其中LSH-VC、ITQ-VC、PCA- RR-VC和DSH-VC的优势更明显。依赖数据的策略(ITQ、ITQ-VC、PCA-RR、PCA-RR-VC和SH、SH- (b)cnn特征下不同编码位数时mPA值 VC)在gist和CNN特征下随着编码位数的增加都图3所有策略在Caltech101上的mAP值会遇到性能瓶颈，而独立于数据的SKLSH和 Fig.3 The mean average precision of all strategies on Caltech 101 SKLSH-VC策略就没有这种限制。此外，图2表明TQ-VC和PCA-RR-VC在编码 3.2 Caltech256 位数较小时，相比于本文其他4种策略在相同召回 Caltech256数据集包含29780张图片，共256 率情况下的准确率有更大的优势。 2)mAP是反映一个方法在全部相关数据上性个类别，相比于Caltech1(01,类与类之间和每类中图能的单值指标。利用该方法检索出来的相关数据的像主体位置变化更明显，十分适合于图像检索实验。排位越靠前，mAP就可能越高。本文方法在mAP 为了公平地对比，实验中，所有策略同样都是随机选 Number of bits标准上的实验结果如图3。取1000张作为测试图像

（ｃ）１２８位编码时Ｐｒｅｃｉｓｉｏｎ⁃Ｒｅｃａｌｌ曲线（ｄ）２５６位编码时Ｐｒｅｃｉｓｉｏｎ⁃Ｒｅｃａｌｌ曲线图２本文方法６种策略在Ｃａｌｔｅｃｈ１０１上的Ｐｒｅｃｉｓｉｏｎ⁃ Ｒｅｃａｌｌ曲线Ｆｉｇ．２ＴｈｅＰｒｅｃｉｓｉｏｎ⁃ＲｅｃａｌｌｃｕｒｖｅｏｆｔｈｅｓｉｘｓｔｒａｔｅｇｉｅｓｏｎＣａｌｔｅｃｈ１０１对比图１和图２，我们清楚地看到，本文的６种图像检索策略相比于以前最好水准的对应的策略有更优的Ｐｒｅｃｉｓｉｏｎ⁃Ｒｅｃａｌｌ曲线（６４位编码时ＳＫＬＳＨ⁃ ＶＣ略差于ＳＫＬＳＨ）；其中ＬＳＨ⁃ＶＣ、ＩＴＱ⁃ＶＣ、ＰＣＡ⁃ ＲＲ⁃ＶＣ和ＤＳＨ⁃ＶＣ的优势更明显。依赖数据的策略（ＩＴＱ、ＩＴＱ⁃ＶＣ、ＰＣＡ⁃ＲＲ、ＰＣＡ⁃ＲＲ⁃ＶＣ和ＳＨ、ＳＨ⁃ ＶＣ）在ｇｉｓｔ和ＣＮＮ特征下随着编码位数的增加都会遇到性能瓶颈，而独立于数据的ＳＫＬＳＨ和ＳＫＬＳＨ⁃ＶＣ策略就没有这种限制。此外，图２表明ＩＴＱ⁃ＶＣ和ＰＣＡ⁃ＲＲ⁃ＶＣ在编码位数较小时，相比于本文其他４种策略在相同召回率情况下的准确率有更大的优势。２）ｍＡＰ是反映一个方法在全部相关数据上性能的单值指标。利用该方法检索出来的相关数据的排位越靠前，ｍＡＰ就可能越高。本文方法在ｍＡＰ⁃ Ｎｕｍｂｅｒｏｆｂｉｔｓ标准上的实验结果如图３。图３中，使用ＣＮＮ特征的本文６种策略的ｍＡＰ值明显高于以前最好水准的对应的使用ｇｉｓｔ特征的检索策略（１６和６４位编码时ＳＫＬＳＨ⁃ＶＣ略差于ＳＫＬＳＨ）；同样的，ＬＳＨ⁃ＶＣ、ＩＴＱ⁃ＶＣ、ＰＣＡ⁃ＲＲ⁃ＶＣ和ＤＳＨ⁃ＶＣ的优势更明显。其中ＩＴＱ⁃ＶＣ在不同的编码位数时一直拥有最高的ｍＡＰ值，相比于ＩＴＱ策略分别提升了１０３．０％、１０５．７％、９７．２％、９３．４％、８９．３％，效果显著。（ａ）ｇｉｓｔ特征下不同编码位数时ｍＰＡ值（ｂ）ｃｎｎ特征下不同编码位数时ｍＰＡ值图３所有策略在Ｃａｌｔｅｃｈ１０１上的ｍＡＰ值Ｆｉｇ．３ＴｈｅｍｅａｎａｖｅｒａｇｅｐｒｅｃｉｓｉｏｎｏｆａｌｌｓｔｒａｔｅｇｉｅｓｏｎＣａｌｔｅｃｈ１０１３．２Ｃａｌｔｅｃｈ２５６Ｃａｌｔｅｃｈ２５６数据集包含２９７８０张图片，共２５６个类别，相比于Ｃａｌｔｅｃｈ１０１，类与类之间和每类中图像主体位置变化更明显，十分适合于图像检索实验。为了公平地对比，实验中，所有策略同样都是随机选取１０００张作为测试图像。 ·３９６· 智能系统学报第１１卷

·398 智能系统学报第11卷著：结合前面的实验中TQ-VC一直有最好的性能 1.0 -e-LSH-VC SH-VC 表现，可以得知基于人工特征的性能较好的编码策 0.9 SKLSH-VC ITO-VC 略在深层卷积特征下依旧能够获得较好的性能。 PCA-RR-VC 0.7 DSH-VC 0.6 。 6 0.5 0.4 0.4 03 2 0.3 eLSH 0.2 一SH 0.2 0.40.6 0.8 1.0 -SKLSH Recall ★一1TO -PCA-RR (c)l28位编码时Precision-Recall曲线 -e-DSH 16 32 64 128 256 编码长度 1.0 0.9 (a)Gist特征下不同编码位数时mAP值 0.8 0.7 0.9 0.6 08 0.5 0 0.4 -e-LSH-VC 0.3 一SH-VC SKLSH-VC 0.2 ITO-VC 0.1 PCA-RR-VC 0.4 -DSH-VC 0 0.3 -e-LSH-VC 0.2 SH-VC 0.40.6 0.8 1.0 02 -0-SKLSH-VO Recall ◆ITQ-VC 0.1 PCA-RR-VC (d)256位编码时Precision-Recall曲线 --DSH-VC 图5本文方法6种策略在Caltech256上的Precision- 16 32 64 28 256 Recall曲线编码长度 Fig.5 The Precision-Recall curve of the six strategies (b)cnn特征下不同编码位数时mAP值 on Caltech 256 图6所有策略在Caltech.256上的mAP值对比图4、5，可以看到本文方法的5种策略相 Fig.6 The mean Average Precision of all strategies on 比于以前最好水准的对应策略具有更好的Preci- Caltech 256 sion-Recall曲线(SKLSH-VC除外)。随着编码位数在Caltech101和Caltech256数据集上的两组实增加，TQ-VC、PCA-RR-VC和SH-VC似乎达到了性验充分说明了使用CNN的卷积特征进行哈希编码能的上限，而LSH-VC在CNN特征下却不受这个限检索能够获得一定程度的性能提升。制，性能提升迅速。同时，可以清楚地看到结合 4结束语 CNN特征的TQ-VC检索策略在4种不同的编码位数下都具有最优的Precision-Recall曲线。在图像检索上，本文提出一种结合CNN和以前 2)在mean Average Precision-Number of bits标最好水准的哈希编码策略的有效方法。首先，采用准上的实验结果如图6。分析图6，相比以前最好水 VGGNet-D网络模型对目标图像集提取图像的深层准的对应策略，使用CNN特征的本文5种策略获得特征表示，再使用以前最好水准的哈希编码策略把了更高的mAP值(SKLSH-VC除外)。ITQ-VC在所这些特征编码成二进制码。实验结果显示，本文方有编码位数下一直有最高的mAP值，分别为0.401、法的LSH-VC、SH-VC、ITQ-VC、PCA-RR-VC和DSH 0.665、0.785、0.849和0.886，在TQ上提高了 VC策略相比于以前最好水准的对应策略获得了更 74.2%、116.8%、109.5%、107.4%和103.3%，效果显高的性能。同时本文方法表明，当CNN这种最先进

（ｃ）１２８位编码时Ｐｒｅｃｉｓｉｏｎ⁃Ｒｅｃａｌｌ曲线（ｄ）２５６位编码时Ｐｒｅｃｉｓｉｏｎ⁃Ｒｅｃａｌｌ曲线图５本文方法６种策略在Ｃａｌｔｅｃｈ２５６上的Ｐｒｅｃｉｓｉｏｎ－Ｒｅｃａｌｌ曲线Ｆｉｇ．５ＴｈｅＰｒｅｃｉｓｉｏｎ⁃ＲｅｃａｌｌｃｕｒｖｅｏｆｔｈｅｓｉｘｓｔｒａｔｅｇｉｅｓｏｎＣａｌｔｅｃｈ２５６对比图４、５，可以看到本文方法的５种策略相比于以前最好水准的对应策略具有更好的Ｐｒｅｃｉ⁃ ｓｉｏｎ⁃Ｒｅｃａｌｌ曲线（ＳＫＬＳＨ⁃ＶＣ除外）。随着编码位数增加，ＩＴＱ⁃ＶＣ、ＰＣＡ⁃ＲＲ⁃ＶＣ和ＳＨ⁃ＶＣ似乎达到了性能的上限，而ＬＳＨ⁃ＶＣ在ＣＮＮ特征下却不受这个限制，性能提升迅速。同时，可以清楚地看到结合ＣＮＮ特征的ＩＴＱ⁃ＶＣ检索策略在４种不同的编码位数下都具有最优的Ｐｒｅｃｉｓｉｏｎ⁃Ｒｅｃａｌｌ曲线。２）在ｍｅａｎＡｖｅｒａｇｅＰｒｅｃｉｓｉｏｎ⁃Ｎｕｍｂｅｒｏｆｂｉｔｓ标准上的实验结果如图６。分析图６，相比以前最好水准的对应策略，使用ＣＮＮ特征的本文５种策略获得了更高的ｍＡＰ值（ＳＫＬＳＨ⁃ＶＣ除外）。ＩＴＱ⁃ＶＣ在所有编码位数下一直有最高的ｍＡＰ值，分别为０．４０１、０．６６５、０．７８５、０．８４９和０．８８６，在ＩＴＱ上提高了７４．２％、１１６．８％、１０９．５％、１０７．４％和１０３．３％，效果显著；结合前面的实验中ＩＴＱ⁃ＶＣ一直有最好的性能表现，可以得知基于人工特征的性能较好的编码策略在深层卷积特征下依旧能够获得较好的性能。（ａ）Ｇｉｓｔ特征下不同编码位数时ｍＡＰ值（ｂ）ｃｎｎ特征下不同编码位数时ｍＡＰ值图６所有策略在Ｃａｌｔｅｃｈ２５６上的ｍＡＰ值Ｆｉｇ．６ＴｈｅｍｅａｎＡｖｅｒａｇｅＰｒｅｃｉｓｉｏｎｏｆａｌｌｓｔｒａｔｅｇｉｅｓｏｎＣａｌｔｅｃｈ２５６在Ｃａｌｔｅｃｈ１０１和Ｃａｌｔｅｃｈ２５６数据集上的两组实验充分说明了使用ＣＮＮ的卷积特征进行哈希编码检索能够获得一定程度的性能提升。４结束语在图像检索上，本文提出一种结合ＣＮＮ和以前最好水准的哈希编码策略的有效方法。首先，采用ＶＧＧＮｅｔ⁃Ｄ网络模型对目标图像集提取图像的深层特征表示，再使用以前最好水准的哈希编码策略把这些特征编码成二进制码。实验结果显示，本文方法的ＬＳＨ⁃ＶＣ、ＳＨ⁃ＶＣ、ＩＴＱ⁃ＶＣ、ＰＣＡ⁃ＲＲ⁃ＶＣ和ＤＳＨ⁃ ＶＣ策略相比于以前最好水准的对应策略获得了更高的性能。同时本文方法表明，当ＣＮＮ这种最先进 ·３９８· 智能系统学报第１１卷

第3期龚震霆，等：基于卷积神经网络和哈希编码的图像检索方法 ·399. 的技术在图像检索领域迅猛发展的时候，一些先前 learning representations.Banff,Canada,2014. 经典的哈希编码策略仍不能忽略，这将在图像检索 [12]GIONIS A,INDYK P,MOTWANI R.Similarity search in 应用上具有一定的参考价值。另外，我们还有若干 high dimensions via hashing[C//Proceedings of the 25th 问题有待解决，如卷积特征并不是对所有的哈希编 international conference on very large data bases.San Fran- cisco,CA,USA,1999:518-529. 码策略都有效，这些问题有待进一步研究。 [13]WEISS Y,TORRALBA A,FERGUS R.Spectral hashing 参考文献： [C]//Proceedings of conference on neural information processing systems.Vancouver,British Columbia,Cana- [1]SMEULDERS A W M,WORRING M,SANTINI S,et al. da.2008:1753-1760. Content-based image retrieval at the end of the early years [14]KULIS B,DARRELL T.Learning to hash with binary re- [J].IEEE transactions on pattern analysis and machine in- constructive embeddings[C]//Advances in neural informa- telligence,2000,22(12):1349-1380. tion processing systems 22:23rd annual conference on [2]WAN Ji,WANG Dayong,HOI S C H,et al.Deep learning neural information processing systems 2009.Vancouver, for content-based image retrieval:a comprehensive study British Columbia,Canada,2010:1042-1050. [C]//Proceedings of the 22nd ACM international confer- [15 RAGINSKY M,LAZEBNIK S.Locality-sensitive binary ence on multimedia.Orlando,USA,2014:157-166. codes from shift-invariant kernels[C]//Advances in neu- [3]LOWE D G.Distinctive Image features from scale-invariant ral information processing systems 22:conference on neu- keypoints[J].International journal of computer vision, ral information processing systems 2009.Vancouver, 2004,60(2):91-110. British Columbia,Canada,2009:1509-1517. [4]BAY H,TUYTELAARS T,VAN GOOL L.SURF:speeded [16]GONG Yunchao,LAZEBNIK S,GORDO A,et al.Itera- up robust features M ]//LEONARDIS A,BISCHOF H, tive quantization:a procrustean approach to learning binary PINZ A.Computer vision-ECCV 2006.Berlin Heidelberg: codes for large-scale image retrieval.IEEE transactions Springer,2006:404-417. on pattern analysis and machine intelligence,2013,35 [5]SARIKAYA R,HINTON G E,DEORAS A.Application of (12):2916-2929. deep belief networks for natural language understanding[J]. [17]NOROUZI M,FLEET D J.Minimal loss hashing for com- IEEE/ACM transactions on audio,speech,and language pact binary codes[C]//Proceedings of the 28th interna- processing,2014,22(4):778-784. tional conference on machine learning.Bellevue,WA, [6]LANDECKER W,CHARTRAND R,DEDEO S.Robust USA,2011:353-360. sparse coding and compressed sensing with the difference [18 JIN Zhongming,LI Cheng,LIN Yue,et al.Density sensi- map[C]//Proceedings of the 13th European conference on tive hashing[J].IEEE transactions on cybernetics,2014, computer vision.Zurich,Switzerland,2014:315-329. 44(8):1362-1371. [7]GRAVES A,MOHAMED A R,HINTON G.Speech recog- [19]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Ima- nition with deep recurrent neural networks[C]//Proceed- geNet classification with deep convolutional neural net- ings of the IEEE international conference on acoustic speech works[C]//Advances in Neural Information Processing and signal processing.Vancouver,British Columbia,Cana- Systems 25.Lake Tahoe,Nevada,USA,2012 da.2013:6645-6649. [20 DONAHUE J,JIA Yangqing,VINYALS O,et al.De- [8]BRUNA J,SZLAM A,LECUN Y.Signal recovery from poo- CAF:a deep convolutional activation feature for generic ling representations[J].Eprint Arxiv,2013:307-315. visual recognition [C]//Proceedings of the 31st interna- [9]LI Haoxiang,LIN Zhe,SHEN Xiaohui,et al.A convolu- tional conference on machine learning.Beijing,China, tional neural network cascade for face detection [C]//Pro- 2014：647-655. ceedings of the 2015 IEEE conference on computer vision [21]ZEILER M D,FERGUS R.Visualizing and Understanding and pattern recognition.Boston,Massachusetts,USA, Convolutional Networks[C]//Proceedings of the 13th Eu- 2015:5325-5334. ropean conference on computer vision.Zurich,Switzer- [10]GIRSHICK R,DONAHUE J,DARRELL T,et al.Rich land.2014:818-833. feature hierarchies for accurate object detection and seman- [22]SERMANET P,EIGEN D,ZHANG Xiang,et al.Over- tic segmentation[C]//Proceedings of the 2014 IEEE con- Feat:integrated recognition,localization and detection u- ference on computer vision and pattern recognition.Colum- sing convolutional networks[J].Eprint Arxiv,2013. bus,0H,USA,2014:580-587. [23]RAZAVIAN A S,AZIZPOUR H,SULLIVAN J,et al. [11]LIN Min,CHEN Qiang,YAN Shuicheng.Network in net- CNN features off-the-shelf:an astounding baseline for rec- work [C]//Proceedings of international conference on ognition[C]//Proceedings of the 2014 IEEE conference

的技术在图像检索领域迅猛发展的时候，一些先前经典的哈希编码策略仍不能忽略，这将在图像检索应用上具有一定的参考价值。另外，我们还有若干问题有待解决，如卷积特征并不是对所有的哈希编码策略都有效，这些问题有待进一步研究。参考文献：［１］ＳＭＥＵＬＤＥＲＳＡＷＭ，ＷＯＲＲＩＮＧＭ，ＳＡＮＴＩＮＩＳ，ｅｔａｌ．Ｃｏｎｔｅｎｔ⁃ｂａｓｅｄｉｍａｇｅｒｅｔｒｉｅｖａｌａｔｔｈｅｅｎｄｏｆｔｈｅｅａｒｌｙｙｅａｒｓ［Ｊ］．ＩＥＥＥｔｒａｎｓａｃｔｉｏｎｓｏｎｐａｔｔｅｒｎａｎａｌｙｓｉｓａｎｄｍａｃｈｉｎｅｉｎ⁃ ｔｅｌｌｉｇｅｎｃｅ，２０００，２２（１２）：１３４９⁃１３８０．［２］ＷＡＮＪｉ，ＷＡＮＧＤａｙｏｎｇ，ＨＯＩＳＣＨ，ｅｔａｌ．Ｄｅｅｐｌｅａｒｎｉｎｇｆｏｒｃｏｎｔｅｎｔ⁃ｂａｓｅｄｉｍａｇｅｒｅｔｒｉｅｖａｌ：ａｃｏｍｐｒｅｈｅｎｓｉｖｅｓｔｕｄｙ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２２ｎｄＡＣＭｉｎｔｅｒｎａｔｉｏｎａｌｃｏｎｆｅｒ⁃ ｅｎｃｅｏｎｍｕｌｔｉｍｅｄｉａ．Ｏｒｌａｎｄｏ，ＵＳＡ，２０１４：１５７⁃１６６．［３］ＬＯＷＥＤＧ．ＤｉｓｔｉｎｃｔｉｖｅＩｍａｇｅｆｅａｔｕｒｅｓｆｒｏｍｓｃａｌｅ⁃ｉｎｖａｒｉａｎｔｋｅｙｐｏｉｎｔｓ［Ｊ］．Ｉｎｔｅｒｎａｔｉｏｎａｌｊｏｕｒｎａｌｏｆｃｏｍｐｕｔｅｒｖｉｓｉｏｎ，２００４，６０（２）：９１⁃１１０．［４］ＢＡＹＨ，ＴＵＹＴＥＬＡＡＲＳＴ，ＶＡＮＧＯＯＬＬ．ＳＵＲＦ：ｓｐｅｅｄｅｄｕｐｒｏｂｕｓｔｆｅａｔｕｒｅｓ［Ｍ］／／ＬＥＯＮＡＲＤＩＳＡ，ＢＩＳＣＨＯＦＨ，ＰＩＮＺＡ．Ｃｏｍｐｕｔｅｒｖｉｓｉｏｎ⁃ＥＣＣＶ２００６．ＢｅｒｌｉｎＨｅｉｄｅｌｂｅｒｇ：Ｓｐｒｉｎｇｅｒ，２００６：４０４⁃４１７．［５］ＳＡＲＩＫＡＹＡＲ，ＨＩＮＴＯＮＧＥ，ＤＥＯＲＡＳＡ．Ａｐｐｌｉｃａｔｉｏｎｏｆｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋｓｆｏｒｎａｔｕｒａｌｌａｎｇｕａｇｅｕｎｄｅｒｓｔａｎｄｉｎｇ［Ｊ］．ＩＥＥＥ／ＡＣＭｔｒａｎｓａｃｔｉｏｎｓｏｎａｕｄｉｏ，ｓｐｅｅｃｈ，ａｎｄｌａｎｇｕａｇｅｐｒｏｃｅｓｓｉｎｇ，２０１４，２２（４）：７７８⁃７８４．［６］ＬＡＮＤＥＣＫＥＲＷ，ＣＨＡＲＴＲＡＮＤＲ，ＤＥＤＥＯＳ．Ｒｏｂｕｓｔｓｐａｒｓｅｃｏｄｉｎｇａｎｄｃｏｍｐｒｅｓｓｅｄｓｅｎｓｉｎｇｗｉｔｈｔｈｅｄｉｆｆｅｒｅｎｃｅｍａｐ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１３ｔｈＥｕｒｏｐｅａｎｃｏｎｆｅｒｅｎｃｅｏｎｃｏｍｐｕｔｅｒｖｉｓｉｏｎ．Ｚｕｒｉｃｈ，Ｓｗｉｔｚｅｒｌａｎｄ，２０１４：３１５⁃３２９．［７］ＧＲＡＶＥＳＡ，ＭＯＨＡＭＥＤＡＲ，ＨＩＮＴＯＮＧ．Ｓｐｅｅｃｈｒｅｃｏｇ⁃ ｎｉｔｉｏｎｗｉｔｈｄｅｅｐｒｅｃｕｒｒｅｎｔｎｅｕｒａｌｎｅｔｗｏｒｋｓ［Ｃ］／／Ｐｒｏｃｅｅｄ⁃ ｉｎｇｓｏｆｔｈｅＩＥＥＥｉｎｔｅｒｎａｔｉｏｎａｌｃｏｎｆｅｒｅｎｃｅｏｎａｃｏｕｓｔｉｃｓｐｅｅｃｈａｎｄｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇ．Ｖａｎｃｏｕｖｅｒ，ＢｒｉｔｉｓｈＣｏｌｕｍｂｉａ，Ｃａｎａ⁃ ｄａ，２０１３：６６４５⁃６６４９．［８］ＢＲＵＮＡＪ，ＳＺＬＡＭＡ，ＬＥＣＵＮＹ．Ｓｉｇｎａｌｒｅｃｏｖｅｒｙｆｒｏｍｐｏｏ⁃ ｌｉｎｇｒｅｐｒｅｓｅｎｔａｔｉｏｎｓ［Ｊ］．ＥｐｒｉｎｔＡｒｘｉｖ，２０１３：３０７⁃３１５．［９］ＬＩＨａｏｘｉａｎｇ，ＬＩＮＺｈｅ，ＳＨＥＮＸｉａｏｈｕｉ，ｅｔａｌ．Ａｃｏｎｖｏｌｕ⁃ ｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｃａｓｃａｄｅｆｏｒｆａｃｅｄｅｔｅｃｔｉｏｎ［Ｃ］／／Ｐｒｏ⁃ ｃｅｅｄｉｎｇｓｏｆｔｈｅ２０１５ＩＥＥＥｃｏｎｆｅｒｅｎｃｅｏｎｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎ．Ｂｏｓｔｏｎ，Ｍａｓｓａｃｈｕｓｅｔｔｓ，ＵＳＡ，２０１５：５３２５⁃５３３４．［１０］ＧＩＲＳＨＩＣＫＲ，ＤＯＮＡＨＵＥＪ，ＤＡＲＲＥＬＬＴ，ｅｔａｌ．Ｒｉｃｈｆｅａｔｕｒｅｈｉｅｒａｒｃｈｉｅｓｆｏｒａｃｃｕｒａｔｅｏｂｊｅｃｔｄｅｔｅｃｔｉｏｎａｎｄｓｅｍａｎ⁃ ｔｉｃｓｅｇｍｅｎｔａｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２０１４ＩＥＥＥｃｏｎ⁃ ｆｅｒｅｎｃｅｏｎｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎ．Ｃｏｌｕｍ⁃ ｂｕｓ，ＯＨ，ＵＳＡ，２０１４：５８０⁃５８７．［１１］ＬＩＮＭｉｎ，ＣＨＥＮＱｉａｎｇ，ＹＡＮＳｈｕｉｃｈｅｎｇ．Ｎｅｔｗｏｒｋｉｎｎｅｔ⁃ ｗｏｒｋ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｉｎｔｅｒｎａｔｉｏｎａｌｃｏｎｆｅｒｅｎｃｅｏｎｌｅａｒｎｉｎｇｒｅｐｒｅｓｅｎｔａｔｉｏｎｓ．Ｂａｎｆｆ，Ｃａｎａｄａ，２０１４．［１２］ＧＩＯＮＩＳＡ，ＩＮＤＹＫＰ，ＭＯＴＷＡＮＩＲ．Ｓｉｍｉｌａｒｉｔｙｓｅａｒｃｈｉｎｈｉｇｈｄｉｍｅｎｓｉｏｎｓｖｉａｈａｓｈｉｎｇ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２５ｔｈｉｎｔｅｒｎａｔｉｏｎａｌｃｏｎｆｅｒｅｎｃｅｏｎｖｅｒｙｌａｒｇｅｄａｔａｂａｓｅｓ．ＳａｎＦｒａｎ⁃ ｃｉｓｃｏ，ＣＡ，ＵＳＡ，１９９９：５１８⁃５２９．［１３］ＷＥＩＳＳＹ，ＴＯＲＲＡＬＢＡＡ，ＦＥＲＧＵＳＲ．Ｓｐｅｃｔｒａｌｈａｓｈｉｎｇ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｃｏｎｆｅｒｅｎｃｅｏｎｎｅｕｒａｌｉｎｆｏｒｍａｔｉｏｎｐｒｏｃｅｓｓｉｎｇｓｙｓｔｅｍｓ．Ｖａｎｃｏｕｖｅｒ，ＢｒｉｔｉｓｈＣｏｌｕｍｂｉａ，Ｃａｎａ⁃ ｄａ，２００８：１７５３⁃１７６０．［１４］ＫＵＬＩＳＢ，ＤＡＲＲＥＬＬＴ．Ｌｅａｒｎｉｎｇｔｏｈａｓｈｗｉｔｈｂｉｎａｒｙｒｅ⁃ ｃｏｎｓｔｒｕｃｔｉｖｅｅｍｂｅｄｄｉｎｇｓ［Ｃ］／／Ａｄｖａｎｃｅｓｉｎｎｅｕｒａｌｉｎｆｏｒｍａ⁃ ｔｉｏｎｐｒｏｃｅｓｓｉｎｇｓｙｓｔｅｍｓ２２：２３ｒｄａｎｎｕａｌｃｏｎｆｅｒｅｎｃｅｏｎｎｅｕｒａｌｉｎｆｏｒｍａｔｉｏｎｐｒｏｃｅｓｓｉｎｇｓｙｓｔｅｍｓ２００９．Ｖａｎｃｏｕｖｅｒ，ＢｒｉｔｉｓｈＣｏｌｕｍｂｉａ，Ｃａｎａｄａ，２０１０：１０４２⁃１０５０．［１５］ＲＡＧＩＮＳＫＹＭ，ＬＡＺＥＢＮＩＫＳ．Ｌｏｃａｌｉｔｙ⁃ｓｅｎｓｉｔｉｖｅｂｉｎａｒｙｃｏｄｅｓｆｒｏｍｓｈｉｆｔ⁃ｉｎｖａｒｉａｎｔｋｅｒｎｅｌｓ［Ｃ］／／Ａｄｖａｎｃｅｓｉｎｎｅｕ⁃ ｒａｌｉｎｆｏｒｍａｔｉｏｎｐｒｏｃｅｓｓｉｎｇｓｙｓｔｅｍｓ２２：ｃｏｎｆｅｒｅｎｃｅｏｎｎｅｕ⁃ ｒａｌｉｎｆｏｒｍａｔｉｏｎｐｒｏｃｅｓｓｉｎｇｓｙｓｔｅｍｓ２００９．Ｖａｎｃｏｕｖｅｒ，ＢｒｉｔｉｓｈＣｏｌｕｍｂｉａ，Ｃａｎａｄａ，２００９：１５０９⁃１５１７．［１６］ＧＯＮＧＹｕｎｃｈａｏ，ＬＡＺＥＢＮＩＫＳ，ＧＯＲＤＯＡ，ｅｔａｌ．Ｉｔｅｒａ⁃ ｔｉｖｅｑｕａｎｔｉｚａｔｉｏｎ：ａｐｒｏｃｒｕｓｔｅａｎａｐｐｒｏａｃｈｔｏｌｅａｒｎｉｎｇｂｉｎａｒｙｃｏｄｅｓｆｏｒｌａｒｇｅ⁃ｓｃａｌｅｉｍａｇｅｒｅｔｒｉｅｖａｌ［Ｊ］．ＩＥＥＥｔｒａｎｓａｃｔｉｏｎｓｏｎｐａｔｔｅｒｎａｎａｌｙｓｉｓａｎｄｍａｃｈｉｎｅｉｎｔｅｌｌｉｇｅｎｃｅ，２０１３，３５（１２）：２９１６⁃２９２９．［１７］ＮＯＲＯＵＺＩＭ，ＦＬＥＥＴＤＪ．Ｍｉｎｉｍａｌｌｏｓｓｈａｓｈｉｎｇｆｏｒｃｏｍ⁃ ｐａｃｔｂｉｎａｒｙｃｏｄｅｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２８ｔｈｉｎｔｅｒｎａ⁃ ｔｉｏｎａｌｃｏｎｆｅｒｅｎｃｅｏｎｍａｃｈｉｎｅｌｅａｒｎｉｎｇ．Ｂｅｌｌｅｖｕｅ，ＷＡ，ＵＳＡ，２０１１：３５３⁃３６０．［１８］ＪＩＮＺｈｏｎｇｍｉｎｇ，ＬＩＣｈｅｎｇ，ＬＩＮＹｕｅ，ｅｔａｌ．Ｄｅｎｓｉｔｙｓｅｎｓｉ⁃ ｔｉｖｅｈａｓｈｉｎｇ［Ｊ］．ＩＥＥＥｔｒａｎｓａｃｔｉｏｎｓｏｎｃｙｂｅｒｎｅｔｉｃｓ，２０１４，４４（８）：１３６２⁃１３７１．［１９］ＫＲＩＺＨＥＶＳＫＹＡ，ＳＵＴＳＫＥＶＥＲＩ，ＨＩＮＴＯＮＧＥ．Ｉｍａ⁃ ｇｅＮｅｔｃｌａｓｓｉｆｉｃａｔｉｏｎｗｉｔｈｄｅｅｐｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔ⁃ ｗｏｒｋｓ［Ｃ］／／ＡｄｖａｎｃｅｓｉｎＮｅｕｒａｌＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍｓ２５．ＬａｋｅＴａｈｏｅ，Ｎｅｖａｄａ，ＵＳＡ，２０１２．［２０］ＤＯＮＡＨＵＥＪ，ＪＩＡＹａｎｇｑｉｎｇ，ＶＩＮＹＡＬＳＯ，ｅｔａｌ．Ｄｅ⁃ ＣＡＦ：ａｄｅｅｐｃｏｎｖｏｌｕｔｉｏｎａｌａｃｔｉｖａｔｉｏｎｆｅａｔｕｒｅｆｏｒｇｅｎｅｒｉｃｖｉｓｕａｌｒｅｃｏｇｎｉｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ３１ｓｔｉｎｔｅｒｎａ⁃ ｔｉｏｎａｌｃｏｎｆｅｒｅｎｃｅｏｎｍａｃｈｉｎｅｌｅａｒｎｉｎｇ．Ｂｅｉｊｉｎｇ，Ｃｈｉｎａ，２０１４：６４７⁃６５５．［２１］ＺＥＩＬＥＲＭＤ，ＦＥＲＧＵＳＲ．ＶｉｓｕａｌｉｚｉｎｇａｎｄＵｎｄｅｒｓｔａｎｄｉｎｇＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１３ｔｈＥｕ⁃ ｒｏｐｅａｎｃｏｎｆｅｒｅｎｃｅｏｎｃｏｍｐｕｔｅｒｖｉｓｉｏｎ．Ｚｕｒｉｃｈ，Ｓｗｉｔｚｅｒ⁃ ｌａｎｄ，２０１４：８１８⁃８３３．［２２］ＳＥＲＭＡＮＥＴＰ，ＥＩＧＥＮＤ，ＺＨＡＮＧＸｉａｎｇ，ｅｔａｌ．Ｏｖｅｒ⁃ Ｆｅａｔ：ｉｎｔｅｇｒａｔｅｄｒｅｃｏｇｎｉｔｉｏｎ，ｌｏｃａｌｉｚａｔｉｏｎａｎｄｄｅｔｅｃｔｉｏｎｕ⁃ ｓｉｎｇｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｔｗｏｒｋｓ［Ｊ］．ＥｐｒｉｎｔＡｒｘｉｖ，２０１３．［２３］ＲＡＺＡＶＩＡＮＡＳ，ＡＺＩＺＰＯＵＲＨ，ＳＵＬＬＩＶＡＮＪ，ｅｔａｌ．ＣＮＮｆｅａｔｕｒｅｓｏｆｆ⁃ｔｈｅ⁃ｓｈｅｌｆ：ａｎａｓｔｏｕｎｄｉｎｇｂａｓｅｌｉｎｅｆｏｒｒｅｃ⁃ ｏｇｎｉｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２０１４ＩＥＥＥｃｏｎｆｅｒｅｎｃｅ第３期龚震霆，等：基于卷积神经网络和哈希编码的图像检索方法 ·３９９·

·400· 智能系统学报第11卷 on computer vision and pattern recognition workshops.Co- [30]GRIFFIN G,HOLUB A,PERONA P.Caltech-256 object umbus,0H.USA,2014:512-519. category dataset R].CaltechAUTHORS:CNS-TR-2007- [24]XIA Rongkai,PAN Yan,LIU Cong,et al.Supervised 001,2007. hashing for image retrieval via image representation learn- 作者简介： ing[C]//Proceedings of the 24th AAAI conference on ar- 龚震霆，男，1991年生，硕士研究 tificial intelligence.Qubec City,Canada,2014:2156- 生，主要研究方向为计算机视觉、机器 2162. 学习。 [25]GUO Jinma,LI Jianmin.CNN Based Hashing for Image Retrieval[Z].arXiv:1509.01354v1,2015. [26]LIN K,YANG H F,HSIAO J H,et al.Deep learing of binary hash codes for fast image retrieval[C]//Proceed- ings of the 2015 IEEE conference on computer vision and 陈光喜，男，1971年生，博士生导 pattern recognition workshops (CVPRW).Boston,Massa- 师，主要研究方向为可信计算、图像处 chusetts,USA,2015:27-35. 理。主持完成国家自然基金项目2项、 [27]ANDONI A,INDYK P.Near-optimal hashing algorithms 广西省科学基金及企业开发项目多项。 for approximate nearest neighbor in high dimensions[C] 获桂林市科技进步三等奖1项、广西教 Proceedings of IEEE 54th annual symposium on founda- 学成果奖一等奖1项。发表学术论文 tions of computer science.Berkeley,CA,USA,2006: 30余篇，主编教材1部。 459-468. [28]SIMONYAN K,ZISSERMAN A.Very deep convolutional 任夏荔，女，1992年生，硕士研究 networks for large-scale image recognition[J].Eprint Arx- 生，主要研究方向为计算机视觉、深度 iv,2014. 学习。 [29]LI Feifei,FERGUS R,PERONA P.Learning generative visual models from few training examples:an incremental Bayesian approach tested on 101 object categories[] Computer vision and image understanding,2007,106 (1):59-70. 2016年控制论、机器人与控制国际会议 2016 International Conference on Cybernetics, Robotics and Control (CRC 2016) 2016 International Conference on Cybernetics,Robotics and Control will be held in Hong Kong during August 19-21,2016. The idea of the conference is providing a platform for scientists,scholars,and engineers from all over the world to present ongoing researches,and to foster research relations between the Universities and the Industry.We are looking forward to your participation. It features invited keynote speakers as well as peer-reviewed paper presentations.The conference is completely open (one needs to register first),you will not have to be an author or a discussant to attend. The covered key topics will include (but will not be limited to): Modern Advanced Control Strategies; Data Analysis,Prediction Model Identification: Decision Making and Information Retrieval; Control System Application; Database System; Human-Machine Systems; Robotics and Automation; Multimedia and Communication Systems; Hybrid Systems. Website:http://www.iccrc.org/index.html

ｏｎｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎｗｏｒｋｓｈｏｐｓ．Ｃｏ⁃ ｌｕｍｂｕｓ，ＯＨ，ＵＳＡ，２０１４：５１２⁃５１９．［２４］ＸＩＡＲｏｎｇｋａｉ，ＰＡＮＹａｎ，ＬＩＵＣｏｎｇ，ｅｔａｌ．Ｓｕｐｅｒｖｉｓｅｄｈａｓｈｉｎｇｆｏｒｉｍａｇｅｒｅｔｒｉｅｖａｌｖｉａｉｍａｇｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｌｅａｒｎ⁃ ｉｎｇ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２４ｔｈＡＡＡＩｃｏｎｆｅｒｅｎｃｅｏｎａｒ⁃ ｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅ．ＱｕｂｅｃＣｉｔｙ，Ｃａｎａｄａ，２０１４：２１５６⁃ ２１６２．［２５］ＧＵＯＪｉｎｍａ，ＬＩＪｉａｎｍｉｎ．ＣＮＮＢａｓｅｄＨａｓｈｉｎｇｆｏｒＩｍａｇｅＲｅｔｒｉｅｖａｌ［Ｚ］．ａｒＸｉｖ：１５０９．０１３５４ｖ１，２０１５．［２６］ＬＩＮＫ，ＹＡＮＧＨＦ，ＨＳＩＡＯＪＨ，ｅｔａｌ．Ｄｅｅｐｌｅａｒｎｉｎｇｏｆｂｉｎａｒｙｈａｓｈｃｏｄｅｓｆｏｒｆａｓｔｉｍａｇｅｒｅｔｒｉｅｖａｌ［Ｃ］／／Ｐｒｏｃｅｅｄ⁃ ｉｎｇｓｏｆｔｈｅ２０１５ＩＥＥＥｃｏｎｆｅｒｅｎｃｅｏｎｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎｗｏｒｋｓｈｏｐｓ（ＣＶＰＲＷ）．Ｂｏｓｔｏｎ，Ｍａｓｓａ⁃ ｃｈｕｓｅｔｔｓ，ＵＳＡ，２０１５：２７⁃３５．［２７］ＡＮＤＯＮＩＡ，ＩＮＤＹＫＰ．Ｎｅａｒ⁃ｏｐｔｉｍａｌｈａｓｈｉｎｇａｌｇｏｒｉｔｈｍｓｆｏｒａｐｐｒｏｘｉｍａｔｅｎｅａｒｅｓｔｎｅｉｇｈｂｏｒｉｎｈｉｇｈｄｉｍｅｎｓｉｏｎｓ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆＩＥＥＥ５４ｔｈａｎｎｕａｌｓｙｍｐｏｓｉｕｍｏｎｆｏｕｎｄａ⁃ ｔｉｏｎｓｏｆｃｏｍｐｕｔｅｒｓｃｉｅｎｃｅ．Ｂｅｒｋｅｌｅｙ，ＣＡ，ＵＳＡ，２００６：４５９⁃４６８．［２８］ＳＩＭＯＮＹＡＮＫ，ＺＩＳＳＥＲＭＡＮＡ．Ｖｅｒｙｄｅｅｐｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｔｗｏｒｋｓｆｏｒｌａｒｇｅ⁃ｓｃａｌｅｉｍａｇｅｒｅｃｏｇｎｉｔｉｏｎ［Ｊ］．ＥｐｒｉｎｔＡｒｘ⁃ ｉｖ，２０１４．［２９］ＬＩＦｅｉｆｅｉ，ＦＥＲＧＵＳＲ，ＰＥＲＯＮＡＰ．Ｌｅａｒｎｉｎｇｇｅｎｅｒａｔｉｖｅｖｉｓｕａｌｍｏｄｅｌｓｆｒｏｍｆｅｗｔｒａｉｎｉｎｇｅｘａｍｐｌｅｓ：ａｎｉｎｃｒｅｍｅｎｔａｌＢａｙｅｓｉａｎａｐｐｒｏａｃｈｔｅｓｔｅｄｏｎ１０１ｏｂｊｅｃｔｃａｔｅｇｏｒｉｅｓ［Ｊ］．Ｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｉｍａｇｅｕｎｄｅｒｓｔａｎｄｉｎｇ，２００７，１０６（１）：５９⁃７０．［３０］ＧＲＩＦＦＩＮＧ，ＨＯＬＵＢＡ，ＰＥＲＯＮＡＰ．Ｃａｌｔｅｃｈ⁃２５６ｏｂｊｅｃｔｃａｔｅｇｏｒｙｄａｔａｓｅｔ［Ｒ］．ＣａｌｔｅｃｈＡＵＴＨＯＲＳ：ＣＮＳ⁃ＴＲ⁃２００７⁃ ００１，２００７．作者简介：龚震霆，男，１９９１年生，硕士研究生，主要研究方向为计算机视觉、机器学习。陈光喜，男，１９７１年生，博士生导师，主要研究方向为可信计算、图像处理。主持完成国家自然基金项目２项、广西省科学基金及企业开发项目多项。获桂林市科技进步三等奖１项、广西教学成果奖一等奖１项。发表学术论文３０余篇，主编教材１部。任夏荔，女，１９９２年生，硕士研究生，主要研究方向为计算机视觉、深度学习。２０１６年控制论、机器人与控制国际会议２０１６ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｙｂｅｒｎｅｔｉｃｓ，ＲｏｂｏｔｉｃｓａｎｄＣｏｎｔｒｏｌ（ＣＲＣ２０１６）２０１６ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｙｂｅｒｎｅｔｉｃｓ，ＲｏｂｏｔｉｃｓａｎｄＣｏｎｔｒｏｌｗｉｌｌｂｅｈｅｌｄｉｎＨｏｎｇＫｏｎｇｄｕｒｉｎｇＡｕｇｕｓｔ１９⁃２１，２０１６．Ｔｈｅｉｄｅａｏｆｔｈｅｃｏｎｆｅｒｅｎｃｅｉｓｐｒｏｖｉｄｉｎｇａｐｌａｔｆｏｒｍｆｏｒｓｃｉｅｎｔｉｓｔｓ，ｓｃｈｏｌａｒｓ，ａｎｄｅｎｇｉｎｅｅｒｓｆｒｏｍａｌｌｏｖｅｒｔｈｅｗｏｒｌｄｔｏｐｒｅｓｅｎｔｏｎｇｏｉｎｇｒｅｓｅａｒｃｈｅｓ，ａｎｄｔｏｆｏｓｔｅｒｒｅｓｅａｒｃｈｒｅｌａｔｉｏｎｓｂｅｔｗｅｅｎｔｈｅＵｎｉｖｅｒｓｉｔｉｅｓａｎｄｔｈｅＩｎｄｕｓｔｒｙ．Ｗｅａｒｅｌｏｏｋｉｎｇｆｏｒｗａｒｄｔｏｙｏｕｒｐａｒｔｉｃｉｐａｔｉｏｎ．Ｉｔｆｅａｔｕｒｅｓｉｎｖｉｔｅｄｋｅｙｎｏｔｅｓｐｅａｋｅｒｓａｓｗｅｌｌａｓｐｅｅｒ⁃ｒｅｖｉｅｗｅｄｐａｐｅｒｐｒｅｓｅｎｔａｔｉｏｎｓ．Ｔｈｅｃｏｎｆｅｒｅｎｃｅｉｓｃｏｍｐｌｅｔｅｌｙｏｐｅｎ（ｏｎｅｎｅｅｄｓｔｏｒｅｇｉｓｔｅｒｆｉｒｓｔ），ｙｏｕｗｉｌｌｎｏｔｈａｖｅｔｏｂｅａｎａｕｔｈｏｒｏｒａｄｉｓｃｕｓｓａｎｔｔｏａｔｔｅｎｄ．Ｔｈｅｃｏｖｅｒｅｄｋｅｙｔｏｐｉｃｓｗｉｌｌｉｎｃｌｕｄｅ（ｂｕｔｗｉｌｌｎｏｔｂｅｌｉｍｉｔｅｄｔｏ）：ＭｏｄｅｒｎＡｄｖａｎｃｅｄＣｏｎｔｒｏｌＳｔｒａｔｅｇｉｅｓ；ＤａｔａＡｎａｌｙｓｉｓ，Ｐｒｅｄｉｃｔｉｏｎ＆ＭｏｄｅｌＩｄｅｎｔｉｆｉｃａｔｉｏｎ；ＤｅｃｉｓｉｏｎＭａｋｉｎｇａｎｄＩｎｆｏｒｍａｔｉｏｎＲｅｔｒｉｅｖａｌ；ＣｏｎｔｒｏｌＳｙｓｔｅｍＡｐｐｌｉｃａｔｉｏｎ；ＤａｔａｂａｓｅＳｙｓｔｅｍ；Ｈｕｍａｎ⁃ＭａｃｈｉｎｅＳｙｓｔｅｍｓ；ＲｏｂｏｔｉｃｓａｎｄＡｕｔｏｍａｔｉｏｎ；ＭｕｌｔｉｍｅｄｉａａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎＳｙｓｔｅｍｓ；ＨｙｂｒｉｄＳｙｓｔｅｍｓ．Ｗｅｂｓｉｔｅ：ｈｔｔｐ：／／ｗｗｗ．ｉｃｃｒｃ．ｏｒｇ／ｉｎｄｅｘ．ｈｔｍｌ ·４００· 智能系统学报第１１卷

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录