【机器感知与模式识别】人脸识别背后的数据清理问题研究

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：2.01MB

第12卷第5期智能系统学报 Vol.12 No.5 2017年10月 CAAI Transactions on Intelligent Systems 0ct.2017 D0I:10.11992/tis.201706025 网络出版地址：http:/kns.cmki.ne/kcms/detail/23.1538.TP.20171021.1350.012.html 人脸识别背后的数据清理问题研究夏洋洋1，龚勋，洪西进12 (1.西南交通大学信息科学与技术学院，四川成都611756：2.台湾科技大学资讯工程系，台湾台北10607) 摘要：人脸识别技术在深度卷积神经网络(deep convolution neural networks,DCNN)的快速发展下取得了显著的成就。这些成果主要体现在更深层次的DCNN架构和更大的训练数据库。然而，由大多数私人公司持有的大型数据库（百万级）并不对外公开，即使当前部分开放的大型数据库，因为标注信息过少，无法保证精度，会影响DCNN的训练。本文提出了一种易于使用的多角度清理图像方法来提高数据的准确性：通过人脸检测算法清除掉无法检测到人脸的图像：在清理后的数据集上利用已有模型提取图像特征，并计算相似度，进而统计出一类人脸图像中每一张图像与其他图像不相似的数目，根据改进参数清理数据。实验表明，清理后的数据库训练模型在LFW和Youu山 Face数据集上测试的精度得到了提升，使用较小规模数据集情况下，在LFW数据集上取得了99.17%的准确率，在 Youtube Face数据集也达到了93.53%的准确率。关键词：深度卷积神经网络：DCNN;清理图像；人脸识别：大型数据库中图分类号：TP391.4文献标志码：A文章编号：1673-4785(2017)05-0616-08 中文引用格式：夏洋洋，龚勋，洪西进.人脸识别背后的数据清理问题研究[J].智能系统学报，2017,12(5)：616-623. 英文引用格式：XIA Yangyang,GONG Xun,HONG Xijin.Research on the data cleansing problem for face recognition technology [J].CAAI transactions on intelligent systems,2017,12(5):616-623. Research on the data cleansing problem for face recognition technology XIA Yangyang',GONG Xun',HONG Xijin'.2 (1.School of Information Science and Technology,Southwest Jiaotong University,Chengdu 611756.China;2.Department of Computer Science and Information Engineering,National Taiwan University of Science and Technology,Taipei 10607,China) Abstract:Face recognition technology has made a significant progress in the rapid development of deep convolution neural networks(DCNN).These developments are mainly focused toward a denser DCNN architecture and larger training database.However,DCNN training is affected because the large-scale database held by most private companies are not publically accessible.Moreover,current large-scale open databases are not accessible because of the slight availability of the labeled information and hard-to-guarantee accuracy.This study presents an easy-to-use image cleansing method to improve the accuracy of data from the following perspectives:First,deleting the face image that cannot be detected by face detection;second,using the existing model to extract the features of an image on the cleaned dataset and calculate the similarity;and finally,counting the number of images that are unlike the other images.The data were cleansed according to the improved parameters extracted from the abovementioned perspectives.The experimental results reveal that the cleansed database training model has improved the accuracy of face recognition in LFW(labeled faces in the wild)and You'Tube face database.In the case of using a small-scale dataset,an accuracy of 99.17%and 93.53%was achieved on the LFW and YouTube face datasets,respectively. Keywords:deep convolution neural network;DCNN;cleansing image;face recognition;large database 构建一个完整的人脸识别系统主要包括图像识别，而特征提取则是人脸识别的重点关注采集、人脸检测、人脸对齐、特征表示与分类识别等点[1-3]。深度学习与传统人脸识别技术的主要区步骤。人脸识别技术的核心在于特征提取和分类别在于：深度学习是通过从海量数据中有监督的训练学习来获取能够有效表示人脸信息的特征，不再收稿日期：2017-06-08.网络出版日期：2017-10-21. 需要大量的人脸识别先验知识来设计特征，这种人基金项目：国家自然科学基金项目(61202191)：计算智能重庆市重点实脸面部特征学习更具鲁棒性46)。深度卷积神经网验室开放基金项目(CQ-LC-2013-06):国家重点研发计划项目(2016YFC0802209). 络(DCNN)作为一种深度学习架构，已成功应用于通信作者：龚勋.E-mail:xgong(@swju.cdu.cm 人脸识别和其他计算机视觉任务，并逐渐成为一种

第１２卷第５期智能系统学报Ｖｏｌ．１２ №．５２０１７年１０月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＯｃｔ．２０１７ＤＯＩ：１０．１１９９２／ｔｉｓ．２０１７０６０２５网络出版地址：ｈｔｔｐ：／／ｋｎｓ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１７１０２１．１３５０．０１２．ｈｔｍｌ人脸识别背后的数据清理问题研究夏洋洋１，龚勋１，洪西进１，２（１．西南交通大学信息科学与技术学院，四川成都６１１７５６；２．台湾科技大学资讯工程系，台湾台北１０６０７）摘要：人脸识别技术在深度卷积神经网络（ｄｅｅｐｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋｓ，ＤＣＮＮ）的快速发展下取得了显著的成就。这些成果主要体现在更深层次的ＤＣＮＮ架构和更大的训练数据库。然而，由大多数私人公司持有的大型数据库（百万级）并不对外公开，即使当前部分开放的大型数据库，因为标注信息过少，无法保证精度，会影响ＤＣＮＮ的训练。本文提出了一种易于使用的多角度清理图像方法来提高数据的准确性：通过人脸检测算法清除掉无法检测到人脸的图像；在清理后的数据集上利用已有模型提取图像特征，并计算相似度，进而统计出一类人脸图像中每一张图像与其他图像不相似的数目，根据改进参数清理数据。实验表明，清理后的数据库训练模型在ＬＦＷ和ＹｏｕｔｕｂｅＦａｃｅ数据集上测试的精度得到了提升，使用较小规模数据集情况下，在ＬＦＷ数据集上取得了９９．１７％的准确率，在ＹｏｕｔｕｂｅＦａｃｅ数据集也达到了９３．５３％的准确率。关键词：深度卷积神经网络；ＤＣＮＮ；清理图像；人脸识别；大型数据库中图分类号：ＴＰ３９１．４文献标志码：Ａ文章编号：１６７３－４７８５（２０１７）０５－０６１６－０８中文引用格式：夏洋洋，龚勋，洪西进．人脸识别背后的数据清理问题研究［Ｊ］．智能系统学报，２０１７，１２（５）：６１６－６２３．英文引用格式：ＸＩＡＹａｎｇｙａｎｇ，ＧＯＮＧＸｕｎ，ＨＯＮＧＸｉｊｉｎ．Ｒｅｓｅａｒｃｈｏｎｔｈｅｄａｔａｃｌｅａｎｓｉｎｇｐｒｏｂｌｅｍｆｏｒｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｔｅｃｈｎｏｌｏｇｙ［Ｊ］．ＣＡＡＩｔｒａｎｓａｃｔｉｏｎｓｏｎｉｎｔｅｌｌｉｇｅｎｔｓｙｓｔｅｍｓ，２０１７，１２（５）：６１６－６２３．ＲｅｓｅａｒｃｈｏｎｔｈｅｄａｔａｃｌｅａｎｓｉｎｇｐｒｏｂｌｅｍｆｏｒｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｔｅｃｈｎｏｌｏｇｙＸＩＡＹａｎｇｙａｎｇ１，ＧＯＮＧＸｕｎ１，ＨＯＮＧＸｉｊｉｎ１，２（１．ＳｃｈｏｏｌｏｆＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，ＳｏｕｔｈｗｅｓｔＪｉａｏｔｏｎｇＵｎｉｖｅｒｓｉｔｙ，Ｃｈｅｎｇｄｕ６１１７５６，Ｃｈｉｎａ；２．ＤｅｐａｒｔｍｅｎｔｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＩｎｆｏｒｍａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇ，ＮａｔｉｏｎａｌＴａｉｗａｎＵｎｉｖｅｒｓｉｔｙｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，Ｔａｉｐｅｉ１０６０７，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｔｅｃｈｎｏｌｏｇｙｈａｓｍａｄｅａｓｉｇｎｉｆｉｃａｎｔｐｒｏｇｒｅｓｓｉｎｔｈｅｒａｐｉｄｄｅｖｅｌｏｐｍｅｎｔｏｆｄｅｅｐｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋｓ（ＤＣＮＮ）．ＴｈｅｓｅｄｅｖｅｌｏｐｍｅｎｔｓａｒｅｍａｉｎｌｙｆｏｃｕｓｅｄｔｏｗａｒｄａｄｅｎｓｅｒＤＣＮＮａｒｃｈｉｔｅｃｔｕｒｅａｎｄｌａｒｇｅｒｔｒａｉｎｉｎｇｄａｔａｂａｓｅ．Ｈｏｗｅｖｅｒ，ＤＣＮＮｔｒａｉｎｉｎｇｉｓａｆｆｅｃｔｅｄｂｅｃａｕｓｅｔｈｅｌａｒｇｅ⁃ｓｃａｌｅｄａｔａｂａｓｅｈｅｌｄｂｙｍｏｓｔｐｒｉｖａｔｅｃｏｍｐａｎｉｅｓａｒｅｎｏｔｐｕｂｌｉｃａｌｌｙａｃｃｅｓｓｉｂｌｅ．Ｍｏｒｅｏｖｅｒ，ｃｕｒｒｅｎｔｌａｒｇｅ⁃ｓｃａｌｅｏｐｅｎｄａｔａｂａｓｅｓａｒｅｎｏｔａｃｃｅｓｓｉｂｌｅｂｅｃａｕｓｅｏｆｔｈｅｓｌｉｇｈｔａｖａｉｌａｂｉｌｉｔｙｏｆｔｈｅｌａｂｅｌｅｄｉｎｆｏｒｍａｔｉｏｎａｎｄｈａｒｄ⁃ｔｏ⁃ｇｕａｒａｎｔｅｅａｃｃｕｒａｃｙ．Ｔｈｉｓｓｔｕｄｙｐｒｅｓｅｎｔｓａｎｅａｓｙ⁃ｔｏ⁃ｕｓｅｉｍａｇｅｃｌｅａｎｓｉｎｇｍｅｔｈｏｄｔｏｉｍｐｒｏｖｅｔｈｅａｃｃｕｒａｃｙｏｆｄａｔａｆｒｏｍｔｈｅｆｏｌｌｏｗｉｎｇｐｅｒｓｐｅｃｔｉｖｅｓ：Ｆｉｒｓｔ，ｄｅｌｅｔｉｎｇｔｈｅｆａｃｅｉｍａｇｅｔｈａｔｃａｎｎｏｔｂｅｄｅｔｅｃｔｅｄｂｙｆａｃｅｄｅｔｅｃｔｉｏｎ；ｓｅｃｏｎｄ，ｕｓｉｎｇｔｈｅｅｘｉｓｔｉｎｇｍｏｄｅｌｔｏｅｘｔｒａｃｔｔｈｅｆｅａｔｕｒｅｓｏｆａｎｉｍａｇｅｏｎｔｈｅｃｌｅａｎｅｄｄａｔａｓｅｔａｎｄｃａｌｃｕｌａｔｅｔｈｅｓｉｍｉｌａｒｉｔｙ；ａｎｄｆｉｎａｌｌｙ，ｃｏｕｎｔｉｎｇｔｈｅｎｕｍｂｅｒｏｆｉｍａｇｅｓｔｈａｔａｒｅｕｎｌｉｋｅｔｈｅｏｔｈｅｒｉｍａｇｅｓ．Ｔｈｅｄａｔａｗｅｒｅｃｌｅａｎｓｅｄａｃｃｏｒｄｉｎｇｔｏｔｈｅｉｍｐｒｏｖｅｄｐａｒａｍｅｔｅｒｓｅｘｔｒａｃｔｅｄｆｒｏｍｔｈｅａｂｏｖｅｍｅｎｔｉｏｎｅｄｐｅｒｓｐｅｃｔｉｖｅｓ．ＴｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｒｅｖｅａｌｔｈａｔｔｈｅｃｌｅａｎｓｅｄｄａｔａｂａｓｅｔｒａｉｎｉｎｇｍｏｄｅｌｈａｓｉｍｐｒｏｖｅｄｔｈｅａｃｃｕｒａｃｙｏｆｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｉｎＬＦＷ（ｌａｂｅｌｅｄｆａｃｅｓｉｎｔｈｅｗｉｌｄ）ａｎｄＹｏｕＴｕｂｅｆａｃｅｄａｔａｂａｓｅ．Ｉｎｔｈｅｃａｓｅｏｆｕｓｉｎｇａｓｍａｌｌ⁃ｓｃａｌｅｄａｔａｓｅｔ，ａｎａｃｃｕｒａｃｙｏｆ９９．１７％ａｎｄ９３．５３％ｗａｓａｃｈｉｅｖｅｄｏｎｔｈｅＬＦＷａｎｄＹｏｕＴｕｂｅｆａｃｅｄａｔａｓｅｔｓ，ｒｅｓｐｅｃｔｉｖｅｌｙ．Ｋｅｙｗｏｒｄｓ：ｄｅｅｐｃｏｎｖｏｌｕｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋ；ＤＣＮＮ；ｃｌｅａｎｓｉｎｇｉｍａｇｅ；ｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ；ｌａｒｇｅｄａｔａｂａｓｅ收稿日期：２０１７－０６－０８．网络出版日期：２０１７－１０－２１．基金项目：国家自然科学基金项目（６１２０２１９１）；计算智能重庆市重点实验室开放基金项目（ＣＱ⁃ＬＣＩ⁃２０１３⁃０６）；国家重点研发计划项目（２０１６ＹＦＣ０８０２２０９）．通信作者：龚勋．Ｅ⁃ｍａｉｌ：ｘｇｏｎｇ＠ｓｗｊｔｕ．ｅｄｕ．ｃｎ．构建一个完整的人脸识别系统主要包括图像采集、人脸检测、人脸对齐、特征表示与分类识别等步骤。人脸识别技术的核心在于特征提取和分类识别，而特征提取则是人脸识别的重点关注点［１－３］。深度学习与传统人脸识别技术的主要区别在于：深度学习是通过从海量数据中有监督的训练学习来获取能够有效表示人脸信息的特征，不再需要大量的人脸识别先验知识来设计特征，这种人脸面部特征学习更具鲁棒性［４－６］。深度卷积神经网络（ＤＣＮＮ）作为一种深度学习架构，已成功应用于人脸识别和其他计算机视觉任务，并逐渐成为一种

第5期夏洋洋，等：人脸识别背后的数据清理问题研究 617 通用算法[1,45，-o)。虽然DCNN是通过从大量数据没有公开发布。由于在获取大规模标注信息丰富、中自动学习更具区分力的特征，人脸识别的主要目准确度高的数据库方面遇到了较大的障碍，人脸识的也是通过从海量数据中学习具有泛化能力的人别技术在学术领域处于被动状态，甚至落后于工业脸特征，但最大的挑战是如何训练更好的DCNN算界。为了克服这个问题，越来越多的研究机构也相法。目前可以通过以下两种方式进行提升：设计更继发布了一些大型的、多样化的数据集。目前，表2 强表达能力的网络结构：使用规模更大的数据集，是公开的一些大型人脸数据集及其标注信息，香港对训练集进行更精确的预处理。中文大学团队发布了CelebFaces+数据集，包含了大 1人脸识别技术与数据库现状约10000个身份的20万张图像，标注信息丰富，身份信息未划分，主要可以用来研究特征点定位和人 2009年发布的LFW数据库的样本图片来自于脸属性学习。2014年中科院自动化研究所发布并互联网名人图像，其中有5700余人13000多张图建立了一个大规模的CASIA-webface人脸识别数据像，采用十折平均精度作为人脸识别性能指标，是集，包含了大约10500个身份的49万张图像，并表在真实条件下最具权威的人脸识别数据库之一山。示这个数据集是作为大规模训练集来使用。在文有许多DCNN的开源实现已经公布，2014年献[4]中，作者也公布了2622个身份的260万张图 Facebook[)和香港中文大学[a]使用DCNN技术在像。MegaFace[2o数量大于CASIA,但是被设计为测人脸识别中取得重大突破，分别在LFW上获得了试集，每个人提供的图像很少，因此它从未用于训 97.35%和97.45%的平均分类精度。随后，在LFW 练DCNN系统。目前，这些数据集仍有很多噪声，数据集上平均分类精度分别由VGGface、CaffeFace 身份标签错误，单张图像含有多个人脸等（图1）问和Google FaceNet刷新到97.27%、99.28%和题，这导致数据库的准确性很难得到保证。 99.63%,百度公司甚至得到99.77%的准确率]。 DCNN算法之所以需要大量的数据，主要原因在于越大规模的数据越能够学习到更加抽象、更加鲁棒的特征。表1中的数据充分体现了这一趋势： DeepID系列从20万~45万，Caffeface使用70万，百度使用120万，DeepFace为4亿，VGGFace有260 万，谷歌达到2亿，Facebook使用超过10万人的50 亿图像数据库4。表1几种经典的DCNN模型在LW数据集上的测试结果 Table 1 The test results of several classic DCNN models on the LFW data set 训练集网络LFW平均图1数据库存的问题示例名称年份数据量/万数量精度/% Fig.1 Examples of problems that exist with the database DeepFace(] 2014 400 97.35 表2人脸检测和识别数据集 DeepID[2) Table 2 Face Detection and Identification Data Set 2014 20 25 97.45 图像数 DeepID2 2014 20 25 99.15 数据集人数注释属性量（万） DeepID2+[15] 2015 45 25 99.47 VGG Face[4] 260 2622 人脸边框和姿态 VGGFace[4] 2015 260 98.95 CASIA WebFace() 49 10575 FaceNet(1] 2015 20000 99.63 MSCeleb(21-2] 1000 100000 Caffeface( 2016 70 99.28 人脸边框，21特征点， Facebook(14] 2015 50000 98.00 UMDfaces[23) 31 8501 性别和3D姿态 FaceNet_centerloss[]2017 505 1 99.30 MegaFace(] 100 69052 人脸识别测集合可以看出，DCNN需要大量数据进行训练，虽然 Youtube face[24] 3 425 videos 1 595 非限制场景、视频很多数据可以从网络上抓取，但是没有组织，需要 Low-shot face 面部区域被手动标注信息。可用性强并且标注信息丰富的大 recogntion[2s) 100-20021000 裁剪和对齐规模数据库往往由Google、Facebook和百度这样的人脸边框和大型公司持有，但因为版权和隐私的问题，它们并 MF2 Training Dataset[) 470672000 68个特征点

通用算法［１，４－５，７－１０］。虽然ＤＣＮＮ是通过从大量数据中自动学习更具区分力的特征，人脸识别的主要目的也是通过从海量数据中学习具有泛化能力的人脸特征，但最大的挑战是如何训练更好的ＤＣＮＮ算法。目前可以通过以下两种方式进行提升：设计更强表达能力的网络结构；使用规模更大的数据集，对训练集进行更精确的预处理。１人脸识别技术与数据库现状２００９年发布的ＬＦＷ数据库的样本图片来自于互联网名人图像，其中有５７００余人１３０００多张图像，采用十折平均精度作为人脸识别性能指标，是在真实条件下最具权威的人脸识别数据库之一［１１］。有许多ＤＣＮＮ的开源实现已经公布，２０１４年Ｆａｃｅｂｏｏｋ［９］和香港中文大学［１２］使用ＤＣＮＮ技术在人脸识别中取得重大突破，分别在ＬＦＷ上获得了９７．３５％和９７．４５％的平均分类精度。随后，在ＬＦＷ数据集上平均分类精度分别由ＶＧＧｆａｃｅ、ＣａｆｆｅＦａｃｅ和ＧｏｏｇｌｅＦａｃｅＮｅｔ刷新到９７．２７％、９９．２８％和９９．６３％，百度公司甚至得到９９．７７％的准确率［１３］。ＤＣＮＮ算法之所以需要大量的数据，主要原因在于越大规模的数据越能够学习到更加抽象、更加鲁棒的特征。表１中的数据充分体现了这一趋势：ＤｅｅｐＩＤ系列从２０万～４５万，Ｃａｆｆｅｆａｃｅ使用７０万，百度使用１２０万，ＤｅｅｐＦａｃｅ为４亿，ＶＧＧＦａｃｅ有２６０万，谷歌达到２亿，Ｆａｃｅｂｏｏｋ使用超过１０万人的５０亿图像数据库［１４］。表１几种经典的ＤＣＮＮ模型在ＬＦＷ数据集上的测试结果Ｔａｂｌｅ１ＴｈｅｔｅｓｔｒｅｓｕｌｔｓｏｆｓｅｖｅｒａｌｃｌａｓｓｉｃＤＣＮＮｍｏｄｅｌｓｏｎｔｈｅＬＦＷｄａｔａｓｅｔ名称年份训练集数据量／万网络数量ＬＦＷ平均精度／％ＤｅｅｐＦａｃｅ［９］２０１４４００３９７．３５ＤｅｅｐＩＤ［２］２０１４２０２５９７．４５ＤｅｅｐＩＤ２［１］２０１４２０２５９９．１５ＤｅｅｐＩＤ２＋［１５］２０１５４５２５９９．４７ＶＧＧＦａｃｅ［４］２０１５２６０１９８．９５ＦａｃｅＮｅｔ［１６］２０１５２００００１９９．６３Ｃａｆｆｅｆａｃｅ［１７］２０１６７０１９９．２８Ｆａｃｅｂｏｏｋ［１４］２０１５５００００－９８．００ＦａｃｅＮｅｔ＿ｃｅｎｔｅｒｌｏｓｓ［１８］２０１７５０５１９９．３０可以看出，ＤＣＮＮ需要大量数据进行训练，虽然很多数据可以从网络上抓取，但是没有组织，需要手动标注信息。可用性强并且标注信息丰富的大规模数据库往往由Ｇｏｏｇｌｅ、Ｆａｃｅｂｏｏｋ和百度这样的大型公司持有，但因为版权和隐私的问题，它们并没有公开发布。由于在获取大规模标注信息丰富、准确度高的数据库方面遇到了较大的障碍，人脸识别技术在学术领域处于被动状态，甚至落后于工业界。为了克服这个问题，越来越多的研究机构也相继发布了一些大型的、多样化的数据集。目前，表２是公开的一些大型人脸数据集及其标注信息，香港中文大学团队发布了ＣｅｌｅｂＦａｃｅｓ＋数据集，包含了大约１００００个身份的２０万张图像，标注信息丰富，身份信息未划分，主要可以用来研究特征点定位和人脸属性学习。２０１４年中科院自动化研究所发布并建立了一个大规模的ＣＡＳＩＡ⁃ｗｅｂｆａｃｅ人脸识别数据集，包含了大约１０５００个身份的４９万张图像，并表示这个数据集是作为大规模训练集来使用。在文献［４］中，作者也公布了２６２２个身份的２６０万张图像。ＭｅｇａＦａｃｅ［２０］数量大于ＣＡＳＩＡ，但是被设计为测试集，每个人提供的图像很少，因此它从未用于训练ＤＣＮＮ系统。目前，这些数据集仍有很多噪声，身份标签错误，单张图像含有多个人脸等（图１）问题，这导致数据库的准确性很难得到保证。图１数据库存的问题示例Ｆｉｇ．１Ｅｘａｍｐｌｅｓｏｆｐｒｏｂｌｅｍｓｔｈａｔｅｘｉｓｔｗｉｔｈｔｈｅｄａｔａｂａｓｅ表２人脸检测和识别数据集Ｔａｂｌｅ２ＦａｃｅＤｅｔｅｃｔｉｏｎａｎｄＩｄｅｎｔｉｆｉｃａｔｉｏｎＤａｔａＳｅｔ数据集图像数量（万）人数注释属性ＶＧＧＦａｃｅ［４］２６０２６２２人脸边框和姿态ＣＡＳＩＡＷｅｂＦａｃｅ［１９］４９１０５７５ — ＭＳＣｅｌｅｂ［２１－２２］１０００１０００００ — ＵＭＤｆａｃｅｓ［２３］３７８５０１人脸边框，２１特征点，性别和３Ｄ姿态ＭｅｇａＦａｃｅ［２０］１００６９０５７２人脸识别测集合Ｙｏｕｔｕｂｅｆａｃｅ［２４］３４２５ｖｉｄｅｏｓ１５９５非限制场景、视频Ｌｏｗ⁃ｓｈｏｔｆａｃｅｒｅｃｏｇｎｔｉｏｎ［２５］１００－２００２１０００面部区域被裁剪和对齐ＭＦ２ＴｒａｉｎｉｎｇＤａｔａｓｅｔ［２６］４７０６７２０００人脸边框和６８个特征点第５期夏洋洋，等：人脸识别背后的数据清理问题研究 ·６１７·

.618 智能系统学报第12卷 DCNN的训练集通常需要进行大量的预处理工 2.1脸检测与特征点定位作，包括图像反转、随机裁剪、多尺度、彩色渲染、标人脸检测和人脸对齐已经成为独立的研究方准化数据等。通过不同方式的预处理产生的结果向，人脸特征提取的前提就需要对这些算法进行研也是有很大偏差的，主要表现为人脸检测错误、特究，其中必不可少的就是人脸检测。人脸对齐（校征点定位错误、身份归类错误等，这些偏差会对训准)或面部特征点定位主要是通过瞳孔、眉毛、嘴巴练结果造成较大的影响。为了研究数据库准确性等人脸上的面部特征点对人脸进行校准，以促进正对DCNN训练的影响，本文提出了一种多角度评估面特征提取，特别是对于局部关键特征提取。数据清理方法，主要贡献总结包括：)从人脸检测、特本节主要对香港中文大学DCNN Seetaface、中征点定位和人脸相似性等方面对数据库进行了清理：国科学院的面部检测算法和深圳先进学校MTCNN 2)验证清理图像数据库的有效性，以提高训练准确性。算法[2通过比较分析实际面部检测表现，并针对接 2 多角度评价清理图像下来的大规模脸数据集选择适当的人脸检测和关键点检测算法，从不同角度对DCNN、Seetaface、首先，采用当前主流的人脸检测和特征点定位 MTCNN这3种算法进行测试和分析，验证3种算法算法对数据集进行清理。其次，利用公开的网络模的性能。型提取特征计算相似度，并使用相似度统计算法进表3是3种算法在3个不同测试数据集上5个行图像清理。如图2是数据清理的具体流程。关键点的平均差、标准差和效率。从表3中可以看人脸检测原始数清理未检清理过后流程1：据集s 特征的出，DCNN算法的标准差均小于Seetaface算法和测到的的数据集定位图像 MTCNN算法，MTCNN算法略好于Seetaface算法，提取特征在这3个小数据集的测试中DCNN算法的稳定性最流程2：清理后的人脸对齐数据集归一化计算相似度好，其次是MTCNN;从平均误差来说，表现最好的是 Seetaface算法，表明Seetaface算法可以适应更广泛最终保留根据缝法统计图像的数据集清理图像不相似的的场景。数量通过比较人脸检测和特征点定位的时间效率图2数据清理流程可以看出，MTCNN检测的时间最短，DCNN算法检 Fig.2 Data cleansing process 测的时间最长。表35个关键点的测试平均差、标准差和效率 Table 3 Five key points of the test mean difference,standard deviation and efficiency DCNN算法 Seetaface算法 MTCNN 算法平均差标准差效率/f·s1 平均差标准差效率/f·s 平均差标准差效率1·s HELEN 0.0432 0.0136 3.6 0.0362 0.0172 5.1 0.0421 0.0250 15.4 AFW 0.0680 0.0202 4.1 0.0555 0.0383 7.0 0.0629 0.0375 18.2 LFPW 0.0594 0.0156 3.9 0.0490 0.0226 6.5 0.0482 0.0182 17.5 在本文中训练深度卷积神经网络需要大规模根据上述实际测试的数据，本文选择MTCNN 数据集预处理工作，因此需要考虑面部检测算法的算法作为所有数据库的面部检测算法。综合性能，主要包括效果和效率。表4进一步进行 2.2基于相似度统计的图像清理了两次大规模数据集的测试，从表4可以看出，基于相似度统计的图像清理算法的3个主要步 MTCNN算法对大数据的稳定性较好，CelebA共计骤如下。 20多万图像，测试CelebA时MTCNN算法实际检测 1)人脸对齐的面部图像为l82387张，Seetaface算法实际检测所有的人脸区域都需要对齐到112×96的RGB 的脸部图像为1800O32张，MTCNN算法在大规模图像，这里使用来自于文献[17]给出的对齐好的示例数据集中具有较好的效果。图像的5个关键点作为标准人脸模板，根据式(1)求表4大规模数据集上5个特征点的比较出5个关键点的平均值，：，其中，表示对应图 Table 4 Comparison of five feature points on large-scale data 像点的坐标，i=1,2,3,4,5分别表示这5个关键点， j表示第j张图像，n表示所有的示例图像。评价指标数据集 MTCNN Seetaface 平均误差 Lfpw_net 0.0492 0.0555 Lx/n CelebA 0.0488 0.0490 (1) 标准误差 Lfpw net 0.0251 0.0383 CelebA 0.0248 0.0326 j=i

ＤＣＮＮ的训练集通常需要进行大量的预处理工作，包括图像反转、随机裁剪、多尺度、彩色渲染、标准化数据等。通过不同方式的预处理产生的结果也是有很大偏差的，主要表现为人脸检测错误、特征点定位错误、身份归类错误等，这些偏差会对训练结果造成较大的影响。为了研究数据库准确性对ＤＣＮＮ训练的影响，本文提出了一种多角度评估数据清理方法，主要贡献总结包括：１）从人脸检测、特征点定位和人脸相似性等方面对数据库进行了清理；２）验证清理图像数据库的有效性，以提高训练准确性。２多角度评价清理图像首先，采用当前主流的人脸检测和特征点定位算法对数据集进行清理。其次，利用公开的网络模型提取特征计算相似度，并使用相似度统计算法进行图像清理。如图２是数据清理的具体流程。图２数据清理流程Ｆｉｇ．２Ｄａｔａｃｌｅａｎｓｉｎｇｐｒｏｃｅｓｓ２．１脸检测与特征点定位人脸检测和人脸对齐已经成为独立的研究方向，人脸特征提取的前提就需要对这些算法进行研究，其中必不可少的就是人脸检测。人脸对齐（校准）或面部特征点定位主要是通过瞳孔、眉毛、嘴巴等人脸上的面部特征点对人脸进行校准，以促进正面特征提取，特别是对于局部关键特征提取。本节主要对香港中文大学ＤＣＮＮＳｅｅｔａｆａｃｅ、中国科学院的面部检测算法和深圳先进学校ＭＴＣＮＮ算法［２７］通过比较分析实际面部检测表现，并针对接下来的大规模脸数据集选择适当的人脸检测和关键点检测算法，从不同角度对ＤＣＮＮ、Ｓｅｅｔａｆａｃｅ、ＭＴＣＮＮ这３种算法进行测试和分析，验证３种算法的性能。表３是３种算法在３个不同测试数据集上５个关键点的平均差、标准差和效率。从表３中可以看出，ＤＣＮＮ算法的标准差均小于Ｓｅｅｔａｆａｃｅ算法和ＭＴＣＮＮ算法，ＭＴＣＮＮ算法略好于Ｓｅｅｔａｆａｃｅ算法，在这３个小数据集的测试中ＤＣＮＮ算法的稳定性最好，其次是ＭＴＣＮＮ；从平均误差来说，表现最好的是Ｓｅｅｔａｆａｃｅ算法，表明Ｓｅｅｔａｆａｃｅ算法可以适应更广泛的场景。通过比较人脸检测和特征点定位的时间效率可以看出，ＭＴＣＮＮ检测的时间最短，ＤＣＮＮ算法检测的时间最长。表３５个关键点的测试平均差、标准差和效率Ｔａｂｌｅ３Ｆｉｖｅｋｅｙｐｏｉｎｔｓｏｆｔｈｅｔｅｓｔｍｅａｎｄｉｆｆｅｒｅｎｃｅ，ｓｔａｎｄａｒｄｄｅｖｉａｔｉｏｎａｎｄｅｆｆｉｃｉｅｎｃｙ算法ＤＣＮＮ算法Ｓｅｅｔａｆａｃｅ算法ＭＴＣＮＮ平均差标准差效率／ｆ·ｓ－１平均差标准差效率／ｆ·ｓ－１平均差标准差效率／ｆ·ｓ－１ＨＥＬＥＮ０．０４３２０．０１３６３．６０．０３６２０．０１７２５．１０．０４２１０．０２５０１５．４ＡＦＷ０．０６８００．０２０２４．１０．０５５５０．０３８３７．００．０６２９０．０３７５１８．２ＬＦＰＷ０．０５９４０．０１５６３．９０．０４９００．０２２６６．５０．０４８２０．０１８２１７．５在本文中训练深度卷积神经网络需要大规模数据集预处理工作，因此需要考虑面部检测算法的综合性能，主要包括效果和效率。表４进一步进行了两次大规模数据集的测试，从表４可以看出，ＭＴＣＮＮ算法对大数据的稳定性较好，ＣｅｌｅｂＡ共计２０多万图像，测试ＣｅｌｅｂＡ时ＭＴＣＮＮ算法实际检测的面部图像为１８２３８７张，Ｓｅｅｔａｆａｃｅ算法实际检测的脸部图像为１８００３２张，ＭＴＣＮＮ算法在大规模数据集中具有较好的效果。表４大规模数据集上５个特征点的比较Ｔａｂｌｅ４Ｃｏｍｐａｒｉｓｏｎｏｆｆｉｖｅｆｅａｔｕｒｅｐｏｉｎｔｓｏｎｌａｒｇｅ⁃ｓｃａｌｅｄａｔａ评价指标数据集ＭＴＣＮＮＳｅｅｔａｆａｃｅ平均误差Ｌｆｐｗ＿ｎｅｔ０．０４９２０．０５５５ＣｅｌｅｂＡ０．０４８８０．０４９０标准误差Ｌｆｐｗ＿ｎｅｔ０．０２５１０．０３８３ＣｅｌｅｂＡ０．０２４８０．０３２６根据上述实际测试的数据，本文选择ＭＴＣＮＮ算法作为所有数据库的面部检测算法。２．２基于相似度统计的图像清理基于相似度统计的图像清理算法的３个主要步骤如下。１）人脸对齐所有的人脸区域都需要对齐到１１２×９６的ＲＧＢ图像，这里使用来自于文献［１７］给出的对齐好的示例图像的５个关键点作为标准人脸模板，根据式（１）求出５个关键点的平均值ｘ－ｉ、ｙ－ｉ，其中，ｘｊｉ、ｙｊｉ表示对应图像点的坐标，ｉ＝１，２，３，４，５分别表示这５个关键点，ｊ表示第ｊ张图像，ｎ表示所有的示例图像。ｘ－ｉ＝ ∑ ｎｊ＝１ｘｊｉ／ｎｙ－ｉ＝ ∑ ｎｊ＝１ｙｊｉ／ｎ ì î í ï ï ï ï （１） ·６１８· 智能系统学报第１２卷

第5期夏洋洋，等：人脸识别背后的数据清理问题研究 ·619. 在求出标准模板之后，根据式(2)求出原图到式(5)表明如何判断两个图像是否为同一目标图像的仿射变换矩阵：个人。 T=cp2tform(Opt,Cpt,'similarity')(2) 1, similarity(P:,P,）≥T 式中：Opt是原图像的5个特征点，Cpt是标准模板 Li= 0,similarity(P,P）<T'ij=L,2,…,n 的5个点，T是求得的变换矩阵，cp2fom是 (5) MATLAB的标准函数。式中：P:、P,表示一类图像中的第i和j张图像的特根据式(3)得出对齐之后的人脸图像：征向量，L,表示第i和j张图像是否为同一个人。 crop imtransform(I,T,'XData',[1,imgsize(2)], 3)根据不相似的图像的比例确定是否清理 'YData',[1,imgsize(1)],'size',imgsize)(3) 根据式(6)统计同一个人的人脸图像C中每一式中：I是原图像，imgsize是要对齐的图像尺寸，crop 张图像与其他图像不相似的数目。是对齐之后的人脸图像，imtransform是MATLAB的 N:count(L=0),j=1,2,..,n (6) 标准函数。式中：N:表示第i张图像与其他图像不相似的数 2)人脸特征提取与相似度计算目，i=1,2,…,no 本文使用的网络结构来自于文献[17]在git山hub 最后，根据式(7)判断是否清理该图像。上提供的开源文件，如图3所示。 delete,N:≥An C:卷积层对于C P:池化层 hold,N,<n,i=1,2,…,n(7) LC:局积 FC:全连接层式中：n表示一类人脸所有图像数目：参数入的值需 Softmax @ 损失函数要根据不同的数据库来确定，具体入值将在下一章实验部分具体分析。中心损失函数 3 实验与分析图3本文中人脸识别任务中使用的DCNN架构 Fig.3 The DCNN architecture used in face recognition 本节选取了CASIA-webface数据集、UMDface tasks in this article 数据集和MSceleb数据集作为实验数据库，并选取 Softmax损失函数和中心损失函数的联合监视. 公共权威人脸识别测试数据集LFW和Youtube face 可以训练足够强大的DCNN,并且能够得到两个关作为测试数据集。键学习目标的深层特征以及尽可能高的类间分散 LFW收集的数据集包含5749个不同的人，有性和类内紧密性。这些特性对人脸识别来说至关姿态、表情和光照的变化，总共13233个图像，旨在重要。提取特征的模型也采用了文献[17]公布的研究人脸图像数据库中的困难的人脸识别问题。根网络模型，部分超参数设置由实际数据库来确定。据LFW提供的测试方案一unrestricted with 对于特征提取，按照惯例在进入网络模型之 labeled outside data2】,我们测试了6000个人脸对，前，RGB图像像素值将减去127.5，并将每个像素值人脸如图4所示。除以128。深度特征来自第一F℃层的输出，提取每个图像的特征和翻转图像的特征，并将其作为特征向量进行连接。在提取所有图像的特征之后，对从两个不同图像提取的特征向量进行相似性计算。所使用的度量是余弦距离，(4)式是两个特征向量 A和B的角度，直接计算余弦距离作为相似度S,即 AB (a)匹配的对 )不匹配的对 S(A,B)=cos(0)=AB (4) 图4LFW测试协议人脸对使用等误差率(EER)作为判断是否为同一个 Fig.4 The LFW test protocol face pair 人的阈值。当相似度超过该阈值T时，认定为同一 Youtube脸(YTF)数据集包含3495个不同人个人，小于阈值T时不为同一个人。对于每种图像，的视频，平均每人2.15个视频。剪辑持续48~6070 进行相似度计算，1表示两个图像是同一个人，0表帧，平均长度为181.3帧。它旨在研究视频下人脸示两个图像不是一个人。识别的问题。根据YT℉提供的测试协议

在求出标准模板之后，根据式（２）求出原图到目标图像的仿射变换矩阵：Ｔ＝ｃｐ２ｔｆｏｒｍ（Ｏｐｔ，Ｃｐｔ，′ｓｉｍｉｌａｒｉｔｙ′）（２）式中：Ｏｐｔ是原图像的５个特征点，Ｃｐｔ是标准模板的５个点，Ｔ是求得的变换矩阵，ｃｐ２ｔｆｏｒｍ是ＭＡＴＬＡＢ的标准函数。根据式（３）得出对齐之后的人脸图像：ｃｒｏｐ＝ｉｍｔｒａｎｓｆｏｒｍ（Ｉ，Ｔ，′ＸＤａｔａ′，［１，ｉｍｇｓｉｚｅ（２）］， ′ＹＤａｔａ′，［１，ｉｍｇｓｉｚｅ（１）］，′ｓｉｚｅ′，ｉｍｇｓｉｚｅ）（３）式中：Ｉ是原图像，ｉｍｇｓｉｚｅ是要对齐的图像尺寸，ｃｒｏｐ是对齐之后的人脸图像，ｉｍｔｒａｎｓｆｏｒｍ是ＭＡＴＬＡＢ的标准函数。２）人脸特征提取与相似度计算本文使用的网络结构来自于文献［１７］在ｇｉｔｈｕｂ上提供的开源文件，如图３所示。图３本文中人脸识别任务中使用的ＤＣＮＮ架构Ｆｉｇ．３ＴｈｅＤＣＮＮａｒｃｈｉｔｅｃｔｕｒｅｕｓｅｄｉｎｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｔａｓｋｓｉｎｔｈｉｓａｒｔｉｃｌｅＳｏｆｔｍａｘ损失函数和中心损失函数的联合监视，可以训练足够强大的ＤＣＮＮ，并且能够得到两个关键学习目标的深层特征以及尽可能高的类间分散性和类内紧密性。这些特性对人脸识别来说至关重要。提取特征的模型也采用了文献［１７］公布的网络模型，部分超参数设置由实际数据库来确定。对于特征提取，按照惯例在进入网络模型之前，ＲＧＢ图像像素值将减去１２７．５，并将每个像素值除以１２８。深度特征来自第一ＦＣ层的输出，提取每个图像的特征和翻转图像的特征，并将其作为特征向量进行连接。在提取所有图像的特征之后，对从两个不同图像提取的特征向量进行相似性计算。所使用的度量是余弦距离，（４）式是两个特征向量Ａ和Ｂ的角度，直接计算余弦距离作为相似度Ｓ，即Ｓ（Ａ，Ｂ）＝ｃｏｓ（θ）＝ＡＢＡＢ（４）使用等误差率（ＥＥＲ）作为判断是否为同一个人的阈值。当相似度超过该阈值Ｔ时，认定为同一个人，小于阈值Ｔ时不为同一个人。对于每种图像，进行相似度计算，１表示两个图像是同一个人，０表示两个图像不是一个人。式（５）表明如何判断两个图像是否为同一个人。Ｌｉｊ＝１，ｓｉｍｉｌａｒｉｔｙ（Ｐｉ，Ｐｊ） ≥ Ｔ {０，ｓｉｍｉｌａｒｉｔｙ（Ｐｉ，Ｐｊ）＜Ｔ，ｉ，ｊ＝１，２，…，ｎ（５）式中：Ｐｉ、Ｐｊ表示一类图像中的第ｉ和ｊ张图像的特征向量，Ｌｉｊ表示第ｉ和ｊ张图像是否为同一个人。３）根据不相似的图像的比例确定是否清理根据式（６）统计同一个人的人脸图像Ｃ中每一张图像与其他图像不相似的数目。Ｎｉ＝ｃｏｕｎｔ（Ｌｉｊ＝０），ｊ＝１，２，…，ｎ（６）式中：Ｎｉ表示第ｉ张图像与其他图像不相似的数目，ｉ＝１，２，…，ｎ。最后，根据式（７）判断是否清理该图像。对于Ｃｄｅｌｅｔｅ，Ｎｉ ≥ λｎ { ｈｏｌｄ，Ｎｉ＜ λｎ，ｉ＝１，２，…，ｎ（７）式中：ｎ表示一类人脸所有图像数目；参数 λ 的值需要根据不同的数据库来确定，具体 λ 值将在下一章实验部分具体分析。３实验与分析本节选取了ＣＡＳＩＡ⁃ｗｅｂｆａｃｅ数据集、ＵＭＤｆａｃｅ数据集和ＭＳｃｅｌｅｂ数据集作为实验数据库，并选取公共权威人脸识别测试数据集ＬＦＷ和Ｙｏｕｔｕｂｅｆａｃｅ作为测试数据集。ＬＦＷ收集的数据集包含５７４９个不同的人，有姿态、表情和光照的变化，总共１３２３３个图像，旨在研究人脸图像数据库中的困难的人脸识别问题。根据ＬＦＷ提供的测试方案———ｕｎｒｅｓｔｒｉｃｔｅｄｗｉｔｈｌａｂｅｌｅｄｏｕｔｓｉｄｅｄａｔａ［２８］，我们测试了６０００个人脸对，人脸如图４所示。图４ＬＦＷ测试协议人脸对Ｆｉｇ．４ＴｈｅＬＦＷｔｅｓｔｐｒｏｔｏｃｏｌｆａｃｅｐａｉｒＹｏｕｔｕｂｅ脸（ＹＴＦ）数据集包含３４９５个不同人的视频，平均每人２．１５个视频。剪辑持续４８～６０７０帧，平均长度为１８１．３帧。它旨在研究视频下人脸识别的问题。根据ＹＴＦ提供的测试协议——— 第５期夏洋洋，等：人脸识别背后的数据清理问题研究 ·６１９·

·620 智能系统学报第12卷 unrestricted with labeled outside data,测试5Ooo个视使用UMDface数据库和Webface数据库，这两个数频对，如图5所示。据库在保证数据准确性的程度上表现出很大的区别，UMDface的数据库精度由大量人工信息标注，并且类别精确，Webface数据库则没有任何人脸标注信息，很难保证数据的准确性。MSceleb的准确性 (a)匹配的对由于规模庞大，更加难以保证数据准确性，3个数据库的详细数据对比如表5所示。 8883888 表53个数据库的属性比较 (b)不匹配对 Table 5 Comparison of the properties of the three data sets 图5YTF测试协议人脸视频对数据库人数图像总数是否清理噪声规模 Fig.5 The YTF test protocol face video pair UMDface 8501 367920 是极少 3.1训练细节 Webface 10575 494414 否少量 1)预处理 CASIA-webface和MSceleb使用2.1节提出的人 MSceleb890768549824 否大量脸检测方法进行初步筛选，删除未检测到的人脸图在表6中，EER是等错误率的准确率，这种像，并使用2.2节步骤1提出的人脸对齐将所有的精度是面部识别性能的重要指标。当FPR较小人脸图像对齐成112×96的RGB图像。UMDface数时，较大的TPR可以进一步解释模型的影响，应据集是经过包括人工判断在内的深度清理过的人用场景不同对FPR的要求也不一样。因此，从表脸图像数据集，清理过程在文献[23]中具体描述， 6可以看出，UMDface以最小的规模实现了最高提供了21个关键点的标注信息，我们选取了与的精度，而MSceleb数据库规模最大，准确率也是 MTCNN算法检测相同的5个点作为UMDface原始最低的，数据的准确性对训练的影响是非常大图像的特征点，并使用2.2节步骤1提出的方法进的，即使数据规模再大，无法保证较高的数据精行人脸对齐。度，也无法获得较高的准确率，说明进行数据库 2)数据集设置清理是非常有必要的。本文使用经过2.1节方式清理过的CASIA- 表6不同模型在LFW上的准确率 webface作为第1个数据集A,共有10575个人， Table 6 The accuracy of different models on LFW 491582张图像。使用UMDface数据集作为第2个训练数据集 EER/% FPR=0.01 FPR=0.001 数据集B,共有8501个人，367919张图像。第3个数据集C来自于2.2节得出最终清理的数据集。经 UMDface 99.07 99.02 96.10 过2.1节方式清理过的MSceleb数据集作为第4个 Webface 98.53 98.10 92.77 数据集D,共有近90000个人，8500000余张图像。所有数据集按照11：1的比例分为训练集和验证集， MSceleb 98.43 97.80 90.90 至少使用一个图像作为验证集。 3.3参数入和一类图像的最小灵敏度 3)网络设置和参数参数入在清理图像数量方面起着重要作用，这本文使用的是windows环境下配置的caffe 可能会影响训练结果，某类图像的最小数量也可能平台[2]来训练模型，本节中的所有CNN模型都会影响训练。是相同的架构，详细信息如图3所示。学习率从在第1个实验中，入从0.1~1来完成数据集A 0.1开始，学习策略(learning policy)多步衰减，迭的深度清理工作，并使用清理后的数据集来训练模代次数到15000、24000、32000次时学习率分型，这些模型在LFW数据集上的准确率如图6(a) 别除10，权重腐蚀(weight decay)为0.0005，记忆所示。显然，不做任何清理入=1)准确率最差；正确因子(momentum)为0.9。选择入的值可以提高DCNN特征的准确率；进行不 3.2不同准确度数据库训练实验同程度的清理（入不同）在一定范围内准确率保持本实验是研究不同精度数据库对训练的影响，稳定，清理过度会导准确率下降。本文建议将入的

ｕｎｒｅｓｔｒｉｃｔｅｄｗｉｔｈｌａｂｅｌｅｄｏｕｔｓｉｄｅｄａｔａ，测试５０００个视频对，如图５所示。图５ＹＴＦ测试协议人脸视频对Ｆｉｇ．５ＴｈｅＹＴＦｔｅｓｔｐｒｏｔｏｃｏｌｆａｃｅｖｉｄｅｏｐａｉｒ３．１训练细节１）预处理ＣＡＳＩＡ⁃ｗｅｂｆａｃｅ和ＭＳｃｅｌｅｂ使用２．１节提出的人脸检测方法进行初步筛选，删除未检测到的人脸图像，并使用２．２节步骤１提出的人脸对齐将所有的人脸图像对齐成１１２×９６的ＲＧＢ图像。ＵＭＤｆａｃｅ数据集是经过包括人工判断在内的深度清理过的人脸图像数据集，清理过程在文献［２３］中具体描述，提供了２１个关键点的标注信息，我们选取了与ＭＴＣＮＮ算法检测相同的５个点作为ＵＭＤｆａｃｅ原始图像的特征点，并使用２．２节步骤１提出的方法进行人脸对齐。２）数据集设置本文使用经过２．１节方式清理过的ＣＡＳＩＡ⁃ ｗｅｂｆａｃｅ作为第１个数据集Ａ，共有１０５７５个人，４９１５８２张图像。使用ＵＭＤｆａｃｅ数据集作为第２个数据集Ｂ，共有８５０１个人，３６７９１９张图像。第３个数据集Ｃ来自于２．２节得出最终清理的数据集。经过２．１节方式清理过的ＭＳｃｅｌｅｂ数据集作为第４个数据集Ｄ，共有近９００００个人，８５０００００余张图像。所有数据集按照１１ ∶１的比例分为训练集和验证集，至少使用一个图像作为验证集。３）网络设置和参数本文使用的是ｗｉｎｄｏｗｓ环境下配置的ｃａｆｆｅ平台［２９］来训练模型，本节中的所有ＣＮＮ模型都是相同的架构，详细信息如图３所示。学习率从０．１开始，学习策略（ｌｅａｒｎｉｎｇｐｏｌｉｃｙ）多步衰减，迭代次数到１５０００、２４０００、３２０００次时学习率分别除１０，权重腐蚀（ｗｅｉｇｈｔｄｅｃａｙ）为０．０００５，记忆因子（ｍｏｍｅｎｔｕｍ）为０．９。３．２不同准确度数据库训练实验本实验是研究不同精度数据库对训练的影响，使用ＵＭＤｆａｃｅ数据库和Ｗｅｂｆａｃｅ数据库，这两个数据库在保证数据准确性的程度上表现出很大的区别，ＵＭＤｆａｃｅ的数据库精度由大量人工信息标注，并且类别精确，Ｗｅｂｆａｃｅ数据库则没有任何人脸标注信息，很难保证数据的准确性。ＭＳｃｅｌｅｂ的准确性由于规模庞大，更加难以保证数据准确性，３个数据库的详细数据对比如表５所示。表５３个数据库的属性比较Ｔａｂｌｅ５Ｃｏｍｐａｒｉｓｏｎｏｆｔｈｅｐｒｏｐｅｒｔｉｅｓｏｆｔｈｅｔｈｒｅｅｄａｔａｓｅｔｓ数据库人数图像总数是否清理噪声规模ＵＭＤｆａｃｅ８５０１３６７９２０是极少Ｗｅｂｆａｃｅ１０５７５４９４４１４否少量ＭＳｃｅｌｅｂ８９０７６８５４９８２４否大量在表６中，ＥＥＲ是等错误率的准确率，这种精度是面部识别性能的重要指标。当ＦＰＲ较小时，较大的ＴＰＲ可以进一步解释模型的影响，应用场景不同对ＦＰＲ的要求也不一样。因此，从表６可以看出，ＵＭＤｆａｃｅ以最小的规模实现了最高的精度，而ＭＳｃｅｌｅｂ数据库规模最大，准确率也是最低的，数据的准确性对训练的影响是非常大的，即使数据规模再大，无法保证较高的数据精度，也无法获得较高的准确率，说明进行数据库清理是非常有必要的。表６不同模型在ＬＦＷ上的准确率Ｔａｂｌｅ６ＴｈｅａｃｃｕｒａｃｙｏｆｄｉｆｆｅｒｅｎｔｍｏｄｅｌｓｏｎＬＦＷ训练数据集ＥＥＲ／％ＦＰＲ＝０．０１ＦＰＲ＝０．００１ＵＭＤｆａｃｅ９９．０７９９．０２９６．１０Ｗｅｂｆａｃｅ９８．５３９８．１０９２．７７ＭＳｃｅｌｅｂ９８．４３９７．８０９０．９０３．３参数 λ 和一类图像的最小灵敏度参数 λ 在清理图像数量方面起着重要作用，这可能会影响训练结果，某类图像的最小数量也可能会影响训练。在第１个实验中，λ 从０．１～１来完成数据集Ａ的深度清理工作，并使用清理后的数据集来训练模型，这些模型在ＬＦＷ数据集上的准确率如图６（ａ）所示。显然，不做任何清理 λ ＝１）准确率最差；正确选择 λ 的值可以提高ＤＣＮＮ特征的准确率；进行不同程度的清理（λ 不同）在一定范围内准确率保持稳定，清理过度会导准确率下降。本文建议将 λ 的 ·６２０· 智能系统学报第１２卷

第5期夏洋洋，等：人脸识别青后的数据清理问题研究 621· 值设定在0.3~0.6，然后使用不同程度的清理数据也是本文的2倍，而在测试时，Caffeface的结果是经集进行训练，并选取最佳入值。过特征提取后的PCA处理，本文的结果未被PCA 在第2个实验中，将入值设为0.4，再继续清理处理，也与原来的结果非常接近，进一步证明了数掉某些类图像数目少于一定值（从10到20）的类，据清理的有效性。然后使用清理后的数据集来训练模型，这些模型在表7LFW上的人脸验证结果 LFW数据集上的准确率如图6(b)所示。同样，这 Table 7 Face verification results on LFW 种模式的准确性在一定范围内可以稳定，最好的结方法数据是训练训练网络 LFW 果是每个类别中不少于15个人，参数入=0.4，清理名称否清理人数数量/万个数准确率% 后的CASIA-webface数据集有9240个人，一共 DeepID是（人工）10177 场子 97.45 400000张图像作为数据集C。 99.5 DeeplD2是（人工）10177 20 25 99.15 99.0 Deepface 是 4030 400 97.35 98.5 Caffeface 是 17189 70 99.28 98.0 模型A 否 10575 49 1 98.47 97.5 模型B 是 8501 36 1 99.07 97.0 模型C 是 9240 40 99.17 96.5 00.10.20.30.40.50.60.70.80.91.0 模型A模型C DeeplD DeepID2 DeepFace (a)不同的入模型 1.0 模型B 99.5 99.0 0.9 40ey 98.5 98.0 97.5 0.8 97.0 96.5 1011121314151617181920 0.7 最少图像数目 0 0.1 假正率0.2 0.3 (b)A=0.4不同的最少图像数目模型 (a)假正率0-0.3的R0C曲线图6LFW数据集上验证准确率 1.00 模型C DeeplD2 Fig.6 Verification accuracy on LFW datasets 3.4在LFW和Youtube face上的测试结果 0.99 模型B 表7是在LFW上的测试结果和其他算法结果的对比，模型A是由数据集A作为训练集训练出来 0.98 模型A 的模型，模型B是由数据集B作为训练集训练出来 0.97 DeepFace 的模型，模型C是由数据集C作为训练集训练出来的模型。 0.96 图7显示了不同方法的0C曲线，我们可以从表7和图7的测试结果中得出以下结论：首先，模型 0.95 0 0.01 0.020.030.040.05 C在3个实验模型中达到了最高的精度，模型B精假正率度高于模型A,表明数据清理明显提高了人脸识别 (b)假正率0-0.05的R0C曲线训练模型的准确性；其次，原来的Caffeface训练所图7LFW上不同方法的ROC曲线使用的数据集包含其他数据集，数据量更大，类别 Fig.7 ROC curves of different methods on LFW

值设定在０．３～０．６，然后使用不同程度的清理数据集进行训练，并选取最佳 λ 值。在第２个实验中，将 λ 值设为０．４，再继续清理掉某些类图像数目少于一定值（从１０到２０）的类，然后使用清理后的数据集来训练模型，这些模型在ＬＦＷ数据集上的准确率如图６（ｂ）所示。同样，这种模式的准确性在一定范围内可以稳定，最好的结果是每个类别中不少于１５个人，参数 λ ＝０．４，清理后的ＣＡＳＩＡ⁃ｗｅｂｆａｃｅ数据集有９２４０个人，一共４０００００张图像作为数据集Ｃ。（ａ）不同的 λ 模型（ｂ）λ＝０．４不同的最少图像数目模型图６ＬＦＷ数据集上验证准确率Ｆｉｇ．６ＶｅｒｉｆｉｃａｔｉｏｎａｃｃｕｒａｃｙｏｎＬＦＷｄａｔａｓｅｔｓ３．４在ＬＦＷ和Ｙｏｕｔｕｂｅｆａｃｅ上的测试结果表７是在ＬＦＷ上的测试结果和其他算法结果的对比，模型Ａ是由数据集Ａ作为训练集训练出来的模型，模型Ｂ是由数据集Ｂ作为训练集训练出来的模型，模型Ｃ是由数据集Ｃ作为训练集训练出来的模型。图７显示了不同方法的ＲＯＣ曲线，我们可以从表７和图７的测试结果中得出以下结论：首先，模型Ｃ在３个实验模型中达到了最高的精度，模型Ｂ精度高于模型Ａ，表明数据清理明显提高了人脸识别训练模型的准确性；其次，原来的Ｃａｆｆｅｆａｃｅ训练所使用的数据集包含其他数据集，数据量更大，类别也是本文的２倍，而在测试时，Ｃａｆｆｅｆａｃｅ的结果是经过特征提取后的ＰＣＡ处理，本文的结果未被ＰＣＡ处理，也与原来的结果非常接近，进一步证明了数据清理的有效性。表７ＬＦＷ上的人脸验证结果Ｔａｂｌｅ７ＦａｃｅｖｅｒｉｆｉｃａｔｉｏｎｒｅｓｕｌｔｓｏｎＬＦＷ方法名称数据是否清理训练人数训练数量／万网络个数ＬＦＷ准确率％ＤｅｅｐＩＤ是（人工）１０１７７２０２５９７．４５ＤｅｅｐＩＤ２是（人工）１０１７７２０２５９９．１５Ｄｅｅｐｆａｃｅ是４０３０４００３９７．３５Ｃａｆｆｅｆａｃｅ是１７１８９７０１９９．２８模型Ａ否１０５７５４９１９８．４７模型Ｂ是８５０１３６１９９．０７模型Ｃ是９２４０４０１９９．１７（ａ）假正率０～０．３的ＲＯＣ曲线（ｂ）假正率０～０．０５的ＲＯＣ曲线图７ＬＦＷ上不同方法的ＲＯＣ曲线Ｆｉｇ．７ＲＯＣｃｕｒｖｅｓｏｆｄｉｆｆｅｒｅｎｔｍｅｔｈｏｄｓｏｎＬＦＷ第５期夏洋洋，等：人脸识别背后的数据清理问题研究 ·６２１·

·622. 智能系统学报第12卷表8是在Youtube face数据集上本文得出的测试结果和其他算法结果的对比，测试协议按照3.1 4 结束语节对Youtube face数据库的描述进行。深度卷积神经网络的发展得益于大数据，因为表8 Youtube face上的人脸验证结果数据量够大，计算机够强大，机器本身才能学习出 Table 8 Face verification results on Youtube face 各种复杂的特征。而数据的准确性，也就是数据标方法是否训练训练网络签、标注信息、类别等的准确性，也会对训练的模型准确率/% 名称清理人数数量/万个数结果造成一定的影响，因此本文对数据库清理方面 CNN-3DMM (0] 否10575 49 1 88.80 做了研究。本文提出将数据库进行多角度清理后 DeeplD2+ 是 10177 45 25 93.20 再训练的方法，通过与未清理和其他方法的比较发 Deepface 是 4030 400 3 91.40 现，清理后的数据库在训练上结果更精确。实验证 Caffeface 是17189 70 1 94.90 明，清理后的数据集能够提高网络识别率。模型A 否10575 49 1 90.80 目前，大多数公开的数据集仍含有很多噪声，模型B 是8501 36 1 92.50 模型C 是9240 40 93.54 大规模数据去除噪声仍是一个值得重视的问题。 1 本文数据清理方法是否对所有数据库具有普适性，图8显示了不同方法的R0C曲线，我们还可以是否已经存在更高效更准确的数据清理方法需要从表8和图8的测试结果中得出以下结论：模型C 进一步探究。下一步的工作可以考虑将多个清理在3个模型中已经达到了最高的准确度，远远超过其他两个模型的ROC曲线，在非限制条件下的视频后的数据集进行合并来扩大数据量。场景中，数据清理仍然会提高人脸识别精度。在目参考文献：前的主流人脸识别算法中，模型C也显示出显著的成果，比3DMM算法、DeepID2+算法、Deepface算 [1]SUN Y,WANG X,TANG X.Deep learning face representation by joint identification-verification[J]. 法，以及Caffeface算法训练的效果好。图像清理后， Advances in neural information processing systems,2014, 对数据集进行训练，干扰因子较小，对于基于深卷 27:1988-1996. 积神经网络的人脸识别非常有用。 [2]SUN Y,WANG X.TANG X.Deep learning face 1.0 模型B representation from predicting 10,000 classes[C]//IEEE 模型C Conference on Computer Vision and Pattern Recognition Boston,USA,2014:1891-1898. 0.9 Deepface 3DMM CNN [3]王晓刚，孙袆，汤晓鸥.从统一子空间分析到联合深度学习：人脸识别的十年历程[J].中国计算机学会通讯， 2015,11(4):8-15. 模型A WANG Xiaogang,SUN Hui,TANG Xiaoou.From unified subspace analysis to joint depth learning:ten years of face recognition[].China computer society newsletter,2015, 0.1 0.2 0.3 假正率 11(4):8-15 (a)假正率0-0.3的R0C曲线 [4]PARKHI O M,VEDALDI A,ZISSERMAN A.Deep face 0.95 recognition[C]//British Machine Vision.London,Britain, 0.94 2015:411-4112. 0.93 Deepface [5]SCHROFF F,KALENICHENKO D,PHILBIN J.FaceNet: 0.92 模型C 0.91 A unified embedding for face recognition and clustering 0.90 [C]//IEEE Conference on Computer Vision and Pattern 0.89 3DMM CNN Recognition.Boston,USA,2015:815-823. 0.88 模型A [6]DING C.TAO D.A comprehensive survey on pose-invariant 0.87 模型B 0.86 face recognition[].Acm transactions on intelligent systems 0.85 and technology,2015,7(3):37. 00.010.020.030.040.050.060.070.080.090.10 [7]SUN Y,LIANG D,WANG X,et al.DeepID3:face 假正率 recognition with very deep neural networks[C]//IEEE (b)假正率0-0.1的R0C曲线 Conference on Computer Vision and Pattern Recognition. 图8 Youtube face上不同方法的ROC曲线 Boston,USA,2015:963-971. Fig.8 ROC curves of different methods on Youtube face [8]SUN Y,WANG X,TANG X.Hybrid deep learning for face

表８是在Ｙｏｕｔｕｂｅｆａｃｅ数据集上本文得出的测试结果和其他算法结果的对比，测试协议按照３．１节对Ｙｏｕｔｕｂｅｆａｃｅ数据库的描述进行。表８Ｙｏｕｔｕｂｅｆａｃｅ上的人脸验证结果Ｔａｂｌｅ８ＦａｃｅｖｅｒｉｆｉｃａｔｉｏｎｒｅｓｕｌｔｓｏｎＹｏｕｔｕｂｅｆａｃｅ方法名称是否清理训练人数训练数量／万网络个数准确率／％ＣＮＮ⁃３ＤＭＭ［３０］否１０５７５４９１８８．８０ＤｅｅｐＩＤ２＋是１０１７７４５２５９３．２０Ｄｅｅｐｆａｃｅ是４０３０４００３９１．４０Ｃａｆｆｅｆａｃｅ是１７１８９７０１９４．９０模型Ａ否１０５７５４９１９０．８０模型Ｂ是８５０１３６１９２．５０模型Ｃ是９２４０４０１９３．５４图８显示了不同方法的ＲＯＣ曲线，我们还可以从表８和图８的测试结果中得出以下结论：模型Ｃ在３个模型中已经达到了最高的准确度，远远超过其他两个模型的ＲＯＣ曲线，在非限制条件下的视频场景中，数据清理仍然会提高人脸识别精度。在目前的主流人脸识别算法中，模型Ｃ也显示出显著的成果，比３ＤＭＭ算法、ＤｅｅｐＩＤ２＋算法、Ｄｅｅｐｆａｃｅ算法，以及Ｃａｆｆｅｆａｃｅ算法训练的效果好。图像清理后，对数据集进行训练，干扰因子较小，对于基于深卷积神经网络的人脸识别非常有用。（ａ）假正率０～０．３的ＲＯＣ曲线（ｂ）假正率０～０．１的ＲＯＣ曲线图８Ｙｏｕｔｕｂｅｆａｃｅ上不同方法的ＲＯＣ曲线Ｆｉｇ．８ＲＯＣｃｕｒｖｅｓｏｆｄｉｆｆｅｒｅｎｔｍｅｔｈｏｄｓｏｎＹｏｕｔｕｂｅｆａｃｅ４结束语深度卷积神经网络的发展得益于大数据，因为数据量够大，计算机够强大，机器本身才能学习出各种复杂的特征。而数据的准确性，也就是数据标签、标注信息、类别等的准确性，也会对训练的模型结果造成一定的影响，因此本文对数据库清理方面做了研究。本文提出将数据库进行多角度清理后再训练的方法，通过与未清理和其他方法的比较发现，清理后的数据库在训练上结果更精确。实验证明，清理后的数据集能够提高网络识别率。目前，大多数公开的数据集仍含有很多噪声，大规模数据去除噪声仍是一个值得重视的问题。本文数据清理方法是否对所有数据库具有普适性，是否已经存在更高效更准确的数据清理方法需要进一步探究。下一步的工作可以考虑将多个清理后的数据集进行合并来扩大数据量。参考文献：［１］ＳＵＮＹ，ＷＡＮＧＸ，ＴＡＮＧＸ．Ｄｅｅｐｌｅａｒｎｉｎｇｆａｃｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｂｙｊｏｉｎｔｉｄｅｎｔｉｆｉｃａｔｉｏｎ⁃ｖｅｒｉｆｉｃａｔｉｏｎ［Ｊ］．Ａｄｖａｎｃｅｓｉｎｎｅｕｒａｌｉｎｆｏｒｍａｔｉｏｎｐｒｏｃｅｓｓｉｎｇｓｙｓｔｅｍｓ，２０１４，２７：１９８８－１９９６．［２］ＳＵＮＹ，ＷＡＮＧＸ，ＴＡＮＧＸ．Ｄｅｅｐｌｅａｒｎｉｎｇｆａｃｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｆｒｏｍｐｒｅｄｉｃｔｉｎｇ１０，０００ｃｌａｓｓｅｓ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｂｏｓｔｏｎ，ＵＳＡ，２０１４：１８９１－１８９８．［３］王晓刚，孙袆，汤晓鸥．从统一子空间分析到联合深度学习：人脸识别的十年历程［Ｊ］．中国计算机学会通讯，２０１５，１１（４）：８－１５．ＷＡＮＧＸｉａｏｇａｎｇ，ＳＵＮＨｕｉ，ＴＡＮＧＸｉａｏｏｕ．Ｆｒｏｍｕｎｉｆｉｅｄｓｕｂｓｐａｃｅａｎａｌｙｓｉｓｔｏｊｏｉｎｔｄｅｐｔｈｌｅａｒｎｉｎｇ：ｔｅｎｙｅａｒｓｏｆｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ［Ｊ］．Ｃｈｉｎａｃｏｍｐｕｔｅｒｓｏｃｉｅｔｙｎｅｗｓｌｅｔｔｅｒ，２０１５，１１（４）：８－１５．［４］ＰＡＲＫＨＩＯＭ，ＶＥＤＡＬＤＩＡ，ＺＩＳＳＥＲＭＡＮＡ．Ｄｅｅｐｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ［Ｃ］／／ＢｒｉｔｉｓｈＭａｃｈｉｎｅＶｉｓｉｏｎ．Ｌｏｎｄｏｎ，Ｂｒｉｔａｉｎ，２０１５：４１１－４１１２．［５］ＳＣＨＲＯＦＦＦ，ＫＡＬＥＮＩＣＨＥＮＫＯＤ，ＰＨＩＬＢＩＮＪ．ＦａｃｅＮｅｔ：Ａｕｎｉｆｉｅｄｅｍｂｅｄｄｉｎｇｆｏｒｆａｃｅｒｅｃｏｇｎｉｔｉｏｎａｎｄｃｌｕｓｔｅｒｉｎｇ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｂｏｓｔｏｎ，ＵＳＡ，２０１５：８１５－８２３．［６］ＤＩＮＧＣ，ＴＡＯＤ．Ａｃｏｍｐｒｅｈｅｎｓｉｖｅｓｕｒｖｅｙｏｎｐｏｓｅ⁃ｉｎｖａｒｉａｎｔｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ［Ｊ］．Ａｃｍｔｒａｎｓａｃｔｉｏｎｓｏｎｉｎｔｅｌｌｉｇｅｎｔｓｙｓｔｅｍｓａｎｄｔｅｃｈｎｏｌｏｇｙ，２０１５，７（３）：３７．［７］ＳＵＮＹ，ＬＩＡＮＧＤ，ＷＡＮＧＸ，ｅｔａｌ．ＤｅｅｐＩＤ３：ｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｗｉｔｈｖｅｒｙｄｅｅｐｎｅｕｒａｌｎｅｔｗｏｒｋｓ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｂｏｓｔｏｎ，ＵＳＡ，２０１５：９６３－９７１．［８］ＳＵＮＹ，ＷＡＮＧＸ，ＴＡＮＧＸ．Ｈｙｂｒｉｄｄｅｅｐｌｅａｒｎｉｎｇｆｏｒｆａｃｅ ·６２２· 智能系统学报第１２卷

第5期夏洋洋，等：人脸识别背后的数据清理问题研究 .623· verification[J].IEEE transactions on pattern analysis and [22]GUO Y,ZHANG L,HU Y,et al.MS-celeb-1M:a dataset machine intelligence,2016,38(10):1997-2009. and benchmark for large-scale face recognition[C]//IEEE [9]TAIGMAN Y,YANG M,RANZATO M,et al.Deepface: Conference on Computer Vision and Pattern Recognition. closing the gap to human-level performance in face Las Vegas,USA,2016:113-124. verification[C]//IEEE Conference on Computer Vision and [23]BANSAL A,NANDURI A,CASTILLO C,et al.UMDFaces: Pattern Recognition.Columbia,American, 2014: an annotated face dataset for training deep networks[C]/ 1701-1708. IEEE Conference on Computer Vision and Pattern [10]WEN Y,ZHANG K,LI Z,et al.A discriminative feature Recognition.Las Vegas,USA,2016:976-984. learning approach for deep face recognition C]//ECCV [24]WOLF L,HASSENER T,MAOZ I.Face recognition in Conference on Computer Vision.Amsterdam,Holand, unconstrained videos with matched background similarity 2016:499-515. [C]//Computer Vision and Pattern Recognition.Colorado [11]HUANG G B,MATTAR M,BERG T,et al.Labeled faces Springs,USA,2011:529-534. in the wild:a database for studying face recognition in [25 GUO Y,ZHANG L.One-shot face recognition by unconstrained environments[J].Month,2007. promoting underrepresented classes[].Computer vision [12 SUN Y,WANG X,TANG X.Deep learning face and pattern recognition,arxiv:1707.05574,2017. representation from predicting 10,000 classes[C]//IEEE [26]NECH A,Kemelmachershlizerman I.Level playing field Conference on Computer Vision and Pattern Recognition. for million scale face recognition[.Computer vision and Hawaii,USA,2014:1891-1898. pattern recognition,arxiv:1705.00393,2017. [13]LIU J,DENG Y,BAI T,et al.Targeting ultimate [27]ZHANG K,ZHANG Z,LI Z,et al.Joint face detection and accuracy:face recognition via deep embedding [C]/ alignment using multitask cascaded convolutional networks[J] European Conference on Computer Vision.Amsterdam, IEEE signal processing letters,2016,23(10):1499-1503. Netherlands,2016:499-515. [28]HUANG G.B,LEARNED-MILLER E.Labeled faces in the [14]TAIGMAN Y.YANG M,RANZATO M,et al.Web-scale wild:updates and new reporting procedures[R].Technical training for face identification[C]//Computer Vision and report UM-CS-2014-003. Pattern Recognition.Columbus,USA,2014:2746-2754. [29]JIA Y,SHELHAMER E,DONAHUE J,et al.Caffe: [15 SUN Y,WANG X,TANG X.Deeply learned face convolutional architecture for fast feature embedding [J]. representations are sparse,selective,and robust[C]// Eprint arxiv,2014:675-678. Computer Vision and Pattern Recognition.Boston,USA, [30]LIU F,ZENG D,ZHAO Q,et al.Joint face alignment and 2015:2892-2900. 3D face reconstruction C]//European Conference on [16]SCHROFF F,KALENICHENKO D,PHILBIN J.Facenet: Computer Vision.Amsterdam,Netherlands,2016:545-560. a unified embedding for face recognition and clustering 作者简介： [C]//IEEE Conference on Computer Vision and Pattern 夏洋洋，男，1990年生，硕士研究 Recognition.Boston,USA,2015:815-823. 生，主要研究方向为深度学习、图像处 [17]WEN Y,ZHANG K,LI Z,et al.A discriminative feature 理、人脸识别。 learning approach for deep face recognition[C]//European Conference on Computer Vision.Amsterdam,Netherlands, 2016:499-515. [18]SEITZ S M,MILLER D,et al.The megaface benchmark: 1 million faces for recognition at scale[C]//Computer 龚勋，男，1980年生，副教授，博士， Vision and Pattern Recognition.Las Vegas,USA,2016: 主要研究方向为图像处理及模式识别、 4873-4882 三维人脸建模、人脸图像分析及识别。 [19]BORJI A,IZADI S,ITTI L.iLab-20M:a large-scale 获国家发明专利2项，发表学术论文30 controlled object dataset to investigate deep learning[Cl// 余篇，出版专著1部。 IEEE Conference on Computer Vision and Pattern Recognition.Las Vegas,USA,2016:2221-2230. [20]KEMELMACHERSHLIZERMAN I.SEITZ S M.MILLER D,et al.The megaface benchmark:I million faces for 洪西进，男，1957年生，特聘教授 recognition at scale C]//Computer Vision and Pattern 博士，主要研究方向为信息安全、生物 Recognition.Las Vegas,USA,2016:4873-4882. 辨识、云计算与大数据、智能图像处理。 [21]GUO Y,ZHANG L,HU Y,et al.MS-Celeb-1M:challenge 发明专利13项，发表SC期刊学术论 of recognizing one million celebrities in the real world[C/ 文80余篇，国际学术会议论文110 Electronic imaging.San Francisco,USA,2016:1-6. 余篇

ｖｅｒｉｆｉｃａｔｉｏｎ［Ｊ］．ＩＥＥＥｔｒａｎｓａｃｔｉｏｎｓｏｎｐａｔｔｅｒｎａｎａｌｙｓｉｓａｎｄｍａｃｈｉｎｅｉｎｔｅｌｌｉｇｅｎｃｅ，２０１６，３８（１０）：１９９７－２００９．［９］ＴＡＩＧＭＡＮＹ，ＹＡＮＧＭ，ＲＡＮＺＡＴＯＭ，ｅｔａｌ．Ｄｅｅｐｆａｃｅ：ｃｌｏｓｉｎｇｔｈｅｇａｐｔｏｈｕｍａｎ⁃ｌｅｖｅｌｐｅｒｆｏｒｍａｎｃｅｉｎｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｃｏｌｕｍｂｉａ，Ａｍｅｒｉｃａｎ，２０１４：１７０１－１７０８．［１０］ＷＥＮＹ，ＺＨＡＮＧＫ，ＬＩＺ，ｅｔａｌ．Ａｄｉｓｃｒｉｍｉｎａｔｉｖｅｆｅａｔｕｒｅｌｅａｒｎｉｎｇａｐｐｒｏａｃｈｆｏｒｄｅｅｐｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ［Ｃ］／／ＥＣＣＶＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ａｍｓｔｅｒｄａｍ，Ｈｏｌａｎｄ，２０１６：４９９－５１５．［１１］ＨＵＡＮＧＧＢ，ＭＡＴＴＡＲＭ，ＢＥＲＧＴ，ｅｔａｌ．Ｌａｂｅｌｅｄｆａｃｅｓｉｎｔｈｅｗｉｌｄ：ａｄａｔａｂａｓｅｆｏｒｓｔｕｄｙｉｎｇｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｉｎｕｎｃｏｎｓｔｒａｉｎｅｄｅｎｖｉｒｏｎｍｅｎｔｓ［Ｊ］．Ｍｏｎｔｈ，２００７．［１２］ＳＵＮＹ，ＷＡＮＧＸ，ＴＡＮＧＸ．Ｄｅｅｐｌｅａｒｎｉｎｇｆａｃｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｆｒｏｍｐｒｅｄｉｃｔｉｎｇ１０，０００ｃｌａｓｓｅｓ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｈａｗａｉｉ，ＵＳＡ，２０１４：１８９１－１８９８．［１３］ＬＩＵＪ，ＤＥＮＧＹ，ＢＡＩＴ，ｅｔａｌ．Ｔａｒｇｅｔｉｎｇｕｌｔｉｍａｔｅａｃｃｕｒａｃｙ：ｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｖｉａｄｅｅｐｅｍｂｅｄｄｉｎｇ［Ｃ］／／ＥｕｒｏｐｅａｎＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ａｍｓｔｅｒｄａｍ，Ｎｅｔｈｅｒｌａｎｄｓ，２０１６：４９９－５１５．［１４］ＴＡＩＧＭＡＮＹ，ＹＡＮＧＭ，ＲＡＮＺＡＴＯＭ，ｅｔａｌ．Ｗｅｂ⁃ｓｃａｌｅｔｒａｉｎｉｎｇｆｏｒｆａｃｅｉｄｅｎｔｉｆｉｃａｔｉｏｎ［Ｃ］／／ＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｃｏｌｕｍｂｕｓ，ＵＳＡ，２０１４：２７４６－２７５４．［１５］ＳＵＮＹ，ＷＡＮＧＸ，ＴＡＮＧＸ．Ｄｅｅｐｌｙｌｅａｒｎｅｄｆａｃｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｓａｒｅｓｐａｒｓｅ，ｓｅｌｅｃｔｉｖｅ，ａｎｄｒｏｂｕｓｔ［Ｃ］／／ＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｂｏｓｔｏｎ，ＵＳＡ，２０１５：２８９２－２９００．［１６］ＳＣＨＲＯＦＦＦ，ＫＡＬＥＮＩＣＨＥＮＫＯＤ，ＰＨＩＬＢＩＮＪ．Ｆａｃｅｎｅｔ：ａｕｎｉｆｉｅｄｅｍｂｅｄｄｉｎｇｆｏｒｆａｃｅｒｅｃｏｇｎｉｔｉｏｎａｎｄｃｌｕｓｔｅｒｉｎｇ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｂｏｓｔｏｎ，ＵＳＡ，２０１５：８１５－８２３．［１７］ＷＥＮＹ，ＺＨＡＮＧＫ，ＬＩＺ，ｅｔａｌ．Ａｄｉｓｃｒｉｍｉｎａｔｉｖｅｆｅａｔｕｒｅｌｅａｒｎｉｎｇａｐｐｒｏａｃｈｆｏｒｄｅｅｐｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ［Ｃ］／／ＥｕｒｏｐｅａｎＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ａｍｓｔｅｒｄａｍ，Ｎｅｔｈｅｒｌａｎｄｓ，２０１６：４９９－５１５．［１８］ＳＥＩＴＺＳＭ，ＭＩＬＬＥＲＤ，ｅｔａｌ．Ｔｈｅｍｅｇａｆａｃｅｂｅｎｃｈｍａｒｋ：１ｍｉｌｌｉｏｎｆａｃｅｓｆｏｒｒｅｃｏｇｎｉｔｉｏｎａｔｓｃａｌｅ［Ｃ］／／ＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．ＬａｓＶｅｇａｓ，ＵＳＡ，２０１６：４８７３－４８８２．［１９］ＢＯＲＪＩＡ，ＩＺＡＤＩＳ，ＩＴＴＩＬ．ｉＬａｂ⁃２０Ｍ：ａｌａｒｇｅ⁃ｓｃａｌｅｃｏｎｔｒｏｌｌｅｄｏｂｊｅｃｔｄａｔａｓｅｔｔｏｉｎｖｅｓｔｉｇａｔｅｄｅｅｐｌｅａｒｎｉｎｇ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．ＬａｓＶｅｇａｓ，ＵＳＡ，２０１６：２２２１－２２３０．［２０］ＫＥＭＥＬＭＡＣＨＥＲＳＨＬＩＺＥＲＭＡＮＩ，ＳＥＩＴＺＳＭ，ＭＩＬＬＥＲＤ，ｅｔａｌ．Ｔｈｅｍｅｇａｆａｃｅｂｅｎｃｈｍａｒｋ：１ｍｉｌｌｉｏｎｆａｃｅｓｆｏｒｒｅｃｏｇｎｉｔｉｏｎａｔｓｃａｌｅ［Ｃ］／／ＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．ＬａｓＶｅｇａｓ，ＵＳＡ，２０１６：４８７３－４８８２．［２１］ＧＵＯＹ，ＺＨＡＮＧＬ，ＨＵＹ，ｅｔａｌ．ＭＳ⁃Ｃｅｌｅｂ⁃１Ｍ：ｃｈａｌｌｅｎｇｅｏｆｒｅｃｏｇｎｉｚｉｎｇｏｎｅｍｉｌｌｉｏｎｃｅｌｅｂｒｉｔｉｅｓｉｎｔｈｅｒｅａｌｗｏｒｌｄ［Ｃ］／／Ｅｌｅｃｔｒｏｎｉｃｉｍａｇｉｎｇ．ＳａｎＦｒａｎｃｉｓｃｏ，ＵＳＡ，２０１６：１－６．［２２］ＧＵＯＹ，ＺＨＡＮＧＬ，ＨＵＹ，ｅｔａｌ．ＭＳ⁃ｃｅｌｅｂ⁃１Ｍ：ａｄａｔａｓｅｔａｎｄｂｅｎｃｈｍａｒｋｆｏｒｌａｒｇｅ⁃ｓｃａｌｅｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．ＬａｓＶｅｇａｓ，ＵＳＡ，２０１６：１１３－１２４．［２３］ＢＡＮＳＡＬＡ，ＮＡＮＤＵＲＩＡ，ＣＡＳＴＩＬＬＯＣ，ｅｔａｌ．ＵＭＤＦａｃｅｓ：ａｎａｎｎｏｔａｔｅｄｆａｃｅｄａｔａｓｅｔｆｏｒｔｒａｉｎｉｎｇｄｅｅｐｎｅｔｗｏｒｋｓ［Ｃ］／／ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．ＬａｓＶｅｇａｓ，ＵＳＡ，２０１６：９７６－９８４．［２４］ＷＯＬＦＬ，ＨＡＳＳＥＮＥＲＴ，ＭＡＯＺＩ．Ｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｉｎｕｎｃｏｎｓｔｒａｉｎｅｄｖｉｄｅｏｓｗｉｔｈｍａｔｃｈｅｄｂａｃｋｇｒｏｕｎｄｓｉｍｉｌａｒｉｔｙ［Ｃ］／／ＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．ＣｏｌｏｒａｄｏＳｐｒｉｎｇｓ，ＵＳＡ，２０１１：５２９－５３４．［２５］ＧＵＯＹ，ＺＨＡＮＧＬ．Ｏｎｅ⁃ｓｈｏｔｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｂｙｐｒｏｍｏｔｉｎｇｕｎｄｅｒｒｅｐｒｅｓｅｎｔｅｄｃｌａｓｓｅｓ［Ｊ］．Ｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎ，ａｒｘｉｖ：１７０７．０５５７４，２０１７．［２６］ＮＥＣＨＡ，ＫｅｍｅｌｍａｃｈｅｒｓｈｌｉｚｅｒｍａｎＩ．Ｌｅｖｅｌｐｌａｙｉｎｇｆｉｅｌｄｆｏｒｍｉｌｌｉｏｎｓｃａｌｅｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ［Ｊ］．Ｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎ，ａｒｘｉｖ：１７０５．００３９３，２０１７．［２７］ＺＨＡＮＧＫ，ＺＨＡＮＧＺ，ＬＩＺ，ｅｔａｌ．Ｊｏｉｎｔｆａｃｅｄｅｔｅｃｔｉｏｎａｎｄａｌｉｇｎｍｅｎｔｕｓｉｎｇｍｕｌｔｉｔａｓｋｃａｓｃａｄｅｄｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｔｗｏｒｋｓ［Ｊ］．ＩＥＥＥｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇｌｅｔｔｅｒｓ，２０１６，２３（１０）：１４９９－１５０３．［２８］ＨＵＡＮＧＧ．Ｂ，ＬＥＡＲＮＥＤ⁃ＭＩＬＬＥＲＥ．Ｌａｂｅｌｅｄｆａｃｅｓｉｎｔｈｅｗｉｌｄ：ｕｐｄａｔｅｓａｎｄｎｅｗｒｅｐｏｒｔｉｎｇｐｒｏｃｅｄｕｒｅｓ［Ｒ］．ＴｅｃｈｎｉｃａｌｒｅｐｏｒｔＵＭ⁃ＣＳ⁃２０１４－００３．［２９］ＪＩＡＹ，ＳＨＥＬＨＡＭＥＲＥ，ＤＯＮＡＨＵＥＪ，ｅｔａｌ．Ｃａｆｆｅ：ｃｏｎｖｏｌｕｔｉｏｎａｌａｒｃｈｉｔｅｃｔｕｒｅｆｏｒｆａｓｔｆｅａｔｕｒｅｅｍｂｅｄｄｉｎｇ［Ｊ］．Ｅｐｒｉｎｔａｒｘｉｖ，２０１４：６７５－６７８．［３０］ＬＩＵＦ，ＺＥＮＧＤ，ＺＨＡＯＱ，ｅｔａｌ．Ｊｏｉｎｔｆａｃｅａｌｉｇｎｍｅｎｔａｎｄ３Ｄｆａｃｅｒｅｃｏｎｓｔｒｕｃｔｉｏｎ［Ｃ］／／ＥｕｒｏｐｅａｎＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ａｍｓｔｅｒｄａｍ，Ｎｅｔｈｅｒｌａｎｄｓ，２０１６：５４５－５６０．作者简介：夏洋洋，男，１９９０年生，硕士研究生，主要研究方向为深度学习、图像处理、人脸识别。龚勋，男，１９８０年生，副教授，博士，主要研究方向为图像处理及模式识别、三维人脸建模、人脸图像分析及识别。获国家发明专利２项，发表学术论文３０余篇，出版专著１部。洪西进，男，１９５７年生，特聘教授，博士，主要研究方向为信息安全、生物辨识、云计算与大数据、智能图像处理。发明专利１３项，发表ＳＣＩ期刊学术论文８０余篇，国际学术会议论文１１０余篇。第５期夏洋洋，等：人脸识别背后的数据清理问题研究 ·６２３·

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录