ｕｎｒｅｓｔｒｉｃｔｅｄｗｉｔｈｌａｂｅｌｅｄｏｕｔｓｉｄｅｄａｔ

正在加载图片...

·620 智能系统学报第12卷 unrestricted with labeled outside data,测试5Ooo个视使用UMDface数据库和Webface数据库，这两个数频对，如图5所示。据库在保证数据准确性的程度上表现出很大的区别，UMDface的数据库精度由大量人工信息标注，并且类别精确，Webface数据库则没有任何人脸标注信息，很难保证数据的准确性。MSceleb的准确性 (a)匹配的对由于规模庞大，更加难以保证数据准确性，3个数据库的详细数据对比如表5所示。 8883888 表53个数据库的属性比较 (b)不匹配对 Table 5 Comparison of the properties of the three data sets 图5YTF测试协议人脸视频对数据库人数图像总数是否清理噪声规模 Fig.5 The YTF test protocol face video pair UMDface 8501 367920 是极少 3.1训练细节 Webface 10575 494414 否少量 1)预处理 CASIA-webface和MSceleb使用2.1节提出的人 MSceleb890768549824 否大量脸检测方法进行初步筛选，删除未检测到的人脸图在表6中，EER是等错误率的准确率，这种像，并使用2.2节步骤1提出的人脸对齐将所有的精度是面部识别性能的重要指标。当FPR较小人脸图像对齐成112×96的RGB图像。UMDface数时，较大的TPR可以进一步解释模型的影响，应据集是经过包括人工判断在内的深度清理过的人用场景不同对FPR的要求也不一样。因此，从表脸图像数据集，清理过程在文献[23]中具体描述， 6可以看出，UMDface以最小的规模实现了最高提供了21个关键点的标注信息，我们选取了与的精度，而MSceleb数据库规模最大，准确率也是 MTCNN算法检测相同的5个点作为UMDface原始最低的，数据的准确性对训练的影响是非常大图像的特征点，并使用2.2节步骤1提出的方法进的，即使数据规模再大，无法保证较高的数据精行人脸对齐。度，也无法获得较高的准确率，说明进行数据库 2)数据集设置清理是非常有必要的。本文使用经过2.1节方式清理过的CASIA- 表6不同模型在LFW上的准确率 webface作为第1个数据集A,共有10575个人， Table 6 The accuracy of different models on LFW 491582张图像。使用UMDface数据集作为第2个训练数据集 EER/% FPR=0.01 FPR=0.001 数据集B,共有8501个人，367919张图像。第3个数据集C来自于2.2节得出最终清理的数据集。经 UMDface 99.07 99.02 96.10 过2.1节方式清理过的MSceleb数据集作为第4个 Webface 98.53 98.10 92.77 数据集D,共有近90000个人，8500000余张图像。所有数据集按照11：1的比例分为训练集和验证集， MSceleb 98.43 97.80 90.90 至少使用一个图像作为验证集。 3.3参数入和一类图像的最小灵敏度 3)网络设置和参数参数入在清理图像数量方面起着重要作用，这本文使用的是windows环境下配置的caffe 可能会影响训练结果，某类图像的最小数量也可能平台[2]来训练模型，本节中的所有CNN模型都会影响训练。是相同的架构，详细信息如图3所示。学习率从在第1个实验中，入从0.1~1来完成数据集A 0.1开始，学习策略(learning policy)多步衰减，迭的深度清理工作，并使用清理后的数据集来训练模代次数到15000、24000、32000次时学习率分型，这些模型在LFW数据集上的准确率如图6(a) 别除10，权重腐蚀(weight decay)为0.0005，记忆所示。显然，不做任何清理入=1)准确率最差；正确因子(momentum)为0.9。选择入的值可以提高DCNN特征的准确率；进行不 3.2不同准确度数据库训练实验同程度的清理（入不同）在一定范围内准确率保持本实验是研究不同精度数据库对训练的影响，稳定，清理过度会导准确率下降。本文建议将入的ｕｎｒｅｓｔｒｉｃｔｅｄｗｉｔｈｌａｂｅｌｅｄｏｕｔｓｉｄｅｄａｔａ，测试５０００个视频对，如图５所示。图５ＹＴＦ测试协议人脸视频对Ｆｉｇ．５ＴｈｅＹＴＦｔｅｓｔｐｒｏｔｏｃｏｌｆａｃｅｖｉｄｅｏｐａｉｒ３．１训练细节１）预处理ＣＡＳＩＡ⁃ｗｅｂｆａｃｅ和ＭＳｃｅｌｅｂ使用２．１节提出的人脸检测方法进行初步筛选，删除未检测到的人脸图像，并使用２．２节步骤１提出的人脸对齐将所有的人脸图像对齐成１１２×９６的ＲＧＢ图像。ＵＭＤｆａｃｅ数据集是经过包括人工判断在内的深度清理过的人脸图像数据集，清理过程在文献［２３］中具体描述，提供了２１个关键点的标注信息，我们选取了与ＭＴＣＮＮ算法检测相同的５个点作为ＵＭＤｆａｃｅ原始图像的特征点，并使用２．２节步骤１提出的方法进行人脸对齐。２）数据集设置本文使用经过２．１节方式清理过的ＣＡＳＩＡ⁃ ｗｅｂｆａｃｅ作为第１个数据集Ａ，共有１０５７５个人，４９１５８２张图像。使用ＵＭＤｆａｃｅ数据集作为第２个数据集Ｂ，共有８５０１个人，３６７９１９张图像。第３个数据集Ｃ来自于２．２节得出最终清理的数据集。经过２．１节方式清理过的ＭＳｃｅｌｅｂ数据集作为第４个数据集Ｄ，共有近９００００个人，８５０００００余张图像。所有数据集按照１１ ∶１的比例分为训练集和验证集，至少使用一个图像作为验证集。３）网络设置和参数本文使用的是ｗｉｎｄｏｗｓ环境下配置的ｃａｆｆｅ平台［２９］来训练模型，本节中的所有ＣＮＮ模型都是相同的架构，详细信息如图３所示。学习率从０．１开始，学习策略（ｌｅａｒｎｉｎｇｐｏｌｉｃｙ）多步衰减，迭代次数到１５０００、２４０００、３２０００次时学习率分别除１０，权重腐蚀（ｗｅｉｇｈｔｄｅｃａｙ）为０．０００５，记忆因子（ｍｏｍｅｎｔｕｍ）为０．９。３．２不同准确度数据库训练实验本实验是研究不同精度数据库对训练的影响，使用ＵＭＤｆａｃｅ数据库和Ｗｅｂｆａｃｅ数据库，这两个数据库在保证数据准确性的程度上表现出很大的区别，ＵＭＤｆａｃｅ的数据库精度由大量人工信息标注，并且类别精确，Ｗｅｂｆａｃｅ数据库则没有任何人脸标注信息，很难保证数据的准确性。ＭＳｃｅｌｅｂ的准确性由于规模庞大，更加难以保证数据准确性，３个数据库的详细数据对比如表５所示。表５３个数据库的属性比较Ｔａｂｌｅ５Ｃｏｍｐａｒｉｓｏｎｏｆｔｈｅｐｒｏｐｅｒｔｉｅｓｏｆｔｈｅｔｈｒｅｅｄａｔａｓｅｔｓ数据库人数图像总数是否清理噪声规模ＵＭＤｆａｃｅ８５０１３６７９２０是极少Ｗｅｂｆａｃｅ１０５７５４９４４１４否少量ＭＳｃｅｌｅｂ８９０７６８５４９８２４否大量在表６中，ＥＥＲ是等错误率的准确率，这种精度是面部识别性能的重要指标。当ＦＰＲ较小时，较大的ＴＰＲ可以进一步解释模型的影响，应用场景不同对ＦＰＲ的要求也不一样。因此，从表６可以看出，ＵＭＤｆａｃｅ以最小的规模实现了最高的精度，而ＭＳｃｅｌｅｂ数据库规模最大，准确率也是最低的，数据的准确性对训练的影响是非常大的，即使数据规模再大，无法保证较高的数据精度，也无法获得较高的准确率，说明进行数据库清理是非常有必要的。表６不同模型在ＬＦＷ上的准确率Ｔａｂｌｅ６ＴｈｅａｃｃｕｒａｃｙｏｆｄｉｆｆｅｒｅｎｔｍｏｄｅｌｓｏｎＬＦＷ训练数据集ＥＥＲ／％ＦＰＲ＝０．０１ＦＰＲ＝０．００１ＵＭＤｆａｃｅ９９．０７９９．０２９６．１０Ｗｅｂｆａｃｅ９８．５３９８．１０９２．７７ＭＳｃｅｌｅｂ９８．４３９７．８０９０．９０３．３参数 λ 和一类图像的最小灵敏度参数 λ 在清理图像数量方面起着重要作用，这可能会影响训练结果，某类图像的最小数量也可能会影响训练。在第１个实验中，λ 从０．１～１来完成数据集Ａ的深度清理工作，并使用清理后的数据集来训练模型，这些模型在ＬＦＷ数据集上的准确率如图６（ａ）所示。显然，不做任何清理 λ ＝１）准确率最差；正确选择 λ 的值可以提高ＤＣＮＮ特征的准确率；进行不同程度的清理（λ 不同）在一定范围内准确率保持稳定，清理过度会导准确率下降。本文建议将 λ 的 ·６２０· 智能系统学报第１２卷

<<向上翻页向下翻页>>

点击下载：【机器感知与模式识别】人脸识别背后的数据清理问题研究