·622. 智能系统学报 第12卷 表8是在Youtube face数据集上本文得出的测 试结果和其他算法结果的对比,测试协议按照3.1 4 结束语 节对Youtube face数据库的描述进行。 深度卷积神经网络的发展得益于大数据,因为 表8 Youtube face上的人脸验证结果 数据量够大,计算机够强大,机器本身才能学习出 Table 8 Face verification results on Youtube face 各种复杂的特征。而数据的准确性,也就是数据标 方法 是否训练 训练 网络 签、标注信息、类别等的准确性,也会对训练的模型 准确率/% 名称 清理人数 数量/万 个数 结果造成一定的影响,因此本文对数据库清理方面 CNN-3DMM (0] 否10575 49 1 88.80 做了研究。本文提出将数据库进行多角度清理后 DeeplD2+ 是 10177 45 25 93.20 再训练的方法,通过与未清理和其他方法的比较发 Deepface 是 4030 400 3 91.40 现,清理后的数据库在训练上结果更精确。实验证 Caffeface 是17189 70 1 94.90 明,清理后的数据集能够提高网络识别率。 模型A 否10575 49 1 90.80 目前,大多数公开的数据集仍含有很多噪声, 模型B 是8501 36 1 92.50 模型C 是9240 40 93.54 大规模数据去除噪声仍是一个值得重视的问题。 1 本文数据清理方法是否对所有数据库具有普适性, 图8显示了不同方法的R0C曲线,我们还可以 是否已经存在更高效更准确的数据清理方法需要 从表8和图8的测试结果中得出以下结论:模型C 进一步探究。下一步的工作可以考虑将多个清理 在3个模型中已经达到了最高的准确度,远远超过 其他两个模型的ROC曲线,在非限制条件下的视频 后的数据集进行合并来扩大数据量。 场景中,数据清理仍然会提高人脸识别精度。在目 参考文献: 前的主流人脸识别算法中,模型C也显示出显著的 成果,比3DMM算法、DeepID2+算法、Deepface算 [1]SUN Y,WANG X,TANG X.Deep learning face representation by joint identification-verification[J]. 法,以及Caffeface算法训练的效果好。图像清理后, Advances in neural information processing systems,2014, 对数据集进行训练,干扰因子较小,对于基于深卷 27:1988-1996. 积神经网络的人脸识别非常有用。 [2]SUN Y,WANG X.TANG X.Deep learning face 1.0 模型B representation from predicting 10,000 classes[C]//IEEE 模型C Conference on Computer Vision and Pattern Recognition Boston,USA,2014:1891-1898. 0.9 Deepface 3DMM CNN [3]王晓刚,孙袆,汤晓鸥.从统一子空间分析到联合深度学 习:人脸识别的十年历程[J].中国计算机学会通讯, 2015,11(4):8-15. 模型A WANG Xiaogang,SUN Hui,TANG Xiaoou.From unified subspace analysis to joint depth learning:ten years of face recognition[].China computer society newsletter,2015, 0.1 0.2 0.3 假正率 11(4):8-15 (a)假正率0-0.3的R0C曲线 [4]PARKHI O M,VEDALDI A,ZISSERMAN A.Deep face 0.95 recognition[C]//British Machine Vision.London,Britain, 0.94 2015:411-4112. 0.93 Deepface [5]SCHROFF F,KALENICHENKO D,PHILBIN J.FaceNet: 0.92 模型C 0.91 A unified embedding for face recognition and clustering 0.90 [C]//IEEE Conference on Computer Vision and Pattern 0.89 3DMM CNN Recognition.Boston,USA,2015:815-823. 0.88 模型A [6]DING C.TAO D.A comprehensive survey on pose-invariant 0.87 模型B 0.86 face recognition[].Acm transactions on intelligent systems 0.85 and technology,2015,7(3):37. 00.010.020.030.040.050.060.070.080.090.10 [7]SUN Y,LIANG D,WANG X,et al.DeepID3:face 假正率 recognition with very deep neural networks[C]//IEEE (b)假正率0-0.1的R0C曲线 Conference on Computer Vision and Pattern Recognition. 图8 Youtube face上不同方法的ROC曲线 Boston,USA,2015:963-971. Fig.8 ROC curves of different methods on Youtube face [8]SUN Y,WANG X,TANG X.Hybrid deep learning for face表 8 是在 Youtube face 数据集上本文得出的测 试结果和其他算法结果的对比,测试协议按照 3.1 节对 Youtube face 数据库的描述进行。 表 8 Youtube face 上的人脸验证结果 Table 8 Face verification results on Youtube face 方法 名称 是否 清理 训练 人数 训练 数量/ 万 网络 个数 准确率/ % CNN⁃3DMM [30] 否 10 575 49 1 88.80 DeepID2+ 是 10 177 45 25 93.20 Deepface 是 4 030 400 3 91.40 Caffeface 是 17 189 70 1 94.90 模型 A 否 10 575 49 1 90.80 模型 B 是 8 501 36 1 92.50 模型 C 是 9 240 40 1 93.54 图 8 显示了不同方法的 ROC 曲线,我们还可以 从表 8 和图 8 的测试结果中得出以下结论:模型 C 在 3 个模型中已经达到了最高的准确度,远远超过 其他两个模型的 ROC 曲线,在非限制条件下的视频 场景中,数据清理仍然会提高人脸识别精度。 在目 前的主流人脸识别算法中,模型 C 也显示出显著的 成果,比 3DMM 算法、DeepID2 +算法、Deepface 算 法,以及 Caffeface 算法训练的效果好。 图像清理后, 对数据集进行训练,干扰因子较小,对于基于深卷 积神经网络的人脸识别非常有用。 (a)假正率 0~ 0.3 的 ROC 曲线 (b)假正率 0~ 0.1 的 ROC 曲线 图 8 Youtube face 上不同方法的 ROC 曲线 Fig.8 ROC curves of different methods on Youtube face 4 结束语 深度卷积神经网络的发展得益于大数据,因为 数据量够大,计算机够强大,机器本身才能学习出 各种复杂的特征。 而数据的准确性,也就是数据标 签、标注信息、类别等的准确性,也会对训练的模型 结果造成一定的影响,因此本文对数据库清理方面 做了研究。 本文提出将数据库进行多角度清理后 再训练的方法,通过与未清理和其他方法的比较发 现,清理后的数据库在训练上结果更精确。 实验证 明,清理后的数据集能够提高网络识别率。 目前,大多数公开的数据集仍含有很多噪声, 大规模数据去除噪声仍是一个值得重视的问题。 本文数据清理方法是否对所有数据库具有普适性, 是否已经存在更高效更准确的数据清理方法需要 进一步探究。 下一步的工作可以考虑将多个清理 后的数据集进行合并来扩大数据量。 参考文献: [ 1 ] SUN Y, WANG X, TANG X. Deep learning face representation by joint identification⁃verification[J]. Advances in neural information processing systems, 2014, 27: 1988-1996. [ 2 ] SUN Y, WANG X, TANG X. Deep learning face representation from predicting 10,000 classes[C] / / IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA, 2014: 1891-1898. [3]王晓刚,孙袆,汤晓鸥. 从统一子空间分析到联合深度学 习: 人脸识别的十年历程[ J]. 中国计算机学会通讯, 2015, 11(4): 8-15 . WANG Xiaogang, SUN Hui, TANG Xiaoou. From unified subspace analysis to joint depth learning: ten years of face recognition[ J]. China computer society newsletter, 2015, 11(4): 8-15. [4]PARKHI O M, VEDALDI A, ZISSERMAN A. Deep face recognition[C] / / British Machine Vision. London, Britain, 2015: 411-4112. [5]SCHROFF F, KALENICHENKO D, PHILBIN J. FaceNet: A unified embedding for face recognition and clustering [C] / / IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA, 2015: 815-823. [6]DING C, TAO D. A comprehensive survey on pose⁃invariant face recognition[J]. Acm transactions on intelligent systems and technology, 2015, 7(3): 37. [7 ] SUN Y, LIANG D, WANG X, et al. DeepID3: face recognition with very deep neural networks[C] / / IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA, 2015: 963-971. [8]SUN Y, WANG X, TANG X. Hybrid deep learning for face ·622· 智 能 系 统 学 报 第 12 卷