在求出标准模板之后，根据式（２）求出原图到目标图像的仿射变换矩阵：Ｔ

正在加载图片...

第5期夏洋洋，等：人脸识别背后的数据清理问题研究 ·619. 在求出标准模板之后，根据式(2)求出原图到式(5)表明如何判断两个图像是否为同一目标图像的仿射变换矩阵：个人。 T=cp2tform(Opt,Cpt,'similarity')(2) 1, similarity(P:,P,）≥T 式中：Opt是原图像的5个特征点，Cpt是标准模板 Li= 0,similarity(P,P）<T'ij=L,2,…,n 的5个点，T是求得的变换矩阵，cp2fom是 (5) MATLAB的标准函数。式中：P:、P,表示一类图像中的第i和j张图像的特根据式(3)得出对齐之后的人脸图像：征向量，L,表示第i和j张图像是否为同一个人。 crop imtransform(I,T,'XData',[1,imgsize(2)], 3)根据不相似的图像的比例确定是否清理 'YData',[1,imgsize(1)],'size',imgsize)(3) 根据式(6)统计同一个人的人脸图像C中每一式中：I是原图像，imgsize是要对齐的图像尺寸，crop 张图像与其他图像不相似的数目。是对齐之后的人脸图像，imtransform是MATLAB的 N:count(L=0),j=1,2,..,n (6) 标准函数。式中：N:表示第i张图像与其他图像不相似的数 2)人脸特征提取与相似度计算目，i=1,2,…,no 本文使用的网络结构来自于文献[17]在git山hub 最后，根据式(7)判断是否清理该图像。上提供的开源文件，如图3所示。 delete,N:≥An C:卷积层对于C P:池化层 hold,N,<n,i=1,2,…,n(7) LC:局积 FC:全连接层式中：n表示一类人脸所有图像数目：参数入的值需 Softmax @ 损失函数要根据不同的数据库来确定，具体入值将在下一章实验部分具体分析。中心损失函数 3 实验与分析图3本文中人脸识别任务中使用的DCNN架构 Fig.3 The DCNN architecture used in face recognition 本节选取了CASIA-webface数据集、UMDface tasks in this article 数据集和MSceleb数据集作为实验数据库，并选取 Softmax损失函数和中心损失函数的联合监视. 公共权威人脸识别测试数据集LFW和Youtube face 可以训练足够强大的DCNN,并且能够得到两个关作为测试数据集。键学习目标的深层特征以及尽可能高的类间分散 LFW收集的数据集包含5749个不同的人，有性和类内紧密性。这些特性对人脸识别来说至关姿态、表情和光照的变化，总共13233个图像，旨在重要。提取特征的模型也采用了文献[17]公布的研究人脸图像数据库中的困难的人脸识别问题。根网络模型，部分超参数设置由实际数据库来确定。据LFW提供的测试方案一unrestricted with 对于特征提取，按照惯例在进入网络模型之 labeled outside data2】,我们测试了6000个人脸对，前，RGB图像像素值将减去127.5，并将每个像素值人脸如图4所示。除以128。深度特征来自第一F℃层的输出，提取每个图像的特征和翻转图像的特征，并将其作为特征向量进行连接。在提取所有图像的特征之后，对从两个不同图像提取的特征向量进行相似性计算。所使用的度量是余弦距离，(4)式是两个特征向量 A和B的角度，直接计算余弦距离作为相似度S,即 AB (a)匹配的对 )不匹配的对 S(A,B)=cos(0)=AB (4) 图4LFW测试协议人脸对使用等误差率(EER)作为判断是否为同一个 Fig.4 The LFW test protocol face pair 人的阈值。当相似度超过该阈值T时，认定为同一 Youtube脸(YTF)数据集包含3495个不同人个人，小于阈值T时不为同一个人。对于每种图像，的视频，平均每人2.15个视频。剪辑持续48~6070 进行相似度计算，1表示两个图像是同一个人，0表帧，平均长度为181.3帧。它旨在研究视频下人脸示两个图像不是一个人。识别的问题。根据YT℉提供的测试协议在求出标准模板之后，根据式（２）求出原图到目标图像的仿射变换矩阵：Ｔ＝ｃｐ２ｔｆｏｒｍ（Ｏｐｔ，Ｃｐｔ，′ｓｉｍｉｌａｒｉｔｙ′）（２）式中：Ｏｐｔ是原图像的５个特征点，Ｃｐｔ是标准模板的５个点，Ｔ是求得的变换矩阵，ｃｐ２ｔｆｏｒｍ是ＭＡＴＬＡＢ的标准函数。根据式（３）得出对齐之后的人脸图像：ｃｒｏｐ＝ｉｍｔｒａｎｓｆｏｒｍ（Ｉ，Ｔ，′ＸＤａｔａ′，［１，ｉｍｇｓｉｚｅ（２）］， ′ＹＤａｔａ′，［１，ｉｍｇｓｉｚｅ（１）］，′ｓｉｚｅ′，ｉｍｇｓｉｚｅ）（３）式中：Ｉ是原图像，ｉｍｇｓｉｚｅ是要对齐的图像尺寸，ｃｒｏｐ是对齐之后的人脸图像，ｉｍｔｒａｎｓｆｏｒｍ是ＭＡＴＬＡＢ的标准函数。２）人脸特征提取与相似度计算本文使用的网络结构来自于文献［１７］在ｇｉｔｈｕｂ上提供的开源文件，如图３所示。图３本文中人脸识别任务中使用的ＤＣＮＮ架构Ｆｉｇ．３ＴｈｅＤＣＮＮａｒｃｈｉｔｅｃｔｕｒｅｕｓｅｄｉｎｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｔａｓｋｓｉｎｔｈｉｓａｒｔｉｃｌｅＳｏｆｔｍａｘ损失函数和中心损失函数的联合监视，可以训练足够强大的ＤＣＮＮ，并且能够得到两个关键学习目标的深层特征以及尽可能高的类间分散性和类内紧密性。这些特性对人脸识别来说至关重要。提取特征的模型也采用了文献［１７］公布的网络模型，部分超参数设置由实际数据库来确定。对于特征提取，按照惯例在进入网络模型之前，ＲＧＢ图像像素值将减去１２７．５，并将每个像素值除以１２８。深度特征来自第一ＦＣ层的输出，提取每个图像的特征和翻转图像的特征，并将其作为特征向量进行连接。在提取所有图像的特征之后，对从两个不同图像提取的特征向量进行相似性计算。所使用的度量是余弦距离，（４）式是两个特征向量Ａ和Ｂ的角度，直接计算余弦距离作为相似度Ｓ，即Ｓ（Ａ，Ｂ）＝ｃｏｓ（θ）＝ＡＢＡＢ（４）使用等误差率（ＥＥＲ）作为判断是否为同一个人的阈值。当相似度超过该阈值Ｔ时，认定为同一个人，小于阈值Ｔ时不为同一个人。对于每种图像，进行相似度计算，１表示两个图像是同一个人，０表示两个图像不是一个人。式（５）表明如何判断两个图像是否为同一个人。Ｌｉｊ＝１，ｓｉｍｉｌａｒｉｔｙ（Ｐｉ，Ｐｊ） ≥ Ｔ {０，ｓｉｍｉｌａｒｉｔｙ（Ｐｉ，Ｐｊ）＜Ｔ，ｉ，ｊ＝１，２，…，ｎ（５）式中：Ｐｉ、Ｐｊ表示一类图像中的第ｉ和ｊ张图像的特征向量，Ｌｉｊ表示第ｉ和ｊ张图像是否为同一个人。３）根据不相似的图像的比例确定是否清理根据式（６）统计同一个人的人脸图像Ｃ中每一张图像与其他图像不相似的数目。Ｎｉ＝ｃｏｕｎｔ（Ｌｉｊ＝０），ｊ＝１，２，…，ｎ（６）式中：Ｎｉ表示第ｉ张图像与其他图像不相似的数目，ｉ＝１，２，…，ｎ。最后，根据式（７）判断是否清理该图像。对于Ｃｄｅｌｅｔｅ，Ｎｉ ≥ λｎ { ｈｏｌｄ，Ｎｉ＜ λｎ，ｉ＝１，２，…，ｎ（７）式中：ｎ表示一类人脸所有图像数目；参数 λ 的值需要根据不同的数据库来确定，具体 λ 值将在下一章实验部分具体分析。３实验与分析本节选取了ＣＡＳＩＡ⁃ｗｅｂｆａｃｅ数据集、ＵＭＤｆａｃｅ数据集和ＭＳｃｅｌｅｂ数据集作为实验数据库，并选取公共权威人脸识别测试数据集ＬＦＷ和Ｙｏｕｔｕｂｅｆａｃｅ作为测试数据集。ＬＦＷ收集的数据集包含５７４９个不同的人，有姿态、表情和光照的变化，总共１３２３３个图像，旨在研究人脸图像数据库中的困难的人脸识别问题。根据ＬＦＷ提供的测试方案———ｕｎｒｅｓｔｒｉｃｔｅｄｗｉｔｈｌａｂｅｌｅｄｏｕｔｓｉｄｅｄａｔａ［２８］，我们测试了６０００个人脸对，人脸如图４所示。图４ＬＦＷ测试协议人脸对Ｆｉｇ．４ＴｈｅＬＦＷｔｅｓｔｐｒｏｔｏｃｏｌｆａｃｅｐａｉｒＹｏｕｔｕｂｅ脸（ＹＴＦ）数据集包含３４９５个不同人的视频，平均每人２．１５个视频。剪辑持续４８～６０７０帧，平均长度为１８１．３帧。它旨在研究视频下人脸识别的问题。根据ＹＴＦ提供的测试协议——— 第５期夏洋洋，等：人脸识别背后的数据清理问题研究 ·６１９·

<<向上翻页向下翻页>>

点击下载：【机器感知与模式识别】人脸识别背后的数据清理问题研究