第16卷第2期 智能系统学报 Vol.16 No.2 2021年3月 CAAI Transactions on Intelligent Systems Mar.2021 D0:10.11992/tis.202011029 跨年龄人脸验证技术研究 孙燕,李旭军,何启泓 (湘潭大学物理与光电工程学院,湖南湘潭411105) 摘要:针对跨年龄人脸验证任务中面部纹理、形状特征变化的问题,提出一种基于双编码平均局部二值模式 (dual-coded average local binary pattern,.DCALBP)与深度学习算法相结合的多任务人脸验证算法。首先,使用多 任务卷积神经网络(multi---task convolutional neural network,MTCNN)对人脸检测图片进行预处理,引入双编码平 均局部二值模式(DCALBP)和梯度直方图算法(histogram of oriented gradient,HOG)提取人脸的局部纹理特征和 形状特征,运用典型相关性分析(canonical correlation analysis,CCA)算法将两种特征融合,得到人脸年龄特征。 然后,李生网络(siamese network)提取人脸面部特征,并将纹理形状特征从中分离,抑制年龄因素对人脸验证的 影响,从而得到具有年龄不变性的人脸特征。最后进行人脸特征匹配,实现跨年龄人脸验证。通过在数据集 FG-NET、MORPH Album2以及经过处理的综合数据集上进行实验,准确率分别为89.73%、98.32%和98.27%,充 分验证了该方法的有效性。 关键词:人脸验证:深度学习:年龄干扰:双编码平均局部二值模式:方向梯度直方图:典型相关性分析 中图分类号:TP391.41文献标志码:A文章编号:1673-4785(2021)02-0247-07 中文引用格式:孙燕,李旭军,何启泓.跨年龄人脸验证技术研究.智能系统学报,2021,16(2):247-253. 英文引用格式:SUN Yan,LIXujun,HE Qihong.Research on age invariant face verification technology.CAAI transactions on intelligent systems,2021,16(2):247-253. Research on age invariant face verification technology SUN Yan,LI Xujun,HE Qihong (School of Physics and Optoelectronics,Xiangtan University,Xiangtan 411105,China) Abstract:The texture,shape,and other features of the face will change dramatically with age,significantly reducing the accuracy of face recognition.To solve this problem,this study proposes a multitask cross-age face verification al- gorithm based on the dual coding average local binary pattern(DCALBP)and deep learning algorithm.First,the multi- task convolutional neural network is used to detect the face area.Second,the DCALBP and histogram of oriented gradi- ents are used to extract the face texture and shape features,respectively.Then,the canonical correlation analysis is con- ducted to merge the face texture and shape features to determine the facial age features.Finally,the Siamese network is employed to extract the facial features and separate the facial age features from the facial features,suppress the influence of age factors on face verification,and obtain age-invariant facial features.The algorithm can identify whether it is the same person by feature matching.In this study,the accuracy of the FGNet,MORPH Album2,and processed synthesis data sets is 89.73%,98.32%,and 98.27%,respectively,and the effectiveness of the proposed method is fully verified. Keywords:face verification;deep learning;age interference;dual-coded average local binary pattern;histogram of ori- ented gradient;canonical correlation analysis 年龄因素导致人脸识别准确率降低,如何抑 率。目前跨年龄人脸识别研究主要分为三类:生 制年龄因素是人脸识别技术中的关键。在2015 成方法、判别方法和基于深度学习的方法6。生 年,Chen等将一般的人脸识别模型应用在跨年 成方法先构建一个模拟人脸老化或者年轻化的生 龄人脸识别任务中,研究结果显示准确率降低13% 成模型,在人脸匹配阶段,生成目标年龄的人脸, 以上,直接说明了年龄的变化会降低人脸识别 以此来降低年龄因素对人脸识别的影响。该方法 收稿日期:2020-11-24. 需要准确的数据标签和先验参数假设,对非受限 通信作者:李旭军.E-mail:xjli@xtu.edu.cn 环境敏感,生成的图像会增加噪声,影响匹配结
DOI: 10.11992/tis.202011029 跨年龄人脸验证技术研究 孙燕,李旭军,何启泓 (湘潭大学 物理与光电工程学院,湖南 湘潭 411105) 摘 要:针对跨年龄人脸验证任务中面部纹理、形状特征变化的问题,提出一种基于双编码平均局部二值模式 (dual-coded average local binary pattern,DCALBP) 与深度学习算法相结合的多任务人脸验证算法。首先,使用多 任务卷积神经网络 (multi-task convolutional neural network ,MTCNN) 对人脸检测图片进行预处理,引入双编码平 均局部二值模式 (DCALBP) 和梯度直方图算法 (histogram of oriented gradient,HOG) 提取人脸的局部纹理特征和 形状特征,运用典型相关性分析 (canonical correlation analysis,CCA) 算法将两种特征融合,得到人脸年龄特征。 然后,孪生网络 (siamese network) 提取人脸面部特征,并将纹理形状特征从中分离,抑制年龄因素对人脸验证的 影响,从而得到具有年龄不变性的人脸特征。最后进行人脸特征匹配,实现跨年龄人脸验证。通过在数据集 FG-NET、MORPH Album2 以及经过处理的综合数据集上进行实验,准确率分别为 89.73%、98.32% 和 98.27%,充 分验证了该方法的有效性。 关键词:人脸验证;深度学习;年龄干扰;双编码平均局部二值模式;方向梯度直方图;典型相关性分析 中图分类号:TP391.41 文献标志码:A 文章编号:1673−4785(2021)02−0247−07 中文引用格式:孙燕, 李旭军, 何启泓. 跨年龄人脸验证技术研究 [J]. 智能系统学报, 2021, 16(2): 247–253. 英文引用格式:SUN Yan, LI Xujun, HE Qihong. Research on age invariant face verification technology[J]. CAAI transactions on intelligent systems, 2021, 16(2): 247–253. Research on age invariant face verification technology SUN Yan,LI Xujun,HE Qihong (School of Physics and Optoelectronics, Xiangtan University, Xiangtan 411105, China) Abstract: The texture, shape, and other features of the face will change dramatically with age, significantly reducing the accuracy of face recognition. To solve this problem, this study proposes a multitask cross-age face verification algorithm based on the dual coding average local binary pattern (DCALBP) and deep learning algorithm. First, the multitask convolutional neural network is used to detect the face area. Second, the DCALBP and histogram of oriented gradients are used to extract the face texture and shape features, respectively. Then, the canonical correlation analysis is conducted to merge the face texture and shape features to determine the facial age features. Finally, the Siamese network is employed to extract the facial features and separate the facial age features from the facial features, suppress the influence of age factors on face verification, and obtain age-invariant facial features. The algorithm can identify whether it is the same person by feature matching. In this study, the accuracy of the FGNet, MORPH Album2, and processed synthesis data sets is 89.73%, 98.32%, and 98.27%, respectively, and the effectiveness of the proposed method is fully verified. Keywords: face verification; deep learning; age interference; dual-coded average local binary pattern; histogram of oriented gradient; canonical correlation analysis 年龄因素导致人脸识别准确率降低,如何抑 制年龄因素是人脸识别技术中的关键。在 2015 年,Chen 等 [1] 将一般的人脸识别模型应用在跨年 龄人脸识别任务中,研究结果显示准确率降低 13% 以上,直接说明了年龄的变化会降低人脸识别 率。目前跨年龄人脸识别研究主要分为三类:生 成方法、判别方法和基于深度学习的方法[2-6]。生 成方法先构建一个模拟人脸老化或者年轻化的生 成模型,在人脸匹配阶段,生成目标年龄的人脸, 以此来降低年龄因素对人脸识别的影响。该方法 需要准确的数据标签和先验参数假设,对非受限 环境敏感,生成的图像会增加噪声,影响匹配结 收稿日期:2020−11−24. 通信作者:李旭军. E-mail:xjli@xtu.edu.cn. 第 16 卷第 2 期 智 能 系 统 学 报 Vol.16 No.2 2021 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2021
·248· 智能系统学报 第16卷 果。判别方法先提取出随年龄变化稳定的人 的LBP编码值,用来表示这个区域的纹理信息。 脸特征,再进行人脸识别。2013年,Gong等0提 LBP编码公式如下: 出了一种隐藏因子分析(HFA)的方法,该方法分 W-1 别提取年龄相关的人脸特征以及不随年龄变化的 LBP(Xe.ye)= S(n-i)25 (1) p=l 稳定特征,对这两个特征建模,然后用期望最大 1,x≥0 化(EM)算法估计参数,以此实现跨年龄的人脸 S()= 10,x<0 (2) 识别。2016年,Gong等1又提出了一种最大熵 式中:(x,y)是中心像素点;i表示中心像素点的 特征描述符(MEFD)的方法,该方法根据最大嫡 灰度值:N表示邻域像素点的个数;i(p=0,1·p-1) 将面部图像的微观特征编码为一组离散代码,通 表示邻域像素点的灰度值。以3×3像素窗口为 过密集采样编码的面部图像,提取大量具有区分 例,LBP计算过程如图1所示。 性和表达性的信息,进一步对跨年龄人脸特征进 行分析。2017年,Xu等2依据年龄变化是一种 非线性变换,提出了一种耦合自动编码器网络 Binary:00010011 Decimal-19 (CAN)的方法,由两个浅层神经网络组成,适用于 复杂的非线性老化过程。由于卷积神经网络具有 从原始特征中端到端学习非线性特征的优势3 图1LBP编码算子 基于深度学习的跨年龄人脸识别方法相继提出。 Fig.1 LBP encoded operator Wang等l提出正交嵌入卷积神经网络模型(OE 传统LBP只考虑了邻域像素灰度值与中心 CNN),该方法将面部特征分解成两个正交分量, 像素灰度值之间的关系,没有考虑邻域像素灰度 分别表示年龄特征和身份特征,以实现跨年龄人 值之间的影响。针对这一问题,后来有研究者提 脸识别。Wen等1o1提出了一种并行的卷积神经 出一种中心对称局部二值模式(CS-LBP),即设置 网络模型(LF-CNN)学习年龄不变的人脸特征, 一个阈值T,将中心对称的两个邻域像素灰度值 并且提出了LIA分析法进行参数更新,代替了传 相减,与阈值T相比较,大于等于T取1,反之取 统梯度下降法。 0。编码公式为 本文基于判别方法提出一种跨年龄人脸验证 ¥-1 网络模型,首先改进LBP算法,提出双编码平均 CS-LBP&N(c)= 〉S(p-i+g)29 (3) =0 局部二值模式算法(DCALBP)。该算法使用邻域 1, 像素的平均值与中心像素的差值以及差值的绝对 S(x)= x≥T 10,x<T (4) 值作为差值阈值和幅度阈值,可减少光照和高频 式中:R表示区域半径(R=1):N表示邻域像素点 噪声对像素值的影响,同时丰富纹理特征信息, 个数(W=8);in表示邻域像素点p(p=0,1,…,7)灰 降低特征维度。以3×3像素块为例,将8点采样 度值;T为阈值。 降为4点采样,编码数量从2=256降为2=16。 1.2 DCALBP算法 之后采取多任务方式,应用CCA算法融合DCALBP 传统LBP方法和改进后的CS-LBP算法,都 和HOG提取的人脸纹理形状特征,得到一维的 是8点采样,且CS-LBP算法中阈值为预设值,需 年龄特征信息。另外,本文引入孪生网络(siamese 要根据先验知识进行设置,很难定义一个合适的 network)进行特征匹配,从网络提取的特征中分 阈值。本文提出的DCALBP方法将采样点降低 离出年龄特征信息,得到具有年龄不变性的人脸 到4个,减少特征向量的维度,同时考虑了光照变 特征,从而完成跨年龄人脸验证任务。 化不均匀时对像素的影响,采样点的灰度值用相 1 DCALBP算法 邻像素点和自身灰度值的平均值代替,引入两个 阈值变量,分别为差值阈值d和幅度阈值t,两个 1.1LBP算法 变量的计算公式为 局部二值模式(LBP)是一种描述图像局部纹 1 N-1 理特征的算子7,以中心像素灰度值为阈值,相邻 d- N (i2p*1-ie) (5) 像素的灰度值与其比较,若邻域像素灰度值大于 =( 等于阈值,记为1,反之记为0。对其结果进行编 (6) 码,得到相应的二进制数,转为十进制,作为该点
果 [7-9]。判别方法先提取出随年龄变化稳定的人 脸特征,再进行人脸识别。2013 年,Gong 等 [10] 提 出了一种隐藏因子分析 (HFA) 的方法,该方法分 别提取年龄相关的人脸特征以及不随年龄变化的 稳定特征,对这两个特征建模,然后用期望最大 化 (EM) 算法估计参数,以此实现跨年龄的人脸 识别。2016 年,Gong 等 [11] 又提出了一种最大熵 特征描述符 (MEFD) 的方法,该方法根据最大熵 将面部图像的微观特征编码为一组离散代码,通 过密集采样编码的面部图像,提取大量具有区分 性和表达性的信息,进一步对跨年龄人脸特征进 行分析。2017 年,Xu 等 [12] 依据年龄变化是一种 非线性变换,提出了一种耦合自动编码器网络 (CAN) 的方法,由两个浅层神经网络组成,适用于 复杂的非线性老化过程。由于卷积神经网络具有 从原始特征中端到端学习非线性特征的优势[13-14] , 基于深度学习的跨年龄人脸识别方法相继提出。 Wang 等 [15] 提出正交嵌入卷积神经网络模型 (OECNN),该方法将面部特征分解成两个正交分量, 分别表示年龄特征和身份特征,以实现跨年龄人 脸识别。Wen 等 [16] 提出了一种并行的卷积神经 网络模型 (LF-CNN) 学习年龄不变的人脸特征, 并且提出了 LIA 分析法进行参数更新,代替了传 统梯度下降法。 本文基于判别方法提出一种跨年龄人脸验证 网络模型,首先改进 LBP 算法,提出双编码平均 局部二值模式算法 (DCALBP)。该算法使用邻域 像素的平均值与中心像素的差值以及差值的绝对 值作为差值阈值和幅度阈值,可减少光照和高频 噪声对像素值的影响,同时丰富纹理特征信息, 降低特征维度。以 3×3 像素块为例,将 8 点采样 降为 4 点采样,编码数量从 2 8 =256 降为 2 4 =16。 之后采取多任务方式,应用 CCA 算法融合 DCALBP 和 HOG 提取的人脸纹理形状特征,得到一维的 年龄特征信息。另外,本文引入孪生网络 (siamese network) 进行特征匹配,从网络提取的特征中分 离出年龄特征信息,得到具有年龄不变性的人脸 特征,从而完成跨年龄人脸验证任务。 1 DCALBP 算法 1.1 LBP 算法 局部二值模式 (LBP) 是一种描述图像局部纹 理特征的算子[17] ,以中心像素灰度值为阈值,相邻 像素的灰度值与其比较,若邻域像素灰度值大于 等于阈值,记为 1,反之记为 0。对其结果进行编 码,得到相应的二进制数,转为十进制,作为该点 的 LBP 编码值,用来表示这个区域的纹理信息。 LBP 编码公式如下: LBP(xc , yc) = ∑N−1 p=0 S (ip −ic)2p (1) S (x) = { 1, x ⩾ 0 0, x < 0 (2) (xc , yc) ic N ip(p = 0,1 · · · p−1) 3×3 式中: 是中心像素点; 表示中心像素点的 灰度值; 表示邻域像素点的个数; 表示邻域像素点的灰度值。以 像素窗口为 例,LBP 计算过程如图 1 所示。 1 2 2 9 5 6 5 3 1 0 0 0 1 1 1 0 0 Decimal:19 Binary:00010011 图 1 LBP 编码算子 Fig. 1 LBP encoded operator T T T 传统 LBP 只考虑了邻域像素灰度值与中心 像素灰度值之间的关系,没有考虑邻域像素灰度 值之间的影响。针对这一问题,后来有研究者提 出一种中心对称局部二值模式 (CS-LBP),即设置 一个阈值 ,将中心对称的两个邻域像素灰度值 相减,与阈值 相比较,大于等于 取 1,反之取 0。编码公式为 CS−LBPR,N(c) = N 2∑−1 p=0 S (ip −ip+ N 2 )2p (3) S (x) = { 1, x ⩾ T 0, x < T (4) R (R = 1) N (N = 8) ip p(p = 0,1,··· ,7) T 式中: 表示区域半径 ; 表示邻域像素点 个数 ; 表示邻域像素点 灰 度值; 为阈值。 1.2 DCALBP 算法 d t 传统 LBP 方法和改进后的 CS-LBP 算法,都 是 8 点采样,且 CS-LBP 算法中阈值为预设值,需 要根据先验知识进行设置,很难定义一个合适的 阈值。本文提出的 DCALBP 方法将采样点降低 到 4 个,减少特征向量的维度,同时考虑了光照变 化不均匀时对像素的影响,采样点的灰度值用相 邻像素点和自身灰度值的平均值代替,引入两个 阈值变量,分别为差值阈值 和幅度阈值 ,两个 变量的计算公式为 d = 1 N ∑N−1 p=0 (i2p+1 −ic) (5) t = 1 N ∑N−1 p=0 |i2p+1 −ic | (6) ·248· 智 能 系 统 学 报 第 16 卷
第2期 孙燕,等:跨年龄人脸验证技术研究 ·249· 其中,N表示采样点的个数;i表示中心像素点的 将两组向量通过线性变换投影到一维空间,求出 灰度值;i2p+1(p=0,1,2…)表示采样点的灰度值。 投影向量a和b,使得U=aTX和V=bTY之间的 为了提取出丰富的面部纹理信息,DCAL- 相关系数Coor(U,V)最大。向量X和Y的协方差 BP采用双编码的方法。取采样点与中心像素点 灰度值的差值,差值大于等于阈值d,编码为1, 矩阵为Σ=rw其中x=cov,),表示 反之为0,得到第一位编码值。第二位编码值与 X的协方差矩阵;x=cov(X,Y),Ex=cov(Y,X), 表示X和Y的互协方差矩阵;r=cov(Y,Y),表 采样点与中心像素灰度值的绝对值有关,绝对值 示Y的协方差矩阵。先求出U=aX和V=bY 大于等于t,编码为1,反之为0。编码公式如下: 的方差和协方差,有: N DCALBPN= >(S(in.i)22+S(ip.i)22) (7) var(U)=var(aTX)=aTExxa (9) =0 var(v)=var(bY)=bEyrb (10) 00, ip-ie<d and lip-id<t 01, cov(U,V)=cov(aTX,bY)=aTExyb (11) S(ip.i)= ip-ie<d and li-i.l≥t (8) 10, ip-ie≥d and lip-i.l<t 然后求U和V的相关系数 11, ip-ie≥d and lip-i.l≥t cov(U,V) aExrb 其中S和Sa分别表示S(,i)编码中的第一位 p=Com(U,V)= Var(U)Var(V)Va Exxa VBEyyb 和第二位编码值。以3×3的窗口,采样点为 (12) 4N=4)为例,DCALBP编码过程如图2所示。 此时,问题转化为,求解出投影向量α、b,使 得相关系数P最大。分母固定,求解分子最大 55 取平 双编码 均值 值,即:令aTExxa=1,b2wb=1,aEb最大,构 45 50 70 43 50 59 00 造拉格朗日等式,有: 20 42 31 La.b)=d'Exyb-(a'Zxa-1-(bEnb-1)(13) 图2 DCALBP双编码 求导得出: Fig.2 DCALBP dual-encoded aL 首先求取4个采样点的灰度值,灰度值取整, Ba =Exyb-AExxa aL (14) 根据式(5),差值阈值为d=【56-50)+(59-50)+ ab =Eyxa-0Evrb (31-50)+(43-50]=-2.75,根据式(6),幅度阈值 令导数为0,则有: 1=456-501+159-501+131-501+43-501=7.75。由 Exyb-AExxa=0 ∑yxa-0Eyrb=0 (15) 式(T)、(8),得到DCALBP编码值。由于二值编码 由此求出A=0=a2xb,对式(15)进一步简 模式经循环位移后会产生不同的编码结果,为了 化,有: 保证算法的旋转不变性,取最小值为DCALBP的 值。图2中,循环移位后二值编码分别为: ExkExyb=Aa (16) EyErxa=Ab (10110100)2=(180)10,(00101101)2=(45)10,(01001011)2= (75)10,(110100102=(210)10,取最小值,故该像素点 转化成矩阵的形式,即: 的DCALBP值为45。 效 1.3CCA特征融合 10 典型相关性分析(canonical correlation analys- 对 0l「0xw 求出最大特征值入, is,CCA)用来挖掘两个来自于同一个体的多维数 即可以求出向量a、b和p。得到的a、b称为典型 据之间的联系1。CCA将多维向量X和Y通过 向量,融合后的特征向量为fx)=U+V=aTX+bTY, 线性变换为U和V,计算U和V之间的相关系 作为年龄特征向量。 数,从而得到二者的相关性。该算法将两组特征 l.4 Siamese Network网络模型 向量的典型特征作为有效特征,既达到特征融合 人脸验证任务的目的就是比较两幅输入人脸 的目的,又消除了特征向量之间的信息冗余,同 图片的匹配程度,因此需要构建一个卷积神经网 时起到降维的作用。在本研究中,首先应用 络,实现图像对输入、输出两幅图片的相似度量 DCALBP和HOG算法分别提取人脸纹理特征和 值。在2005年,Chopral9提出了一种用于图片匹 形状特征向量,用X、Y表示,然后引入CCA算法 配的卷积神经网络结构,称之为孪生网络(Sia-
N ic i2p+1(p = 0,1,2 · ··) 其中, 表示采样点的个数; 表示中心像素点的 灰度值; 表示采样点的灰度值。 d t 为了提取出丰富的面部纹理信息,DCALBP 采用双编码的方法。取采样点与中心像素点 灰度值的差值,差值大于等于阈值 ,编码为 1, 反之为 0,得到第一位编码值。第二位编码值与 采样点与中心像素灰度值的绝对值有关,绝对值 大于等于 ,编码为 1,反之为 0。编码公式如下: DCALBPN = ∑N−1 p=0 (S (1)(ip ,ic)22p+S (2)(ip ,ic)22p+1 ) (7) S (ip,ic) = 00, ip −ic < d and |ip −ic | < t 01, ip −ic < d and |ip −ic | ⩾ t 10, ip −ic ⩾ d and |ip −ic | < t 11, ip −ic ⩾ d and |ip −ic | ⩾ t (8) S (1) S (2) S (ip,ic) (N = 4) 其中 和 分别表示 编码中的第一位 和第二位编码值。 以 3 ×3 的窗口,采样点 为 4 为例,DCALBP 编码过程如图 2 所示。 31 45 20 42 50 70 50 55 65 × 43 31 × 50 59 × 56 × × 00 01 × 11 取平 × 10 × 均值 双编码 图 2 DCALBP 双编码 Fig. 2 DCALBP dual-encoded d = 1 4 [(56−50)+(59−50)+ (31−50)+(43−50)] = −2.75 t= 1 4 [|56−50|+|59−50|+|31−50|+|43−50|]=7.75 (10110100)2=(180)10 (00101101)2=(45)10 (01001011)2= (75)10 (11010010)2 = (210)10 首先求取 4 个采样点的灰度值,灰度值取整, 根据式 (5),差值阈值为 ,根据式 (6),幅度阈值 。由 式 (7)、(8),得到 DCALBP 编码值。由于二值编码 模式经循环位移后会产生不同的编码结果,为了 保证算法的旋转不变性,取最小值为 DCALBP 的 值 。 图 2 中,循环移位后二值编码分别为: , , , ,取最小值,故该像素点 的 DCALBP 值为 45。 1.3 CCA 特征融合 典型相关性分析 (canonical correlation analysis,CCA) 用来挖掘两个来自于同一个体的多维数 据之间的联系[18]。CCA 将多维向量 X 和 Y 通过 线性变换为 U 和 V,计算 U 和 V 之间的相关系 数,从而得到二者的相关性。该算法将两组特征 向量的典型特征作为有效特征,既达到特征融合 的目的,又消除了特征向量之间的信息冗余,同 时起到降维的作用。在本研究中,首先应 用 DCALBP 和 HOG 算法分别提取人脸纹理特征和 形状特征向量,用 X、Y 表示,然后引入 CCA 算法 U = a TX V = b TY Coor(U,V) Σ = [ ΣXX ΣXY ΣYX ΣYY ] ΣXX = cov(X,X) ΣXY = cov(X,Y) ΣYX = cov(Y,X) ΣYY = cov(Y,Y) U = a TX V = b TY 将两组向量通过线性变换投影到一维空间,求出 投影向量 a 和 b,使得 和 之间的 相关系数 最大。向量 X 和 Y 的协方差 矩阵为 ,其中 ,表示 X 的协方差矩阵; , , 表示 X 和 Y 的互协方差矩阵; ,表 示 Y 的协方差矩阵。先求出 和 的方差和协方差,有: var(U) = var(a TX) = a TΣXX a (9) var(V) = var(b TY) = b TΣYY b (10) cov(U,V) = cov(a T X, b TY) = a TΣXY b (11) 然后求 U 和 V 的相关系数: ρ = Corr(U,V)= cov(U,V) √ var(U) √ var(V) = a TΣXY b √ a TΣXX a √ b TΣYY b (12) ρ a TΣXX a = 1 b TΣYY b = 1 a TΣXY b 此时,问题转化为,求解出投影向量 a、b,使 得相关系数 最大。分母固定,求解分子最大 值,即:令 , , 最大,构 造拉格朗日等式,有: L(a, b) = a TΣXY b− λ 2 (a TΣXX a−1)− θ 2 (b TΣYY b−1) (13) 求导得出: ∂L ∂a = ΣXY b−λΣXX a ∂L ∂b = ΣYX a−θΣYY b (14) 令导数为 0,则有: { ΣXY b−λΣXX a = 0 ΣYX a−θΣYY b = 0 (15) λ = θ = a T 由此求出 ΣXY b ,对式 (15) 进一步简 化,有: Σ −1 XXΣXY b = λa Σ −1 YYΣYX a = λb (16) 转化成矩阵的形式,即: Σ −1 XX 0 0 Σ −1 YY 0 ΣXY ΣYX 0 a b = λ a b [ Σ −1 XX 0 0 Σ −1 YY ] [ 0 ΣXY ΣYX 0 ] λ ρ f(x) = U +V = a TX+ b TY 对 求出最大特征值 , 即可以求出向量 a、b 和 。得到的 a、b 称为典型 向量,融合后的特征向量为 , 作为年龄特征向量。 1.4 Siamese Network 网络模型 人脸验证任务的目的就是比较两幅输入人脸 图片的匹配程度,因此需要构建一个卷积神经网 络,实现图像对输入、输出两幅图片的相似度量 值。在 2005 年,Chopra[19] 提出了一种用于图片匹 配的卷积神经网络结构,称之为孪生网络 (Sia- 第 2 期 孙燕,等:跨年龄人脸验证技术研究 ·249·
·250· 智能系统学报 第16卷 mese Network),该网络通过两个共享权值的卷积 被何凯明团队提出,由多个残差块组成,结构中 神经网络(CNN)提取特征,再进行特征匹配。在 使用了“shortcut connection”的连接方式,很好地 本文的网络结构中,对Siamese Network进行了改 解决了深层网络中梯度弥散和训练困难的问题。 进,把CNN结构替换为ResNet,.该结构在20l5年 整体的模型流程图如图3所示。 DCALBP 面部纹理特征X, 特征融合 fx)=aX+bY CCA HOG 面部形状特征Y 面部整体特征G.(T) 年龄不变 ResNet 人脸特征 g(x) 对比损 权值W 失函数 面部整体特征G(T) 年龄不变 ResNet 人脸特征 gi(x) HOG 面部形状特征Y ●CA 特征融合 DCALBP 面部纹理特征X Ax)=aX+bY 图3RS-CNN模型流程图 Fig.3 Architecture of the RS-CNN 首先构建一个映射函数Gw(X),把输入图片 d= T:、T2作为参数自变量,输出得到特征向量 (-)月 (22) Gw(T)、Gw(T2),分离出年龄特征向量,得到两组年 式中:d代表两个样本特征之间的欧氏距离;P表示 龄无关的特征向量进行相似度量,通过反向传 样本的特征维数。y表示图像对中两个样本是否匹 播,不断优化网络参数,使得两张同一人脸图片 1 的距离相似度量值最小化,两张不同人脸图片的 配,y=0表示不匹配,此时Loss=2N名maxm-d.0, 即两个样本不同时,特征空间的欧氏距离越小, 距离相似度量值最大化,以此来实现人脸验证。 损失越大:y=1表示匹配,此时L=永三,即 I N 其计算过程为 f(x)=aTX+bTY (17) 两个样本相似时,如果在特征空间的欧氏距离较 h(x)=Gw(x),x=T (18) 大,损失就会越大,说明网络模型不好,则会训练 优化模型。m为设定好的阈值,取值为1.25,表示 g(x)=h(x)-uf(x) (19) 只考虑欧氏距离在0~m的特征,超过阈值时, Ew(g(x))=llgi(x)-g2(x)ll (20) Loss=0:N为样本数。 式中:X表示纹理特征;Y表示轮廓特征;a和 b是CCA算法中的投影向量;f(x)即是X和Y特 2实验过程及结果 征融合后的年龄特征向量。h(x)表示输人图像的 整个人脸特征,4表示年龄特征向量的权值,经过 2.1数据集及实验参数 实验验证,当=0.72时,实验结果最优。g(x)表 本次实验所使用的数据集有3种,分别是 示特征分离得到的与年龄无关的人脸特征向量, FG-NET数据集、MORPH2数据集以及从FG NET数据集、MORPH2数据集中按照实验所需选 Ew(g(x》为相似性度量函数,表示图片对的匹配 择图片构成一个综合数据集。综合数据集年龄跨 程度。引入损失函数Contrastive Loss,通过反向 度为0~62岁,包括13040人52840张照片,正样 传播不断更新网络的权值,降低损失值,优化网 本为同一人不同年龄段的图像对,负样本为两 络性能。损失函数表达式如下: 类,一类是不同人同一年龄段的图像对,一类是 是之e+1-y)max(m-d02 1 21) 不同人不同年龄段的图像对。其中训练集包括 三1 30000个图像对,验证集包括4000个图像对,则
mese Network),该网络通过两个共享权值的卷积 神经网络 (CNN) 提取特征,再进行特征匹配。在 本文的网络结构中,对 Siamese Network 进行了改 进,把 CNN 结构替换为 ResNet,该结构在 2015 年 被何凯明团队提出[20] ,由多个残差块组成,结构中 使用了“shortcut connection”的连接方式,很好地 解决了深层网络中梯度弥散和训练困难的问题。 整体的模型流程图如图 3 所示。 面部纹理特征 X1 面部纹理特征 X2 DCALBP 特征融合 f(x1 ) = a TX1+ b TY1 特征融合 f(x2 ) = a TX2+ b TY2 MTCNN MTCNN 面部形状特征 Y1 面部形状特征 Y2 面部整体特征 GW(T1 ) 年龄不变 人脸特征 g1 (x) ResNet 对比损 失函数 权值 W ResNet 年龄不变 人脸特征 g2 (x) 面部整体特征 GW(T2 ) HOG HOG CCA CCA DCALBP − − 图 3 RS-CNN 模型流程图 Fig. 3 Architecture of the RS-CNN GW (X) T1 T2 GW (T1) GW (T2) 首先构建一个映射函数 ,把输入图片 、 作为参数自变量,输出得到特征向量 、 ,分离出年龄特征向量,得到两组年 龄无关的特征向量进行相似度量,通过反向传 播,不断优化网络参数,使得两张同一人脸图片 的距离相似度量值最小化,两张不同人脸图片的 距离相似度量值最大化,以此来实现人脸验证。 其计算过程为 f(x) = a TX+ b TY (17) h(x) = GW (x), x = T (18) g(x) = h(x)−µ f(x) (19) EW (g(x)) = ||g1(x)−g2(x)|| (20) f(x) h(x) µ µ=0.72 g(x) EW (g(x)) 式中:X 表示纹理特征;Y 表示轮廓特征; a 和 b 是 CCA 算法中的投影向量; 即是 X 和 Y 特 征融合后的年龄特征向量。 表示输入图像的 整个人脸特征, 表示年龄特征向量的权值,经过 实验验证,当 时,实验结果最优。 表 示特征分离得到的与年龄无关的人脸特征向量, 为相似性度量函数,表示图片对的匹配 程度。引入损失函数 Contrastive Loss,通过反向 传播不断更新网络的权值,降低损失值,优化网 络性能。损失函数表达式如下: Loss = 1 2N ∑N n=1 yd2 +(1−y)max (m−d,0)2 (21) d = vt∑P i=1 (x i 1 − x i 2 ) 2 (22) d P y y = 0 Loss= 1 2N ∑N n=1 max (m−d,0)2 y = 1 Loss = 1 2N ∑N n=1 d 2 m 0 ∼ m Loss = 0 N 式中: 代表两个样本特征之间的欧氏距离; 表示 样本的特征维数。 表示图像对中两个样本是否匹 配, 表示不匹配,此时 , 即两个样本不同时,特征空间的欧氏距离越小, 损失越大; 表示匹配,此时 ,即 两个样本相似时,如果在特征空间的欧氏距离较 大,损失就会越大,说明网络模型不好,则会训练 优化模型。 为设定好的阈值,取值为 1.25,表示 只考虑欧氏距离在 的特征,超过阈值时, ; 为样本数。 2 实验过程及结果 2.1 数据集及实验参数 本次实验所使用的数据集有 3 种,分别是 FG-NET 数据集、MORPH2 数据集以及从 FGNET 数据集、MORPH2 数据集中按照实验所需选 择图片构成一个综合数据集。综合数据集年龄跨 度为 0~62 岁,包括 13 040 人 52 840 张照片,正样 本为同一人不同年龄段的图像对,负样本为两 类,一类是不同人同一年龄段的图像对,一类是 不同人不同年龄段的图像对。其中训练集包括 30 000 个图像对,验证集包括 4 000 个图像对,测 ·250· 智 能 系 统 学 报 第 16 卷
第2期 孙燕,等:跨年龄人脸验证技术研究 ·251· 试集包括4000个图像对。每个图像对有对应的 18岁以下的人脸图像占据该数据集的61% 标签,1表示正样本,0表示负样本。3个数据集 以上,而人脸轮廓纹理变化最大的便是婴幼儿到 的年龄段占比分布如图4所示。 青少年时期,此数据集给人脸验证算法带来了很 大的难度,因此要对数据进行更加科学的处理。 0.6 ■FG-NET MORPH 训练集选取了60个人不同年龄段的照片,从每个 综合数据集 0.5 年龄段中选取图片组成正样本图像对和负样本图 0.4 像对,如表2所示。不同方法在FG-NET数据集 0.3 上的实验结果如表3所示。 表2正负样本组合方式 Table 2 Positive and negative sample combination method 0.1 样本组合方式 正样本对个数 负样本对个数 0.0 0-1617-2526-3536-4546-5556-6566-75 04and5-10 50 年龄跨度/岁 50 0~4and11~16 50 50 图4数据集年龄分布 Fig.4 Data set age distribution 0-4and17-24 50 2.1.1数据预处理 04and25-69 50 50 采用MTCNN检测人脸关键点,通过相似性 5-10and11-16 50 50 变换实现人脸对齐,检测出人脸区域,统一将输 5~10and1724 50 50 入图片像素大小裁剪为224×224。为了防止过拟 5-10and2669 50 50 合,在训练的过程中为保证样本的多样性,采用 11-16and17-24 50 50 在线数据增强的方式,对训练集数据进行随机翻 11-16and25-69 50 50 转、水平镜像、亮度变换的操作,最后对图片数据 归一化,归一化区间为[-1,1]。 17-24and25-69 50 50 2.1.2实验参数设置 表3不同方法在FG-NET数据集上的识别率 本实验模型使用的框架为Pytorch框架, Table 3 Recognition rate of different method on FGNET batch size设为64,学习率预设为0.01,实验过程 方法 识别率/% 中防止学习率过大带来模型振荡的问题,采用 HFA 69.0 Warmup Learning的方法对学习率进行处理,训练 MEFA 76.2 开始使用较小的学习率,设为0.0001,迭代训练 3次后,学习率恢复为预设值,之后每迭代50次, CAN 86.5 学习率下降1/10,迭代次数设为200,动量因子设 LF-CNN 88.1 为0.9。 本文方法 89.73 2.2实验结果 2.2.2在MORPH2数据集上的实验结果 2.2.1在FG-NET数据集上的实验结果 MORPH2收录了同一个人在不同年龄段的图 FG-NET数据集包含82个人1002张不同年 片。该数据集包括13000个人的55134张图片, 龄段的面部图像,年龄范围在0~69周岁,其年龄 人物年龄跨度为16~77岁。训练集选取6000人 段分布如表1所示。 不同年龄段的照片,正样本为每个人年龄跨度最 表1 FG-NET数据集年龄分布 大的两张图片,即6000个样本对,负样本为6000 Table 1 FG-NET data set age distribution 人中不同人不同年龄的两张图片,也组成6000个 年龄段 样本数量张 样本对。验证集为不包括训练集的3000人的数 0-4 193 据集,测试集为不包括训练集和验证集的4000人 5-10 218 样本对,正负样本对的选取方式和训练集相同。 1116 201 不同方法在MORPH2上的实验结果如表4所示。 182 2.2.3在综合数据集上的实验结果 17-24 FG-NET数据集数量少,且18岁以下的数据 25-69 208 量占据整个数据集的60%以上,MORPH数据集
试集包括 4 000 个图像对。每个图像对有对应的 标签,1 表示正样本,0 表示负样本。3 个数据集 的年龄段占比分布如图 4 所示。 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0-16 17-25 26-35 36-45 46-55 56-65 66-75 年龄跨度/岁 FG-NET MORPH 综合数据集 人数占比 图 4 数据集年龄分布 Fig. 4 Data set age distribution 2.1.1 数据预处理 采用 MTCNN 检测人脸关键点,通过相似性 变换实现人脸对齐,检测出人脸区域,统一将输 入图片像素大小裁剪为 224×224。为了防止过拟 合,在训练的过程中为保证样本的多样性,采用 在线数据增强的方式,对训练集数据进行随机翻 转、水平镜像、亮度变换的操作,最后对图片数据 归一化,归一化区间为 [−1,1]。 2.1.2 实验参数设置 本实验模型使用的框架 为 Pytorch 框架, batch_size 设为 64,学习率预设为 0.01,实验过程 中防止学习率过大带来模型振荡的问题,采用 Warmup Learning 的方法对学习率进行处理,训练 开始使用较小的学习率,设为 0.000 1,迭代训练 3 次后,学习率恢复为预设值,之后每迭代 50 次, 学习率下降 1/10,迭代次数设为 200,动量因子设 为 0.9。 2.2 实验结果 2.2.1 在 FG-NET 数据集上的实验结果 FG-NET 数据集包含 82 个人 1 002 张不同年 龄段的面部图像,年龄范围在 0~69 周岁,其年龄 段分布如表 1 所示。 表 1 FG-NET 数据集年龄分布 Table 1 FG-NET data set age distribution 年龄段 样本数量/张 0~4 193 5~10 218 11~16 201 17~24 182 25~69 208 18 岁以下的人脸图像占据该数据集的 61% 以上,而人脸轮廓纹理变化最大的便是婴幼儿到 青少年时期,此数据集给人脸验证算法带来了很 大的难度,因此要对数据进行更加科学的处理。 训练集选取了 60 个人不同年龄段的照片,从每个 年龄段中选取图片组成正样本图像对和负样本图 像对,如表 2 所示。不同方法在 FG-NET 数据集 上的实验结果如表 3 所示。 表 2 正负样本组合方式 Table 2 Positive and negative sample combination method 样本组合方式 正样本对个数 负样本对个数 0~4 and 5~10 50 50 0~4 and 11~16 50 50 0~4 and 17~24 50 50 0~4 and 25~69 50 50 5~10 and 11~16 50 50 5~10 and 17~24 50 50 5~10 and 26~69 50 50 11~16 and 17~24 50 50 11~16 and 25~69 50 50 17~24 and 25~69 50 50 表 3 不同方法在 FG-NET 数据集上的识别率 Table 3 Recognition rate of different method on FGNET 方法 识别率/% HFA 69.0 MEFA 76.2 CAN 86.5 LF-CNN 88.1 本文方法 89.73 2.2.2 在 MORPH2 数据集上的实验结果 MORPH2 收录了同一个人在不同年龄段的图 片。该数据集包括 13 000 个人的 55 134 张图片, 人物年龄跨度为 16~77 岁。训练集选取 6 000 人 不同年龄段的照片,正样本为每个人年龄跨度最 大的两张图片,即 6 000 个样本对,负样本为 6 000 人中不同人不同年龄的两张图片,也组成 6 000 个 样本对。验证集为不包括训练集的 3 000 人的数 据集,测试集为不包括训练集和验证集的 4 000 人 样本对,正负样本对的选取方式和训练集相同。 不同方法在 MORPH2 上的实验结果如表 4 所示。 2.2.3 在综合数据集上的实验结果 FG-NET 数据集数量少,且 18 岁以下的数据 量占据整个数据集的 60% 以上,MORPH 数据集 第 2 期 孙燕,等:跨年龄人脸验证技术研究 ·251·
·252· 智能系统学报 第16卷 数据量足够,但是不包含幼儿时期的数据,且两 and retrieval using cross-age reference coding with cross- 个数据集中60岁以上的数据呈现个位数的情况, age celebrity dataset[J].IEEE transactions on multimedia, 为了提高算法的鲁棒性和泛化性,对两个数据集 2015,17(6):804-815 进行整理,整合成一个包含13040人52840张照 [2]LANITIS A.TAYLOR C J.COOTES T F.Toward auto- 片的数据集,年龄跨度为0~77,表5是本文提出 matic simulation of aging effects on face images[J].IEEE 的方法在综合数据集上的实验结果。 transactions on pattern analysis and machine intelligence, 2002.24(4):442-455. 表4不同方法在MORPH2数据集上的识别率 [3]DUONG C N,QUACH K G,LUU K,et al.Temporal non- Table 4 Recognition rate of different method on MORPH2 volume preserving approach to facial age-progression and 方法 识别率/% age-invariant face recognition[C]//Proceedings of 2017 HOG+HFA 91.14 IEEE International Conference on Computer Vision. HLBP+CARC 92.80 Venice,Italy,2017:3755-3763. [4]LI Zhifeng,PARK U,JAIN A K.A discriminative model HOG+IFA 92.26 for age invariant face recognition[J.IEEE transactions on MEFA 93.80 information forensics and security,2011,6(3):1028-1037. LSP+HFA 94.87 [5]张媛媛,霍静,杨婉琪,等.深度信念网络的二代身份证 LF-CNNs基线模型 异构人脸核实算法[.智能系统学报,2015,10(2): 95.13 193-200 LF-CNNs 97.51 ZHANG Yuanyuan,HUO Jing,YANG Wanqi,et al.A OE-CNNs 98.55 deep belief network-based heterogeneous face verification 本文方法 98.32 method for the second-generation identity card[J].CAAI transactions on intelligent systems,2015,10(2):193-200. 表5本文不同方法组合在综合数据集上的识别率 [6]方涛,陈志国,傅毅.神经网络多层特征信息融合的人脸 Table 5 Recognition rate of different method combina- 识别方法.智能系统学报,2021,16(2):279-285 tions on the comprehensive data set FANG Tao,CHEN Zhiguo,FU Yi.Face recognition meth- 方法 识别率% od based on neural network multi-layer feature informa- SiameseNet 84.36 tion fusion[J].CAAl transactions on intelligent systems. 2021,16(2):279-285 SiameseNet+ResNet 90.80 [7]OJALA T.PIETIKAINEN M.MAENPAA T.Multiresolu- SiameseNet+ResNet+HOG 93.13 tion gray-scale and rotation invariant texture classification SiameseNet+ResNet+DCALBP 94.96 with local binary patterns[J].IEEE transactions on pattern SiameseNet+ResNet+DCALBP+HOG 98.27 analysis and machine intelligence.2002.24(7):971-987. [8]LOWE D G.Distinctive image features from scale-invari- 3结束语 ant keypoints[J].International journal of computer vision, 2004,60(2):91-110 本文提出了一种基于深度学习算法与传统图 [9]PARK U,TONG Yiying,JAIN A K.Age-invariant face 像算法相融合的跨年龄人脸验证方法,该方法分 recognition[J].IEEE transactions on pattern analysis and 别提取人脸特征信息和年龄特征信息,并通过特 machine intelligence,2010,32(5):947-954. 征分离得到具有年龄不变性的人脸特征。为了更 [10]GONG Dihong,LI Zhifeng,LIN Dahua,et al.Hidden factor analysis for age invariant face recognition[C]//Pro- 好地匹配人脸特征,本文利用孪生网络的结构特 ceedings of 2013 IEEE International Conference on Com- 性,对人脸特征进行相似性度量,判定匹配程度, puter Vision.Sydney,Australia,2013:978-989. 得到跨年龄人脸验证结果。为了验证算法的鲁棒 [11]GONG Dihong,LI Zhifeng,TAO Dacheng,et al.A max- 性,在FG-NET、MORPH以及两个数据集的综合 imum entropy feature descriptor for age invariant face re- 数据集上进行实验,得到理想的效果,验证了此 cognition[C]//Proceedings of 2015 IEEE Conference on 方法的有效性。 Computer Vision and Pattern Recognition.Boston,USA, 参考文献: 2015:5289-5297 [12]XU Chenfei,LIU Qihe,YE Mao.Age invariant face re- [1]CHEN B C,CHEN Chusong,HSU W H.Face recognition cognition and retrieval by coupled auto-encoder net-
数据量足够,但是不包含幼儿时期的数据,且两 个数据集中 60 岁以上的数据呈现个位数的情况, 为了提高算法的鲁棒性和泛化性,对两个数据集 进行整理,整合成一个包含 13 040 人 52 840 张照 片的数据集,年龄跨度为 0~77,表 5 是本文提出 的方法在综合数据集上的实验结果。 表 4 不同方法在 MORPH2 数据集上的识别率 Table 4 Recognition rate of different method on MORPH2 方法 识别率/% HOG+HFA 91.14 HLBP+CARC 92.80 HOG+IFA 92.26 MEFA 93.80 LSP+HFA 94.87 LF-CNNs基线模型 95.13 LF-CNNs 97.51 OE-CNNs 98.55 本文方法 98.32 表 5 本文不同方法组合在综合数据集上的识别率 Table 5 Recognition rate of different method combinations on the comprehensive data set 方法 识别率/% SiameseNet 84.36 SiameseNet+ResNet 90.80 SiameseNet+ResNet+HOG 93.13 SiameseNet+ResNet+DCALBP 94.96 SiameseNet+ResNet+DCALBP+HOG 98.27 3 结束语 本文提出了一种基于深度学习算法与传统图 像算法相融合的跨年龄人脸验证方法,该方法分 别提取人脸特征信息和年龄特征信息,并通过特 征分离得到具有年龄不变性的人脸特征。为了更 好地匹配人脸特征,本文利用孪生网络的结构特 性,对人脸特征进行相似性度量,判定匹配程度, 得到跨年龄人脸验证结果。为了验证算法的鲁棒 性,在 FG-NET、MORPH 以及两个数据集的综合 数据集上进行实验,得到理想的效果,验证了此 方法的有效性。 参考文献: [1] CHEN B C, CHEN Chusong, HSU W H. Face recognition and retrieval using cross-age reference coding with crossage celebrity dataset[J]. IEEE transactions on multimedia, 2015, 17(6): 804–815. LANITIS A, TAYLOR C J, COOTES T F. Toward automatic simulation of aging effects on face images[J]. IEEE transactions on pattern analysis and machine intelligence, 2002, 24(4): 442–455. [2] DUONG C N, QUACH K G, LUU K, et al. Temporal nonvolume preserving approach to facial age-progression and age-invariant face recognition[C]//Proceedings of 2017 IEEE International Conference on Computer Vision. Venice, Italy, 2017: 3755−3763. [3] LI Zhifeng, PARK U, JAIN A K. A discriminative model for age invariant face recognition[J]. IEEE transactions on information forensics and security, 2011, 6(3): 1028–1037. [4] 张媛媛, 霍静, 杨婉琪, 等. 深度信念网络的二代身份证 异构人脸核实算法 [J]. 智能系统学报, 2015, 10(2): 193–200. ZHANG Yuanyuan, HUO Jing, YANG Wanqi, et al. A deep belief network-based heterogeneous face verification method for the second-generation identity card[J]. CAAI transactions on intelligent systems, 2015, 10(2): 193–200. [5] 方涛, 陈志国, 傅毅. 神经网络多层特征信息融合的人脸 识别方法 [J]. 智能系统学报, 2021, 16(2): 279–285. FANG Tao, CHEN Zhiguo, FU Yi. Face recognition method based on neural network multi-layer feature information fusion[J]. CAAI transactions on intelligent systems, 2021, 16(2): 279–285. [6] OJALA T, PIETIKAINEN M, MAENPAA T. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J]. IEEE transactions on pattern analysis and machine intelligence, 2002, 24(7): 971–987. [7] LOWE D G. Distinctive image features from scale-invariant keypoints[J]. International journal of computer vision, 2004, 60(2): 91–110. [8] PARK U, TONG Yiying, JAIN A K. Age-invariant face recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2010, 32(5): 947–954. [9] GONG Dihong, LI Zhifeng, LIN Dahua, et al. Hidden factor analysis for age invariant face recognition[C]//Proceedings of 2013 IEEE International Conference on Computer Vision. Sydney, Australia, 2013: 978−989. [10] GONG Dihong, LI Zhifeng, TAO Dacheng, et al. A maximum entropy feature descriptor for age invariant face recognition[C]//Proceedings of 2015 IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA, 2015: 5289−5297. [11] XU Chenfei, LIU Qihe, YE Mao. Age invariant face recognition and retrieval by coupled auto-encoder net- [12] ·252· 智 能 系 统 学 报 第 16 卷
第2期 孙燕,等:跨年龄人脸验证技术研究 ·253· works[J].Neurocomputing,2017,222:62-71 [19]CHOPRA S,HADSELL R,LECUN Y.Learning a simil- [13]LIN Liang,WANG Guangrun,ZUO Wangmeng,et al. arity metric discriminatively,with application to face Cross-domain visual matching via generalized similarity verification[Cl//Proceedings of 2005 IEEE Computer So- measure and feature learning[J].IEEE transactions on pat- ciety Conference on Computer Vision and Pattern Recog- tern analysis and machine intelligence,2017,39(6): nition.San Diego,CA,USA,2005:539-546. 1089-1102. [20]HE Kaiming,ZHANG Xiangyu,REN Shaoqing,et al. [14]LING Haibin,SOATTO S,RAMANATHAN N,et al. Deep residual learning for image recognition[C]//Proceed- Face verification across age progression using discrimin- ings of 2016 IEEE Conference on Computer Vision and ative methods[J].IEEE transactions on information Pattern Recognition.Las Vegas,NV,USA,2016: forensics and security,2010,5(1):82-91. 770-778. [15]WANG Yitong,GONG Dihong,ZHOU Zheng,et al.Or- thogonal deep features decomposition for age-invariant 作者简介: face recognition[C]//Proceedings of the 15th European 孙燕,硕士研究生,主要研究方向 Conference on Computer Vision.Munich,Germany, 为人工智能、计算机视觉、图像处理、 2018:764-779. 人脸识别。 [16]WEN Yandong,LI Zhifeng,QIAO Yu.Latent factor guided convolutional neural networks for age-invariant face recognition[C]//Proceedings of 2016 IEEE Confer- ence on Computer Vision and Pattern Recognition.Las Vegas,USA,2016:4893-4901. 李旭军,副教授,博士,主要研究 方向为人工智能、计算机视觉、虚拟 [17刀任飞凯,邱晓晖.基于LBP和数据扩充的CNN人脸识 仪器。 别研究[J.计算机技术与发展,2020,30(3):62-66. REN Feikai,QIU Xiaohui.Research on face recognition of CNN Based on LBP and data expansion[J].Computer technology and development,2020,30(3):62-66. [18]孙权森,曾生根,王平安,等.典型相关分析的理论及其 在特征融合中的应用[].计算机学报,2005,28(9): 何启泓.硕士研究生,主要研究方 1524-1533 向为大数据、数据挖掘、图像处理。 SUN Quansen,ZENG Shenggen,HENG P A,et al.The theory of canonical correlation analysis and its applica- tion to feature fusion[J].Chinese journal of computer, 2005,28(9)15241533
works[J]. Neurocomputing, 2017, 222: 62–71. LIN Liang, WANG Guangrun, ZUO Wangmeng, et al. Cross-domain visual matching via generalized similarity measure and feature learning[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(6): 1089–1102. [13] LING Haibin, SOATTO S, RAMANATHAN N, et al. Face verification across age progression using discriminative methods[J]. IEEE transactions on information forensics and security, 2010, 5(1): 82–91. [14] WANG Yitong, GONG Dihong, ZHOU Zheng, et al. Orthogonal deep features decomposition for age-invariant face recognition[C]//Proceedings of the 15th European Conference on Computer Vision. Munich, Germany, 2018: 764−779. [15] WEN Yandong, LI Zhifeng, QIAO Yu. Latent factor guided convolutional neural networks for age-invariant face recognition[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA, 2016: 4893−4901. [16] 任飞凯, 邱晓晖. 基于 LBP 和数据扩充的 CNN 人脸识 别研究 [J]. 计算机技术与发展, 2020, 30(3): 62–66. REN Feikai, QIU Xiaohui. Research on face recognition of CNN Based on LBP and data expansion[J]. Computer technology and development, 2020, 30(3): 62–66. [17] 孙权森, 曾生根, 王平安, 等. 典型相关分析的理论及其 在特征融合中的应用 [J]. 计算机学报, 2005, 28(9): 1524–1533. SUN Quansen, ZENG Shenggen, HENG P A, et al. The theory of canonical correlation analysis and its application to feature fusion[J]. Chinese journal of computer, 2005, 28(9): 1524–1533. [18] CHOPRA S, HADSELL R, LECUN Y. Learning a similarity metric discriminatively, with application to face verification[C]//Proceedings of 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Diego, CA, USA, 2005: 539−546. [19] HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Deep residual learning for image recognition[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, NV, USA, 2016: 770−778. [20] 作者简介: 孙燕,硕士研究生,主要研究方向 为人工智能、计算机视觉、图像处理、 人脸识别。 李旭军,副教授,博士,主要研究 方向为人工智能、计算机视觉、虚拟 仪器。 何启泓,硕士研究生,主要研究方 向为大数据、数据挖掘、图像处理。 第 2 期 孙燕,等:跨年龄人脸验证技术研究 ·253·