第13卷第5期 智能系统学报 Vol.13 No.5 2018年10月 CAAI Transactions on Intelligent Systems Oct.2018 D0:10.11992/tis.201706052 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20180426.1131.006html 基于卷积特征和贝叶斯分类器的人脸识别 冯小荣,惠康华,柳振东 (中国民航大学计算机科学与技术学院,天津300300)】 摘要:为解决传统人脸识别算法特征提取困难的问题,提出了基于卷积特征和贝叶斯分类器的人脸识别方 法,利用卷积神经网络提取人脸特征,通过主成分分析法对特征降维,最后利用贝叶斯分类器进行判别分类, 在ORL(olivetti research laboratory)人脸库上进行实验,获得了99.0O%的识别准确率。实验结果表明,卷积神经 网络提取的人脸图像特征具有很强的辨识度,与PCA(principal component analysis)和贝叶斯分类器结合之后可 有效提高人脸识别的准确率。 关键词:人脸识别:卷积神经网络:模式识别:深度学习:贝叶斯分类器 中图分类号:TP393文献标志码:A文章编号:1673-47852018)05-0769-07 中文引用格式:冯小荣,惠康华,柳振东.基于卷积特征和贝叶斯分类器的人脸识别J.智能系统学报,2018,13(5): 769-775. 英文引用格式:FENG Xiaorong,,HUI Kanghua,LIU Zhendong..Face recognition based on convolution feature and Bayes classifierJ.CAAI transactions on intelligent systems,2018,13(5):769-775. Face recognition based on convolution feature and Bayes classifier FENG Xiaorong,HUI Kanghua,LIU Zhendong (School of Computer Science and Technology,Civil Aviation University of China,Tianjin 300300,China) Abstract:To solve the difficulty of feature extraction of the traditional face recognition algorithm,a new method based on convolution feature and Bayes classifier is proposed,which uses convolution neural network to extract facial fea- tures and principal component analysis(PCA)to reduce the feature dimension,and finally,employs a Bayes classifier to classify the features.Experiments were carried out on the ORL face database,and a recognition accuracy of99%was achieved.The experimental results show that the face features extracted by the convolution neural network have a strong degree of recognition.Therefore,the accuracy of face recognition in feature extraction can be effectively improved by combining PCA and Bayes classifier with convolution neural network. Keywords:face recognition;convolutional neural network;pattern recognition,deep learning,Bayes classifier 人脸识别一直是模式识别和人工智能领域 有LBP纹理特征)、HOG方向梯度直方图特征 研究的热点问题。在此背景下,国内外公司竞相 和Haar-like特征,这三种特征虽然在人脸识别 进入该领域,如苹果公司推出的手机人脸识别解 中获得了不错的效果,但是也存在特征提取过程 锁,支付宝的刷脸登录等。解决人脸识别问题的 比较复杂,识别效率较低等不足。与传统的人脸 关键环节是特征提取,特征提取的好坏直接影响 识别算法相比,卷积神经网络可以将原始图像直 分类器识别准确率的高低。目前常用图像特征 接作为输入,减少数据的预处理过程,通过自学 习的方式完成特征提取,不仅有效降低了人脸特 征提取的时间消耗,而且提取的人脸特征具有很 收稿日期:2017-06-13.网络出版日期:2018-04-26 基金项目:国家自然科学基金项目(U1233113,61571441):中央 高的辨识度。为了克服传统人脸识别算法特征提 高校基金项目(ZXH2012M005,3122014C016):中国 民航大学科研启动基金项目(2010QD10X). 取带来的长时间消耗、低识别度的问题,本文提 通信作者:惠康华.E-mail:khhui@cauc.edu.cn 出一种基于卷积神经网络特征提取和贝叶斯分类
DOI: 10.11992/tis.201706052 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20180426.1131.006.html 基于卷积特征和贝叶斯分类器的人脸识别 冯小荣,惠康华,柳振东 (中国民航大学 计算机科学与技术学院,天津 300300) 摘 要:为解决传统人脸识别算法特征提取困难的问题,提出了基于卷积特征和贝叶斯分类器的人脸识别方 法,利用卷积神经网络提取人脸特征,通过主成分分析法对特征降维,最后利用贝叶斯分类器进行判别分类, 在 ORL(olivetti research laboratory) 人脸库上进行实验,获得了 99.00% 的识别准确率。实验结果表明,卷积神经 网络提取的人脸图像特征具有很强的辨识度,与 PCA(principal component analysis) 和贝叶斯分类器结合之后可 有效提高人脸识别的准确率。 关键词:人脸识别;卷积神经网络;模式识别;深度学习;贝叶斯分类器 中图分类号:TP393 文献标志码:A 文章编号:1673−4785(2018)05−0769−07 中文引用格式:冯小荣, 惠康华, 柳振东. 基于卷积特征和贝叶斯分类器的人脸识别[J]. 智能系统学报, 2018, 13(5): 769–775. 英文引用格式:FENG Xiaorong, HUI Kanghua, LIU Zhendong. Face recognition based on convolution feature and Bayes classifier[J]. CAAI transactions on intelligent systems, 2018, 13(5): 769–775. Face recognition based on convolution feature and Bayes classifier FENG Xiaorong,HUI Kanghua,LIU Zhendong (School of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China) Abstract: To solve the difficulty of feature extraction of the traditional face recognition algorithm, a new method based on convolution feature and Bayes classifier is proposed, which uses convolution neural network to extract facial features and principal component analysis (PCA) to reduce the feature dimension, and finally, employs a Bayes classifier to classify the features. Experiments were carried out on the ORL face database, and a recognition accuracy of 99% was achieved. The experimental results show that the face features extracted by the convolution neural network have a strong degree of recognition. Therefore, the accuracy of face recognition in feature extraction can be effectively improved by combining PCA and Bayes classifier with convolution neural network. Keywords: face recognition; convolutional neural network; pattern recognition; deep learning; Bayes classifier 人脸识别[1-2]一直是模式识别和人工智能领域 研究的热点问题。在此背景下,国内外公司竞相 进入该领域,如苹果公司推出的手机人脸识别解 锁,支付宝的刷脸登录等。解决人脸识别问题的 关键环节是特征提取,特征提取的好坏直接影响 分类器识别准确率的高低。目前常用图像特征 有 LBP 纹理特征[3] 、HOG 方向梯度直方图特征[4] 和 Haar-like 特征[5] ,这三种特征虽然在人脸识别 中获得了不错的效果,但是也存在特征提取过程 比较复杂,识别效率较低等不足。与传统的人脸 识别算法相比,卷积神经网络可以将原始图像直 接作为输入,减少数据的预处理过程,通过自学 习的方式完成特征提取,不仅有效降低了人脸特 征提取的时间消耗,而且提取的人脸特征具有很 高的辨识度。为了克服传统人脸识别算法特征提 取带来的长时间消耗、低识别度的问题,本文提 出一种基于卷积神经网络特征提取和贝叶斯分类 收稿日期:2017−06−13. 网络出版日期:2018−04−26. 基金项目:国家自然科学基金项目 (U1233113,61571441);中央 高校基金项目 (ZXH2012M005,3122014C016);中国 民航大学科研启动基金项目 (2010QD10X). 通信作者:惠康华. E-mail: khhui@cauc.edu.cn. 第 13 卷第 5 期 智 能 系 统 学 报 Vol.13 No.5 2018 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2018
·770· 智能系统学报 第13卷 器相结合的人脸识别算法,利用卷积神经网络提 取人脸特征,利用主成分分析法(PCA)对提取的 u=- (3) 特征进行降维,采用贝叶斯分类器进行判别分 把训练样本每一个图像均值化之后得到样本 类,最后在ORL人脸数据集上进行实验分析,验 矩阵Z,Z的计算表达式如式(4)所示。 证该方法提取特征辨识度高和低耗时的优点。 Z=[x1-u2-…xn-叫 (4) 1相关工作 此时,可得到训练样本的协方差矩阵C,C的 表达式如式(⑤)所示。 1.1卷积神经网络 C=Z.Z 卷积神经网络6刀作为一种高效的深度学习识 N (5) 别算法,近些年引起了广泛关注,其在语音识别、 协方差矩阵的维数为p×p。 语音分析和图像处理等领域都获得了巨大成功。 主成分分析法所要寻找的最优投影子空间由 在图像处理领域,卷积神经网络可直接将多维的 协方差矩阵C的非零特征值对应的特征向量组 图像数据输入网络,有效避免了复杂的特征提取 成。在利用PCA降维过程中,一般通过特征值的 和预处理过程。 累积贡献率α来确定主成分维数k,α可由式(6) 1.1.1卷积层 计算。 卷积层一般为特征提取层,由多个二维的 特征图组成,每个特征图由许多共享权值的神经 (6) 元组成。特征图中每个神经元通过卷积核与上一 层特征图的局部区域相连接。卷积层特征图的计 算表达式如式(1)所示。 假设求得的特征空间矩阵为U=[4…, =f∑+的 (1) 那么将训练样本向上投影,可以得到投影矩阵 Q,Q的计算表达式如式(7)所示。 式中:1表示层数;表示层的第j个特征图;f代表 Q=UZ (7) 激活函数:k表示卷积核;M,表示输入特征图的一 Q即为降维之后的数据。 个选择;b表示对应的偏置。 1.3朴素贝叶斯分类器 1.1.2亚采样层 朴素贝叶斯分类器是一个简单、高效的分 亚采样层利用图像的局部相关原理,对卷积 类器。它主要是根据先验概率预测样本属于某 层输入的特征图在相邻小区域内进行聚合统计, 类别的概率,选取概率最大的类别作为预测类 在减少数据量的同时,保留有用信息。常用的亚 别。整个朴素贝叶斯算法的过程分为两个阶段: 采样操作有均值池化(average pooling)、最大值池 分类器训练阶段、判别分类阶段。分类器训练阶 化(max pooling)和随机池化(stochastic pool-. 段的目的是生成分类器;判别分类阶段则是根据 ing)。亚采样操作之后,输入特征图的宽度和高 训练得到的分类器,对一个未知的样本进行预测 度均缩小为原来的1/m,特征图的个数和上一层一 分类。朴素贝叶斯分类器的数学模型可表示为: 致。亚采样层特征图的计算表达式如式(2)所示。 假设x(,2,…,x)为一个待分类的样本,类别集合 =f(B,down()+b) (2) 表示为C=y2,…,ym,要对样本x判别分类,则 式中:down()表示亚采样函数;B表示乘性偏置; 需分别计算PGy,x,Px,…,P0yx),那么x的预测 b表示加性偏置。 类别计算表达式如式(8)所示。 1.2PCA算法 P(yax)=max(P(yix),P(y2x),...P(ymx)(8) PCA即主成分分析法,是一种基于统计思 y即为贝叶斯分类器判别的未知样本x的类别。 想的降维方法。它通过正交变换,将与其分量相 计算上述条件概率的步骤: 关的原随机向量转化为与其分量不相关的新随机 1)构造已知类别的训练样本集合; 向量,达到降维的目的。 2)统计训练集中各个特征属性在每个类别中 设p维的随机向量x=[x2…x,J严,N个训练样 的条件概率估计,即计算式(9)所示概率: 本x,=[xx2…xpJT,i=1,2…,N,N>p,则训练样本 Pxby),Pxby)…P(xnby) (9) 的均值可由式(3)计算出来。 3)假定各个特征属性是独立的,根据贝叶斯
器相结合的人脸识别算法,利用卷积神经网络提 取人脸特征,利用主成分分析法(PCA)对提取的 特征进行降维,采用贝叶斯分类器进行判别分 类,最后在 ORL 人脸数据集上进行实验分析,验 证该方法提取特征辨识度高和低耗时的优点。 1 相关工作 1.1 卷积神经网络 卷积神经网络[6-7]作为一种高效的深度学习识 别算法,近些年引起了广泛关注,其在语音识别、 语音分析和图像处理等领域都获得了巨大成功。 在图像处理领域,卷积神经网络可直接将多维的 图像数据输入网络,有效避免了复杂的特征提取 和预处理过程。 1.1.1 卷积层 卷积层[8]一般为特征提取层,由多个二维的 特征图组成,每个特征图由许多共享权值的神经 元组成。特征图中每个神经元通过卷积核与上一 层特征图的局部区域相连接。卷积层特征图的计 算表达式如式 (1) 所示。 x l j = f( ∑ i∈Mj x l−1 i k l i j +b l j ) (1) l j l j f k Mj b 式中: 表示层数; 表示 层的第 个特征图; 代表 激活函数; 表示卷积核; 表示输入特征图的一 个选择; 表示对应的偏置。 1.1.2 亚采样层 1/n 亚采样层利用图像的局部相关原理,对卷积 层输入的特征图在相邻小区域内进行聚合统计, 在减少数据量的同时,保留有用信息。常用的亚 采样操作有均值池化 (average pooling)、最大值池 化 (max pooling) 和随机池化 (stochastic pooling)。亚采样操作之后,输入特征图的宽度和高 度均缩小为原来的 ,特征图的个数和上一层一 致。亚采样层特征图的计算表达式如式 (2) 所示。 x l j = f(β l jdown(x l−1 j )+b l j ) (2) down(·) β b 式中: 表示亚采样函数; 表示乘性偏置; 表示加性偏置。 1.2 PCA 算法 PCA 即主成分分析法[9] ,是一种基于统计思 想的降维方法。它通过正交变换,将与其分量相 关的原随机向量转化为与其分量不相关的新随机 向量,达到降维的目的。 p x = [x1 x2 ··· xp] T N xi = [xi1 xi2 ··· xip] T ,i = 1,2··· ,N N > p u 设 维的随机向量 , 个训练样 本 , ,则训练样本 的均值 可由式 (3) 计算出来。 u = 1 N ∑N i=1 xi (3) 把训练样本每一个图像均值化之后得到样本 矩阵 Z,Z 的计算表达式如式 (4) 所示。 Z = [x1 −u x2 −u··· xn −u] (4) 此时,可得到训练样本的协方差矩阵 C,C 的 表达式如式 (5) 所示。 C = Z · Z T N (5) 协方差矩阵的维数为 p× p。 C α k α 主成分分析法所要寻找的最优投影子空间由 协方差矩阵 的非零特征值对应的特征向量组 成。在利用 PCA 降维过程中,一般通过特征值的 累积贡献率 来确定主成分维数 , 可由式 (6) 计算。 α = ∑k i=1 λi ∑p i=1 λi (6) U = [u1 u2 ···uk] U Q Q 假设求得的特征空间矩阵为 , 那么将训练样本向 上投影,可以得到投影矩阵 , 的计算表达式如式 (7) 所示。 Q = U T Z (7) Q 即为降维之后的数据。 1.3 朴素贝叶斯分类器 x(x1, x2,··· , xn) C = {y1, y2,··· , ym} x P(y1|x),P(y2|x),··· ,P(yn|x) x 朴素贝叶斯[10]分类器是一个简单、高效的分 类器。它主要是根据先验概率预测样本属于某一 类别的概率,选取概率最大的类别作为预测类 别。整个朴素贝叶斯算法的过程分为两个阶段: 分类器训练阶段、判别分类阶段。分类器训练阶 段的目的是生成分类器;判别分类阶段则是根据 训练得到的分类器,对一个未知的样本进行预测 分类。朴素贝叶斯分类器的数学模型可表示为: 假设 为一个待分类的样本,类别集合 表示为 ,要对样本 判别分类,则 需分别计算 ,那么 的预测 类别计算表达式如式 (8) 所示。 P(yk |x) = max{P(y1|x),P(y2|x),··· ,P(ym|x)} (8) yk即为贝叶斯分类器判别的未知样本x的类别。 计算上述条件概率的步骤: 1) 构造已知类别的训练样本集合; 2) 统计训练集中各个特征属性在每个类别中 的条件概率估计,即计算式 (9) 所示概率: P(x1|y1),P(x2|y1),···P(xn|y1) (9) 3) 假定各个特征属性是独立的,根据贝叶斯 ·770· 智 能 系 统 学 报 第 13 卷
第5期 冯小荣,等:基于卷积特征和贝叶斯分类器的人脸识别 ·771· 定理,可得条件概率计算表达式,即 类器即可得到该样本的预测类别。 P(x)=P(xly:)P(y )/P(x) (10) 2.2数据预处理 4)P(x)对所有类别都是一样的,因此只要将 本文采用ORL人脸数据集作为实验数据集。 分子最大化即可,简化后的条件概率表达式为 在训练算法模型之前,对数据集中的人脸图像进 P(xy)PO)=POy) P(xilya) (11) 行预处理,步骤如下: l)调整图像尺寸。通过imresize函数对训练 集和测试集中每一幅图像进行缩放处理,由原始 2算法详细设计 的112×92变为28×28。 2.1算法框架 2)归一化图像。ORL数据集中的图像为灰 基于卷积特征和贝叶斯分类器的人脸识别方 度图像,其颜色灰度值一般在0~255,将缩放后图 法的主要思想是通过训练好的卷积神经网络模型 像的原始像素值除以255归一化到[0,1]。 提取人脸特征,利用PCA对提取的人脸特征进行 假设向量x表示原始图像、向量x表示归一化 降维,最后利用贝叶斯分类器进行判别分类。算 后的图像,则归一化操作如式(12)。 法框架如图1所示。 x=x/255 (12) 整个数据预处理的过程如图2所示。 输入图像 图像预处理 卷积神经网 特征提取 络模型 imresize 灰度值归 函数变换 一化 识别结果 贝叶斯分 PCA降维 类器 原始112×92 28×28 28×28 图1算法框架 图2数据预处理过程 Fig.1 Schematic diagram of algorithm frame Fig.2 Data preprocessing 从图1可知,算法主要分为两个阶段:学习阶 2.3卷积神经网络结构 段和测试阶段。学习阶段:利用训练图像样本集 根据前面的介绍可知,卷积神经网络一般是 合对卷积神经网络模型进行训练,然后用训练好 由输入层、卷积层、亚采样层、全连接层和输出层 的网络模型提取训练集所有样本图像的特征,通 组成。对于卷积神经网络的结构设计,目前都是 过PCA降维处理之后,用降维后的特征集训练贝 以经验为基础,缺乏科学的理论指导。依据ORL 叶斯分类器。测试阶段:对待识别的图像预处理 数据集中人脸图像的尺寸及类别,本文经过大量 之后,通过卷积神经网络提取人脸特征,利用 实验之后设计了一个合适的卷积神经网络结构用 PCA降维,最后将降维之后的特征送入贝叶斯分 于提取ORL人脸特征,网络层次结构如图3所示。 8×8 4×4 24×24 12×12 8×8 4×4 28×28 160 40 8×8 4×4 24×24 12×12 8×8 44 输入 C C SF输出 图3卷积神经网络层次结构 Fig.3 Hierarchical structure of convolution neural network
定理,可得条件概率计算表达式,即 P(yi |x) = P(x|yi)P(yi)/P(x) (10) 4) P(x) 对所有类别都是一样的,因此只要将 分子最大化即可,简化后的条件概率表达式为 P(x|yi)P(yi) = P(yi) ∏n j=1 P(xj |yi) (11) 2 算法详细设计 2.1 算法框架 基于卷积特征和贝叶斯分类器的人脸识别方 法的主要思想是通过训练好的卷积神经网络模型 提取人脸特征,利用 PCA 对提取的人脸特征进行 降维,最后利用贝叶斯分类器进行判别分类。算 法框架如图 1 所示。 卷积神经网 络模型 输入图像 图像预处理 贝叶斯分 类器 特征提取 识别结果 PCA 降维 图 1 算法框架 Fig. 1 Schematic diagram of algorithm frame 从图 1 可知,算法主要分为两个阶段:学习阶 段和测试阶段。学习阶段:利用训练图像样本集 合对卷积神经网络模型进行训练,然后用训练好 的网络模型提取训练集所有样本图像的特征,通 过 PCA 降维处理之后,用降维后的特征集训练贝 叶斯分类器。测试阶段:对待识别的图像预处理 之后,通过卷积神经网络提取人脸特征,利用 PCA 降维,最后将降维之后的特征送入贝叶斯分 类器即可得到该样本的预测类别。 2.2 数据预处理 本文采用 ORL 人脸数据集作为实验数据集。 在训练算法模型之前,对数据集中的人脸图像进 行预处理,步骤如下: 1) 调整图像尺寸。通过 imresize 函数对训练 集和测试集中每一幅图像进行缩放处理,由原始 的 112×92 变为 28×28。 2) 归一化图像。ORL 数据集中的图像为灰 度图像,其颜色灰度值一般在 0~255,将缩放后图 像的原始像素值除以 255 归一化到[0, 1]。 x x 假设向量 表示原始图像、向量 ′表示归一化 后的图像,则归一化操作如式 (12)。 x ′ = x/255 (12) 整个数据预处理的过程如图 2 所示。 原始 112×92 28×28 imresize 函数变换 灰度值归 一化 28×28 图 2 数据预处理过程 Fig. 2 Data preprocessing 2.3 卷积神经网络结构 根据前面的介绍可知,卷积神经网络一般是 由输入层、卷积层、亚采样层、全连接层和输出层 组成。对于卷积神经网络的结构设计,目前都是 以经验为基础,缺乏科学的理论指导。依据 ORL 数据集中人脸图像的尺寸及类别,本文经过大量 实验之后设计了一个合适的卷积神经网络结构用 于提取 ORL 人脸特征,网络层次结构如图 3 所示。 28×28 24×24 12×12 8×8 24×24 12×12 8×8 8×8 4×4 8×8 4×4 4×4 4×4 160 40 输入 C1 S2 C3 S4 F5 输出 图 3 卷积神经网络层次结构 Fig. 3 Hierarchical structure of convolution neural network 第 5 期 冯小荣,等:基于卷积特征和贝叶斯分类器的人脸识别 ·771·
·772· 智能系统学报 第13卷 从图3可知,网络的主要参数设置如下: 5=n+1-m (13) 1)输入层为28×28的灰度图像; ORL人脸图像经2.2节预处理后大小变为 2)卷积层C,通过6个5×5的卷积核对输入 28×28,为确保卷积后的特征图大小为整数,将 层的灰度图像进行卷积操作,得到6个24×24的 C和C层卷积核大小设置为5×5。 特征图: 3.1.2C层卷积核个数选择 3)亚采样层S2在2×2的区域内对C,层的特 卷积神经网络识别准确率与卷积核的个数密 征图执行均值亚采样,得到6个12×12的特征图; 切相关。卷积核个数越多,提取的图像特征越丰 4)卷积层C,通过10个5×5的卷积核对S,层 富,但同时会增加网络训练时间。为选取C;层合 的特征图进行卷积操作,得到10个8×8的特征图; 适的卷积核个数,保持C1层卷积核个数不变,训 5)亚采样层S,在2×2的区域内对C,层的特 练迭代次数为60次,改变C层卷积核的个数,分 征图执行均值亚采样,得到10个4×4的特征图。 别使用训练集和测试集对变化后网络结构的识别 此时将S,层的所有特征图连接为一个160维的特 准确率进行验证。实验结果如图5所示。 征向量; 100 6)学习率为1.7,批处理块大小为2,网络阈 值函数为sigmoid, 90 80 3实验结果 70 为了验证本文所提算法的有效性,在ORL数 60 据集中进行了人脸识别实验。 ·-测试集 50 ·训练集 ORL人脸数据集I中部分人脸图像如图4 40 6 8 10 1214 16 所示。 C,层卷积核数目/个 图5C,层卷积核个数与识别率关系 Fig.5 Relationship between the number of C3 layer convo- lution kernel and recognition accuracy 图5的实验结果表明,卷积核个数与网络识 别正确率并非正比关系。当C:层卷积核个数为 10时,测试集的识别准确率达到最高。若继续增 加卷积核个数,网络中对应的权重W个数也随之 增多,但由于OL数据集样本的个数较少,可选 图4ORL数据集中部分人脸图像 取的训练集样本有限,已无法满足网络学习的需 Fig.4 Partial face images of ORL dataset 要,因此测试集的识别准确率开始下降。 ORL数据集中包含40个不同人物的脸部图 3.1.3C1层卷积核个数选择 像,每个人物包含10张图像,总共400张图像,每 由3.1.2节实验结果可知,C层有10个卷积 个图像原始大小均为112像素×92像素。每个类 核时,测试集的识别准确率均达到最高。为选取 别中的脸部图像在不同的时间拍摄得到,主要存 C层合适的卷积核个数,保持C,层卷积核个数不 在光线、面部表情和面部细节上的一些差异。本 变,训练迭代次数为60次,改变C,层卷积核的个 文随机选取每一个类别图像中的8张作为训练样 数,分别使用训练集和测试集对变化后的网络结 本,剩下的2张图像作为测试样本,训练集与测试 构进行实验验证。实验结果如图6所示。 集的比例为4:1。 图6的实验结果同样表明,卷积核个数与网 3.1网络结构设计 络最终识别正确率并非正比关系。当C,层卷积 3.11卷积核尺寸选择 核个数为6时,测试集的识别准确率达到最高。 卷积核的尺寸决定了卷积层输出特征图的大 若继续增加卷积核,网络需要学习的参数也增 小。假设卷积层输入图像的大小为n×n,卷积核 多,但由于ORL数据集样本的个数较少,选取的 的大小为m×m,卷积之后特征图的大小为s×s, 训练集样本有限,已无法满足网络学习的需要, 则s可通过式(13)算出。 因此测试集的识别准确率开始下降
从图 3 可知,网络的主要参数设置如下: 1) 输入层为 28×28 的灰度图像; 2) 卷积层 C1 通过 6 个 5×5 的卷积核对输入 层的灰度图像进行卷积操作,得到 6 个 24×24 的 特征图; 3) 亚采样层 S2 在 2×2 的区域内对 C1 层的特 征图执行均值亚采样,得到 6 个 12×12 的特征图; 4) 卷积层 C3 通过 10 个 5×5 的卷积核对 S2 层 的特征图进行卷积操作,得到 10 个 8×8 的特征图; 5) 亚采样层 S4 在 2×2 的区域内对 C3 层的特 征图执行均值亚采样,得到 10 个 4×4 的特征图。 此时将 S4 层的所有特征图连接为一个 160 维的特 征向量; 6) 学习率为 1.7,批处理块大小为 2,网络阈 值函数为 sigmoid。 3 实验结果 为了验证本文所提算法的有效性,在 ORL 数 据集中进行了人脸识别实验。 ORL 人脸数据集[11]中部分人脸图像如图 4 所示。 图 4 ORL 数据集中部分人脸图像 Fig. 4 Partial face images of ORL dataset ORL 数据集中包含 40 个不同人物的脸部图 像,每个人物包含 10 张图像,总共 400 张图像,每 个图像原始大小均为 112 像素×92 像素。每个类 别中的脸部图像在不同的时间拍摄得到,主要存 在光线、面部表情和面部细节上的一些差异。本 文随机选取每一个类别图像中的 8 张作为训练样 本,剩下的 2 张图像作为测试样本,训练集与测试 集的比例为 4∶1。 3.1 网络结构设计 3.1.1 卷积核尺寸选择 n× n m× m s× s 卷积核的尺寸决定了卷积层输出特征图的大 小。假设卷积层输入图像的大小为 ,卷积核 的大小为 ,卷积之后特征图的大小为 , 则 s 可通过式 (13) 算出。 s = n+1− m (13) ORL 人脸图像经 2.2 节预处理后大小变为 28×28,为确保卷积后的特征图大小为整数,将 C1 和 C3 层卷积核大小设置为 5×5。 3.1.2 C3 层卷积核个数选择 卷积神经网络识别准确率与卷积核的个数密 切相关。卷积核个数越多,提取的图像特征越丰 富,但同时会增加网络训练时间。为选取 C3 层合 适的卷积核个数,保持 C1 层卷积核个数不变,训 练迭代次数为 60 次,改变 C3 层卷积核的个数,分 别使用训练集和测试集对变化后网络结构的识别 准确率进行验证。实验结果如图 5 所示。 40 50 60 70 80 90 100 6 8 10 12 14 16 识别率/% C3 层卷积核数目/个 测试集 训练集 图 5 C3 层卷积核个数与识别率关系 Fig. 5 Relationship between the number of C3 layer convolution kernel and recognition accuracy 图 5 的实验结果表明,卷积核个数与网络识 别正确率并非正比关系。当 C3 层卷积核个数为 10 时,测试集的识别准确率达到最高。若继续增 加卷积核个数,网络中对应的权重 W 个数也随之 增多,但由于 ORL 数据集样本的个数较少,可选 取的训练集样本有限,已无法满足网络学习的需 要,因此测试集的识别准确率开始下降。 3.1.3 C1 层卷积核个数选择 由 3.1.2 节实验结果可知,C3 层有 10 个卷积 核时,测试集的识别准确率均达到最高。为选取 C1 层合适的卷积核个数,保持 C3 层卷积核个数不 变,训练迭代次数为 60 次,改变 C1 层卷积核的个 数,分别使用训练集和测试集对变化后的网络结 构进行实验验证。实验结果如图 6 所示。 图 6 的实验结果同样表明,卷积核个数与网 络最终识别正确率并非正比关系。当 C1 层卷积 核个数为 6 时,测试集的识别准确率达到最高。 若继续增加卷积核,网络需要学习的参数也增 多,但由于 ORL 数据集样本的个数较少,选取的 训练集样本有限,已无法满足网络学习的需要, 因此测试集的识别准确率开始下降。 ·772· 智 能 系 统 学 报 第 13 卷
第5期 冯小荣,等:基于卷积特征和贝叶斯分类器的人脸识别 ·773· 100 征提取。为更加直观地展示卷积神经网络不同层 提取到的具体人脸特征,本文对卷积神经网络每 95 一层的人脸特征图进行可视化,实验结果如图8所示。 日 的 图 图 ●● 四 80 。-测试集 训练集 ◆ 0 75 4 6 8 10 12 ■ C,层卷积核数目个 牙 图6C层卷积核个数与识别率关系 Fig.6 Relationship between the number of C layer convo- 图8人脸图像卷积特征 lution kernel and recognition accuracy Fig.8 Convolution feature of face image 3.1.4学习率 图8分别展示了本文所设计的卷积神经网络 学习率不仅决定卷积神经网铬学习过程中训 结构从输入层到全连接层每一层提取到的人脸特 练误差的收敛速度,而且影响网络的识别正确 征图。第一层将缩放和归一化后的28×28大小的 率。学习率越大,权值变化越快,训练误差收敛 图像直接作为网络的输入,经过C,层卷积操作后 越快。学习率越低,权值变化越慢,收敛越慢,网 得到6个24×24的特征图,第三层的池化层S2在 络训练时间就会增加。但学习率过大或过小,均 2×2的小区域内进行均值亚采样操作后,得到 可能导致训练误差无法收敛。为研究学习率与网 6个12×12的特征图,第四层C3为卷积层,第五 络识别正确率的关系,网络结构参数设置为: 层S,为卷积池化层,分别采用C和S2相同的处 C,层6个卷积核,C层10个卷积核,统计不同学 理方式,经过C、S层的卷积与亚采样处理后,可 习率下的训练集和测试集的识别正确率,实验结 得到10个4×4的特征图,网络最后一层为全连接 果如图7所示。 层,全连接层将最后一层的10个特征图连成一维 100 的特征向量,该特征向量即为提取到的人脸特 99 征,通过PCA降维之后送入贝叶斯分类器即可完 -测试集 98 女训练集 成判别分类。 97 3.3卷积神经网络 由于卷积神经网络结构本身也具备分类器的 、96 功能。为检验单独用卷积神经网络的识别效果, 95 本文利用卷积神经网络对ORL数据集中的人脸 进行识别。卷积神经网络训练过程代价函数误差 93 曲线变化如图9所示。 922141516171.819 学习率 6 图7学习率与识别率关系曲线 Fig.7 Relationship curve between learning rate and recog- nition rate 从图7可以看出,随着学习率的增大,训练集 和测试集的识别率也相应提高。当学习率为 17时,训练集和测试集的识别率最高。此后继续 增大学习率,识别率反而下降。因此,本文将学 习率设定为1.7。 12346789i010 训练迭代次数 3.2卷积激活特征 图9卷积神经网络训练误差曲线 通过训练好的卷积神经网络结构即可完成特 Fig.9 Training error curve of convolution neural network
75 80 85 90 95 100 2 4 6 8 10 12 识别率/% C1 层卷积核数目/个 测试集 训练集 图 6 C1 层卷积核个数与识别率关系 Fig. 6 Relationship between the number of C1 layer convolution kernel and recognition accuracy 3.1.4 学习率 学习率不仅决定卷积神经网络学习过程中训 练误差的收敛速度,而且影响网络的识别正确 率。学习率越大,权值变化越快,训练误差收敛 越快。学习率越低,权值变化越慢,收敛越慢,网 络训练时间就会增加。但学习率过大或过小,均 可能导致训练误差无法收敛。为研究学习率与网 络识别正确率的关系,网络结构参数设置为: C1 层 6 个卷积核,C3 层 10 个卷积核,统计不同学 习率下的训练集和测试集的识别正确率,实验结 果如图 7 所示。 92 93 94 95 96 97 98 99 100 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 识别率/% 学习率 测试集 训练集 图 7 学习率与识别率关系曲线 Fig. 7 Relationship curve between learning rate and recognition rate 从图 7 可以看出,随着学习率的增大,训练集 和测试集的识别率也相应提高。当学习率为 1.7 时,训练集和测试集的识别率最高。此后继续 增大学习率,识别率反而下降。因此,本文将学 习率设定为 1.7。 3.2 卷积激活特征 通过训练好的卷积神经网络结构即可完成特 征提取。为更加直观地展示卷积神经网络不同层 提取到的具体人脸特征,本文对卷积神经网络每 一层的人脸特征图进行可视化,实验结果如图8所示。 图 8 人脸图像卷积特征 Fig. 8 Convolution feature of face image 图 8 分别展示了本文所设计的卷积神经网络 结构从输入层到全连接层每一层提取到的人脸特 征图。第一层将缩放和归一化后的 28×28 大小的 图像直接作为网络的输入,经过 C1 层卷积操作后 得到 6 个 24×24 的特征图,第三层的池化层 S2 在 2×2 的小区域内进行均值亚采样操作后,得到 6 个 12×12 的特征图,第四层 C3 为卷积层,第五 层 S4 为卷积池化层,分别采用 C1 和 S2 相同的处 理方式,经过 C3、S4 层的卷积与亚采样处理后,可 得到 10 个 4×4 的特征图,网络最后一层为全连接 层,全连接层将最后一层的 10 个特征图连成一维 的特征向量,该特征向量即为提取到的人脸特 征,通过 PCA 降维之后送入贝叶斯分类器即可完 成判别分类。 3.3 卷积神经网络 由于卷积神经网络结构本身也具备分类器的 功能。为检验单独用卷积神经网络的识别效果, 本文利用卷积神经网络对 ORL 数据集中的人脸 进行识别。卷积神经网络训练过程代价函数误差 曲线变化如图 9 所示。 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 ×103 训练迭代次数 训练误差 图 9 卷积神经网络训练误差曲线 Fig. 9 Training error curve of convolution neural network 第 5 期 冯小荣,等:基于卷积特征和贝叶斯分类器的人脸识别 ·773·
·774· 智能系统学报 第13卷 从图9可以看出,在训练过程中,卷积神经网 所提算法的有效性和优越性,将此方法与几种传 络的输出误差一直在减小,最终不再变化,此时 统的人脸识别算法在ORL数据集全部样本的识 卷积神经网络已达到收敛状态。用训练好的网络 别效果进行对比,结果如表1所示。 模型对OL数据集80张测试样本的识别准确率 表1对比实验结果 为96.25%,对全部样本的识别准确率为98.75%, Table 1 Comparison of experimental results 达到了预期的目标。 算法 正确率/% 3.4PCA降维 Eigenfacel12 97.50 通过卷积神经网络提取到的人脸特征为 160维,维数较高,为降低人脸特征维数,本文采 Fisherface2 98.50 用PCA对160维的特征进行降维处理,为研究主 ICA2☒ 93.75 成分特征值累计贡献率对识别性能的影响,本文 2DPCAI13 98.30 分别研究了不同累积贡献率下基于卷积特征和贝 CNNII4 98.75 叶斯分类器人脸识别方法的识别效果,特征值累 本文方法 99.00 积贡献率与识别率的关系曲线如图10所示。 表1的实验结果可以表明:本文提出的基于 99 卷积特征和贝叶斯分类器的人脸识别算法,在 ORL人脸库的识别效果好于传统的人脸识别算 法;本文方法相对2DPCA的识别准确率提高了 897 0.7%,比FisherFace方法识别准确率提高了0.5%, 96 比Eigenface的识别准确率提高了1.5%,比 ICA识别方法的识别准确率提高了5.25%,比单 95 独卷积神经网络的识别准确率高0.25%。这一系 列实验结果表明,卷积神经网络提取的人脸特征 94 5 80 859095 100 具有较高的辨识度,与PCA和贝叶斯分类器结合 特征值累计贡献率/% 可进一步提高人脸识别正确率。 图10特征值累积贡献率与识别准确率的关系 3.6结果分析 Fig.10 Relationship between eigenvalue cumulative con- tribution rate and recognition accuracy rate 为了克服传统人脸识别算法特征提取带来的 令α表示特征值累积贡献率,从图10可知,当 长时间消耗、低识别度的问题,本文提出一种卷 a的取值从100%减少到95%过程中,识别准确率 积神经网络、PCA和贝叶斯分类器相结合的方 逐渐增加,当α=95%时,识别准确率最高,当a取 法,用卷积神经网络提取人脸特征,用PCA对提 值继续减小时,识别准确率逐渐开始下降。这主 取的特征降维压缩,通过朴素贝叶斯判别分类, 要是因为,当α的取值从100%减少到95%过程 在ORL人脸数据集中获得了良好的识别效果。 中,卷积特征经PCA变换时,冗余信息被去除的 该方法在选取的80张测试图像中获得了97.5% 越来越多,当α取值为95%时,冗余信息几乎被全 的高识别率,在全部人脸图像的识别正确率可达 部剔除,获得的识别准确率也最高;当α继续减少 到99.00%,且识别效果好于几种经典的人脸识别 时,卷积特征中的部分有用信息也被别除,导致 算法以及单独的卷积神经网络算法。因此卷积神 识别效果越来越差。因此,在利用PCA进行降维 经网络提取到的人脸特征具有更强的辨识度,在 压缩时,主成分的维数选择至关重要。在本文人 判别分类的过程中表现出了强大的优势。 脸识别实验中,选取α=95%时的主成分维数,那 4结束语 么经PCA变换之后,原来160维的卷积特征就变 为41维的特征,降维效果比较显著。 当前人脸识别仍是学术界和工业界研究的热 3.5对比实验 点问题。为降低人脸特征提取的复杂性,本文将 本文提出的方法在ORL人脸数据集中获得 当下最为流行的深度学习模型卷积神经网络引入 了良好的识别效果,该方法在选取的80张测试图 人脸识别任务,提出基于卷积神经网络和贝叶斯 像中获得了97.5%的高识别率,在全部人脸图像 分类器以及主成分分析法的人脸识别算法模型, 的识别正确率可达99.00%。为进一步验证本文 首先利用卷积神经网络提取人脸特征,其次通过
从图 9 可以看出,在训练过程中,卷积神经网 络的输出误差一直在减小,最终不再变化,此时 卷积神经网络已达到收敛状态。用训练好的网络 模型对 ORL 数据集 80 张测试样本的识别准确率 为 96.25%,对全部样本的识别准确率为 98.75%, 达到了预期的目标。 3.4 PCA 降维 通过卷积神经网络提取到的人脸特征 为 160 维,维数较高,为降低人脸特征维数,本文采 用 PCA 对 160 维的特征进行降维处理,为研究主 成分特征值累计贡献率对识别性能的影响,本文 分别研究了不同累积贡献率下基于卷积特征和贝 叶斯分类器人脸识别方法的识别效果,特征值累 积贡献率与识别率的关系曲线如图 10 所示。 99 98 97 96 95 94 75 80 85 90 95 100 特征值累计贡献率/% 识别率/% 图 10 特征值累积贡献率与识别准确率的关系 Fig. 10 Relationship between eigenvalue cumulative contribution rate and recognition accuracy rate α α α = α α α α α = 令 表示特征值累积贡献率,从图 10 可知,当 的取值从 100% 减少到 95% 过程中,识别准确率 逐渐增加,当 95% 时,识别准确率最高,当 取 值继续减小时,识别准确率逐渐开始下降。这主 要是因为,当 的取值从 100% 减少到 95% 过程 中,卷积特征经 PCA 变换时,冗余信息被去除的 越来越多,当 取值为 95% 时,冗余信息几乎被全 部剔除,获得的识别准确率也最高;当 继续减少 时,卷积特征中的部分有用信息也被剔除,导致 识别效果越来越差。因此,在利用 PCA 进行降维 压缩时,主成分的维数选择至关重要。在本文人 脸识别实验中,选取 95% 时的主成分维数,那 么经 PCA 变换之后,原来 160 维的卷积特征就变 为 41 维的特征,降维效果比较显著。 3.5 对比实验 本文提出的方法在 ORL 人脸数据集中获得 了良好的识别效果,该方法在选取的 80 张测试图 像中获得了 97.5% 的高识别率,在全部人脸图像 的识别正确率可达 99.00%。为进一步验证本文 所提算法的有效性和优越性,将此方法与几种传 统的人脸识别算法在 ORL 数据集全部样本的识 别效果进行对比,结果如表 1 所示。 表 1 对比实验结果 Table 1 Comparison of experimental results 算法 正确率/% Eigenface[12] 97.50 Fisherface[12] 98.50 ICA[12] 93.75 2DPCA[13] 98.30 CNN[14] 98.75 本文方法 99.00 表 1 的实验结果可以表明:本文提出的基于 卷积特征和贝叶斯分类器的人脸识别算法,在 ORL 人脸库的识别效果好于传统的人脸识别算 法;本文方法相对 2DPCA 的识别准确率提高了 0.7%,比 FisherFace 方法识别准确率提高了 0.5%, 比 Eigenfac e 的识别准确率提高 了 1.5%, 比 ICA 识别方法的识别准确率提高了 5.25%,比单 独卷积神经网络的识别准确率高 0.25%。这一系 列实验结果表明,卷积神经网络提取的人脸特征 具有较高的辨识度,与 PCA 和贝叶斯分类器结合 可进一步提高人脸识别正确率。 3.6 结果分析 为了克服传统人脸识别算法特征提取带来的 长时间消耗、低识别度的问题,本文提出一种卷 积神经网络、PCA 和贝叶斯分类器相结合的方 法,用卷积神经网络提取人脸特征,用 PCA 对提 取的特征降维压缩,通过朴素贝叶斯判别分类, 在 ORL 人脸数据集中获得了良好的识别效果。 该方法在选取的 80 张测试图像中获得了 97.5% 的高识别率,在全部人脸图像的识别正确率可达 到 99.00%,且识别效果好于几种经典的人脸识别 算法以及单独的卷积神经网络算法。因此卷积神 经网络提取到的人脸特征具有更强的辨识度,在 判别分类的过程中表现出了强大的优势。 4 结束语 当前人脸识别仍是学术界和工业界研究的热 点问题。为降低人脸特征提取的复杂性,本文将 当下最为流行的深度学习模型卷积神经网络引入 人脸识别任务,提出基于卷积神经网络和贝叶斯 分类器以及主成分分析法的人脸识别算法模型, 首先利用卷积神经网络提取人脸特征,其次通过 ·774· 智 能 系 统 学 报 第 13 卷
第5期 冯小荣,等:基于卷积特征和贝叶斯分类器的人脸识别 ·775· PCA对人脸特征进行降维处理,最后通过朴素贝 LIN Jianghao,YANG Aimin,ZHOU Yongmei,et al. 叶斯进行判别分类。通过实验与分析可以看出, Classification of microblog sentiment based on Naive 本文所提的算法不仅简化了特征提取的过程,而 Bayesian[J].Computer engineering and science,2012, 且提高了人脸识别的准确率,为人脸识别算法的 34(9y:160-165. 研究提供一种新思路。 [11]许可.卷积神经网络在图像识别上的应用的研究D].杭 州:浙江大学,2012. 参考文献: XU Ke.Study of convolutional neural network applied on [1]何春.人脸识别技术综述J1.智能计算机与应用,2016, image recognition[D].Hangzhou:Zhejiang University, 6(5):112-114 2012. HE Chun.Survey of face recognition technology[J].Intelli- [12]陈耀丹,王连明.基于卷积神经网络的人脸识别方法 gent computers and applications,2016,6(5):112-114. 东北师大学报:自然科学版,2016.48(2:70-76 [2]项聪,陶永鹏.基于改进的LBP人脸识别算法的研究) CHEN Yaodan,WANG Lianming.Convolutional neural 微型机与应用,2016,3523:18-20,27 network for face recognition[J].Journal of Northeast Nor- XU Cong,TAO Yongpeng.Research of face recognition mal University:Natural Science Edition,2016,48(2): algorithm based on improved LBP[J].Microcomputer its 70-76. applications,.2016,35(23):18-20,27. [13]BEN Xianye,MENG Weixiao,WANG Kejun,et al.An [3]李春利,沈鲁娟.基于改进LBP算子的纹理图像分类方 adaptive neural networks formulation for the two-dimen- 法[.计算机工程与设计,2016,371)少232-236. sional principal component analysis[J].Neural computing LI Chunli,SHEN Lujuan.Texture image classification and applications,2016,27(5):1245-1261. method based on improved LBP operator[J].Computer en- [14]柳振东.卷积神经网络在图像分类中的研究与应用D] gineering and design,2016,37(1):232-236. 天津:中国民航大学,2017。 [4]SURHONE L M,TENNOE MT,HENSSONOW S F,et LIU Zhendong.Research and application of convolution al.Histogram of oriented gradients[].Betascript publish- neural network in image classification[D].Tianjin:Civil ing,2016,12(4):1368-1371. Aviation University of China,2017. [5]ZHANG Chunjie,LIU Jing,LIANG Chao,et al.Image classification using Harr-like transformation of local fea- 作者简介: tures with coding residuals[J].Signal processing,2013, 冯小荣,男,1980年生,实验师 93(8):2111-2118 硕士研究生,主要研究方向为智能算 法、图像处理。参与国家自然科学基 [6]KRIZHEVSKY A,SUTSKEVER I,HINTON G.Im- 金项目多项。发表学术论文10余篇, ageNet classification with deep convolutional neural net- 其中被SCI、EI检索3篇。 works[C]//Proceedings of the 25th International Confer- ence on Neural Information Processing Systems.Lake Tahoe,Nevada,2012:1097-1105. [7]YU K.SALZMANN M.Second-order convolutional neur- 惠康华,男,1982年生,讲师,博 al networks[].Clinical immunology&immunopathology, 土,主要研究方向为模式识别、计算机 视觉、图像处理。参与国家自然科学 2017.66(3):230-238. 基金项目多项。发表学术论文12篇, [8]LECUN Y,BENGIO Y,HINTON G.Deep learning[J]. 被SCI、EI检索6篇。 Nature,2015,521(7553):436-444. [9]张丹丹,李雷.基于PCANet-RF的人脸检测系统[U.计 算机技术与发展,2016,26(2):31-34. 柳振东,男,1992年生,硕士研究 ZHANG Dandan,LI Lei.Face detection system based on 生,主要研究方向为模式识别、深度学 PCANet-RF[J].Computer technology and development, 习、图像处理。发表学术论文2篇。 2016,26(2):31-34 [10们林江豪,阳爱民,周咏梅,等.一种基于朴素贝叶斯的微 博情感分类[J】.计算机工程与科学,2012,34(9): 160-165
PCA 对人脸特征进行降维处理,最后通过朴素贝 叶斯进行判别分类。通过实验与分析可以看出, 本文所提的算法不仅简化了特征提取的过程,而 且提高了人脸识别的准确率,为人脸识别算法的 研究提供一种新思路。 参考文献: 何春. 人脸识别技术综述[J]. 智能计算机与应用, 2016, 6(5): 112–114. HE Chun. Survey of face recognition technology[J]. Intelligent computers and applications, 2016, 6(5): 112–114. [1] 顼聪, 陶永鹏. 基于改进的 LBP 人脸识别算法的研究[J]. 微型机与应用, 2016, 35(23): 18–20, 27. XU Cong, TAO Yongpeng. Research of face recognition algorithm based on improved LBP[J]. Microcomputer & its applications, 2016, 35(23): 18–20, 27. [2] 李春利, 沈鲁娟. 基于改进 LBP 算子的纹理图像分类方 法[J]. 计算机工程与设计, 2016, 37(1): 232–236. LI Chunli, SHEN Lujuan. Texture image classification method based on improved LBP operator[J]. Computer engineering and design, 2016, 37(1): 232–236. [3] SURHONE L M, TENNOE M T, HENSSONOW S F, et al. Histogram of oriented gradients[J]. Betascript publishing, 2016, 12(4): 1368–1371. [4] ZHANG Chunjie, LIU Jing, LIANG Chao, et al. Image classification using Harr-like transformation of local features with coding residuals[J]. Signal processing, 2013, 93(8): 2111–2118. [5] KRIZHEVSKY A, SUTSKEVER I, HINTON G. ImageNet classification with deep convolutional neural networks[C]//Proceedings of the 25th International Conference on Neural Information Processing Systems. Lake Tahoe, Nevada, 2012: 1097–1105. [6] YU K, SALZMANN M. Second-order convolutional neural networks[J]. Clinical immunology & immunopathology, 2017, 66(3): 230–238. [7] LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553): 436–444. [8] 张丹丹, 李雷. 基于 PCANet-RF 的人脸检测系统[J]. 计 算机技术与发展, 2016, 26(2): 31–34. ZHANG Dandan, LI Lei. Face detection system based on PCANet-RF[J]. Computer technology and development, 2016, 26(2): 31–34. [9] 林江豪, 阳爱民, 周咏梅, 等. 一种基于朴素贝叶斯的微 博情感分类[J]. 计算机工程与科学, 2012, 34(9): 160–165. [10] LIN Jianghao, YANG Aimin, ZHOU Yongmei, et al. Classification of microblog sentiment based on Naïve Bayesian[J]. Computer engineering and science, 2012, 34(9): 160–165. 许可. 卷积神经网络在图像识别上的应用的研究[D]. 杭 州: 浙江大学, 2012. XU Ke. Study of convolutional neural network applied on image recognition[D]. Hangzhou: Zhejiang University, 2012. [11] 陈耀丹, 王连明. 基于卷积神经网络的人脸识别方法[J]. 东北师大学报: 自然科学版, 2016, 48(2): 70–76. CHEN Yaodan, WANG Lianming. Convolutional neural network for face recognition[J]. Journal of Northeast Normal University: Natural Science Edition, 2016, 48(2): 70–76. [12] BEN Xianye, MENG Weixiao, WANG Kejun, et al. An adaptive neural networks formulation for the two-dimensional principal component analysis[J]. Neural computing and applications, 2016, 27(5): 1245–1261. [13] 柳振东. 卷积神经网络在图像分类中的研究与应用[D]. 天津: 中国民航大学, 2017. LIU Zhendong. Research and application of convolution neural network in image classification[D]. Tianjin: Civil Aviation University of China, 2017. [14] 作者简介: 冯小荣,男,1980 年生,实验师, 硕士研究生,主要研究方向为智能算 法、图像处理。参与国家自然科学基 金项目多项。发表学术论文 10 余篇, 其中被 SCI、EI 检索 3 篇。 惠康华,男,1982 年生,讲师,博 士,主要研究方向为模式识别、计算机 视觉、图像处理。参与国家自然科学 基金项目多项。发表学术论文 12 篇, 被 SCI、EI 检索 6 篇。 柳振东,男,1992 年生,硕士研究 生,主要研究方向为模式识别、深度学 习、图像处理。发表学术论文 2 篇。 第 5 期 冯小荣,等:基于卷积特征和贝叶斯分类器的人脸识别 ·775·