正在加载图片...
·282· 智能系统学报 第11卷 分类: 3 基于深度学习的人脸特征分析 identity argmin lly'-X'a' 2.2基于深度学习的特征提取方法 在基于深度学习特征的稀疏表示的人脸识别方 SRDLFC方法的特征提取过程是通过深度卷积 法SRDLFC中,要求特征满足线性子空间特性,且具 神经网络完成的,本文所用的CNN网络结构如图3 有对类内变化的不变性、较好的迁移性和可分性。 所示。 下面对SRDLFC中所提取的深度学习特征进行分析 和讨论。 3.1深度学习特征对类内变化的不变性与可区分性 SRDLFC中特征提取CNN网络的各层卷积核 Covl ov2,3,4,5Cov6,7,8.9Cov10,1l, MP3 12.13 SRPFC Softmax 如图4所示。 Input MP MP2 图3 SRDLFC特征提取网络结构 Fig.3 The structure of SRDLFC's feature extraction network 网络各层具体参数如表1所示。 图4 SRDLFC特征提取网络的第一层卷积核示意 表1 SRDLFC特征提取网络具体结构 Fig.4 The first level's convolutional filters of Table 1 The structure of SRDLFCs feature extraction network SRDLFC's feature extraction network 网络层数 说明 参数 从图4可以看出,CNN底层主要提取一些与边 Input 输入层 200×200大小的人脸灰度图像 缘、角度、轮廓相关信息,具有一定的通用性。CNN Covl 卷积层 64个9×9卷积核步据为2个像素 高层逐渐提取出一些图像结构的信息。 最大值 MP1 5×5大小的范围步据为1个像素 以AR数据集的人脸图像为例,将10类人脸样 池化层 本的深度学习特征进行可视化,如图5所示(每一 Cov2 卷积层128个2×2卷积核步据为2个像素 Cov3,4,5 卷积层 128个2×2卷积核步据为1个像素 列代表一个样本的特征,每张子图对应一类人脸)。 最大值 同一类的样本,在经过多层卷积和池化后,得到的特 MP2 池化层 2×2大小的范围步据为1个像素 征图是相似的,各个子图有明显的横线纹理(说明 Cov6 卷积层256个2×2卷积核步据为2个像素 同类对应项上的特征值比较相似),说明深度学习 Cov7,8.9 卷积层256个2×2卷积核步据为1个像素 特征具有对类变化较好的不变性。而不同类的样本 最大值 MP3 2×2大小的范围步据为1个像素 的特征图明显差异很大,这在一定程度上说明了 池化层 CNN所提取的特征具有较好的可分性。 Cov10 卷积层 512个2×2卷积核步据为2个像素 Cv11,12,13卷积层512个2×2卷积核步据为1个像素 空间金字塔 SPP 输出大小{6,3,2,1} 池化层 FCI 全连接 512维,用于做特征 Softmax Softmax层 7000 该网络训练中使用的Dropout概率为50%,激 活函数为Relu。 本文使用CASIA数据集[26]进行训练,数据集 为不受控环境下采集到的人脸图像,包含光照、遮 挡、姿态。我们选用前7000类约39万人脸图像作 为数据进行有监督学习,监督学习中输出为各类的 标签。图像使用DLB开源库)定位68个特征点, 图5人脸图像的深度学习特征可视化图 然后进行人脸对齐。我们使用FC1层作为人脸特 Fig.5 The visualization deep learning face features 征,使用cosine距离作为人脸特征的相似度度量,在 3.2深度学习特征的子空间特性 LFW数据库上测试得到了96.75%±0.57%人脸认证 SRDLFC将深度学习的特征与基于稀疏表示的 准确率,充分证明网络学到的特征不仅拥有极强的 人脸识别方法相结合,要求特征空间满足人脸线性 判别性,而且具有良好的迁移性。 子空间的假设。CNN特征提取网络实现了人脸灰分类: identity = argmin i y′ - Xi ′α^ i ′ 2 2 2.2 基于深度学习的特征提取方法 SRDLFC 方法的特征提取过程是通过深度卷积 神经网络完成的,本文所用的 CNN 网络结构如图 3 所示。 图 3 SRDLFC 特征提取网络结构 Fig.3 The structure of SRDLFC􀆳s feature extraction network 网络各层具体参数如表 1 所示。 表 1 SRDLFC 特征提取网络具体结构 Table 1 The structure of SRDLFC􀆳s feature extraction network 网络层数 说明 参数 Input 输入层 200×200 大小的人脸灰度图像 Cov1 卷积层 64 个 9×9 卷积核 步据为 2 个像素 MP1 最大值 池化层 5×5 大小的范围 步据为 1 个像素 Cov2 卷积层 128 个 2×2 卷积核 步据为 2 个像素 Cov3,4,5 卷积层 128 个 2×2 卷积核 步据为 1 个像素 MP2 最大值 池化层 2×2 大小的范围 步据为 1 个像素 Cov6 卷积层 256 个 2×2 卷积核 步据为 2 个像素 Cov7,8,9 卷积层 256 个 2×2 卷积核 步据为 1 个像素 MP3 最大值 池化层 2×2 大小的范围 步据为 1 个像素 Cov10 卷积层 512 个 2×2 卷积核 步据为 2 个像素 Cov11,12,13 卷积层 512 个 2×2 卷积核 步据为 1 个像素 SPP 空间金字塔 池化层 输出大小{6, 3, 2, 1} FC1 全连接 512 维,用于做特征 Softmax Softmax 层 7 000 该网络训练中使用的 Dropout 概率为 50%,激 活函数为 Relu。 本文使用 CASIA 数据集[26] 进行训练, 数据集 为不受控环境下采集到的人脸图像,包含光照、遮 挡、姿态。 我们选用前 7 000 类约 39 万人脸图像作 为数据进行有监督学习,监督学习中输出为各类的 标签。 图像使用 DLIB 开源库[27]定位 68 个特征点, 然后进行人脸对齐。 我们使用 FC1 层作为人脸特 征,使用 cosine 距离作为人脸特征的相似度度量,在 LFW 数据库上测试得到了 96.75%±0.57%人脸认证 准确率,充分证明网络学到的特征不仅拥有极强的 判别性,而且具有良好的迁移性。 3 基于深度学习的人脸特征分析 在基于深度学习特征的稀疏表示的人脸识别方 法 SRDLFC 中,要求特征满足线性子空间特性,且具 有对类内变化的不变性、较好的迁移性和可分性。 下面对 SRDLFC 中所提取的深度学习特征进行分析 和讨论。 3.1 深度学习特征对类内变化的不变性与可区分性 SRDLFC 中特征提取 CNN 网络的各层卷积核 如图 4 所示。 图 4 SRDLFC 特征提取网络的第一层卷积核示意 Fig.4 The first level􀆳s convolutional filters of SRDLFC􀆳s feature extraction network 从图 4 可以看出,CNN 底层主要提取一些与边 缘、角度、轮廓相关信息,具有一定的通用性。 CNN 高层逐渐提取出一些图像结构的信息。 以 AR 数据集的人脸图像为例,将 10 类人脸样 本的深度学习特征进行可视化,如图 5 所示(每一 列代表一个样本的特征,每张子图对应一类人脸)。 同一类的样本,在经过多层卷积和池化后,得到的特 征图是相似的,各个子图有明显的横线纹理(说明 同类对应项上的特征值比较相似),说明深度学习 特征具有对类变化较好的不变性。 而不同类的样本 的特征图明显差异很大,这在一定程度上说明了 CNN 所提取的特征具有较好的可分性。 图 5 人脸图像的深度学习特征可视化图 Fig.5 The visualization deep learning face features 3.2 深度学习特征的子空间特性 SRDLFC 将深度学习的特征与基于稀疏表示的 人脸识别方法相结合,要求特征空间满足人脸线性 子空间的假设。 CNN 特征提取网络实现了人脸灰 ·282· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有