第12卷第1期 智能系统学报 Vol.12 No.1 2017年2月 CAAI Transactions on Intelligent Systems Feb.2017 D0I:10.11992/is.201605021 网络出版地址:http://kns.cmki.net/kcms/detail/23.1538.TP.20170227.1805.016.html 局部特征脸型分类方法 孙劲光,邓智硕 (辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105) 摘要:本文针对传统脸型分类算法特征点定位不准和过度依赖轮廓曲线的问题,提出了一种人脸轮廓圆形邻域局 部特征表达方式和脸型分类模型。首先,初步定位脸型轮廓特征点:然后,在特征点周围选取三重八连通圆形邻域, 通过计算一级邻域、拓展邻域与中心区域间的纹理变化,生成二进制编码序列,构造脸型局部特征向量:最后,设计 OVO-RBF-SVM多分类模型,实现脸型分类。本文方法在CAS-PEAL人脸库上进行脸型类型判别,获得了94.28%的 准确率:在相同情况下,分别与基于主动形状模型和基于下颌曲线模型的脸型类型判别方法进行对比,准确率分别 提高了6.64%和6.58%。本文所研究的方法在一定程度上解决了特征点定位相对不准确导致误差增加的问题,同 时尽可能多利用图片原始信息,保证轮廓特征提取的准确率,具有较强的鲁棒性。通过实验证明本文方法适用于脸 型分类。 关键词:脸型分类:圆形邻域:特征编码:局部特征表达:多分类支持向量机 中图分类号:TP391.41文献标志码:A文章编号:1673-4785(2017)01-0104-06 中文引用格式:孙劲光,邓智硕.局部特征脸型分类方法[J].智能系统学报,2017,12(1):104-109. 英文引用格式:SUN Jinguang,DENG Zhishuo2.Local feature facial classification method[J】.CAAI transactions on intelligent 5 ystems,2017,12(1):104-109. Local feature facial classification method SUN Jinguang',DENG Zhishuo2 School of Electronic and Information Engineering,Liaoning Technical University,Huludao 125105,China) Abstract:Considering the problems where the feature points of traditional facial classification algorithms are not located in the position of the actual feature points and are heavily dependent upon the contour curve,a facial contour circular neighborhood local feature expression and a facial classification model were proposed.First,the preliminary facial contour feature points were located and then around the feature points,the triple eight connected round-neighborhood was selected.By calculating a neighborhood level and expanding the neighborhood with the central area between the texture changes,the binary code sequence was generated and the tectonic facial local feature vectors can be created.Then,the faces were classified by designing the OVO-RBF-SVM classification model.The experiment was conducted on the CAS-PEAL face library for facial contour feature discrimination, achieving 94.28%accuracy rate;under the same circumstances,the face-type discrimination methods which are based on the active shape model and jaw curve model were compared,and the accuracy rate raised 6.64%and 6.58%,respectively.To a certain extent,the method proposed in this paper solves the problem where the error increases when the location of the feature points are relatively inaccurate,and at the same time,the original picture information is utilized as much as possible,to ensure the accuracy of the contour feature extraction,which has strong robustness.The experimental results show that this method is suitable for facial classification. Keywords:facial classification;round-neighborhood;feature coding;local feature representation;multi classification support vector machineface 近年来,在模式识别和计算机视觉等领域中, 通过计算机提取待处理人脸图像的特征,在库中找 人脸识别已经成为重要的研究课题。人脸识别即 到对应的身份信息,从而实现人脸与身份的匹配。 人脸识别技术在安全领域中扮演着非常重要的角 收稿日期:2016-05-23.网络出版日期:2017-02-27. 基金项目:国家自然科学基金青年基金项目(61401185). 色,而且该技术还具有巨大的应用前景。 通信作者:邓智硕.E-mail:deng2006zs@163.com
第 12 卷第 1 期 智 能 系 统 学 报 Vol.12 №.1 2017 年 2 月 CAAI Transactions on Intelligent Systems Feb. 2017 DOI:10.11992 / tis.201605021 网络出版地址:http: / / kns.cnki.net / kcms/ detail / 23.1538.TP.20170227.1805.016.html 局部特征脸型分类方法 孙劲光,邓智硕 (辽宁工程技术大学 电子与信息工程学院,辽宁 葫芦岛 125105) 摘 要:本文针对传统脸型分类算法特征点定位不准和过度依赖轮廓曲线的问题,提出了一种人脸轮廓圆形邻域局 部特征表达方式和脸型分类模型。 首先,初步定位脸型轮廓特征点;然后,在特征点周围选取三重八连通圆形邻域, 通过计算一级邻域、拓展邻域与中心区域间的纹理变化,生成二进制编码序列,构造脸型局部特征向量;最后,设计 OVO⁃RBF⁃SVM 多分类模型,实现脸型分类。 本文方法在 CAS⁃PEAL 人脸库上进行脸型类型判别,获得了 94 28%的 准确率;在相同情况下,分别与基于主动形状模型和基于下颌曲线模型的脸型类型判别方法进行对比,准确率分别 提高了 6 64%和 6 58%。 本文所研究的方法在一定程度上解决了特征点定位相对不准确导致误差增加的问题,同 时尽可能多利用图片原始信息,保证轮廓特征提取的准确率,具有较强的鲁棒性。 通过实验证明本文方法适用于脸 型分类。 关键词:脸型分类;圆形邻域;特征编码;局部特征表达;多分类支持向量机 中图分类号: TP391.41 文献标志码:A 文章编号:1673-4785(2017)01-0104-06 中文引用格式:孙劲光,邓智硕. 局部特征脸型分类方法[J]. 智能系统学报, 2017, 12(1): 104-109. 英文引用格式:SUN Jinguang, DENG Zhishuo 2 . Local feature facial classification method[ J]. CAAI transactions on intelligent systems, 2017, 12(1): 104-109. Local feature facial classification method SUN Jinguang 1 , DENG Zhishuo 2 (School of Electronic and Information Engineering, Liaoning Technical University, Huludao 125105, China) Abstract:Considering the problems where the feature points of traditional facial classification algorithms are not located in the position of the actual feature points and are heavily dependent upon the contour curve, a facial contour circular neighborhood local feature expression and a facial classification model were proposed. First, the preliminary facial contour feature points were located and then around the feature points, the triple eight connected round⁃neighborhood was selected. By calculating a neighborhood level and expanding the neighborhood with the central area between the texture changes, the binary code sequence was generated and the tectonic facial local feature vectors can be created. Then, the faces were classified by designing the OVO⁃RBF⁃SVM classification model. The experiment was conducted on the CAS⁃PEAL face library for facial contour feature discrimination, achieving 94.28% accuracy rate; under the same circumstances, the face⁃type discrimination methods which are based on the active shape model and jaw curve model were compared, and the accuracy rate raised 6.64% and 6 58%, respectively. To a certain extent, the method proposed in this paper solves the problem where the error increases when the location of the feature points are relatively inaccurate, and at the same time, the original picture information is utilized as much as possible, to ensure the accuracy of the contour feature extraction, which has strong robustness. The experimental results show that this method is suitable for facial classification. Keywords: facial classification; round⁃neighborhood; feature coding; local feature representation; multi classification support vector machineface 收稿日期:2016-05-23. 网络出版日期:2017-02-27. 基金项目:国家自然科学基金青年基金项目(61401185). 通信作者:邓智硕. E⁃mail:deng2006zs@ 163.com. 近年来,在模式识别和计算机视觉等领域中, 人脸识别已经成为重要的研究课题。 人脸识别即 通过计算机提取待处理人脸图像的特征,在库中找 到对应的身份信息,从而实现人脸与身份的匹配。 人脸识别技术在安全领域中扮演着非常重要的角 色,而且该技术还具有巨大的应用前景
第1期 孙劲光,等:局部特征脸型分类方法 ·105· 香港中文大学汤晓鸥教授领导的计算机视觉 算量巨大,并且不能解决ASM模型定位不准带来的 研究小组宣布他们开发了一个名为DeepID系列的 误差。 深度学习模型,在LFW(labeled faces in the wild)数 2RLFE人脸轮廓特征表达方法研究 据库中得了99.45%的识别率,超出了人类用肉眼达 到的97.52%的识别率,这一成果极大地提升了人脸 为了克服人脸轮廓特征点存在不准确可能性, 识别技术的可信度,同时也将Facebook的DeepFace 通过对人脸轮廓特征点周围的细节特征的分析,以 人脸识别的准确率提升了近2个百分点[1-)。脸型 轮廓特征点为核心进行邻域区域划分,利用面部区 分类对于人脸识别的速度与准确率起着重要作用。 域特征的连贯特性,构建出RLFE表达式,并对每个 虽然DeepID系列取得了如此卓越的成果,但由于该 特征点进行特征编码,构建轮廓特征向量:以此为 模型依然采用局部细节特征及整体特征融合判别 基础,设计多分类器,建立脸型轮廓的多分类模型。 形式,与人类对人物识别的认知方式(外形-轮廓- 2.1 基于圆形邻域的人脸轮廓特征区域划分方法 围绕人脸轮廓初始特征点,圆形邻域可以很好地 细节)和基于外形再进行细节判断的相似性判别方 逼近人脸曲线,更准确地描述人脸轮廓,本文提出了 式存在不一致性,因此,本文从局部特征出发,以人 类的认知方式探索人脸轮廓分类的方法。 种基于圆形邻域的局部特征表达。以特征点(xo, y。)为中心由内向外划分出中心区域、一级邻域、扩展 传统的人脸轮廓分类算法过度依赖脸型轮廓 邻域,共三层圆形邻域,各区域划分遵循式(1)和式 的曲线特征,而忽略脸型周围的纹理特征,在提取 (2)。除中心区域外,一级邻域和扩展邻域按x轴负 脸型轮廓时,对图片质量要求过高,极易产生误差, 方向以0°逆时针划分出8个相同大小的子邻域,依次 很难构建准确的人脸轮廓曲线。为了克服特征点 命名为g0,g1,…,g8,g0',g1',…,g8'。如图1所示,中 定位不准确的问题,充分利用图片原始信息,保证 心区域为go,一级邻域为{g:i=1,2,…,n},扩展邻 人脸轮廓特征的准确率,提出采用圆形邻域局部特 域为{g:+g:'i=1,2,…,8}。 征表达(round local feature expression,RLFE)的形式 中心区域:{(x)0<√+7≤r,i=1,2,…, 描述人脸轮廓特征。 级邻域:{(xy)r<√+≤2,i=1,2,…,n 1 相关工作 扩展邻域:{(x)r<√民+≤3r,i=1,2,…,n 目前,脸型分类主要是基于几何模型和轮廓模 (1) 型,文献[6-7]作者利用人脸轮廓的曲率特征进行 分类,通过轮廓曲率之间的相互关系函数定义相似 i-0×<a<ixi=1,2,8 性,并将人脸分为圆脸、椭圆脸、方脸、三角脸及其 (2) 他脸型五类,具有较好的识别速度,取得了87.7%的 式中:(x,y:)表示邻域内像素点,r为特征点到中心 准确率。该方法定义轮廓曲线为y=f(x),曲率k= 区域边缘半径,α。表示g:区域所对应的圆心角。T y"/(1+y2)2,通过比较对应点的曲率判别脸型。 值的选取见5.1节。 2.2特征邻域对齐 但是下颌轮廓曲线提取较为困难,提取的曲线精度 为了保证图像中的正面人脸处于垂直方向,规 不高,所以分类结果不够可靠。 定图像中人脸的眉心到鼻尖的方向为标准方向。 与此相比,文献[8]提出了基于ASM主动形状 根据标准方向与竖直方向的夹角,计算每个邻域的 模型的方法,原理简单,准确率较高。由先验知识, 偏差角度,假设眉心点为A(x1,y1)、鼻尖点为B(x2, 将作为训练样本的人脸分为椭圆脸、圆脸、方脸和 y2),则每个区域需要旋转偏差角度B,如图2所示。 三角脸,训练不同的脸型得到不同脸型的形状模 根据偏差角B测定调整特征邻域角度,见式(3)和 型,然后分别通过对比经典ASM模型与分类后模板 式(4)。 模型定位的特征点来确定脸型。如模型s。=S+A, B=arctan [(x1-x2)/(y-y2) (3) 其中SS分别表示经典ASM模型和模板模型定 位的特征点集合,当4越接近零向量,说明待测脸 -0×+B<a<ix+Bi=12.… 型与模板模型越相似。但是,在实际应用中模型运 (4)
香港中文大学汤晓鸥教授领导的计算机视觉 研究小组宣布他们开发了一个名为 DeepID 系列的 深度学习模型,在 LFW (labeled faces in the wild)数 据库中得了 99.45%的识别率,超出了人类用肉眼达 到的 97.52%的识别率,这一成果极大地提升了人脸 识别技术的可信度,同时也将 Facebook 的 DeepFace 人脸识别的准确率提升了近 2 个百分点[1-5] 。 脸型 分类对于人脸识别的速度与准确率起着重要作用。 虽然 DeepID 系列取得了如此卓越的成果,但由于该 模型依然采用局部细节特征及整体特征融合判别 形式,与人类对人物识别的认知方式(外形-轮廓- 细节)和基于外形再进行细节判断的相似性判别方 式存在不一致性,因此,本文从局部特征出发,以人 类的认知方式探索人脸轮廓分类的方法。 传统的人脸轮廓分类算法过度依赖脸型轮廓 的曲线特征,而忽略脸型周围的纹理特征,在提取 脸型轮廓时,对图片质量要求过高,极易产生误差, 很难构建准确的人脸轮廓曲线。 为了克服特征点 定位不准确的问题,充分利用图片原始信息,保证 人脸轮廓特征的准确率,提出采用圆形邻域局部特 征表达(round local feature expression,RLFE)的形式 描述人脸轮廓特征。 1 相关工作 目前,脸型分类主要是基于几何模型和轮廓模 型,文献[6-7]作者利用人脸轮廓的曲率特征进行 分类,通过轮廓曲率之间的相互关系函数定义相似 性,并将人脸分为圆脸、椭圆脸、方脸、三角脸及其 他脸型五类,具有较好的识别速度,取得了 87.7%的 准确率。 该方法定义轮廓曲线为 y = f( x),曲率 k = y″ / (1+y′ 2 ) 3/ 2 ,通过比较对应点的曲率判别脸型。 但是下颌轮廓曲线提取较为困难,提取的曲线精度 不高,所以分类结果不够可靠。 与此相比,文献[8]提出了基于 ASM 主动形状 模型的方法,原理简单,准确率较高。 由先验知识, 将作为训练样本的人脸分为椭圆脸、圆脸、方脸和 三角脸,训练不同的脸型得到不同脸型的形状模 型,然后分别通过对比经典 ASM 模型与分类后模板 模型定位的特征点来确定脸型。 如模型 s0 = stype +Δ, 其中 s0 、stype分别表示经典 ASM 模型和模板模型定 位的特征点集合,当 Δ 越接近零向量,说明待测脸 型与模板模型越相似。 但是,在实际应用中模型运 算量巨大,并且不能解决 ASM 模型定位不准带来的 误差。 2 RLFE 人脸轮廓特征表达方法研究 为了克服人脸轮廓特征点存在不准确可能性, 通过对人脸轮廓特征点周围的细节特征的分析,以 轮廓特征点为核心进行邻域区域划分,利用面部区 域特征的连贯特性,构建出 RLFE 表达式,并对每个 特征点进行特征编码,构建轮廓特征向量;以此为 基础,设计多分类器,建立脸型轮廓的多分类模型。 2.1 基于圆形邻域的人脸轮廓特征区域划分方法 围绕人脸轮廓初始特征点,圆形邻域可以很好地 逼近人脸曲线,更准确地描述人脸轮廓,本文提出了 一种基于圆形邻域的局部特征表达。 以特征点(x0 , y0 )为中心由内向外划分出中心区域、一级邻域、扩展 邻域,共三层圆形邻域,各区域划分遵循式(1)和式 (2)。 除中心区域外,一级邻域和扩展邻域按 x 轴负 方向以 0°逆时针划分出 8 个相同大小的子邻域,依次 命名为 g0 ,g1 ,…,g8 ,g0 ′,g1 ′,…,g8 ′。 如图 1 所示,中 心区域为 g0 ,一级邻域为 gi { i = 1,2,…,n} ,扩展邻 域为 gi +gi { ′ i = 1,2,…,8} 。 中心区域: (xi,yi) 0 < x 2 i + y 2 { i ≤ r,i = 1,2,…,n} 一级邻域: (xi,yi) r < x 2 i + y 2 { i ≤2r,i = 1,2,…,n} 扩展邻域: (xi,yi) r < x 2 i + y 2 { i ≤3r,i = 1,2,…,n} ì î í ï ïï ï ï (1) αgi (i - l) × π 4 < α < i × π 4 { ,i = 1,2,…,8} (2) 式中:(xi,yi)表示邻域内像素点,r 为特征点到中心 区域边缘半径,αgi表示 gi 区域所对应的圆心角。 r 值的选取见 5.1 节。 2.2 特征邻域对齐 为了保证图像中的正面人脸处于垂直方向,规 定图像中人脸的眉心到鼻尖的方向为标准方向。 根据标准方向与竖直方向的夹角,计算每个邻域的 偏差角度,假设眉心点为 A(x1 ,y1 )、鼻尖点为 B(x2 , y2 ),则每个区域需要旋转偏差角度 β,如图 2 所示。 根据偏差角 β 测定调整特征邻域角度,见式(3) 和 式(4)。 β = arctan (x1 - x2 ) / (y1 - y [ 2 ) ] (3) αgi (i - l) × π 4 + β < α < i × π 4 { + β,i = 1,2,…,8} (4) 第 1 期 孙劲光,等:局部特征脸型分类方法 ·105·
·106. 智能系统学报 第12卷 go RLE(,)=(B田C×2) (9) g 每张人脸轮廓上特征点按照同位置、同顺序的 86 方式排列,将特征点的特征编码按照该顺序级联起 85 来,级联后的序列作为该脸的特征向量,记作X= (x1,x2,…,xn),其中xn表示第n个特征点的特征 g g 编码。由于每个特征点都融合各个方向邻域间的 梯度强度变化关系,特征向量可以准确地表达人脸 轮廓,具有较强的鉴别能力。 3OVO-RBF-SVM分类器设计 图1圆形邻域示意图 3.1基于Fisher准则的人脸分类RBF-SVM模型设计 Fig.1 Schematic diagram of circular neighborhood 基于SVM分类思想与Fisher准则基本思想], 本分类模型旨在找到一个最优方向,将原始数据向 这个方向投影,使同类数据间距离尽可能小,异类 间距离尽可能大。因此本文用Fisher准则的思想, 优化RBF-SVM核参数,构建RBF-SVM分类模型。 假设X1=(x1,x2,…,x1m),X2=(x21,x22,…, x2,)为RLFE提取的两类人脸特征。这两类特征映 图2偏差角示意图 射到高维度空间中的均值u1“2分别为 Fig.2 Schematic diagram of deviation angle 4=2e) (10) 2.3特征编码 n1i=1 为了便于人脸特征的分类,本文提出根据圆形 (11) 邻域的区域强度关系,构建人脸轮廓区域的特征, n,=1 提取的特征抽象成编码。将每个邻域的平均灰度 类间离散度的平方S。为 作为区域强度,即 1 1 1 S=u1-)'u1-u)=K+K2+K2 ni Power(g;)= (5) (12) 式中:i=1,2,,8;Pg为点(xg,y)的灰度值, X,和X2的类内离散度的平方分别为 j=1,2,…,N0 通过比较中心区域与各个邻域的强度关系,即 =三Ie()-a=a 一K1(13) i=1 n (1 Power(gi)>Power(gi) s(x)= (6) (0,Power(g;)Power(g;) Se=2Ie(a)-u,2=-Ka(14) n, 生成相应的二进制序列:采取异或输出的方式 进行编码,相同梯度邻域的强度关系相同,输出结 K(xx) 果为1,否则结果为0。最终结果可以直观地表达出 相同方向梯度上强度关系是否一致,LFE特征表 式中: K(x2i,) 达的方法见公式(7)~(9),即 级邻域编码为 K2= K(x1i,xg)。 B:=s[Power(gi+1)-Power(go)] (7) 式中:i=0,2,…,7。 根据isher准则,求解最优核参数就转化为求 扩展邻域编码为 解最大值。 C:=s [Power(g'it)-Power(go)] (8) tr(S.) 式中:i=0,2,…,7。 F(y)= (15) tr(S1+S2) RLFE编码为 根据上述方法优化核参数y得到的RBF-SVM
图 1 圆形邻域示意图 Fig.1 Schematic diagram of circular neighborhood 图 2 偏差角示意图 Fig.2 Schematic diagram of deviation angle 2.3 特征编码 为了便于人脸特征的分类,本文提出根据圆形 邻域的区域强度关系,构建人脸轮廓区域的特征, 提取的特征抽象成编码。 将每个邻域的平均灰度 作为区域强度,即 Power(gij) = 1 Nj ∑ Nj j = 1 (pij) (5) 式中: i = 1, 2, …, 8; pij 为 点 ( xij, yij ) 的 灰 度 值, j = 1,2,…,Nj。 通过比较中心区域与各个邻域的强度关系,即 s(x) = 1 ,Power(gi) > Power(gj) {0,Power(gi) ≤ Power(gj) (6) 生成相应的二进制序列;采取异或输出的方式 进行编码,相同梯度邻域的强度关系相同,输出结 果为 1,否则结果为 0。 最终结果可以直观地表达出 相同方向梯度上强度关系是否一致,RLFE 特征表 达的方法见公式(7) ~ (9),即 一级邻域编码为 Bi = s [Power(gi+1 ) - Power(g0 ) ] (7) 式中:i = 0,2,…,7。 扩展邻域编码为 Ci = s Power(g′ [ i+1 ) - Power(g0 ) ] (8) 式中:i = 0,2,…,7。 RLFE 编码为 RLFE(x,y) = ∑ 7 i = 0 (Bi Ci × 2 i ) (9) 每张人脸轮廓上特征点按照同位置、同顺序的 方式排列,将特征点的特征编码按照该顺序级联起 来,级联后的序列作为该脸的特征向量,记作 X = (x1 ,x2 ,…,xn ),其中 xn 表示第 n 个特征点的特征 编码。 由于每个特征点都融合各个方向邻域间的 梯度强度变化关系,特征向量可以准确地表达人脸 轮廓,具有较强的鉴别能力。 3 OVO⁃RBF⁃SVM 分类器设计 3.1 基于 Fisher 准则的人脸分类 RBF⁃SVM 模型设计 基于 SVM 分类思想与 Fisher 准则基本思想[9] , 本分类模型旨在找到一个最优方向,将原始数据向 这个方向投影,使同类数据间距离尽可能小,异类 间距离尽可能大。 因此本文用 Fisher 准则的思想, 优化 RBF⁃SVM 核参数,构建 RBF⁃SVM 分类模型。 假设 X1 = ( x11 ,x12 ,…,x1n1 ),X2 = ( x21 ,x22 ,…, x2n2 )为 RLFE 提取的两类人脸特征。 这两类特征映 射到高维度空间中的均值 μ1 ,μ2 分别为 μ1 = 1 n1 ∑ n1 i = 1 φ(x1i) (10) μ2 = 1 n2 ∑ n2 i = 1 φ(x2i) (11) 类间离散度的平方 Sb 为 Sb = (μ1 - μ2) T (μ1 - μ2) = 1 n 2 1 K11 + 1 n 2 2 K22 + 1 n1n2 K12 (12) X1 和 X2 的类内离散度的平方分别为 Sω1 = ∑ n1 i = 1 ‖φ(x1i) - μ1‖ 2 = n1 - 1 n1 K11 (13) Sω2 = ∑ n2 i = 1 ‖φ(x2i) - μ2‖ 2 = n2 - 1 n2 K22 (14) 式中: K11 = ∑ n1 i = 1 ∑ n1 j = 1 K(x1i,x1j) K22 = ∑ n2 i = 1 ∑ n2 j = 1 K(x2i,x2j) K12 = ∑ n1 i = 1 ∑ n2 j = 1 K(x1i,x2j)。 ì î í ï ï ï ï ï ï ï ï 根据 Fisher 准则,求解最优核参数就转化为求 解最大值。 F(γ) = tr(Sb) tr(Sω1 + Sω2 ) (15) 根据上述方法优化核参数 γ 得到的 RBF⁃SVM ·106· 智 能 系 统 学 报 第 12 卷
第1期 孙劲光,等:局部特征脸型分类方法 ·107· 核函数分类模型为 文采用CAS-PEAL人脸库1o]中的10O0张温和光 K(x:,x)=exp(-y‖x:,x‖2),y>0(16) 照,无表情的正面人脸进行验证,并综合10位专家 3.2OVO-RBF-SVM多分类模型 的意见,将其分为圆脸、椭圆脸、方脸和三角脸4种 为适应多种不同的人脸类型,需要设计一个多 脸型库。采用交叉实验方法,每种脸型随机选出若 分类模型。因此,本文采用“0V0”投票机制实现不 干个样本,进行3次实验。 同脸型的多分类模型(简称OVO-RBF-SVM)。每两 5.1邻域半径对分类准确率影响分析 种脸型之间设计一个分类器,这样k种脸型就需要 由于人脸轮廓的特殊性,圆形邻域尺度选择对 设计C?个分类器:当有未知脸型输入时,通过分类 识别率有较大的影响,偏大的邻域不能表达邻域间 器依次投票,胜利的一方票数加1,最后票数最多的 强度变化特点,偏小的邻域则过于敏感,易出现更 类别即为最终输出脸型,式(17)和(18)给出了基于 大的误差,本文在上述人脸库中对不同邻域半径的 OVO-RBF-SVM的人脸脸型分类模型。如果最多票 RLFE特征表达做了研究,结果如表1所示,其中dis 数相同,使用这两类之间的分类器进行最终决策。 表示相邻两个特征点间的距离。 ω:=w:+1,0前=0 表1不同邻域半径对准确率的影响 (17) w=0+1,0g=1 Table 1 Influence on accuracy of different neighborhood radius T(x)=max(w) (18) 中心区域 一级 扩展 准确率/% 式中:σ,表示分类器在第i类和第j类之间的分类结 半径 邻域 邻域 第1次第2次第3次 果,ω4表示第k类胜利的次数。 3*d 3 xdis 1×dis 91 87 85 4算法描述 算法1RLFE算法描述 6*。 3*。 2*d 94 92 94 输入带有类别信息的N个训练样本S,每个 1 样本人脸轮廓特征点个数为T。 9 xdis 90 87 86 输出脸型轮廓特征向量X=(x1,x2,…,xn)。 FOR i=1 to N 6 1 1 xdis 80 75 70 4 FOR j=1 to T 从表1中可以看出,选择过大或过小的邻域半径 Coding B,C: RLFE(x,y); 都会使识别率下降,当中心邻域半径为石s,一级邻 END FOR END FOR 域半径为了×,二级邻域半径为了×时,准确率达 算法2OVO-RBF-SVM多分类算法描述 到最大值95%。故局部特征模型选用上述邻域半径。 输入:带有K种类别信息的N个脸型轮廓特征 5.2特征点定位对分类准确率影响分析 向量X,未知的测试样本T。 由于中心区域的存在,使得对特征点定位要求 输出:测试样本类型ANS。 降低,并不需要十分精准的定位人脸轮廓,只需中 使用N个脸型轮廓特征向量X,训练出C个分 心区域定位在面部轮廓即可。如图3所示,特征点 类器: A定位在人脸轮廓上时,我们认为特征点A定位准 FOR Num=1 to C 确:特征点B未定位在轮廓上,但是特征点中心区 IF0=0 域定位在轮廓上,我们认为特征点B定位不准确。 w,=ω+1; ELSE 9=w,+1; END IF END FOR 依照式(17)输出未知测试样本的类别。 图3特征点定位示意图 5实验分析与实现 Fig.3 Schematic diagram of feature point location 国际上没有标准的关于脸型的人脸库,所以本
核函数分类模型为 K(xi,xj) = exp( - γ ‖xi,xj‖2 ), γ > 0 (16) 3.2 OVO⁃RBF⁃SVM 多分类模型 为适应多种不同的人脸类型,需要设计一个多 分类模型。 因此,本文采用“OVO”投票机制实现不 同脸型的多分类模型(简称 OVO⁃RBF⁃SVM)。 每两 种脸型之间设计一个分类器,这样 k 种脸型就需要 设计 C 2 k 个分类器;当有未知脸型输入时,通过分类 器依次投票,胜利的一方票数加 1,最后票数最多的 类别即为最终输出脸型,式(17)和(18)给出了基于 OVO⁃RBF⁃SVM 的人脸脸型分类模型。 如果最多票 数相同,使用这两类之间的分类器进行最终决策。 ωi = ωi + 1,σij = 0 ωj = ωj + 1 ,σij = 1 { (17) τ(x) = max(ωk) (18) 式中:σij表示分类器在第 i 类和第 j 类之间的分类结 果,ωk 表示第 k 类胜利的次数。 4 算法描述 算法 1 RLFE 算法描述 输入 带有类别信息的 N 个训练样本 S,每个 样本人脸轮廓特征点个数为 T。 输出 脸型轮廓特征向量 X= (x1 ,x2 ,…,xn )。 FOR i = 1 to N FOR j = 1 to T Coding Bij,Cij; RLFE(x,y); END FOR END FOR 算法 2 OVO⁃RBF⁃SVM 多分类算法描述 输入:带有 K 种类别信息的 N 个脸型轮廓特征 向量 X,未知的测试样本 T。 输出:测试样本类型 ANS。 使用 N 个脸型轮廓特征向量 X,训练出 C 2 k 个分 类器: FOR Num = 1 to C 2 k IF σij = 0 ωi =ωi +1; ELSE ωj =ωj +1; END IF END FOR 依照式(17)输出未知测试样本的类别。 5 实验分析与实现 国际上没有标准的关于脸型的人脸库,所以本 文采用 CAS⁃PEAL 人脸库[10] 中的1 000张温和光 照,无表情的正面人脸进行验证,并综合 10 位专家 的意见,将其分为圆脸、椭圆脸、方脸和三角脸 4 种 脸型库。 采用交叉实验方法,每种脸型随机选出若 干个样本,进行 3 次实验。 5.1 邻域半径对分类准确率影响分析 由于人脸轮廓的特殊性,圆形邻域尺度选择对 识别率有较大的影响,偏大的邻域不能表达邻域间 强度变化特点,偏小的邻域则过于敏感,易出现更 大的误差,本文在上述人脸库中对不同邻域半径的 RLFE 特征表达做了研究,结果如表 1 所示,其中 dis 表示相邻两个特征点间的距离。 表 1 不同邻域半径对准确率的影响 Table 1 Influence on accuracy of different neighborhood radius 中心区域 半径 一级 邻域 扩展 邻域 准确率/ % 第 1 次 第 2 次 第 3 次 1 3 ×dis 2 3 ×dis 1×dis 91 87 85 1 6 ×dis 1 3 ×dis 1 2 ×dis 94 92 94 1 9 ×dis 2 9 ×dis 1 3 ×dis 90 87 86 1 6 ×dis 1 6 ×dis 1 4 ×dis 80 75 70 从表 1 中可以看出,选择过大或过小的邻域半径 都会使识别率下降,当中心邻域半径为 1 6 ×dis,一级邻 域半径为 1 3 ×dis,二级邻域半径为 1 2 ×dis 时,准确率达 到最大值 95%。 故局部特征模型选用上述邻域半径。 5.2 特征点定位对分类准确率影响分析 由于中心区域的存在,使得对特征点定位要求 降低,并不需要十分精准的定位人脸轮廓,只需中 心区域定位在面部轮廓即可。 如图 3 所示,特征点 A 定位在人脸轮廓上时,我们认为特征点 A 定位准 确;特征点 B 未定位在轮廓上,但是特征点中心区 域定位在轮廓上,我们认为特征点 B 定位不准确。 图 3 特征点定位示意图 Fig.3 Schematic diagram of feature point location 第 1 期 孙劲光,等:局部特征脸型分类方法 ·107·
.108. 智能系统学报 第12卷 如表2~4所示,随着不准确特征点个数的上 表5各种算法准确率比较 升,识别率略有下降,当初始定位点存在1/2不准确 Table 5 Comparison of the accuracy of various algorithms 时,基本不影响识别准确率。所以本文所研究的方 算法 准确率/% 法基本上解决了特征点定位不准带来的识别率下 基于主动形状模型 87.64 降问题,在一定的程度上提高了识别系统的容错性。 基于下颌曲线模型 87.7 表2特征点全部定位在人脸轮廓上的实验结果 Table 2 The experimental results of all feature points on 本文 94.28 the face contour 6 结束语 测试 正确分类数 准确率 脸型 样本数第1次第2次第3次 /% 针对传统脸型分类算法的不足,本文提出用 RLFE特征表达方式构建人脸轮廓特征向量,以初 圆脸 45 42 41 42 91.85 始特征点为圆心划分出三重邻域,尽可能减小特征 椭圆脸 50 48 47 47 94.66 点定位带来的分类准确率误差。与传统的脸型分 方脸 50 48 49 48 96.66 类算法相比,分类准确率有较大的提升。但是本文 只在静态、温和的环境下进行实验,在动态、复杂环 三角脸 30 8 27 92.22 境下区分脸型是未来的工作重点。随着虚拟现实 总计 175 166 165 164 94.28 的发展,未来三维数据处理必将成为研究的热点, 表31/2特征点未在人脸轮廓上的实验结果 将本文方法移植到三维图像[)上也是下一步的工 Table 3 The experimental results with 1/2 feature points 作重点。 not on the face contour 参考文献: 测试 正确分类数 准确率 脸型 样本数第1次第2次第3次 /% [1]LUO Ping,WANG Xiaogang,TANG Xiaoou.Hierarchical face parsing via deep learning[C]//Proceedings of 2012 圆脸 45 41 40 41 90.37 IEEE Conference on Computer Vision and Pattern 椭圆脸 50 47 47 47 94.00 Recognition.Providence,RI,USA,2012:2480-2487. 方脸 50 48 48 48 96.00 [2]SUN Yi,WANG Xiaogang,TANG Xiaoou.Deep learning face representation from predicting 10,000 classes[C]/ 三角脸 30 28 27 27 91.11 Proceedings of 2014 IEEE Conference on Computer Vision 总计 175 164 162 163 93.14 and Pattern Recognition.Columbus,OH,USA,2014: 表43/4特征点未在人脸轮廓上的实验结果 1891-1898. Table 4 The experimental results with 3/4 feature points [3]LU Chaochao,ZHAO Deli,TANG Xiaoou.Face recognition not on the face contour using face patch networks C]//Proceedings of 2013 IEEE International Conference on Computer Vision.Sydney, 测试 正确分类数 准确率 脸型 NSW,Australia,2013:3288-3295. 样本数 第1次第2次第3次 /% [4]ZENG Xingyu,OUYANG Wanli,WANG Xiaogang.Multi- 圆脸 45 13 16 16 33.33 stage contextual deep learning for pedestrian detection [C]//Proceedings of 2013 IEEE International Conference 椭圆脸 50 19 公 17 35.33 on Computer Vision.Sydney,VIC,Australia,2013: 方脸 50 10 14 26.00 121-128. [5]SUN Yi,WANG Xiaogang,TANG Xiaoou.Hybrid deep 三角脸 30 5 10 25.56 learning for face verification [C]//Proceedings of 2013 总计 175 50 57 30.47 IEEE International Conference on Computer Vision. 5.3不同算法准确率对比分析 Sydney,NSW,Australia,2013:1489-1496. [6]王俊艳,苏光大.基于下颌轮廓线的人脸分类方法[J] 为了验证本文所研究方法的有效性,与其他具 红外与激光工程,2004,32(2):159-163. 有代表性的算法进行对比实验。从表5可以看出, WANG Junyan,SU Guangda.Human face classification 由于解决了特征点定位不准的问题,本文所研究的 method based on chin contour [J].Infrared and laser 方法的准确率相对于其他算法有较大提升,从分类 engineering,2004,32(2):159-163. 的结果上来看,还是十分令人满意的。 [7]凌旭峰,杨杰,杨勇.基于轮廓线曲率特征的人脸分类
如表 2 ~ 4 所示,随着不准确特征点个数的上 升,识别率略有下降,当初始定位点存在 1 / 2 不准确 时,基本不影响识别准确率。 所以本文所研究的方 法基本上解决了特征点定位不准带来的识别率下 降问题,在一定的程度上提高了识别系统的容错性。 表 2 特征点全部定位在人脸轮廓上的实验结果 Table 2 The experimental results of all feature points on the face contour 脸型 测试 样本数 正确分类数 第 1 次 第 2 次 第 3 次 准确率 / % 圆脸 45 42 41 42 91.85 椭圆脸 50 48 47 47 94.66 方脸 50 48 49 48 96.66 三角脸 30 28 28 27 92.22 总计 175 166 165 164 94.28 表 3 1 / 2 特征点未在人脸轮廓上的实验结果 Table 3 The experimental results with 1 / 2 feature points not on the face contour 脸型 测试 样本数 正确分类数 第 1 次 第 2 次 第 3 次 准确率 / % 圆脸 45 41 40 41 90.37 椭圆脸 50 47 47 47 94.00 方脸 50 48 48 48 96.00 三角脸 30 28 27 27 91.11 总计 175 164 162 163 93.14 表 4 3 / 4 特征点未在人脸轮廓上的实验结果 Table 4 The experimental results with 3 / 4 feature points not on the face contour 脸型 测试 样本数 正确分类数 第 1 次 第 2 次 第 3 次 准确率 / % 圆脸 45 13 16 16 33.33 椭圆脸 50 19 17 17 35.33 方脸 50 10 15 14 26.00 三角脸 30 8 5 10 25.56 总计 175 50 53 57 30.47 5.3 不同算法准确率对比分析 为了验证本文所研究方法的有效性,与其他具 有代表性的算法进行对比实验。 从表 5 可以看出, 由于解决了特征点定位不准的问题,本文所研究的 方法的准确率相对于其他算法有较大提升,从分类 的结果上来看,还是十分令人满意的。 表 5 各种算法准确率比较 Table 5 Comparison of the accuracy of various algorithms 算法 准确率/ % 基于主动形状模型 87.64 基于下颌曲线模型 87.7 本文 94.28 6 结束语 针对传统脸型分类算法的不足,本文提出用 RLFE 特征表达方式构建人脸轮廓特征向量,以初 始特征点为圆心划分出三重邻域,尽可能减小特征 点定位带来的分类准确率误差。 与传统的脸型分 类算法相比,分类准确率有较大的提升。 但是本文 只在静态、温和的环境下进行实验,在动态、复杂环 境下区分脸型是未来的工作重点。 随着虚拟现实 的发展,未来三维数据处理必将成为研究的热点, 将本文方法移植到三维图像[11] 上也是下一步的工 作重点。 参考文献: [1]LUO Ping, WANG Xiaogang, TANG Xiaoou. Hierarchical face parsing via deep learning [ C] / / Proceedings of 2012 IEEE Conference on Computer Vision and Pattern Recognition. Providence, RI, USA, 2012: 2480-2487. [2] SUN Yi, WANG Xiaogang, TANG Xiaoou. Deep learning face representation from predicting 10, 000 classes [ C] / / Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA, 2014: 1891-1898. [3]LU Chaochao, ZHAO Deli, TANG Xiaoou. Face recognition using face patch networks[C] / / Proceedings of 2013 IEEE International Conference on Computer Vision. Sydney, NSW, Australia, 2013: 3288-3295. [4]ZENG Xingyu, OUYANG Wanli, WANG Xiaogang. Multi⁃ stage contextual deep learning for pedestrian detection [C] / / Proceedings of 2013 IEEE International Conference on Computer Vision. Sydney, VIC, Australia, 2013: 121-128. [5] SUN Yi, WANG Xiaogang, TANG Xiaoou. Hybrid deep learning for face verification [ C] / / Proceedings of 2013 IEEE International Conference on Computer Vision. Sydney, NSW, Australia, 2013: 1489-1496. [6]王俊艳, 苏光大. 基于下颌轮廓线的人脸分类方法[ J]. 红外与激光工程, 2004, 32(2): 159-163. WANG Junyan, SU Guangda. Human face classification method based on chin contour [ J ]. Infrared and laser engineering, 2004, 32(2): 159-163. [7]凌旭峰, 杨杰, 杨勇. 基于轮廓线曲率特征的人脸分类 ·108· 智 能 系 统 学 报 第 12 卷
第1期 孙劲光,等:局部特征脸型分类方法 ·109· 及识别[J].红外与激光工程,1999,28(4):37-39 [11]SARAKON P,CHAROENPONG T,CHAROENSIRIWATH S. LING Xufeng,YANG Jie,YANG Yong.Curvature-feature- Face shape classification from 3D human data by using SVM based method for human face classification and recognition [C]//Proceedings of the 7th Biomedical Engineering [J].Infrared and laser engineering,1999,28(4):37-39. International Conference.Fukuoka,Japan,2014:1-5. [8]杜立强,贾鹏,周宗潭,等.基于主动形状模型的人脸 作者简介: 脸型自动分类算法[J].计算机应用,2009,29(10): 孙劲光,女,1962年生,博士,教授, 2710-2712,2715 博士生导师,计算机学会(CC)会员 DU Liqiang,JIA Peng,ZHOU Zongtan,et al.Human face (21314S),主要研究方向为计算机图像 shape classification method based on active shape model 处理、计算机图形学、知识工程。 [J].Journal of computer applications,2009,29(10): 2710-2712,2715. [9]KIM S W,OOMMEN B J.On using prototype reduction schemes to optimize kernel-based fisher discriminant 邓智硕,男,1992年生,硕士研究 analysis[]].IEEE transactions on systems,man,and 生,研究方向为计算机图像处理。 cybernetics,part B (cybernetics),2008,38 (2): 564-570. [10]GAO Wen,GAO Bo,SHAN Shiguang,et al.The CAS- PEAL large-scale Chinese face database and baseline evaluations[.IEEE transactions on systems,man,and cybernetics-part A:systems and humans,2008,38(1): 149-161. 2017多媒体和云研讨会 Multimedia and the Cloud 2017 The proliferation of cloud computing and storage infrastructure as well cloud services provides a rich platform for multimedia researchers and developers to innovate new applications and services which would not have been possible before.For example,video streaming of high-definition content has now reached a fairly mature state.However,going forward we will only see an increase in multimedia applications which will require assistance from the cloud for multimedia processing and delivery.Examples include 3D content (stereo vision,360�virtual reality),interactive content, server-assisted multi-party conferencing and gaming,and large-scale visual recognition.Microsoft Azure Cognitive Services APIs and Google Cloud Vision,Speech,and NLP APIs are just beginning to scratch the surface of what will be possible when multimedia meets the cloud.In addition,the proliferation of mobile devices which need assistance from the cloud for multimedia applications keeps increasing.In this workshop,we aim to provide a forum for research which includes both multimedia services (recognition,processing,coding,delivery)running in the cloud as well as multimedia applications which utilize them. High quality research in all areas related to multimedia and the cloud are solicited.Potential topics of interest are the following.Cloud-assisted multimedia content ingestion,processing,coding,storage,and delivery;Multi-party conferencing and gaming;Interactive client-server multimedia applications;Cloud-assisted virtual reality and augmented reality applications;Multimedia recognition in the cloud and hybrid cloud/device recognition;Multimedia social applications and content sharing utilizing the cloud;Cloud resource management issues specific to multimedia;Privacy/access control for cloud hosted multimedia content;Multimedia big data processing in the cloud;Mobile multimedia cloud applications and stream analytics. Website:http://icme2017-cloudmm.azurewebsites.net/main2.html
及识别[J]. 红外与激光工程, 1999, 28(4): 37-39. LING Xufeng, YANG Jie, YANG Yong. Curvature⁃feature⁃ based method for human face classification and recognition [J]. Infrared and laser engineering, 1999, 28(4): 37-39. [8]杜立强, 贾鹏, 周宗潭, 等. 基于主动形状模型的人脸 脸型自动分类算法[ J]. 计算机应用, 2009, 29 ( 10): 2710-2712, 2715. DU Liqiang, JIA Peng, ZHOU Zongtan, et al. Human face shape classification method based on active shape model [J]. Journal of computer applications, 2009, 29 ( 10 ): 2710-2712, 2715. [9] KIM S W, OOMMEN B J. On using prototype reduction schemes to optimize kernel⁃based fisher discriminant analysis[J]. IEEE transactions on systems, man, and cybernetics, part B ( cybernetics ), 2008, 38 ( 2 ): 564-570. [10]GAO Wen, GAO Bo, SHAN Shiguang, et al. The CAS⁃ PEAL large⁃scale Chinese face database and baseline evaluations[J]. IEEE transactions on systems, man, and cybernetics—part A: systems and humans, 2008, 38(1): 149-161. [11] SARAKON P, CHAROENPONG T, CHAROENSIRIWATH S. Face shape classification from 3D human data by using SVM [ C ] / / Proceedings of the 7th Biomedical Engineering International Conference. Fukuoka, Japan, 2014: 1-5. 作者简介: 孙劲光,女,1962 年生,博士,教授, 博士生导师,计算机学会( CCF) 会员 (21314S),主要研究方向为计算机图像 处理、计算机图形学、知识工程。 邓智硕,男,1992 年生,硕士研究 生,研究方向为计算机图像处理。 2017 多媒体和云研讨会 Multimedia and the Cloud 2017 The proliferation of cloud computing and storage infrastructure as well cloud services provides a rich platform for multimedia researchers and developers to innovate new applications and services which would not have been possible before. For example, video streaming of high⁃definition content has now reached a fairly mature state. However, going forward we will only see an increase in multimedia applications which will require assistance from the cloud for multimedia processing and delivery. Examples include 3D content (stereo vision, 360&#65533; virtual reality), interactive content, server⁃assisted multi⁃party conferencing and gaming, and large⁃scale visual recognition. Microsoft Azure 抯 Cognitive Services APIs and Google Cloud 抯 Vision, Speech, and NLP APIs are just beginning to scratch the surface of what will be possible when multimedia meets the cloud. In addition, the proliferation of mobile devices which need assistance from the cloud for multimedia applications keeps increasing. In this workshop, we aim to provide a forum for research which includes both multimedia services (recognition, processing, coding, delivery) running in the cloud as well as multimedia applications which utilize them. High quality research in all areas related to multimedia and the cloud are solicited. Potential topics of interest are the following.Cloud⁃assisted multimedia content ingestion, processing, coding, storage, and delivery;Multi⁃party conferencing and gaming; Interactive client⁃server multimedia applications; Cloud⁃assisted virtual reality and augmented reality applications;Multimedia recognition in the cloud and hybrid cloud / device recognition;Multimedia social applications and content sharing utilizing the cloud;Cloud resource management issues specific to multimedia;Privacy / access control for cloud hosted multimedia content;Multimedia big data processing in the cloud;Mobile multimedia cloud applications and stream analytics. Website:http: / / icme2017⁃cloudmm.azurewebsites.net / main2.html 第 1 期 孙劲光,等:局部特征脸型分类方法 ·109·