【机器感知与模式识别】基于嘴巴状态约束的人脸特征点定位算法

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：2.52MB

第11卷第5期智能系统学报 Vol.11 No.5 2016年10月 CAAI Transactions on Intelligent Systems 0ct.2016 D0I:10.11992/is.201602006 网络出版地址：htp:/nww.cnki.net/kcms/detail/23.1538.TP.20160718.1522.010.html 基于嘴巴状态约束的人脸特征点定位算法师亚亭，李卫军，宁欣，董肖莉，张丽萍 (中国科学院半导体研究所高速电路与神经网络实验室，北京100083) 摘要：嘴巴区域特征点的精确定位对于特征匹配、表情分析、唇形识别、驾驶行为分析等应用具有极其关键的作用。然而，用现有的人脸特征点定位算法进行人脸形状估计时，嘴巴区域特征点的定位误差相对较大。针对这一问题，提出了基于H$V颜色空间和基于卷积神经网络的两种嘴巴状态分类器以及一种基于局部特征点位置关系的强形状约束策略，并在此基础上提出了基于嘴巴状态约束的人脸特征点定位算法，根据嘴巴状态标签对显式形状回归 ESR算法的估计结果进行约束以获得更加准确的特征的位置。相比传统的ESR算法，该方法在保障人脸形状定位鲁棒性的同时，在Helen数据库和LFPW数据库上的嘴巴特征点定位准确度均明显提高。关键词：人脸特征点定位；ESR;嘴巴状态分类器：强形状约束；HSV颜色空间；卷积神经网络中图分类号：TP183文献标志码：A文章编号：1673-4785(2016)05-0578-08 中文引用格式：师亚亭，李卫军，宁欣，等.基于嘴巴状态约束的人脸特征点定位算法[J].智能系统学报，2016,11(5)：578-585. 英文引用格式：SHI Yating,LI Weijun,NING Xin,etal.A facial feature point locating algorithm based on mouth--state constraints [J].CAAI transactions on intelligent systems,2016,11(5):578-585. A facial feature point locating algorithm based on mouth-state constraints SHI Yating,LI Weijun,NING Xin,DONG Xiaoli,ZHANG Liping Institute of Semiconductors,Chinese Academy of Sciences,Beijing 100083,China) Abstract:The precise locations of the feature points of the mouth critically influence applications which use feature matching,expression analysis,lip recognition and driving behavior analysis,etc.However,when estimating facial shapes using current facial landmarks detecting methods,the locating error of feature points around the mouth re- gion is relatively large.In order to solve this problem,two kinds of 'mouth-state'classifiers were proposed,one was based on HSV color space and the other on a convolutional neural network,with a strong shape constraint strat- egy focusing on the spatial relationship between local facial landmarks.Furthermore a facial feature point locating method was presented based on the mouth-state constraint,which constrains the predicted explicit shape regression (ESR)result and is more accurate as regards locating facial landmarks.Compared with the original ESR algorithm, this method significantly improves the accuracy of locating landmarks for the mouth for both the Helen and LFPW datasets,and has no impact on the robustness of facial shape prediction. Keywords:facial feature points location;ESR;mouth-state classifier;strong shape constraint;HSV color space; convolutional neural network 随着个人照片在移动设备和互联网上的方便呈精确定位十分重要。在实际生活中，嘴巴形状的预现及传播，人脸对齐算法的应用也越来越广泛。对测会受到光照、遮挡、噪声以及个人唇色（肤色以及于特征匹配、表情分析及变换、唇形识别以及疲劳驾妆容)的影响。此外，同一个人的嘴巴形状也因为驶检测等人脸对齐算法的应用，嘴巴区域特征点的讲话、表情的变化以及姿态的不同而不同。这些因素都可能引起在人脸形状向量估计过程中嘴巴特征收稿日期：2016-02-06.网络出版日期：2016-07-18. 点的定位错误。为了解决这一问题，本文提出了一基金项目：国家自然科学基金项目(61572458). 通信作者：李卫军.E-mail:wji@scmi.ac.cn. 种基于嘴巴状态约束的人脸特征点定位算法，使得

第１１卷第５期智能系统学报Ｖｏｌ．１１ №．５２０１６年１０月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＯｃｔ．２０１６ＤＯＩ：１０．１１９９２／ｔｉｓ．２０１６０２００６网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１６０７１８．１５２２．０１０．ｈｔｍｌ基于嘴巴状态约束的人脸特征点定位算法师亚亭，李卫军，宁欣，董肖莉，张丽萍（中国科学院半导体研究所高速电路与神经网络实验室，北京１０００８３）摘要：嘴巴区域特征点的精确定位对于特征匹配、表情分析、唇形识别、驾驶行为分析等应用具有极其关键的作用。然而，用现有的人脸特征点定位算法进行人脸形状估计时，嘴巴区域特征点的定位误差相对较大。针对这一问题，提出了基于ＨＳＶ颜色空间和基于卷积神经网络的两种嘴巴状态分类器以及一种基于局部特征点位置关系的强形状约束策略，并在此基础上提出了基于嘴巴状态约束的人脸特征点定位算法，根据嘴巴状态标签对显式形状回归ＥＳＲ算法的估计结果进行约束以获得更加准确的特征的位置。相比传统的ＥＳＲ算法，该方法在保障人脸形状定位鲁棒性的同时，在Ｈｅｌｅｎ数据库和ＬＦＰＷ数据库上的嘴巴特征点定位准确度均明显提高。关键词：人脸特征点定位；ＥＳＲ；嘴巴状态分类器；强形状约束；ＨＳＶ颜色空间；卷积神经网络中图分类号：ＴＰ１８３文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１６）０５⁃０５７８⁃０８中文引用格式：师亚亭，李卫军，宁欣，等．基于嘴巴状态约束的人脸特征点定位算法［Ｊ］．智能系统学报，２０１６，１１（５）：５７８⁃５８５．英文引用格式：ＳＨＩＹａｔｉｎｇ，ＬＩＷｅｉｊｕｎ，ＮＩＮＧＸｉｎ，ｅｔａｌ．Ａｆａｃｉａｌｆｅａｔｕｒｅｐｏｉｎｔｌｏｃａｔｉｎｇａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｍｏｕｔｈ⁃ｓｔａｔｅｃｏｎｓｔｒａｉｎｔｓ［Ｊ］．ＣＡＡＩｔｒａｎｓａｃｔｉｏｎｓｏｎｉｎｔｅｌｌｉｇｅｎｔｓｙｓｔｅｍｓ，２０１６，１１（５）：５７８⁃５８５．Ａｆａｃｉａｌｆｅａｔｕｒｅｐｏｉｎｔｌｏｃａｔｉｎｇａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｍｏｕｔｈ⁃ｓｔａｔｅｃｏｎｓｔｒａｉｎｔｓＳＨＩＹａｔｉｎｇ，ＬＩＷｅｉｊｕｎ，ＮＩＮＧＸｉｎ，ＤＯＮＧＸｉａｏｌｉ，ＺＨＡＮＧＬｉｐｉｎｇ（ＩｎｓｔｉｔｕｔｅｏｆＳｅｍｉｃｏｎｄｕｃｔｏｒｓ，ＣｈｉｎｅｓｅＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓ，Ｂｅｉｊｉｎｇ１０００８３，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｔｈｅｐｒｅｃｉｓｅｌｏｃａｔｉｏｎｓｏｆｔｈｅｆｅａｔｕｒｅｐｏｉｎｔｓｏｆｔｈｅｍｏｕｔｈｃｒｉｔｉｃａｌｌｙｉｎｆｌｕｅｎｃｅａｐｐｌｉｃａｔｉｏｎｓｗｈｉｃｈｕｓｅｆｅａｔｕｒｅｍａｔｃｈｉｎｇ，ｅｘｐｒｅｓｓｉｏｎａｎａｌｙｓｉｓ，ｌｉｐｒｅｃｏｇｎｉｔｉｏｎａｎｄｄｒｉｖｉｎｇｂｅｈａｖｉｏｒａｎａｌｙｓｉｓ，ｅｔｃ．Ｈｏｗｅｖｅｒ，ｗｈｅｎｅｓｔｉｍａｔｉｎｇｆａｃｉａｌｓｈａｐｅｓｕｓｉｎｇｃｕｒｒｅｎｔｆａｃｉａｌｌａｎｄｍａｒｋｓｄｅｔｅｃｔｉｎｇｍｅｔｈｏｄｓ，ｔｈｅｌｏｃａｔｉｎｇｅｒｒｏｒｏｆｆｅａｔｕｒｅｐｏｉｎｔｓａｒｏｕｎｄｔｈｅｍｏｕｔｈｒｅ⁃ ｇｉｏｎｉｓｒｅｌａｔｉｖｅｌｙｌａｒｇｅ．Ｉｎｏｒｄｅｒｔｏｓｏｌｖｅｔｈｉｓｐｒｏｂｌｅｍ，ｔｗｏｋｉｎｄｓｏｆ ‘ｍｏｕｔｈ⁃ｓｔａｔｅ’ ｃｌａｓｓｉｆｉｅｒｓｗｅｒｅｐｒｏｐｏｓｅｄ，ｏｎｅｗａｓｂａｓｅｄｏｎＨＳＶｃｏｌｏｒｓｐａｃｅａｎｄｔｈｅｏｔｈｅｒｏｎａｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ，ｗｉｔｈａｓｔｒｏｎｇｓｈａｐｅｃｏｎｓｔｒａｉｎｔｓｔｒａｔ⁃ ｅｇｙｆｏｃｕｓｉｎｇｏｎｔｈｅｓｐａｔｉａｌｒｅｌａｔｉｏｎｓｈｉｐｂｅｔｗｅｅｎｌｏｃａｌｆａｃｉａｌｌａｎｄｍａｒｋｓ．Ｆｕｒｔｈｅｒｍｏｒｅａｆａｃｉａｌｆｅａｔｕｒｅｐｏｉｎｔｌｏｃａｔｉｎｇｍｅｔｈｏｄｗａｓｐｒｅｓｅｎｔｅｄｂａｓｅｄｏｎｔｈｅｍｏｕｔｈ⁃ｓｔａｔｅｃｏｎｓｔｒａｉｎｔ，ｗｈｉｃｈｃｏｎｓｔｒａｉｎｓｔｈｅｐｒｅｄｉｃｔｅｄｅｘｐｌｉｃｉｔｓｈａｐｅｒｅｇｒｅｓｓｉｏｎ（ＥＳＲ）ｒｅｓｕｌｔａｎｄｉｓｍｏｒｅａｃｃｕｒａｔｅａｓｒｅｇａｒｄｓｌｏｃａｔｉｎｇｆａｃｉａｌｌａｎｄｍａｒｋｓ．ＣｏｍｐａｒｅｄｗｉｔｈｔｈｅｏｒｉｇｉｎａｌＥＳＲａｌｇｏｒｉｔｈｍ，ｔｈｉｓｍｅｔｈｏｄｓｉｇｎｉｆｉｃａｎｔｌｙｉｍｐｒｏｖｅｓｔｈｅａｃｃｕｒａｃｙｏｆｌｏｃａｔｉｎｇｌａｎｄｍａｒｋｓｆｏｒｔｈｅｍｏｕｔｈｆｏｒｂｏｔｈｔｈｅＨｅｌｅｎａｎｄＬＦＰＷｄａｔａｓｅｔｓ，ａｎｄｈａｓｎｏｉｍｐａｃｔｏｎｔｈｅｒｏｂｕｓｔｎｅｓｓｏｆｆａｃｉａｌｓｈａｐｅｐｒｅｄｉｃｔｉｏｎ．Ｋｅｙｗｏｒｄｓ：ｆａｃｉａｌｆｅａｔｕｒｅｐｏｉｎｔｓｌｏｃａｔｉｏｎ；ＥＳＲ；ｍｏｕｔｈ⁃ｓｔａｔｅｃｌａｓｓｉｆｉｅｒ；ｓｔｒｏｎｇｓｈａｐｅｃｏｎｓｔｒａｉｎｔ；ＨＳＶｃｏｌｏｒｓｐａｃｅ；ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ收稿日期：２０１６⁃０２⁃０６．网络出版日期：２０１６⁃０７⁃１８．基金项目：国家自然科学基金项目（６１５７２４５８）．通信作者：李卫军．Ｅ⁃ｍａｉｌ：ｗｊｌｉ＠ｓｅｍｉ．ａｃ．ｃｎ．随着个人照片在移动设备和互联网上的方便呈现及传播，人脸对齐算法的应用也越来越广泛。对于特征匹配、表情分析及变换、唇形识别以及疲劳驾驶检测等人脸对齐算法的应用，嘴巴区域特征点的精确定位十分重要。在实际生活中，嘴巴形状的预测会受到光照、遮挡、噪声以及个人唇色（肤色以及妆容）的影响。此外，同一个人的嘴巴形状也因为讲话、表情的变化以及姿态的不同而不同。这些因素都可能引起在人脸形状向量估计过程中嘴巴特征点的定位错误。为了解决这一问题，本文提出了一种基于嘴巴状态约束的人脸特征点定位算法，使得

第5期师亚亭，等：基于嘴巴状态约束的人脸特征点定位算法 ·579. 预测人脸形状中嘴巴区域的特征点位置更加接近真嘴巴状态分类器获取嘴巴状态标签，并在ESR定位实情况。回归过程中对每次回归的结果进行强形状约束，达 1 相关算法到人脸形状估计中嘴巴特征点的精确定位。人脸特征点定位算法是一项很有挑战性并且值 2算法流程得深入研究的工作。主动形状模型(active shape 2.1算法框架 model,ASM)[]和主动表观模型(active appearance 本文算法框架如图2所示。输入一副人脸图 model,AAM)[2是最经典并被广泛使用的人脸对齐像，1)通过一个定位7个关键角点的ESR人脸对齐算法，主要通过调整模型的参数来不断优化误差函算法找出嘴角点，以嘴角点横向距离的1.3倍为宽，数，进而进行形状估计。近年来，基于回归的算截取1：2高宽比的嘴巴矩形区域送入嘴巴状态分类法[取得了令人满意的定位效果。他们通过大批器：2)嘴巴状态分类器将送入的嘴巴区域图像分为量的训练数据来学习一个级联回归模型，将图像特不同的状态。其中，基于H$V的嘴巴状态分类器将征直接映射为最终的人脸形状。相比经典的ASM 嘴巴分为张开与非张开：基于卷积神经网络的分类和AAM,基于回归的人脸特征点算法对初始化依赖器将嘴巴分为张开、闭合与微张：3)根据获取的嘴较小，并且具有定位速度快、定位准确度高的优点。巴状态标签，结合输入的人脸图像，在训练好的定位无论是ASM、AAM及其相关的改进算法[7)，还 68个点的E$R人脸对齐算法模型回归过程中，加入是成为研究热点的回归算法，在人脸对齐过程中，特与获取嘴巴状态标签对应的嘴巴特征点强形状约征点的更新都依赖于特征点周围图像的灰度梯度特束，得到最终的人脸形状。接下来介绍与本文方法征。人脸特征点定位算法的目标是达到估计形状与相关的ESR人脸对齐算法、嘴巴状态分类器以及强人脸真实形状的误差最小，而并不保障每一个特征形状约束策略的应用细节。点的精确定位。对于灰度梯度特征不明显或者可能输入图像 7关键角点输出人脸形状性较多的区域（如轮廓、嘴巴），局部区域的定位误获取嘴巴区城差相对较大（如图1）。 0.12 0.10 0.08 状态 006 基于CNN 嘴巴状态标签强形状约束 0.04 分类器特征点定位 0.02 基于HSV 轮廓眉毛眼睛鼻子嘴巴图2本文算法流程人脸部位 Fig.2 Algorithm flow chart 图1不同部位人脸特征点误差 2.2ESR人脸对齐算法 Fig.1 Facial landmarks error in different region ESR人脸对齐算法是一个双层级联的booste-d 许多局部特征点的定位优化都是基于人脸形状 (增强)回归模型，由级联姿态回归算法(cascaded 的估计结果，进行进一步的修正以达到精确化的目 pose regression,CPR)[o发展而来。ESR模型的学标。文献[10]在用人脸对齐算法得到人脸轮廓后，习与人脸灰度图像、初始化形状以及真实人脸形状又通过启发式的边界响应来移动组成轮廓的特征点直接相关。ESR算法结构如图3所示，模型第一层位置。文献「111通过融合AAM和在线肤色纹理特以逐层添加的形式将T个回归器(R,R2,…,R)连征实现低分辨率图像中眼睛区域的精确定位。文献接，每一个回归器R,由K个弱回归器(r1,'2,…,「x) [12]在检测出特征区域后，用外包点集进行曲线拟连接而成，组成模型的第2层。在每个第1层回归合来调整边缘点。此外，文献[9]提出将局部ASM 器中，随机选择P个候选特征点，并将其位置用局与全局ASM结合的多模板ASM方法以提高单一模部坐标)表示，然后将候选特征点的灰度值两两相型对局部区域特征点定位的准确度。然而，这些算法减组成P2灰度差分特征送入第2层弱回归器。每都没有针对性的解决嘴巴特征点定位错误的情况。个第2层弱回归器根据选中的F个特征和阈值将本文从消除嘴巴特征点定位错误的角度出发，特征空间（所有训练样本）划分到2个容器中，由基于计算简单、定位速度快、准确度高且无参的显示每个容器输出更新形状8，计算方法如公式(1)、形状回归算法(explicit shape regression,ESR),通过 (2)所示

预测人脸形状中嘴巴区域的特征点位置更加接近真实情况。１相关算法人脸特征点定位算法是一项很有挑战性并且值得深入研究的工作。主动形状模型（ａｃｔｉｖｅｓｈａｐｅｍｏｄｅｌ，ＡＳＭ）［１］和主动表观模型（ａｃｔｉｖｅａｐｐｅａｒａｎｃｅｍｏｄｅｌ，ＡＡＭ）［２］是最经典并被广泛使用的人脸对齐算法，主要通过调整模型的参数来不断优化误差函数，进而进行形状估计。近年来，基于回归的算法［３⁃６］取得了令人满意的定位效果。他们通过大批量的训练数据来学习一个级联回归模型，将图像特征直接映射为最终的人脸形状。相比经典的ＡＳＭ和ＡＡＭ，基于回归的人脸特征点算法对初始化依赖较小，并且具有定位速度快、定位准确度高的优点。无论是ＡＳＭ、ＡＡＭ及其相关的改进算法［７⁃９］，还是成为研究热点的回归算法，在人脸对齐过程中，特征点的更新都依赖于特征点周围图像的灰度梯度特征。人脸特征点定位算法的目标是达到估计形状与人脸真实形状的误差最小，而并不保障每一个特征点的精确定位。对于灰度梯度特征不明显或者可能性较多的区域（如轮廓、嘴巴），局部区域的定位误差相对较大（如图１）。图１不同部位人脸特征点误差Ｆｉｇ．１Ｆａｃｉａｌｌａｎｄｍａｒｋｓｅｒｒｏｒｉｎｄｉｆｆｅｒｅｎｔｒｅｇｉｏｎ许多局部特征点的定位优化都是基于人脸形状的估计结果，进行进一步的修正以达到精确化的目标。文献［１０］在用人脸对齐算法得到人脸轮廓后，又通过启发式的边界响应来移动组成轮廓的特征点位置。文献［１１］通过融合ＡＡＭ和在线肤色纹理特征实现低分辨率图像中眼睛区域的精确定位。文献［１２］在检测出特征区域后，用外包点集进行曲线拟合来调整边缘点。此外，文献［９］提出将局部ＡＳＭ与全局ＡＳＭ结合的多模板ＡＳＭ方法以提高单一模型对局部区域特征点定位的准确度。然而，这些算法都没有针对性的解决嘴巴特征点定位错误的情况。本文从消除嘴巴特征点定位错误的角度出发，基于计算简单、定位速度快、准确度高且无参的显示形状回归算法（ｅｘｐｌｉｃｉｔｓｈａｐｅｒｅｇｒｅｓｓｉｏｎ，ＥＳＲ），通过嘴巴状态分类器获取嘴巴状态标签，并在ＥＳＲ定位回归过程中对每次回归的结果进行强形状约束，达到人脸形状估计中嘴巴特征点的精确定位。２算法流程２．１算法框架本文算法框架如图２所示。输入一副人脸图像，１）通过一个定位７个关键角点的ＥＳＲ人脸对齐算法找出嘴角点，以嘴角点横向距离的１．３倍为宽，截取１：２高宽比的嘴巴矩形区域送入嘴巴状态分类器；２）嘴巴状态分类器将送入的嘴巴区域图像分为不同的状态。其中，基于ＨＳＶ的嘴巴状态分类器将嘴巴分为张开与非张开；基于卷积神经网络的分类器将嘴巴分为张开、闭合与微张；３）根据获取的嘴巴状态标签，结合输入的人脸图像，在训练好的定位６８个点的ＥＳＲ人脸对齐算法模型回归过程中，加入与获取嘴巴状态标签对应的嘴巴特征点强形状约束，得到最终的人脸形状。接下来介绍与本文方法相关的ＥＳＲ人脸对齐算法、嘴巴状态分类器以及强形状约束策略的应用细节。图２本文算法流程Ｆｉｇ．２Ａｌｇｏｒｉｔｈｍｆｌｏｗｃｈａｒｔ２．２ＥＳＲ人脸对齐算法ＥＳＲ人脸对齐算法是一个双层级联的ｂｏｏｓｔｅ⁃ｄ（增强）回归模型，由级联姿态回归算法（ｃａｓｃａｄｅｄｐｏｓｅｒｅｇｒｅｓｓｉｏｎ，ＣＰＲ）［６］发展而来。ＥＳＲ模型的学习与人脸灰度图像、初始化形状以及真实人脸形状直接相关。ＥＳＲ算法结构如图３所示，模型第一层以逐层添加的形式将Ｔ个回归器（Ｒ１，Ｒ２，…，ＲＴ）连接，每一个回归器Ｒｔ由Ｋ个弱回归器（ｒ１，ｒ２，…，ｒＫ）连接而成，组成模型的第２层。在每个第１层回归器中，随机选择Ｐ个候选特征点，并将其位置用局部坐标［３］表示，然后将候选特征点的灰度值两两相减组成Ｐ２灰度差分特征送入第２层弱回归器。每个第２层弱回归器根据选中的Ｆ个特征和阈值将特征空间（所有训练样本）划分到２Ｆ个容器中，由每个容器输出更新形状 δＳ，计算方法如公式（１）、（２）所示。第５期师亚亭，等：基于嘴巴状态约束的人脸特征点定位算法 ·５７９·

·580 智能系统学报第11卷 d。=argmin∑I5.-(S,+6,)1 (1) ien &=2(③-S) 2 (2) 式中：2为落入某个容器中的训练样本个数，S、S 为第i个样本的真实形状和预测形状。式(3)为形状更新公式，S表示更新后的形状，S-表示上一个回归器的预测形状。图5ESR回归过程特征点位置 S=S-1+6 (3) Fig.5 Landmarks locations during the ESR regression S-RR 2.3.2基于HSV颜色空间的嘴巴状态分类器牙齿区域与周围像素的颜色有着明显的区别，主要呈现为白色。在实际中，很大一部分嘴巴张开的情况下是露出牙齿的，因此可以通过在颜色空间 SS+d=S+dS=S+d网中区分白色区域确定一部分嘴巴张开的情况。在图图3ESR算法结构示意图像颜色空间中，HSV颜色空间]最能反应眼睛对颜 Fig.3 Structure of ESR algorithm 色的感知，相比红绿蓝(red green blue,RGB)这种不均在测试过程中，ESR算法随机为测试样本选择匀的颜色空间而言，更适用于基于颜色的图像分割，相 M个初始形状，并取M个预测结果的平均值作为最比其他的图像分割算法也具有简单、快速的特点。终的人脸预测形状S,如式(4)： HSV颜色空间模型如图6所示，可以看作是一 ∑R(I,s9) (4) 个倒置圆锥体，其中，H表示色调，S表示饱和度，V 2.3嘴巴状态分类器表示亮度。根据Androutsos等4对HSV颜色空间 2.3.1嘴巴区域提取的划分，亮度大于75%并且饱和度小于20%为白色 ESR的特征点位置预测时间主要与候选特征点区域。在本文中将饱和度和亮度均转换到个数以及回归层数有关[)，其定位精度由粗到细。 [0,255],并将饱和度范围在[0,35]、亮度区间为图4为当第1层回归器个数T=10时，ESR算法在 [200,255]的像素点划定为白色点。在HSV颜色空定位进行到不同阶数的第1层回归器时得到的误差间中遍历嘴巴区域的色彩信息，计算白色像素点的统计结果。可以看出，在第3层回归时特征点位置已经基本确定，之后的回归误差下降已经不多，主要累计值，当累计值大于阈值μ时，将嘴巴判定为张开是特征点位置的微调（图5）。因此，本文在提取嘴的状态：否则，嘴巴状态标签为非张开。巴区域时仅将回归进行到T=3。由于划定区域并不需要细节特征点，我们预先训练一个包含7个关键角点（图2）的ESR定位模型找出嘴角位置，然后绿(120》 1.0 黄按照2.1中的方法获取嘴巴区域图像，送入嘴巴状红(0) 态分类器中。蓝(240) 品红 0.16 0.14 0.12 0.10 0.08 0.06 0 0.04 图6HSV颜色空间 0.02 Fig.6 HSV color space 12345678910 2.3.3基于CNN的嘴巴状态分类器回归阶数图4ESR定位过程误差使用HSV颜色空间进行判别具有计算简单、直 Fig.4 Error in each stage during running ESR 接的特点，但因为拍照环境的影响，牙齿可能存在偏

δＳ＝ａｒｇｍｉｎ δＳ ∑ｉ∈Ω ‖ Ｓ＾ｉ－Ｓｉ＋ δＳ ( ) ‖ （１） δＳ＝ Σｉ∈Ω（Ｓ＾ｉ－Ｓｉ） Ω （２）式中：Ω 为落入某个容器中的训练样本个数，Ｓ＾ｉ、Ｓｉ为第ｉ个样本的真实形状和预测形状。式（３）为形状更新公式，Ｓｔ表示更新后的形状，Ｓｔ－１表示上一个回归器的预测形状。Ｓｔ＝Ｓｔ－１＋ δＳ（３）图３ＥＳＲ算法结构示意图Ｆｉｇ．３ＳｔｒｕｃｔｕｒｅｏｆＥＳＲａｌｇｏｒｉｔｈｍ在测试过程中，ＥＳＲ算法随机为测试样本选择Ｍ个初始形状，并取Ｍ个预测结果的平均值作为最终的人脸预测形状Ｓｐｒｅｄｉｃｔ，如式（４）：Ｓｐｒｅｄｉｃｔ＝１Ｍ ∑ Ｍｍ＝１ＲＩ，Ｓ０ｍ ( ) （４）２．３嘴巴状态分类器２．３．１嘴巴区域提取ＥＳＲ的特征点位置预测时间主要与候选特征点个数以及回归层数有关［３］，其定位精度由粗到细。图４为当第１层回归器个数Ｔ＝１０时，ＥＳＲ算法在定位进行到不同阶数的第１层回归器时得到的误差统计结果。可以看出，在第３层回归时特征点位置已经基本确定，之后的回归误差下降已经不多，主要是特征点位置的微调（图５）。因此，本文在提取嘴巴区域时仅将回归进行到Ｔ＝３。由于划定区域并不需要细节特征点，我们预先训练一个包含７个关键角点（图２）的ＥＳＲ定位模型找出嘴角位置，然后按照２．１中的方法获取嘴巴区域图像，送入嘴巴状态分类器中。图４ＥＳＲ定位过程误差Ｆｉｇ．４ＥｒｒｏｒｉｎｅａｃｈｓｔａｇｅｄｕｒｉｎｇｒｕｎｎｉｎｇＥＳＲ图５ＥＳＲ回归过程特征点位置Ｆｉｇ．５ＬａｎｄｍａｒｋｓｌｏｃａｔｉｏｎｓｄｕｒｉｎｇｔｈｅＥＳＲｒｅｇｒｅｓｓｉｏｎ２．３．２基于ＨＳＶ颜色空间的嘴巴状态分类器牙齿区域与周围像素的颜色有着明显的区别，主要呈现为白色。在实际中，很大一部分嘴巴张开的情况下是露出牙齿的，因此可以通过在颜色空间中区分白色区域确定一部分嘴巴张开的情况。在图像颜色空间中，ＨＳＶ颜色空间［１３］最能反应眼睛对颜色的感知，相比红绿蓝（ｒｅｄｇｒｅｅｎｂｌｕｅ，ＲＧＢ）这种不均匀的颜色空间而言，更适用于基于颜色的图像分割，相比其他的图像分割算法也具有简单、快速的特点。ＨＳＶ颜色空间模型如图６所示，可以看作是一个倒置圆锥体，其中，Ｈ表示色调，Ｓ表示饱和度，Ｖ表示亮度。根据Ａｎｄｒｏｕｔｓｏｓ等［１４］对ＨＳＶ颜色空间的划分，亮度大于７５％并且饱和度小于２０％为白色区域。在本文中将饱和度和亮度均转换到［０，２５５］，并将饱和度范围在［０，３５］、亮度区间为［２００，２５５］的像素点划定为白色点。在ＨＳＶ颜色空间中遍历嘴巴区域的色彩信息，计算白色像素点的累计值，当累计值大于阈值 μ 时，将嘴巴判定为张开的状态；否则，嘴巴状态标签为非张开。图６ＨＳＶ颜色空间Ｆｉｇ．６ＨＳＶｃｏｌｏｒｓｐａｃｅ２．３．３基于ＣＮＮ的嘴巴状态分类器使用ＨＳＶ颜色空间进行判别具有计算简单、直接的特点，但因为拍照环境的影响，牙齿可能存在偏 ·５８０· 智能系统学报第１１卷

第5期师亚亭，等：基于嘴巴状态约束的人脸特征点定位算法 ·581· 彩色的现象，仅仅以牙齿露出时呈现白色这一先验表1基于CNN的嘴巴状态分类器信息作为分析并不完备。近年来，卷积神经网络 Table 1 Mouth state classifier based on CNN (convolutional neural network,CNN)在目标识别、图名称类型滤波器大小/步长输出像分类等图像处理领域取得了十分显著的效果，有 Input输入 16×32×3 着越来越深入的研究和应用。相对SVM等传统的分类方法，卷积神经网络是一种端到端的模型，即直 Conl,卷积层 Convolution 5x5/1 12×28×20 卷积接将最初的数据作为网络的输入，通过网络自构建的复杂函数进行特征提取、分类、回归等操作。 Pool max pooling 2×2/2 6×14×20 最大池化本文设计了一个基于CNN的嘴巴状态分类器。池化层将训练样本中的嘴巴分为张开、闭合和微张3种状 Convl2 Convolution 3×3/1 4×12×50 态，分类标准为嘴巴对称线上真实特征点的垂直距卷积层卷积离。如图7所示，对于长矩形框内的4个关键点，令 Pool max pooling 2×2/2 2×6×50 小圆圈内的两个外边缘特征点的垂直距离为D, 池化层最大池化小方框内两个内边缘特征点的垂直距离为D。当 Fer fully connection 300 D与D比值大于0.35时，将嘴巴标定为张开；小于全连接层全连接 0.1时标定为闭合：否则标定为微张。由于问题并 Fez fully connection 不复杂且输人图像不大，参考LeNet--51s]架构设计全连接层全连接网络，网络结构如表1所示，使用ReLU(rectified lin- Cost Softmaxwithloss ear units)[16函数作为激活函数，除最后一个全连接损失层 Softmax损失层层fc2外，卷积层conv1、conv2和全连接层fc,都接有 2.4 强形状约束定位激活函数。对于训练样本（嘴巴图像），使用平移和在人脸对齐算法中，不同部位人脸特征点之间旋转实现简单的对齐，然后将尺寸调整为16×32并的位置关系（形状约束）作为一个隐含的先验用于将像素值归一化到[0,1]。训练数据按9：1划分为特征点的估计中。这种形状约束是人脸固有的特训练集和验证集，使用随机梯度下降法训练网络，初征，如眼晴位置应在眉毛的下方，鼻子应在嘴巴上始学习率为0.01，随着迭代次数的增加按比例衰减，方，这里，称其为弱形状约束。然而，对于具体的状当网络在验证集上的分类准确率不再上升时停止训态细节，例如眼晴睁闭、嘴巴张闭时，局部区域特征练。网络训练完成后，输入嘴巴图像，在网络中进行点之间的位置应满足怎样的距离关系，弱形状约束一次前传获取嘴巴状态标签。该嘴巴状态分类器的并未涉及。在2.3节中使用嘴巴状态分类器得到了具体设计参数以及数据流（每个层的输出）均在表1 嘴巴状态标签，针对不同的嘴巴状态，可以在人脸形中展示。状估计过程中对嘴巴区域特征点进行强形状约束。 52 算法流程如图8所示。 50 将测试图像以及嘴巴状态标签作为输入，并加米载训练好的模型，然后在形状回归估计过程中为每 49 米米 62 6 米65 米55 6 6 66 一个回归器的形状更新添加如式(5)所示的强形状米约束： S=S-1+8S-1,t={1,2,…,T} 9 > S.tD。>入.Dm,A。∈(0,1) (5) 58 S.tDm<入.Dm,入。∈(0,1) 图7嘴巴特征点示意图式中：D。、D分别表示上下嘴唇内边缘特征点对之 Fig.7 Mouth keypoints 间的垂直距离和外边缘特征点对之间的垂直距离

彩色的现象，仅仅以牙齿露出时呈现白色这一先验信息作为分析并不完备。近年来，卷积神经网络（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ，ＣＮＮ）在目标识别、图像分类等图像处理领域取得了十分显著的效果，有着越来越深入的研究和应用。相对ＳＶＭ等传统的分类方法，卷积神经网络是一种端到端的模型，即直接将最初的数据作为网络的输入，通过网络自构建的复杂函数进行特征提取、分类、回归等操作。本文设计了一个基于ＣＮＮ的嘴巴状态分类器。将训练样本中的嘴巴分为张开、闭合和微张３种状态，分类标准为嘴巴对称线上真实特征点的垂直距离。如图７所示，对于长矩形框内的４个关键点，令小圆圈内的两个外边缘特征点的垂直距离为Ｄｏｕ，小方框内两个内边缘特征点的垂直距离为Ｄｉｎ。当Ｄｉｎ与Ｄｏｕ比值大于０．３５时，将嘴巴标定为张开；小于０．１时标定为闭合；否则标定为微张。由于问题并不复杂且输入图像不大，参考ＬｅＮｅｔ⁃５［１５］架构设计网络，网络结构如表１所示，使用ＲｅＬＵ（ｒｅｃｔｉｆｉｅｄｌｉｎ⁃ ｅａｒｕｎｉｔｓ）［１６］函数作为激活函数，除最后一个全连接层ｆｃ２外，卷积层ｃｏｎｖ１、ｃｏｎｖ２和全连接层ｆｃ１都接有激活函数。对于训练样本（嘴巴图像），使用平移和旋转实现简单的对齐，然后将尺寸调整为１６×３２并将像素值归一化到［０，１］。训练数据按９：１划分为训练集和验证集，使用随机梯度下降法训练网络，初始学习率为０．０１，随着迭代次数的增加按比例衰减，当网络在验证集上的分类准确率不再上升时停止训练。网络训练完成后，输入嘴巴图像，在网络中进行一次前传获取嘴巴状态标签。该嘴巴状态分类器的具体设计参数以及数据流（每个层的输出）均在表１中展示。图７嘴巴特征点示意图Ｆｉｇ．７Ｍｏｕｔｈｋｅｙｐｏｉｎｔｓ表１基于ＣＮＮ的嘴巴状态分类器Ｔａｂｌｅ１ＭｏｕｔｈｓｔａｔｅｃｌａｓｓｉｆｉｅｒｂａｓｅｄｏｎＣＮＮ名称类型滤波器大小／步长输出Ｉｎｐｕｔ输入 — — １６×３２×３Ｃｏｎｖｌ１卷积层Ｃｏｎｖｏｌｕｔｉｏｎ卷积５×５／１１２×２８×２０Ｐｏｏｌ１池化层ｍａｘｐｏｏｌｉｎｇ最大池化２×２／２６×１４×２０Ｃｏｎｖｌ２卷积层Ｃｏｎｖｏｌｕｔｉｏｎ卷积３×３／１４×１２×５０Ｐｏｏｌ２池化层ｍａｘｐｏｏｌｉｎｇ最大池化２×２／２２×６×５０Ｆｃ１全连接层ｆｕｌｌｙｃｏｎｎｅｃｔｉｏｎ全连接 — ３００Ｆｃ２全连接层ｆｕｌｌｙｃｏｎｎｅｃｔｉｏｎ全连接 — ３Ｃｏｓｔ损失层ＳｏｆｔｍａｘｗｉｔｈｌｏｓｓＳｏｆｔｍａｘ损失层 — １２．４强形状约束定位在人脸对齐算法中，不同部位人脸特征点之间的位置关系（形状约束）作为一个隐含的先验用于特征点的估计中。这种形状约束是人脸固有的特征，如眼睛位置应在眉毛的下方，鼻子应在嘴巴上方，这里，称其为弱形状约束。然而，对于具体的状态细节，例如眼睛睁闭、嘴巴张闭时，局部区域特征点之间的位置应满足怎样的距离关系，弱形状约束并未涉及。在２．３节中使用嘴巴状态分类器得到了嘴巴状态标签，针对不同的嘴巴状态，可以在人脸形状估计过程中对嘴巴区域特征点进行强形状约束。算法流程如图８所示。将测试图像以及嘴巴状态标签作为输入，并加载训练好的模型，然后在形状回归估计过程中为每一个回归器的形状更新添加如式（５）所示的强形状约束：Ｓｔ＝Ｓｔ－１＋ δ Ｓｔ－１，ｔ＝ {１，２，…，Ｔ} Ｓ．ｔ．Ｄｔｉｎ＞ λｏＤｔｏｕ，λｏ ∈ （０，１）Ｓ．ｔ．Ｄｔｉｎ＜ λｃＤｔｏｕ，λｃ ∈ （０，１）（５）式中：Ｄｉｎ、Ｄｏｕｔ分别表示上下嘴唇内边缘特征点对之间的垂直距离和外边缘特征点对之间的垂直距离。第５期师亚亭，等：基于嘴巴状态约束的人脸特征点定位算法 ·５８１·

·582. 智能系统学报第11卷如图9所示，点51和59、52和58、53和57为3组实际上，当嘴巴状态为张开时，内边缘特征点对外边缘特征点对，分别与点62和68、63和67、64和的垂直距离D.应大于外边缘特征点对垂直距离 66这三组内边缘特征点对相对应，图7为图9嘴巴 D的入。倍，而当嘴巴闭合时，Dn应小于D的A 区域的放大图，更直观地表示了特征点对的对应关系。倍。利用这一特征，在测试阶段的每个外层分类器得到的预测结果中，判断其是否满足式(5)的形状约束。如果满足，则继续进行下一层的估计：如果不测试图像，嘴巴状态标签满足，则对当前预测形状进行如式(6)或(7)的形状更新后再进行下一层的估计。式(6)表示嘴巴张开时加载回归器，随机选择L个的形状更新，式(7)表示嘴巴闭合时的形状更新。其训练形状作为初始形中，表示上嘴唇内边缘特征点未进行强形状约束时状，0,0 的纵坐标，Y'表示其进行强形状约束后的纵坐标。 =1+1(第个初始形状) 表示下嘴唇内边缘特征点未进行强形状约束时的纵坐标，'表示其进行强形状约束后的纵坐标。 t=+1(第个外层回归器) '=-2x(AD-Da） (6) '=+x(an-n.) 获取F个灰度差值特征，获取形状更新量S,得到新的预测形状S Y'=g+2×(Dm-Da) S满足形状约束 (7) 1 N Y'=-2×(AD。-D）根据约束条件更新S 与2.3.3中的嘴巴分类标准一致，在形状约束更新时，选取嘴巴闭合时对应的入。为0.1，嘴巴张开 Y KT 时对应的入。为0.35。由于非张开和微张这两种嘴 N 巴状态很难进行基于距离的强形状约束，因此，本文 i<L 只是对嘴巴张开、闭合状态进行强形状约束，对于基 N 于HSV的嘴巴状态分类器预测的非张开状态和基 S=SUM(S_I)/L 于CNN的嘴巴状态分类器预测的微张状态，在人脸特征点定位时则不进行强形状约束。获得估计形状 3实验分析图8形状预测流程图 3.1数据集 Fig.8 Flow diagram for shape prediction 在模型训练和测试过程中，我们共使用到3个数据库，即LFPW数据集、Helen数据集以及w-3Oo 1g1920,22 2324.25,2627 中的标记自然人脸库(annotated faces in the wild, 38,39 37 424140 843.45 …29 48)6 AFW)。这些数据集中的人脸图像包含丰富的外貌 .17 ·30 特征和人脸形状（姿态、表情），具有一定的挑战性， 2 16 31 32.3335.36 在近些年的人脸识别等研究领域中经常使用。LF 15 3 PW数据库中的图像全部通过web获取，目前可获 14 得的数据包含811个训练样本以及224个测试样 *13 本；Helen数据库中的人脸图像为分辨率较高的网 6 *12 络图像，有利于精确的人脸特征点定位研究，该数据 11 8 10 库包含330个测试样本以及2000个训练样本： AFW数据库共包含337副图像。在本文的实验中，图968特征点位置示意训练数据（以下称本文训练集）由AFW数据库以及 Fig.9 Locations of the 68 facial landmarks Helen,LFPW数据库的训练集组成，大小为3148；

如图９所示，点５１和５９、５２和５８、５３和５７为３组外边缘特征点对，分别与点６２和６８、６３和６７、６４和６６这三组内边缘特征点对相对应，图７为图９嘴巴区域的放大图，更直观地表示了特征点对的对应关系。图８形状预测流程图Ｆｉｇ．８Ｆｌｏｗｄｉａｇｒａｍｆｏｒｓｈａｐｅｐｒｅｄｉｃｔｉｏｎ图９６８特征点位置示意Ｆｉｇ．９Ｌｏｃａｔｉｏｎｓｏｆｔｈｅ６８ｆａｃｉａｌｌａｎｄｍａｒｋｓ实际上，当嘴巴状态为张开时，内边缘特征点对的垂直距离Ｄｉｎ应大于外边缘特征点对垂直距离Ｄｏｕｔ的 λｏ倍，而当嘴巴闭合时，Ｄｉｎ应小于Ｄｏｕｔ的 λｃ倍。利用这一特征，在测试阶段的每个外层分类器得到的预测结果中，判断其是否满足式（５）的形状约束。如果满足，则继续进行下一层的估计；如果不满足，则对当前预测形状进行如式（６）或（７）的形状更新后再进行下一层的估计。式（６）表示嘴巴张开时的形状更新，式（７）表示嘴巴闭合时的形状更新。其中，Ｙｕｉｎ表示上嘴唇内边缘特征点未进行强形状约束时的纵坐标，Ｙｕｉｎ ′表示其进行强形状约束后的纵坐标。Ｙｄｉｎ表示下嘴唇内边缘特征点未进行强形状约束时的纵坐标，Ｙｄｉｎ ′表示其进行强形状约束后的纵坐标。Ｙｕｉｎ ′ ＝Ｙｕｉｎ－１２ × （λｏＤｏｕ－Ｄｉｎ）Ｙｄｉｎ ′ ＝Ｙｄｉｎ＋１２ × （λｏＤｏｕ－Ｄｉｎ） ì î í ï ï ï ï （６）Ｙｕｉｎ ′ ＝Ｙｕｉｎ＋１２ × （λｃＤｏｕ－Ｄｉｎ）Ｙｄｉｎ ′ ＝Ｙｄｉｎ－１２ × （λｃＤｏｕ－Ｄｉｎ） ì î í ï ï ï ï （７）与２．３．３中的嘴巴分类标准一致，在形状约束更新时，选取嘴巴闭合时对应的 λｃ为０．１，嘴巴张开时对应的 λｏ为０．３５。由于非张开和微张这两种嘴巴状态很难进行基于距离的强形状约束，因此，本文只是对嘴巴张开、闭合状态进行强形状约束，对于基于ＨＳＶ的嘴巴状态分类器预测的非张开状态和基于ＣＮＮ的嘴巴状态分类器预测的微张状态，在人脸特征点定位时则不进行强形状约束。３实验分析３．１数据集在模型训练和测试过程中，我们共使用到３个数据库，即ＬＦＰＷ数据集、Ｈｅｌｅｎ数据集以及ｗ⁃３００中的标记自然人脸库（ａｎｎｏｔａｔｅｄｆａｃｅｓｉｎｔｈｅｗｉｌｄ，ＡＦＷ）。这些数据集中的人脸图像包含丰富的外貌特征和人脸形状（姿态、表情），具有一定的挑战性，在近些年的人脸识别等研究领域中经常使用。ＬＦ⁃ ＰＷ数据库中的图像全部通过ｗｅｂ获取，目前可获得的数据包含８１１个训练样本以及２２４个测试样本；Ｈｅｌｅｎ数据库中的人脸图像为分辨率较高的网络图像，有利于精确的人脸特征点定位研究，该数据库包含３３０个测试样本以及２０００个训练样本；ＡＦＷ数据库共包含３３７副图像。在本文的实验中，训练数据（以下称本文训练集）由ＡＦＷ数据库以及Ｈｅｌｅｎ、ＬＦＰＷ数据库的训练集组成，大小为３１４８； ·５８２· 智能系统学报第１１卷

第5期师亚亭，等：基于嘴巴状态约束的人脸特征点定位算法 ·583. 测试数据（以下称本文测试集）由LFPW、Helen数 [3]分别计算这两个测试集中定位误差在5个像素据库的测试集组成，大小为554。本文方法对每个以内和20个像素以内的样本所占百分比作为各自特征点定位误差E的评价指标为预测位置与真正的准确度。表2为LFPW测试集和Helen测试集位置的欧式距离和双眼中心真实欧式距离的比例，中，不同人脸特征点定位算法得到的内边缘特征点如式(8)所示平均准确度。可以直观地看出，本文提出的方法可 E=∥p元川以提高嘴巴特征点的定位精度，而且基于CNN的嘴 (8) ‖净-市，川巴状态分类器比基于HSV颜色空间的嘴巴状态分式中：P:表示第i个特征点的估计坐标，：表示该点类器更有利于精度的提高。表3更加清晰地统计了的真实坐标，序，市分别表示左右眼晴中心真实每个内边缘特征点的定位误差，其中，AvgPixel表示坐标。平均像素误差，即Ip,-市：‖。实际上，基于CNN的 3.2实验结果嘴巴状态分类器在测试集上的分类正确率为83%，除了已经在算法流程部分交代过的，本文实验而基于HSV颜色空间的嘴巴状态分类器为72%。的一些其他的参数选取如下：在基于HSV颜色空间这个分类正确率并不高，为了更直观地展现强形状的嘴巴状态分类器中，选择阈值4为15：本文方法约束的效果，在表4中，单独对得到正确状态标签的共需训练2个ESR模型，即仅定位7个关键角点的嘴巴内边缘特征点定位误差做了统计对比。对比表 (图2)用于嘴巴位置初选取的ESR模型和包含68 3、表4在ESR行的定位误差，发现表4中同一关键个特征点（图9）用于人脸形状估计的ESR模型。点使用同一算法(ESR)的定位误差远远小于表3，前者的训练过程包含第1个回归器个数T=10,第2 也就是说，我们的嘴巴状态分类器给出正确分类结层回归器个数K=100,候选特征点个数P=100,并果的样本恰恰是嘴巴内边缘特征点定位精度相对较仅将形状预测过程进行到T=3:后者的训练过程采高的样本。观察表4，本文算法在ESR定位准确度用文献[3]中给出的最佳参数，即第1个回归器个相对较高时，依然可以降低嘴巴内边缘特征点的定数T=10,第2层回归器个数K=500,候选特征点个位误差。大多数的人脸特征点算法的效果都与训练数P=400,测试过程则按照图8进行。数据的构成有关。对于特定类型的测试数据而言，图10为本文方法的部分实验结果。(a)表示使用与测试数据相似的训练样本集进行模型训练在直接用训练好的ESR模型获取的嘴巴特征点定位结果。可以看出，嘴唇内边缘特征点的定位存在明某种程度上可以提高模型的估计准确率。为了实验显错误：(b)表示本文方法的定位结果：(c)表示手的完备性，增加两组对比实验。在对比实验1中，用工标定的嘴巴特征点位置。可以看出，经过强形状训练好的包含68个特征点的E$R模型进行特征点约束，本文方法得到的嘴唇内边缘特征定位几乎完定位，不添加任何的后续处理，称之为OESR(oigi- 全符合真实情况，错误情况得到极大改善。 nal explicit shape regression)。对比实验2中，将本文训练集按照2.3.3中的方式分为张开、闭合、微张 3个训练集，用这3个训练数据集分别训练3个相应ESR特征点定位模型，在测试阶段根据嘴巴状态 (a)未加强形状约束的原始ES 分类器给出的标签选择相应的模型对测试图像进行特征点定位，称之为SESR(special explicit shape re- gression)。相应地，由于本文方法使用到了强形状 (b)加强形状约束的ESR 约束，在对比实验中称为CESR(constraint explicit shape regression)。3组实验每个特征点的定位误差比较如图11所示。表2内边缘特征点定位准确度 (c)手工标定 Table 2 Locating accuracy of medial lip feature points 图10嘴巴特征点定位结果 Fig.10 Detecting result of mouth landmarks 算法 ESR HSV+ESR CNN+ESR 为了分析本文提出的两种嘴巴状态分类器的效 Helen(<20 pixels) 69.1 73.3 75.6 果，对使用两种策略后嘴唇内边缘特征点的定位精度做了统计分析。由于LFPW、Helen测试图像的平 LFPW(<5 pixels) 68.7 73.3 75.5 均瞳距分别为77.772像素和285.54像素，参考文献

测试数据（以下称本文测试集）由ＬＦＰＷ、Ｈｅｌｅｎ数据库的测试集组成，大小为５５４。本文方法对每个特征点定位误差Ｅｉ的评价指标为预测位置与真正位置的欧式距离和双眼中心真实欧式距离的比例，如式（８）所示Ｅｉ＝ ‖ ｐｉ－ｐ ? ｉ‖ ‖ ｐ ? ｌ－ｐ ? ｒ‖ （８）式中：ｐｉ表示第ｉ个特征点的估计坐标，ｐ ? ｉ表示该点的真实坐标，ｐ ? ｌ，ｐ ? ｒ分别表示左右眼睛中心真实坐标。３．２实验结果除了已经在算法流程部分交代过的，本文实验的一些其他的参数选取如下：在基于ＨＳＶ颜色空间的嘴巴状态分类器中，选择阈值 μ 为１５；本文方法共需训练２个ＥＳＲ模型，即仅定位７个关键角点的（图２）用于嘴巴位置初选取的ＥＳＲ模型和包含６８个特征点（图９）用于人脸形状估计的ＥＳＲ模型。前者的训练过程包含第１个回归器个数Ｔ＝１０，第２层回归器个数Ｋ＝１００，候选特征点个数Ｐ＝１００，并仅将形状预测过程进行到Ｔ＝３；后者的训练过程采用文献［３］中给出的最佳参数，即第１个回归器个数Ｔ＝１０，第２层回归器个数Ｋ＝５００，候选特征点个数Ｐ＝４００，测试过程则按照图８进行。图１０为本文方法的部分实验结果。（ａ）表示直接用训练好的ＥＳＲ模型获取的嘴巴特征点定位结果。可以看出，嘴唇内边缘特征点的定位存在明显错误；（ｂ）表示本文方法的定位结果；（ｃ）表示手工标定的嘴巴特征点位置。可以看出，经过强形状约束，本文方法得到的嘴唇内边缘特征定位几乎完全符合真实情况，错误情况得到极大改善。（ａ）未加强形状约束的原始ＥＳＲ（ｂ）加强形状约束的ＥＳＲ（ｃ）手工标定图１０嘴巴特征点定位结果Ｆｉｇ．１０Ｄｅｔｅｃｔｉｎｇｒｅｓｕｌｔｏｆｍｏｕｔｈｌａｎｄｍａｒｋｓ为了分析本文提出的两种嘴巴状态分类器的效果，对使用两种策略后嘴唇内边缘特征点的定位精度做了统计分析。由于ＬＦＰＷ、Ｈｅｌｅｎ测试图像的平均瞳距分别为７７．７７２像素和２８５．５４像素，参考文献［３］分别计算这两个测试集中定位误差在５个像素以内和２０个像素以内的样本所占百分比作为各自的准确度。表２为ＬＦＰＷ测试集和Ｈｅｌｅｎ测试集中，不同人脸特征点定位算法得到的内边缘特征点平均准确度。可以直观地看出，本文提出的方法可以提高嘴巴特征点的定位精度，而且基于ＣＮＮ的嘴巴状态分类器比基于ＨＳＶ颜色空间的嘴巴状态分类器更有利于精度的提高。表３更加清晰地统计了每个内边缘特征点的定位误差，其中，ＡｖｇＰｉｘｅｌ表示平均像素误差，即‖ｐｉ－ｐ ? ｉ‖。实际上，基于ＣＮＮ的嘴巴状态分类器在测试集上的分类正确率为８３％，而基于ＨＳＶ颜色空间的嘴巴状态分类器为７２％。这个分类正确率并不高，为了更直观地展现强形状约束的效果，在表４中，单独对得到正确状态标签的嘴巴内边缘特征点定位误差做了统计对比。对比表３、表４在ＥＳＲ行的定位误差，发现表４中同一关键点使用同一算法（ＥＳＲ）的定位误差远远小于表３，也就是说，我们的嘴巴状态分类器给出正确分类结果的样本恰恰是嘴巴内边缘特征点定位精度相对较高的样本。观察表４，本文算法在ＥＳＲ定位准确度相对较高时，依然可以降低嘴巴内边缘特征点的定位误差。大多数的人脸特征点算法的效果都与训练数据的构成有关。对于特定类型的测试数据而言，使用与测试数据相似的训练样本集进行模型训练在某种程度上可以提高模型的估计准确率。为了实验的完备性，增加两组对比实验。在对比实验１中，用训练好的包含６８个特征点的ＥＳＲ模型进行特征点定位，不添加任何的后续处理，称之为ＯＥＳＲ（ｏｒｉｇｉ⁃ ｎａｌｅｘｐｌｉｃｉｔｓｈａｐｅｒｅｇｒｅｓｓｉｏｎ）。对比实验２中，将本文训练集按照２．３．３中的方式分为张开、闭合、微张３个训练集，用这３个训练数据集分别训练３个相应ＥＳＲ特征点定位模型，在测试阶段根据嘴巴状态分类器给出的标签选择相应的模型对测试图像进行特征点定位，称之为ＳＥＳＲ（ｓｐｅｃｉａｌｅｘｐｌｉｃｉｔｓｈａｐｅｒｅ⁃ ｇｒｅｓｓｉｏｎ）。相应地，由于本文方法使用到了强形状约束，在对比实验中称为ＣＥＳＲ（ｃｏｎｓｔｒａｉｎｔｅｘｐｌｉｃｉｔｓｈａｐｅｒｅｇｒｅｓｓｉｏｎ）。３组实验每个特征点的定位误差比较如图１１所示。表２内边缘特征点定位准确度Ｔａｂｌｅ２Ｌｏｃａｔｉｎｇａｃｃｕｒａｃｙｏｆｍｅｄｉａｌｌｉｐｆｅａｔｕｒｅｐｏｉｎｔｓ％算法ＥＳＲＨＳＶ＋ＥＳＲＣＮＮ＋ＥＳＲＨｅｌｅｎ（＜２０ｐｉｘｅｌｓ）６９．１７３．３７５．６ＬＦＰＷ（＜５ｐｉｘｅｌｓ）６８．７７３．３７５．５第５期师亚亭，等：基于嘴巴状态约束的人脸特征点定位算法 ·５８３·

·584· 智能系统学报第11卷表3内边缘特征点在测试集上的平均误差 Table 3 Mean error of medial lip feature points on the testset % LFPW 特征点索引 Helen 算法 6263 64 66 67 68 AvgPixel 62 63 64 66 67 68 AvgPixel ESR 6.015.715.646.066.226.46 4.37 6.596.406.717.817.557.61 20.3 HSV+ESR 5.965.645.565.986.176.40 4.33 6.416.206.527.707.447.50 19.9 CNN+ESR 5.875.485.525.845.996.30 4.24 6.245.976.367.577.297.41 19.4 表4分类正确时内边缘特征点在测试集上的平均误差 Table 4 Mean error of medial lip feature points on the testset when all samples classified correctly % LFPW 特征点索引 Helen 算法 62636466 6768 AvgPixel 626364 666768 AvgPixel ESR 5.095.225.745.715.716.29 4.09 6.246.016.297.427.17.29 19.2 强形状约束+ESR5.015.165.635.555.596.2 4.01 5.985.786.097.26.987.1 18.9 下嘴唇内边缘特征点的定位错误情况，显著提高了 0.16r —CESR 嘴唇内边缘特征点的定位准确度，具有很好鲁棒性。 0.14 --SESR 0.12 --OESR 此外，本文提出了嘴巴状态分类器这一人脸局部状 0.10 0.08 态分类的概念，在人脸对齐过程增加了先验信息，为 0.06 局部特征点定位精确化提供了一种可行的思路。 0.04 0.02 由于本文算法主要针对嘴巴状态进行嘴巴区域 0 10 203040506070 的约束调优，因此对嘴巴状态分类器的定位精度要人脸特征，点序号求很高。虽然我们的算法可以有效地提高嘴巴特征图11不同方法人脸特征点定位误差比较图点的定位精度，但嘴巴状态分类器的分类准确率还 Fig.11 Comparison of locating error of facial keypoints predicted by different methods 有很大的提升空间。因此，研究更加准确且鲁棒的嘴巴状态分类器将是我们下一步的重点。可以看出，当使用与测试数据对应的训练数据训练模型时(SE$R),模型仅仅提高了嘴角的特征点参考文献：定位准确度（如图虚线矩形框所示），而其他部位特 [1]COOTES T F,TAYLOR C J,COOPER D H,et al.Active 征点的定位误差反而增大，模型泛化能力和鲁棒性 shape models-their training and application[J].Computer 明显下降：而本文方法(CESR)不仅明显降低嘴唇 vision and image understanding,1995,61(1):38-59. 特征点定位误差（如图实线矩形框所示），而且与 [2]COOTES T F,EDWARDS G J,TAYLOR C J.Active ap- OESR定位曲线几乎完全重合，完全不对其他区域 pearance models M]//BURKHARDT H,NEUMANN B. 的特征点定位结果造成影响。本文方法在保证特征 Computer Vision-ECCV'98.Berlin Heidelberg:Springer, 点定位模型鲁棒性的同时，提高了嘴唇内边缘特征 1998:484-498 点的定位精度。这对于唇型识别、表情识别、追踪、 [3]CAO Xudong,WEI Yichen,WEN Fang,et al.Face align- 图像匹配等都具有非常重要的意义。此外，本文提 ment by explicit shape regression[].International journal 出的强形状约束思想也可以根据具体情况应用于其 of computer vision,2014,107(2):177-190. 他部位（如眼晴）特征点定位精确上。 [4]REN Shaoqing,CAO Xudong,WEI Yichen,et al.Face a- lignment at 3000 FPS via regressing local binary features 4结束语 [C]//Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Columbus,OH. 本文针对人脸对齐算法中嘴巴区域特征点的定 USA,2014:1685-1692. 位错误，基于具有定位速度和精度优势的ESR算 [5]BURGOS-ARTIZZU X P,PERONA P,DOLLAR P.Robust 法，提出了一种基于嘴巴状态约束的改进的人脸特 face landmark estimation under occlusion[C]//Proceedings 征点定位算法。在不影响其他特征点定位精度的情 of 2013 IEEE International Conference on Computer Vision 况下，本文算法大大改善了在嘴巴张开和闭合情况 (ICCV).Sydney,VIC,2013:1513-1520

表３内边缘特征点在测试集上的平均误差Ｔａｂｌｅ３Ｍｅａｎｅｒｒｏｒｏｆｍｅｄｉａｌｌｉｐｆｅａｔｕｒｅｐｏｉｎｔｓｏｎｔｈｅｔｅｓｔｓｅｔ％算法ＬＦＰＷ特征点索引Ｈｅｌｅｎ６２６３６４６６６７６８ＡｖｇＰｉｘｅｌ６２６３６４６６６７６８ＡｖｇＰｉｘｅｌＥＳＲ６．０１５．７１５．６４６．０６６．２２６．４６４．３７６．５９６．４０６．７１７．８１７．５５７．６１２０．３ＨＳＶ＋ＥＳＲ５．９６５．６４５．５６５．９８６．１７６．４０４．３３６．４１６．２０６．５２７．７０７．４４７．５０１９．９ＣＮＮ＋ＥＳＲ５．８７５．４８５．５２５．８４５．９９６．３０４．２４６．２４５．９７６．３６７．５７７．２９７．４１１９．４表４分类正确时内边缘特征点在测试集上的平均误差Ｔａｂｌｅ４Ｍｅａｎｅｒｒｏｒｏｆｍｅｄｉａｌｌｉｐｆｅａｔｕｒｅｐｏｉｎｔｓｏｎｔｈｅｔｅｓｔｓｅｔｗｈｅｎａｌｌｓａｍｐｌｅｓｃｌａｓｓｉｆｉｅｄｃｏｒｒｅｃｔｌｙ％算法ＬＦＰＷ特征点索引Ｈｅｌｅｎ６２６３６４６６６７６８ＡｖｇＰｉｘｅｌ６２６３６４６６６７６８ＡｖｇＰｉｘｅｌＥＳＲ５．０９５．２２５．７４５．７１５．７１６．２９４．０９６．２４６．０１６．２９７．４２７．１７．２９１９．２强形状约束＋ＥＳＲ５．０１５．１６５．６３５．５５５．５９６．２４．０１５．９８５．７８６．０９７．２６．９８７．１１８．９图１１不同方法人脸特征点定位误差比较图Ｆｉｇ．１１Ｃｏｍｐａｒｉｓｏｎｏｆｌｏｃａｔｉｎｇｅｒｒｏｒｏｆｆａｃｉａｌｋｅｙｐｏｉｎｔｓｐｒｅｄｉｃｔｅｄｂｙｄｉｆｆｅｒｅｎｔｍｅｔｈｏｄｓ可以看出，当使用与测试数据对应的训练数据训练模型时（ＳＥＳＲ），模型仅仅提高了嘴角的特征点定位准确度（如图虚线矩形框所示），而其他部位特征点的定位误差反而增大，模型泛化能力和鲁棒性明显下降；而本文方法（ＣＥＳＲ）不仅明显降低嘴唇特征点定位误差（如图实线矩形框所示），而且与ＯＥＳＲ定位曲线几乎完全重合，完全不对其他区域的特征点定位结果造成影响。本文方法在保证特征点定位模型鲁棒性的同时，提高了嘴唇内边缘特征点的定位精度。这对于唇型识别、表情识别、追踪、图像匹配等都具有非常重要的意义。此外，本文提出的强形状约束思想也可以根据具体情况应用于其他部位（如眼睛）特征点定位精确上。４结束语本文针对人脸对齐算法中嘴巴区域特征点的定位错误，基于具有定位速度和精度优势的ＥＳＲ算法，提出了一种基于嘴巴状态约束的改进的人脸特征点定位算法。在不影响其他特征点定位精度的情况下，本文算法大大改善了在嘴巴张开和闭合情况下嘴唇内边缘特征点的定位错误情况，显著提高了嘴唇内边缘特征点的定位准确度，具有很好鲁棒性。此外，本文提出了嘴巴状态分类器这一人脸局部状态分类的概念，在人脸对齐过程增加了先验信息，为局部特征点定位精确化提供了一种可行的思路。由于本文算法主要针对嘴巴状态进行嘴巴区域的约束调优，因此对嘴巴状态分类器的定位精度要求很高。虽然我们的算法可以有效地提高嘴巴特征点的定位精度，但嘴巴状态分类器的分类准确率还有很大的提升空间。因此，研究更加准确且鲁棒的嘴巴状态分类器将是我们下一步的重点。参考文献：［１］ＣＯＯＴＥＳＴＦ，ＴＡＹＬＯＲＣＪ，ＣＯＯＰＥＲＤＨ，ｅｔａｌ．Ａｃｔｉｖｅｓｈａｐｅｍｏｄｅｌｓ⁃ｔｈｅｉｒｔｒａｉｎｉｎｇａｎｄａｐｐｌｉｃａｔｉｏｎ［Ｊ］．Ｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｉｍａｇｅｕｎｄｅｒｓｔａｎｄｉｎｇ，１９９５，６１（１）：３８⁃５９．［２］ＣＯＯＴＥＳＴＦ，ＥＤＷＡＲＤＳＧＪ，ＴＡＹＬＯＲＣＪ．Ａｃｔｉｖｅａｐ⁃ ｐｅａｒａｎｃｅｍｏｄｅｌｓ［Ｍ］／／ＢＵＲＫＨＡＲＤＴＨ，ＮＥＵＭＡＮＮＢ．ＣｏｍｐｕｔｅｒＶｉｓｉｏｎ⁃ＥＣＣＶ’ ９８．ＢｅｒｌｉｎＨｅｉｄｅｌｂｅｒｇ：Ｓｐｒｉｎｇｅｒ，１９９８：４８４⁃４９８．［３］ＣＡＯＸｕｄｏｎｇ，ＷＥＩＹｉｃｈｅｎ，ＷＥＮＦａｎｇ，ｅｔａｌ．Ｆａｃｅａｌｉｇｎ⁃ ｍｅｎｔｂｙｅｘｐｌｉｃｉｔｓｈａｐｅｒｅｇｒｅｓｓｉｏｎ［Ｊ］．Ｉｎｔｅｒｎａｔｉｏｎａｌｊｏｕｒｎａｌｏｆｃｏｍｐｕｔｅｒｖｉｓｉｏｎ，２０１４，１０７（２）：１７７⁃１９０．［４］ＲＥＮＳｈａｏｑｉｎｇ，ＣＡＯＸｕｄｏｎｇ，ＷＥＩＹｉｃｈｅｎ，ｅｔａｌ．Ｆａｃｅａ⁃ ｌｉｇｎｍｅｎｔａｔ３０００ＦＰＳｖｉａｒｅｇｒｅｓｓｉｎｇｌｏｃａｌｂｉｎａｒｙｆｅａｔｕｒｅｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆ２０１４ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ（ＣＶＰＲ）．Ｃｏｌｕｍｂｕｓ，ＯＨ，ＵＳＡ，２０１４：１６８５⁃１６９２．［５］ＢＵＲＧＯＳ⁃ＡＲＴＩＺＺＵＸＰ，ＰＥＲＯＮＡＰ，ＤＯＬＬÁＲＰ．Ｒｏｂｕｓｔｆａｃｅｌａｎｄｍａｒｋｅｓｔｉｍａｔｉｏｎｕｎｄｅｒｏｃｃｌｕｓｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆ２０１３ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ（ＩＣＣＶ）．Ｓｙｄｎｅｙ，ＶＩＣ，２０１３：１５１３⁃１５２０． ·５８４· 智能系统学报第１１卷

第5期师亚亭，等：基于嘴巴状态约束的人脸特征点定位算法 ·585. [6]DOLLAR P,WELINDER P,PERONA P.Cascaded pose [13]张国权，李战明，李向伟，等.HSV空间中彩色图像分 regression[C]//Proceedings of IEEE Conference on Com- 割研究[J].计算机工程与应用，2010,46(26)：179. puter Vision and Pattern Recognition.San Francisco,CA, 181 USA.,2010:1078-1085 ZHANG Guoquan,LI Zhanming,LI Xiangwei,et al.Re- [7]CRISTINACCE D,COOTES T F.Boosted regression active search on color image segmentation in HSV space[J]. shape models[C]//Proceedings of the British Machine Vi- Computer engineering and applications,2010.46(26): sion Conference 2007.Warwick,UK,2007:2. 179-181. [8]SAUER P,COOTES T F,TAYLOR C J.Accurate regres- [14]ANDROUTSOS D,PLATANIOTIS K N,VENETSANOPO- sion procedures for active appearance models[C]//Proceed- ULOS A N.A novel vector-based approach to color image ings of the British Machine Vision Conference 2011.Dund- retrieval using a vector angular-based distance measure ee,2011:681-685. [J].Computer vision and image understanding,1999,75 [9]李英，赖剑煌，阮邦志.多模板ASM方法及其在人脸特 (1/2):46-58. 征点检测中的应用[J].计算机研究与发展，2007,44 [15]LECUN Y,BOTTOU L,BENGIO Y,et al.Gradient-based (1):133-140. learning applied to document recognition[J].Proceedings LI Ying,LAI Jianhuang.YUEN Pongchi.Multi-template of the IEEE,1998,86(11):2278-2324. ASM and its application in facial feature points detection [16]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Ima- [J].Journal of computer research and development,2007, geNet classification with deep convolutional neural net- 44(1)：133-140. works C]//Advances in Neural Information Processing [10]ZENG A,BODDETI V N,KITANI K M,et al.Face a- Systems 25:26th Annual Conference on Neural Informa- lignment refinement[C]//Proceedings of 2015 IEEE Win- tion Processing Systems.Lake Tahoe,Nevada,USA, ter Conference on Applications of Computer Vision.Waiko- 2012:1097-1105. 1oa,HⅢ.USA,2015:162-169. 作者简介： [11]徐国庆.低分辨图像眼晴精确定位方法[J].计算机应师亚亭，女，1991年生，硕士研究用研究，2015,32(11)：3501-3503,3512 生，主要研究方向为机器视觉。参与国 XU Guoqing.Precise eye location in low resolution image 家自然科学基金项目1项，企业合作项 [J].Application research of computers,2015,32(11): 目1项。 3501-3503,3512. [12]雷林华，朱虹，涂善彬，等.一种人脸网格模型的特征区域细节调整方法[J].计算机工程与应用，2006,44 (16):194-196. 李卫军，男，1975年生，研究员，博土 LEI Linhua,ZHU Hong,TU Shanbin,et al.Adaptation 生导师，主要研究方向为机器视觉、模式 method to adjust characteristic region of facial wire frame 识别与智能系统、高维计算、近红外定性 model in detail[J].Computer engineering and applica- 分析技术。主持国家自然科学基金项目 tions,2006,44(16):194-196. 2项，企业合作研究项目3项，发表学术论文30余篇

［６］ＤＯＬＬÁＲＰ，ＷＥＬＩＮＤＥＲＰ，ＰＥＲＯＮＡＰ．Ｃａｓｃａｄｅｄｐｏｓｅｒｅｇｒｅｓｓｉｏｎ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍ⁃ ｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．ＳａｎＦｒａｎｃｉｓｃｏ，ＣＡ，ＵＳＡ，２０１０：１０７８⁃１０８５．［７］ＣＲＩＳＴＩＮＡＣＣＥＤ，ＣＯＯＴＥＳＴＦ．Ｂｏｏｓｔｅｄｒｅｇｒｅｓｓｉｏｎａｃｔｉｖｅｓｈａｐｅｍｏｄｅｌｓ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＢｒｉｔｉｓｈＭａｃｈｉｎｅＶｉ⁃ ｓｉｏｎＣｏｎｆｅｒｅｎｃｅ２００７．Ｗａｒｗｉｃｋ，ＵＫ，２００７：２．［８］ＳＡＵＥＲＰ，ＣＯＯＴＥＳＴＦ，ＴＡＹＬＯＲＣＪ．Ａｃｃｕｒａｔｅｒｅｇｒｅｓ⁃ ｓｉｏｎｐｒｏｃｅｄｕｒｅｓｆｏｒａｃｔｉｖｅａｐｐｅａｒａｎｃｅｍｏｄｅｌｓ［Ｃ］／／Ｐｒｏｃｅｅｄ⁃ ｉｎｇｓｏｆｔｈｅＢｒｉｔｉｓｈＭａｃｈｉｎｅＶｉｓｉｏｎＣｏｎｆｅｒｅｎｃｅ２０１１．Ｄｕｎｄ⁃ ｅｅ，２０１１：６８１⁃６８５．［９］李英，赖剑煌，阮邦志．多模板ＡＳＭ方法及其在人脸特征点检测中的应用［Ｊ］．计算机研究与发展，２００７，４４（１）：１３３⁃１４０．ＬＩＹｉｎｇ，ＬＡＩＪｉａｎｈｕａｎｇ，ＹＵＥＮＰｏｎｇｃｈｉ．Ｍｕｌｔｉ⁃ｔｅｍｐｌａｔｅＡＳＭａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｉｎｆａｃｉａｌｆｅａｔｕｒｅｐｏｉｎｔｓｄｅｔｅｃｔｉｏｎ［Ｊ］．Ｊｏｕｒｎａｌｏｆｃｏｍｐｕｔｅｒｒｅｓｅａｒｃｈａｎｄｄｅｖｅｌｏｐｍｅｎｔ，２００７，４４（１）：１３３⁃１４０．［１０］ＺＥＮＧＡ，ＢＯＤＤＥＴＩＶＮ，ＫＩＴＡＮＩＫＭ，ｅｔａｌ．Ｆａｃｅａ⁃ ｌｉｇｎｍｅｎｔｒｅｆｉｎｅｍｅｎｔ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆ２０１５ＩＥＥＥＷｉｎ⁃ ｔｅｒＣｏｎｆｅｒｅｎｃｅｏｎＡｐｐｌｉｃａｔｉｏｎｓｏｆＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ｗａｉｋｏ⁃ ｌｏａ，ＨＩ，ＵＳＡ，２０１５：１６２⁃１６９．［１１］徐国庆．低分辨图像眼睛精确定位方法［Ｊ］．计算机应用研究，２０１５，３２（１１）：３５０１⁃３５０３，３５１２．ＸＵＧｕｏｑｉｎｇ．Ｐｒｅｃｉｓｅｅｙｅｌｏｃａｔｉｏｎｉｎｌｏｗｒｅｓｏｌｕｔｉｏｎｉｍａｇｅ［Ｊ］．Ａｐｐｌｉｃａｔｉｏｎｒｅｓｅａｒｃｈｏｆｃｏｍｐｕｔｅｒｓ，２０１５，３２（１１）：３５０１⁃３５０３，３５１２．［１２］雷林华，朱虹，涂善彬，等．一种人脸网格模型的特征区域细节调整方法［Ｊ］．计算机工程与应用，２００６，４４（１６）：１９４⁃１９６．ＬＥＩＬｉｎｈｕａ，ＺＨＵＨｏｎｇ，ＴＵＳｈａｎｂｉｎ，ｅｔａｌ．Ａｄａｐｔａｔｉｏｎｍｅｔｈｏｄｔｏａｄｊｕｓｔｃｈａｒａｃｔｅｒｉｓｔｉｃｒｅｇｉｏｎｏｆｆａｃｉａｌｗｉｒｅｆｒａｍｅｍｏｄｅｌｉｎｄｅｔａｉｌ［Ｊ］．Ｃｏｍｐｕｔｅｒｅｎｇｉｎｅｅｒｉｎｇａｎｄａｐｐｌｉｃａ⁃ ｔｉｏｎｓ，２００６，４４（１６）：１９４⁃１９６．［１３］张国权，李战明，李向伟，等．ＨＳＶ空间中彩色图像分割研究［Ｊ］．计算机工程与应用，２０１０，４６（２６）：１７９⁃ １８１．ＺＨＡＮＧＧｕｏｑｕａｎ，ＬＩＺｈａｎｍｉｎｇ，ＬＩＸｉａｎｇｗｅｉ，ｅｔａｌ．Ｒｅ⁃ ｓｅａｒｃｈｏｎｃｏｌｏｒｉｍａｇｅｓｅｇｍｅｎｔａｔｉｏｎｉｎＨＳＶｓｐａｃｅ［Ｊ］．Ｃｏｍｐｕｔｅｒｅｎｇｉｎｅｅｒｉｎｇａｎｄａｐｐｌｉｃａｔｉｏｎｓ，２０１０，４６（２６）：１７９⁃１８１．［１４］ＡＮＤＲＯＵＴＳＯＳＤ，ＰＬＡＴＡＮＩＯＴＩＳＫＮ，ＶＥＮＥＴＳＡＮＯＰＯ⁃ ＵＬＯＳＡＮ．Ａｎｏｖｅｌｖｅｃｔｏｒ⁃ｂａｓｅｄａｐｐｒｏａｃｈｔｏｃｏｌｏｒｉｍａｇｅｒｅｔｒｉｅｖａｌｕｓｉｎｇａｖｅｃｔｏｒａｎｇｕｌａｒ⁃ｂａｓｅｄｄｉｓｔａｎｃｅｍｅａｓｕｒｅ［Ｊ］．Ｃｏｍｐｕｔｅｒｖｉｓｉｏｎａｎｄｉｍａｇｅｕｎｄｅｒｓｔａｎｄｉｎｇ，１９９９，７５（１／２）：４６⁃５８．［１５］ＬＥＣＵＮＹ，ＢＯＴＴＯＵＬ，ＢＥＮＧＩＯＹ，ｅｔａｌ．Ｇｒａｄｉｅｎｔ⁃ｂａｓｅｄｌｅａｒｎｉｎｇａｐｐｌｉｅｄｔｏｄｏｃｕｍｅｎｔｒｅｃｏｇｎｉｔｉｏｎ［Ｊ］．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥ，１９９８，８６（１１）：２２７８⁃２３２４．［１６］ＫＲＩＺＨＥＶＳＫＹＡ，ＳＵＴＳＫＥＶＥＲＩ，ＨＩＮＴＯＮＧＥ．Ｉｍａ⁃ ｇｅＮｅｔｃｌａｓｓｉｆｉｃａｔｉｏｎｗｉｔｈｄｅｅｐｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔ⁃ ｗｏｒｋｓ［Ｃ］／／ＡｄｖａｎｃｅｓｉｎＮｅｕｒａｌＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍｓ２５：２６ｔｈＡｎｎｕａｌＣｏｎｆｅｒｅｎｃｅｏｎＮｅｕｒａｌＩｎｆｏｒｍａ⁃ ｔｉｏｎＰｒｏｃｅｓｓｉｎｇＳｙｓｔｅｍｓ．ＬａｋｅＴａｈｏｅ，Ｎｅｖａｄａ，ＵＳＡ，２０１２：１０９７⁃１１０５．作者简介：师亚亭，女，１９９１年生，硕士研究生，主要研究方向为机器视觉。参与国家自然科学基金项目１项，企业合作项目１项。李卫军，男，１９７５年生，研究员，博士生导师，主要研究方向为机器视觉、模式识别与智能系统、高维计算、近红外定性分析技术。主持国家自然科学基金项目２项，企业合作研究项目３项，发表学术论文３０余篇。第５期师亚亭，等：基于嘴巴状态约束的人脸特征点定位算法 ·５８５·

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录