视觉、行为科学等应用的基础，近年来逐渐成为学者们的研究热点。人脸表

正在加载图片...

第3期童莹：一种方向性的局部二值模式在人脸表情识别中的应用 ·423. 视觉、行为科学等应用的基础，近年来逐渐成为学者们的研究热点。 189外58130 0 人脸表情识别(facial expression recognition, 13015065 01501 >(00011011)=27 FER)系统包含表情图像预处理、人脸检测与人脸区 3080198 001 域分割、表情特征提取和表情分类4个组成部分。图1LBP编码示例表情特征提取是人脸表情识别系统的一个重要环 Fig.1 Illustration of the LBP descriptor 节，是提高表情分类准确性的关键步骤。在众多表情特征提取方法中，局部特征法对光照、姿态等变化 2 基于方向性的LBP算子理论具有较强的鲁棒性，其中局部二值模式(LBP)]和 2.1DLBP算子的定义 Gabor小波变换[2-6是2种代表性方法。Gabor小波原始的LBP提出后，T.Ojala又对其进行改进，变换能够检测多尺度、多方向的表情纹理信息，但其将3×3邻域扩展到任意邻域，并用圆形邻域代替方耗时多，产生特征维数巨大，降维方法的选择会影响形邻域，改进后的LBP算子允许在半径为R的圆形识别准确性。相比于Gabor小波变换，LBP算法可邻域内有任意多个像素点。同时，他还提出了均匀以快速提取表情特征，具有强大的纹理判别能力和模式，将LBP模式由256种减少为59种，降低了特计算简单等特点，因此被广泛地应用于分类、图像检征向量的维数但并不丢失主要信息。在T.Ojala研索和模式识别中7-]。然而传统LBP算子也有其究的基础上，又有很多研究人员提出自己的改进方局限性，它是通过比较中心像素与邻域像素的灰度法，例如Tan提出了局部三值模式[)，通过计算中值大小获取特征，受噪声影响较大，对灰度变化敏心像素与邻域像素的灰度差值与给定经验阈值的正感，识别效果不理想。因此本文对传统LBP算子进负关系进行三值编码，可以有效去除噪声和光照的行改进，提出一种基于方向性的局部二值模式(di- 影响：Yang等提出了汉明LBP,当非均匀模式与某均匀模式的汉明距离最小时，将其归入均匀模式， rectional LBP,DLBP),分别从水平、垂直和对角3 可进一步降低LBP特征向量的维数；Huang等提出个方向对邻域像素进行灰度值比较和二值编码，既了扩展LBP[5),对邻域像素与中心像素的灰度差值符合人脸表情变化趋势，又降低像素相关性，减少噪进行四位二值编码，首位是符号位，后面3位是数值声干扰。在JAFFE数据库和Cohn-Kanade数据库位，该方法以增加向量维数来换取鲁棒性。可以看上的实验结果均表明，DLBP算子是一种实用有出，改进方法多数集中在邻域选择、特征向量降维或效的人脸表情描述算子，且比LBP算子具体较强者编码方式构建上，他们的基本思想仍是比较中心的噪声鲁棒性。像素和邻域像素的灰度大小，并没有考虑邻域像素 1 LBP算子理论间的灰度变化，这种传统比较关系并不有利于表情特征的提取[16-20] 传统局部二值模式(local binary pattern,LBP) 针对这一不足，本文提出一种基于方向性的局是由T.0jala等在1996年提出的，是一种用来描述部二值模式(DLBP),分别从水平、垂直和对角3个图像局部纹理特征的算子，它具有旋转不变性和灰方向比较邻域像素间的灰度值大小，并对其进行二度不变性等显著优点。传统LBP算子定义在3×3 值编码，得到DLBP编码图像。这是一种简单有效窗口内，以窗口中心像素灰度值为阈值，将相邻8个的表情特征提取方法，可以准确描述人脸中各个表像素的灰度值与其进行比较，若邻域像素值大于中情区域的纹理变化，同时也不增加算法的复杂性。心像素值，则编码为1，否则编码为0。从左上角开考虑到3个方向的选择顺序以及编码权重对识别效始顺时针读取数值，先读出的二进制数放在低位，后果无影响，本文定义DLBP算式如式(1)所示。读出的二进制数放在高位，依次得到8位二进制数， DLBPR=s(g:-g3)27 +s(ga-gs)2+ 即LBP编码。将LBP编码值转换为十进制数，则得 s(g6-88)23+s(g1-86)2+s(g2-g7)23+ 到该编码对应的LBP值。图1描述了一个编码示 s(g-g8)22+s(g1-g8)2+s(g1-g6)2° 例，中心像素灰度值为150，依次与八邻域像素比 (s(x)=1,x≥0 (1)》较，顺序得到LBP编码为(00011011)2，将其转化为 s(x)=0,x<0 十进制数得到LBP值为27。式中：81~gs为图2中3×3模板对应像素点的灰度值，其编码运算示例如图3所示。图3中像素灰度视觉、行为科学等应用的基础，近年来逐渐成为学者们的研究热点。人脸表情识别（ｆａｃｉａｌｅｘｐｒｅｓｓｉｏｎｒｅｃｏｇｎｉｔｉｏｎ，ＦＥＲ）系统包含表情图像预处理、人脸检测与人脸区域分割、表情特征提取和表情分类４个组成部分。表情特征提取是人脸表情识别系统的一个重要环节，是提高表情分类准确性的关键步骤。在众多表情特征提取方法中，局部特征法对光照、姿态等变化具有较强的鲁棒性，其中局部二值模式（ＬＢＰ）［１］和Ｇａｂｏｒ小波变换［２－６］是２种代表性方法。Ｇａｂｏｒ小波变换能够检测多尺度、多方向的表情纹理信息，但其耗时多，产生特征维数巨大，降维方法的选择会影响识别准确性。相比于Ｇａｂｏｒ小波变换，ＬＢＰ算法可以快速提取表情特征，具有强大的纹理判别能力和计算简单等特点，因此被广泛地应用于分类、图像检索和模式识别中［７－１２］。然而传统ＬＢＰ算子也有其局限性，它是通过比较中心像素与邻域像素的灰度值大小获取特征，受噪声影响较大，对灰度变化敏感，识别效果不理想。因此本文对传统ＬＢＰ算子进行改进，提出一种基于方向性的局部二值模式（ｄｉ⁃ ｒｅｃｔｉｏｎａｌＬＢＰ，ＤＬＢＰ），分别从水平、垂直和对角３个方向对邻域像素进行灰度值比较和二值编码，既符合人脸表情变化趋势，又降低像素相关性，减少噪声干扰。在ＪＡＦＦＥ数据库和Ｃｏｈｎ⁃Ｋａｎａｄｅ数据库上的实验结果均表明，ＤＬＢＰ算子是一种实用有效的人脸表情描述算子，且比ＬＢＰ算子具体较强的噪声鲁棒性。１ＬＢＰ算子理论传统局部二值模式（ｌｏｃａｌｂｉｎａｒｙｐａｔｔｅｒｎ，ＬＢＰ）是由Ｔ．Ｏｊａｌａ等在１９９６年提出的，是一种用来描述图像局部纹理特征的算子，它具有旋转不变性和灰度不变性等显著优点。传统ＬＢＰ算子定义在３×３窗口内，以窗口中心像素灰度值为阈值，将相邻８个像素的灰度值与其进行比较，若邻域像素值大于中心像素值，则编码为１，否则编码为０。从左上角开始顺时针读取数值，先读出的二进制数放在低位，后读出的二进制数放在高位，依次得到８位二进制数，即ＬＢＰ编码。将ＬＢＰ编码值转换为十进制数，则得到该编码对应的ＬＢＰ值。图１描述了一个编码示例，中心像素灰度值为１５０，依次与八邻域像素比较，顺序得到ＬＢＰ编码为（０００１１０１１）２，将其转化为十进制数得到ＬＢＰ值为２７。图１ＬＢＰ编码示例Ｆｉｇ．１ＩｌｌｕｓｔｒａｔｉｏｎｏｆｔｈｅＬＢＰｄｅｓｃｒｉｐｔｏｒ２基于方向性的ＬＢＰ算子理论２．１ＤＬＢＰ算子的定义原始的ＬＢＰ提出后，Ｔ．Ｏｊａｌａ又对其进行改进，将３×３邻域扩展到任意邻域，并用圆形邻域代替方形邻域，改进后的ＬＢＰ算子允许在半径为Ｒ的圆形邻域内有任意多个像素点。同时，他还提出了均匀模式，将ＬＢＰ模式由２５６种减少为５９种，降低了特征向量的维数但并不丢失主要信息。在Ｔ．Ｏｊａｌａ研究的基础上，又有很多研究人员提出自己的改进方法，例如Ｔａｎ提出了局部三值模式［１３］，通过计算中心像素与邻域像素的灰度差值与给定经验阈值的正负关系进行三值编码，可以有效去除噪声和光照的影响；Ｙａｎｇ等提出了汉明ＬＢＰ［１４］，当非均匀模式与某均匀模式的汉明距离最小时，将其归入均匀模式，可进一步降低ＬＢＰ特征向量的维数；Ｈｕａｎｇ等提出了扩展ＬＢＰ［１５］，对邻域像素与中心像素的灰度差值进行四位二值编码，首位是符号位，后面３位是数值位，该方法以增加向量维数来换取鲁棒性。可以看出，改进方法多数集中在邻域选择、特征向量降维或者编码方式构建上，他们的基本思想仍是比较中心像素和邻域像素的灰度大小，并没有考虑邻域像素间的灰度变化，这种传统比较关系并不有利于表情特征的提取［１６－２０］。针对这一不足，本文提出一种基于方向性的局部二值模式（ＤＬＢＰ），分别从水平、垂直和对角３个方向比较邻域像素间的灰度值大小，并对其进行二值编码，得到ＤＬＢＰ编码图像。这是一种简单有效的表情特征提取方法，可以准确描述人脸中各个表情区域的纹理变化，同时也不增加算法的复杂性。考虑到３个方向的选择顺序以及编码权重对识别效果无影响，本文定义ＤＬＢＰ算式如式（１）所示。ＤＬＢＰＲＰ＝ｓ（ｇ１－ｇ３）２７＋ｓ（ｇ４－ｇ５）２６＋ｓ（ｇ６－ｇ８）２５＋ｓ（ｇ１－ｇ６）２４＋ｓ（ｇ２－ｇ７）２３＋ｓ（ｇ３－ｇ８）２２＋ｓ（ｇ１－ｇ８）２１＋ｓ（ｇ３－ｇ６）２０ｓ（ｘ）＝１，ｘ ≥ ０ｓ（ｘ）＝０，ｘ＜０ { （１）式中：ｇ１～ｇ８为图２中３×３模板对应像素点的灰度值，其编码运算示例如图３所示。图３中像素灰度第３期童莹：一种方向性的局部二值模式在人脸表情识别中的应用 ·４２３·

<<向上翻页向下翻页>>

点击下载：机器感知与模式识别：一种方向性的局部二值模式在人脸表情识别中的应用