·58 智能系统学报 第3卷 法.综合考虑了以上算法,文中采用了Gabor小波 变换和Fisherface判别分析的方法进行特征提取,采 用了C均值聚类对标准的表情图像进行聚类,得到子 类表情模板.对待识别的表情图像使用了K近邻判 别方法进行了分类,该方法考虑到同一种表情可能有 很多种不同的表现形式,比如高兴,有的人是张开嘴 大笑,有的人是闭着嘴微笑,这就表明高兴这类表情 155d 还可以继续划分成多个子类,如果使用聚类的方法, 就可以使每种表情聚成更多的子类,这样,所得到的 表情模板才能更精确地代表该种表情的一种表现形 式.使用K近邻算法将待识别的图像与各个聚类中 0.8d 0.8d 心的表情模板进行比较,从而判别出该种表情与哪些 表情的哪些表现形式更加接近,进而将该种表情进行 图1面部表情图像的剪切比例示意图 分类.文中通过对公开的日本女人表情图像数据库 Fig I Schematic of cut proportion on UAFFE)的测试表明,与其他方法相比,使用了C均 expression image 值聚类与K近邻算法使识别率得到提高 对图像进行各种分析.二维Gabor小波变换描述了 图像1(W上给定一点x=(x,以附近区域的灰度特 1表情分类算法 征,这可以用一个卷积来定义!: 文中所使用的表情分类方法分为以下几个步 f(x)w(x-x)dx' (1) 骤:首先对表情图像进行几何与灰度预处理.几何预 Gabor核函数的定义为 处理是先找到图像中人眼的位置,经过旋转将两眼 调整到同一水平位置.再将该图像按照一定的比例 华( 0 exp 20 剪切下来,假设人两眼间的距离为d,剪切比例如图 1所示.为排除人相貌对表情识别的影响,所以将人 exp(ikjx)- exp 2 的额头与脸的外轮廓剪切掉.人表情的变化主要表 式中: 现在眉毛、眼睛和嘴角的变化上,图示的剪切方法能 krcos蚓 很好地保留表情的变化的表现,同时削减了部分相 k k=2π, kr sin中u 貌差异对表情的影响.最后将剪切下来的图像放缩 .0=2元 到统一大小,文中使用100×128像素大小的图像. 8 (3) 对于灰度预处理,文中使用了直方图均衡化,使图像 文中使用了5个频率,8个方向的Gabor核函 的对比度大大提高,灰度分布也趋于均匀.对图像进 数,即v=0,1,4,μ=1,2,8.对图像中的一个 行预处理之后,使用Gabor小波提取图像的频率特 点进行Gabor滤波,便得到40个Gabor系数.文中 征,然后使用Fisherface判别分析对图像进行训练, 对预处理后的图像使用网格结构均匀取点,每隔20 求得特征空间.文中使用模板匹配的方法分类表情, 个像素点取一个点(共30个点)进行Gabor滤波 表情模板是通过在特征空间对一些标准的表情图像 得到长度为1200 Gabor系数的向量J.即经过该滤 进行动态C均值聚类,将聚类中心作为表情模板而 波之后,将大小为128×100的灰度图像变换为 得到的.对于待识别的图像使用了K近邻算法,该算 1200维Gabor向量. 法与C均值聚类一起使用,达到了很好的识别效果. l.2 Fisherface判别分析 1.1表情图像的二维Gabor小波变换 灰度图像经过二维的Gabor小波变换得到了 文中使用Gabor小波来编码人脸图像.二维 Gabor向量,接下来使用主成分分析(PCA)与线性 Gabor滤波器是带通滤波器,在空间域和频率域均 判别分析(LDA)相结合的方法,即Fisherface法对 有较好的分辨能力,它在空间域有良好的方向选择 Gabor向量进行训练,得到投影空间.该方法先将 性,在频率域有良好的频率选择性.Gabor小波变换 Gabor向量通过PCA提取主成分信息并降维,然后 是具有最好的时-频局部化描述能力的窗函数.二 对降维后的图像应用LDA训练一个最佳分类器」 维Gabor小波变换是图像的多尺度表示和分析的 Fisherface方法既保留了原始向量的主成分信息, 有力工具,作为唯一能够取得空域和频域联合不确 又克服了直接使用LDA带来的大矩阵和类内散布 定关系下限的Gabor函数经常被用作小波基函数, 矩阵奇异的问题,且该方法的识别率比只使用PCA 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net法. 综合考虑了以上算法 ,文中采用了 Gabor 小波 变换和 Fisherface 判别分析的方法进行特征提取 ,采 用了 C均值聚类对标准的表情图像进行聚类 ,得到子 类表情模板. 对待识别的表情图像使用了 K近邻判 别方法进行了分类.该方法考虑到同一种表情可能有 很多种不同的表现形式 ,比如高兴 ,有的人是张开嘴 大笑 ,有的人是闭着嘴微笑 ,这就表明高兴这类表情 还可以继续划分成多个子类 ,如果使用聚类的方法 , 就可以使每种表情聚成更多的子类 ,这样 ,所得到的 表情模板才能更精确地代表该种表情的一种表现形 式.使用 K近邻算法将待识别的图像与各个聚类中 心的表情模板进行比较 ,从而判别出该种表情与哪些 表情的哪些表现形式更加接近 ,进而将该种表情进行 分类. 文中通过对公开的日本女人表情图像数据库 (JAFFE)的测试表明 ,与其他方法相比 ,使用了 C 均 值聚类与 K近邻算法使识别率得到提高. 1 表情分类算法 文中所使用的表情分类方法分为以下几个步 骤 :首先对表情图像进行几何与灰度预处理. 几何预 处理是先找到图像中人眼的位置 ,经过旋转将两眼 调整到同一水平位置. 再将该图像按照一定的比例 剪切下来 ,假设人两眼间的距离为 d ,剪切比例如图 1 所示. 为排除人相貌对表情识别的影响 ,所以将人 的额头与脸的外轮廓剪切掉. 人表情的变化主要表 现在眉毛、眼睛和嘴角的变化上 ,图示的剪切方法能 很好地保留表情的变化的表现 ,同时削减了部分相 貌差异对表情的影响. 最后将剪切下来的图像放缩 到统一大小 ,文中使用 100 ×128 像素大小的图像. 对于灰度预处理 ,文中使用了直方图均衡化 ,使图像 的对比度大大提高 ,灰度分布也趋于均匀. 对图像进 行预处理之后 ,使用 Gabor 小波提取图像的频率特 征 ,然后使用 Fisherface 判别分析对图像进行训练 , 求得特征空间. 文中使用模板匹配的方法分类表情 , 表情模板是通过在特征空间对一些标准的表情图像 进行动态 C 均值聚类 ,将聚类中心作为表情模板而 得到的. 对于待识别的图像使用了 K近邻算法 ,该算 法与 C均值聚类一起使用 ,达到了很好的识别效果. 111 表情图像的二维 Gabor 小波变换 文中使用 Gabor 小波来编码人脸图像. 二维 Gabor 滤波器是带通滤波器 ,在空间域和频率域均 有较好的分辨能力 ,它在空间域有良好的方向选择 性 ,在频率域有良好的频率选择性. Gabor 小波变换 是具有最好的时 - 频局部化描述能力的窗函数. 二 维 Gabor 小波变换是图像的多尺度表示和分析的 有力工具 ,作为唯一能够取得空域和频域联合不确 定关系下限的 Gabor 函数经常被用作小波基函数 , 图 1 面部表情图像的剪切比例示意图 Fig11 Schematic of cut proportion on expression image 对图像进行各种分析. 二维 Gabor 小波变换描述了 图像 I ( x) 上给定一点 x = ( x , y) 附近区域的灰度特 征 ,这可以用一个卷积来定义[13 ] : J j ( x) =∫I ( x′)Ψj ( x - x′) d 2 x′. (1) Gabor 核函数的定义为 Ψj ( x) = ‖kj ‖2 σ2 exp ‖kj ‖2 ‖x ‖2 2σ2 · exp ( ik j x) - exp - σ2 2 . (2) 式中 : kj = kjx kjy = kv cosφμ kv sinφμ , kv = 2 - v+2 2π, φμ = μ π 8 ,σ = 2π. (3) 文中使用了 5 个频率 ,8 个方向的 Gabor 核函 数 ,即 v = 0 ,1 , …,4 ,μ= 1 ,2 , …,8. 对图像中的一个 点进行 Gabor 滤波 ,便得到 40 个 Gabor 系数. 文中 对预处理后的图像使用网格结构均匀取点 ,每隔 20 个像素点取一个点 (共 30 个点) 进行 Gabor 滤波 , 得到长度为 1 200 Gabor 系数的向量 J . 即经过该滤 波之后 ,将大小为 128 ×100 的灰度图像变换为 1 200维 Gabor 向量. 112 Fisherface 判别分析 灰度图像经过二维的 Gabor 小波变换得到了 Gabor 向量 ,接下来使用主成分分析 (PCA) 与线性 判别分析(LDA) 相结合的方法 ,即 Fisherface 法对 Gabor 向量进行训练 ,得到投影空间. 该方法先将 Gabor 向量通过 PCA 提取主成分信息并降维 ,然后 对降维后的图像应用 LDA 训练一个最佳分类器. Fisherface 方法既保留了原始向量的主成分信息 , 又克服了直接使用 LDA 带来的大矩阵和类内散布 矩阵奇异的问题 ,且该方法的识别率比只使用 PCA · 85 · 智 能 系 统 学 报 第 3 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net