因此，通过式 (7) 减小了域之间的条件分布差异。但是在本文要解决的问题

正在加载图片...

·400· 智能系统学报第16卷因此，通过式（⑦减小了域之间的条件分布差而来的。CK+数据库包含123名年龄在1850岁异。但是在本文要解决的问题中，目标同时是最来自不同人种的成年人，包括非裔美国人、亚洲小化域间的边缘分布和条件分布的差异。因此将以及拉丁美洲人的593个图像序列，如图2所式(4)、(7)与式(2)合并到一起得到DaL的优化问示。在CK数据库的基础上对视频序列和采集对题，即象进行扩充，分别增加了22%和27%，且在该数 m盟tr(WXLXW）+ t(WTXLXW)+lW 据库中的视频序列中包括生气、厌恶、恐惧、高 c=1 兴、难过、吃惊和中性等7种表情，每种表情均有 (9) 完整的面部编码。该数据库中表情图像的采集对式中：λ是正则化参数：W表示转换矩阵W的象中有65%是女性，35%是男性。 Frobenius范数。 1.6模型优化令p=diag(p1,p2,…,p)∈Rt为拉格朗日乘子，根据约束优化理论，可以推导出式(9)的拉格朗日函数，即 w(WXLXW)+∑(WXLXW)+ (10) t((I-WXHXW)) 图2CK+数据库部分表情样本令式(10)对变换矩阵W求偏导数，并令其等 Fig.2 Partial expression samples of CK+Database 于零可得到其广义特征分解： 2)Oulu-CASIA NIR&VIS Database数据库 (XLXT+X LXT+ADW=XHXTWO 该数据库主要由Oulu-CASIA NIR(近红外相 (11) c= 机)和Oulu-CASIA VIS(可见光相机)两部分组最后，选择式(11)的前k个最小特征值对应成，如图3、4所示，均通过对年龄范围为25~58岁的特征向量作为变换矩阵W的解。算法的伪代的80位测试者进行表情采集，其中男性和女性码如算法1所示。的比例分别为73.8%和26.2%。在80位测试者算法1分布对齐算法(DaL) 中，50位芬兰测试者由奥卢大学进行采集，剩输入数据矩阵X,标签矩阵y,子空间维度余的测试者由中国科学院模式识别实验室完成 k,以及正则化参数；采集整理。整个数据库包含的面部表情为高兴、输出变换矩阵W,域适应分类器f。生气、厌恶、惊讶、恐惧和悲伤，所有这些表情都 1)通过式(5)构建MMD矩阵L,并令是在3种不同光源条件（正常、强光、黑暗）下，分 (Le=011 别通过一个可见光摄像机和一个近红外摄像机获 2)通过对式(11)进行特征分解选择最小的k 得的。个特征向量构建变换矩阵W; 3)在{(Wxy),上训练一个标准分类器，并用其去更新目标域伪标签=f(Wx,),通过 (a)黑暗式(8)构造MMD矩阵L。 4)重复步骤2)、3)直至收敛： 5)在标注数据{(Wx,y)上训练的域适应 (b)正常分类器f。 2实验与分析 2.1数据库介绍 (c)强光 1)CK+数据库图3 Oulu-CASIA VIS分别在黑暗、正常、强光条件下数 CK+(the extended cohn-kanda dataset)数据库27 据库中表情样本 Fig.3 Expression samples of Oulu-CASIA VIS under 是美国的匹兹堡大学团队和卡内基梅隆大学团队 dark,normal and strong light conditions respect- 合作在CK(cohn-kanade)数据库2！上进行扩充 ively因此，通过式 (7) 减小了域之间的条件分布差异。但是在本文要解决的问题中，目标同时是最小化域间的边缘分布和条件分布的差异。因此将式 (4)、(7) 与式 (2) 合并到一起得到 DaL 的优化问题，即 min WTXHXTW=I tr(WTXLXTW)+ ∑C c=1 tr(WTXLcX TW)+λ∥W∥ 2 F (9) λ ∥W∥ 2 式中：是正则化参数； F 表示转换矩阵 W 的 Frobenius 范数。 1.6 模型优化 φ = diag(φ1,φ2,··· ,φk) ∈ R 令 k×k 为拉格朗日乘子，根据约束优化理论，可以推导出式 (9) 的拉格朗日函数，即 tr(WTXLXTW)+ ∑C c=1 tr(WTXLcX TW)+ tr((I−WTXHXTW)φ) (10) 令式 (10) 对变换矩阵 W 求偏导数，并令其等于零可得到其广义特征分解： (XLXT + X ∑C c=1 LcX T +λI)W = XHXTWφ (11) k W 最后，选择式 (11) 的前个最小特征值对应的特征向量作为变换矩阵的解。算法的伪代码如算法 1 所示。算法 1 分布对齐算法 (DaL) X ys k λ 输入数据矩阵，标签矩阵，子空间维度，以及正则化参数；输出变换矩阵 W ，域适应分类器 f。 L {Lc = 0} C c=1 1 ) 通过式 ( 5 ) 构建 M M D 矩阵，并令。 k W 2) 通过对式 (11) 进行特征分解选择最小的个特征向量构建变换矩阵； {(WT xi , yi)} ns i=1 {yˆj = f(WT xj)} nt j=1 Lc 3) 在上训练一个标准分类器，并用其去更新目标域伪标签，通过式 (8) 构造 MMD 矩阵。 4) 重复步骤 2)、3) 直至收敛； {(WT xi , yi)} ns i=1 f 5) 在标注数据上训练的域适应分类器。 2 实验与分析 2.1 数据库介绍 1)CK+数据库 CK+(the extended cohn-kanda dataset) 数据库[27] 是美国的匹兹堡大学团队和卡内基梅隆大学团队合作在 CK(cohn–kanade) 数据库[28] 上进行扩充而来的。CK +数据库包含 123 名年龄在 18~50 岁来自不同人种的成年人，包括非裔美国人、亚洲以及拉丁美洲人的 593 个图像序列，如图 2 所示。在 CK 数据库的基础上对视频序列和采集对象进行扩充，分别增加了 22% 和 27%，且在该数据库中的视频序列中包括生气、厌恶、恐惧、高兴、难过、吃惊和中性等 7 种表情，每种表情均有完整的面部编码。该数据库中表情图像的采集对象中有 65% 是女性，35% 是男性。图 2 CK+数据库部分表情样本 Fig. 2 Partial expression samples of CK + Database 2)Oulu-CASIA NIR & VIS Database 数据库[29] 该数据库主要由 Oulu-CASIA NIR(近红外相机) 和 Oulu-CASIA VIS(可见光相机) 两部分组成，如图 3、4 所示，均通过对年龄范围为 25~58 岁的 80 位测试者进行表情采集，其中男性和女性的比例分别为 73.8% 和 26.2%。在 80 位测试者中，50 位芬兰测试者由奥卢大学进行采集，剩余的测试者由中国科学院模式识别实验室完成采集整理。整个数据库包含的面部表情为高兴、生气、厌恶、惊讶、恐惧和悲伤，所有这些表情都是在 3 种不同光源条件 (正常、强光、黑暗) 下，分别通过一个可见光摄像机和一个近红外摄像机获得的。 (a) 黑暗 (b) 正常 (c) 强光图 3 Oulu-CASIA VIS 分别在黑暗、正常、强光条件下数据库中表情样本 Fig. 3 Expression samples of Oulu-CASIA VIS under dark, normal and strong light conditions respectively ·400· 智能系统学报第 16 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】基于迁移学习的无监督跨域人脸表情识别