视觉和模式识别技术。所以，许多数据库也选择基于 AU 组合来做情绪标注，

正在加载图片...

·1045· 颜文靖，等：心理学视角下的自动表情识别第5期视觉和模式识别技术。所以，许多数据库也选择们常常会遇到一些困难。在数据标注过程中，我基于AU组合来做情绪标注，并获得了令人满意们很难确定这些表情是否确切地反映了某种情的效果，如Emotionet!。在情绪标注过程中，有绪。虽然在数据采集过程中，我们收集了主观评些数据库的开发人员基于AU组合的同时，也尽价、评估了视频的情绪特点并进行了面部动作编可能地考虑主观报告与视频的内容464切。但是，码，但是却发现主观评估与面部动作有时并不匹标注准确性依然会受到情绪体验与表情之间的一配（基于基本情绪理论的观，点应该是匹配的）。而致性水平的约束，因为只有提供了一致的表面形且，我们还发现巨大的个体差异，例如，有些人看态标准，计算机才可以对表情特征做很好的分类。到恶心的内容会表现出大笑，但是这个大笑并不 4.4情感维度标注等于“高兴”，然而当事人又说不清是什么情绪。非摆拍条件下的表情照片中，符合原型表情于是，虽然基于数据库的自动表情识别准确率非的动作组合较少，所以基于原型表情模板进行情常高，但是在现实生活情景中的识别准确率往往绪类型的标注比较困难。而基于FACS提供的不是很高，难以应用于实践。 “核心AU”分析也很难确认某个表情的情绪类别。 5.1问题一：表情与真实情绪体验的一致性而根据情感维度模型，则没有必要假设独立的离我们前期在微表情数据库的构建以及微表情散的情绪类型。这种观点认为，少量的两极维度分析等领域做了一些颇有成效的工作，但也发现可以作为情感体验和情感识别的基本构件。这情绪与表情的一致性并没有理论预期得那么高。也是为什么许多非摆拍的样本也标注了维度，如同时，大量研究也表明，人的内在情绪体验和外 AFEW-VAs,AffectNet!。在表情、生理信号之间的相关性较低。从愉快到不愉快的效价(Valence)维度在定 Durn等o进行了一项荟萃分析（元分析）. 义情绪体验和表达方面至关重要。这一维度能够其包含了37篇关于情绪体验与原型表情之间关被人类自动地、快速地识别出来，而且具有普遍系的研究。研究通过计算相关系数，来确定一种性6。毕竞，积极和消极的情感状态位于情感空情绪与所设定表达之间的一致性程度（见表1）。间的相反位置，它们以一种非常不同的方式被传荟萃分析的结果显示，高兴与典型笑容的总体相达。所以，效价似乎是非常容易标注的，而唤醒关系数是0.40(95%的置信区间为0.310.49)。如度(Arousal)的标注比较困难。例如，哭泣是唤醒果我们把高兴(Happiness)和好玩(Amusement)看程度低的情绪吗？生闷气的唤醒程度是否比哭泣作是两种相互独立的情绪，那么与微笑相关的总高呢，高多少呢？而且，在较低的效价和唤醒度体估计值是：快乐为0.27[0.16,0.39]，好玩为0.52 状态下，人们哪怕有情绪体验，也往往面无表情。 [0.43,0.62]。而参与者在高兴时出现典型笑容的自动表情识别面临的主要问题概率是0.41[0.08,0.73]。如果把高兴和好玩分开考虑，则高兴的概率为0.12[0.06,0.181，好玩的概在实践中，从数据的标注到计算机的识别，我率为0.47[0.09,0.84]。表1情绪与原型表情表达关系的元分析结果(Duran,2017) Table 1 The meta-analysis for the relationship between felt emotions and prototypical facial expressions 情绪被试数相关系数(95%置信区间) 被试数反应概率(95%置信区间) 高兴+好玩 1398 0.40[0.31,0.49 217 0.41[0.080.73] 高兴 732 0.27[0.16,0.39] 98 0.12[0.06,0.18] 好玩 666 0.52[0.43,0.62 119 0.47[0.09,0.84] 惊讶 168 0.24[0.04,0.44] 515 0.09[0.05,0.14] 厌恶 187 0.24[0.10,0.37J 279 0.32[0.14,0.50] 悲伤 247 0.41[0.200.63] 119 0.21[0.14,0.29] 愤怒 281 0.22[0.11,0.33] 133 0.28[0.20,0.35] 恐惧 60 0.11[-0.14,0.36 170 0.34[0.00,0.74] 在所有测试的情绪类别中，除了恐惧之外，其然而，高于随机水平并不能说明特定情绪可以对他情绪与原型表情的相关系数均高于随机水平。应到特定表情。实际上，它们之间的相关性很视觉和模式识别技术。所以，许多数据库也选择基于 AU 组合来做情绪标注，并获得了令人满意的效果，如 Emotionet[49]。在情绪标注过程中，有些数据库的开发人员基于 AU 组合的同时，也尽可能地考虑主观报告与视频的内容[46-47]。但是，标注准确性依然会受到情绪体验与表情之间的一致性水平的约束，因为只有提供了一致的表面形态标准，计算机才可以对表情特征做很好的分类。 4.4 情感维度标注非摆拍条件下的表情照片中，符合原型表情的动作组合较少，所以基于原型表情模板进行情绪类型的标注比较困难。而基于 FACS 提供的 “核心 AU”分析也很难确认某个表情的情绪类别。而根据情感维度模型，则没有必要假设独立的离散的情绪类型。这种观点认为，少量的两极维度可以作为情感体验和情感识别的基本构件[15]。这也是为什么许多非摆拍的样本也标注了维度，如 AFEW-VA[68] ，AffectNet[34]。从愉快到不愉快的效价（Valence）维度在定义情绪体验和表达方面至关重要。这一维度能够被人类自动地、快速地识别出来，而且具有普遍性 [69]。毕竟，积极和消极的情感状态位于情感空间的相反位置，它们以一种非常不同的方式被传达 [69]。所以，效价似乎是非常容易标注的，而唤醒度（Arousal）的标注比较困难。例如，哭泣是唤醒程度低的情绪吗？生闷气的唤醒程度是否比哭泣高呢，高多少呢？而且，在较低的效价和唤醒度状态下，人们哪怕有情绪体验，也往往面无表情。 5 自动表情识别面临的主要问题在实践中，从数据的标注到计算机的识别，我们常常会遇到一些困难。在数据标注过程中，我们很难确定这些表情是否确切地反映了某种情绪。虽然在数据采集过程中，我们收集了主观评价、评估了视频的情绪特点并进行了面部动作编码，但是却发现主观评估与面部动作有时并不匹配（基于基本情绪理论的观点应该是匹配的）。而且，我们还发现巨大的个体差异，例如，有些人看到恶心的内容会表现出大笑，但是这个大笑并不等于“高兴”，然而当事人又说不清是什么情绪。于是，虽然基于数据库的自动表情识别准确率非常高，但是在现实生活情景中的识别准确率往往不是很高，难以应用于实践。 5.1 问题一：表情与真实情绪体验的一致性我们前期在微表情数据库的构建以及微表情分析等领域做了一些颇有成效的工作，但也发现情绪与表情的一致性并没有理论预期得那么高。同时，大量研究也表明，人的内在情绪体验和外在表情、生理信号之间的相关性较低。 Durán 等 [70] 进行了一项荟萃分析（元分析），其包含了 37 篇关于情绪体验与原型表情之间关系的研究。研究通过计算相关系数，来确定一种情绪与所设定表达之间的一致性程度（见表 1）。荟萃分析的结果显示，高兴与典型笑容的总体相关系数是 0.40（95% 的置信区间为 0.31~0.49）。如果我们把高兴（Happiness）和好玩（Amusement）看作是两种相互独立的情绪，那么与微笑相关的总体估计值是：快乐为 0.27[0.16, 0.39]，好玩为 0.52 [0.43, 0.62]。而参与者在高兴时出现典型笑容的概率是 0.41[0.08, 0.73]。如果把高兴和好玩分开考虑，则高兴的概率为 0.12[0.06, 0.18]，好玩的概率为 0.47[0.09, 0.84]。表 1 情绪与原型表情表达关系的元分析结果（Duran，2017） Table 1 The meta-analysis for the relationship between felt emotions and prototypical facial expressions 情绪被试数相关系数（95%置信区间）被试数反应概率（95%置信区间）高兴+好玩 1398 0.40[0.31, 0.49] 217 0.41 [0.08 0.73] 高兴 732 0.27[0.16, 0.39] 98 0.12[0.06, 0.18] 好玩 666 0.52[0.43, 0.62] 119 0.47[0.09, 0.84] 惊讶 168 0.24 [0.04, 0.44] 515 0.09 [0.05, 0.14] 厌恶 187 0.24 [0.10, 0.37] 279 0.32 [0.14, 0.50] 悲伤 247 0.41 [0.20 0.63] 119 0.21 [0.14, 0.29] 愤怒 281 0.22 [0.11, 0.33] 133 0.28 [0.20, 0.35] 恐惧 60 0.11 [–0. 14, 0.36] 170 0.34 [0.00, 0.74] 在所有测试的情绪类别中，除了恐惧之外，其他情绪与原型表情的相关系数均高于随机水平。然而，高于随机水平并不能说明特定情绪可以对应到特定表情。实际上，它们之间的相关性很 ·1045· 颜文靖，等：心理学视角下的自动表情识别第 5 期

<<向上翻页向下翻页>>

点击下载：【人工智能】心理学视角下的自动表情识别