自主神经通路自主神经通路表情预表达 (大脑皮层运动区) 表情预表达 (

正在加载图片...

第17卷智能系统学报 ·1042· 自主神经通路抑制信号表情预表达泄露 (大脑皮层运动区) 微表情风说险谎非自主情等神经通路表情预表达 (大脑皮层运动区) 微表情终自主神经通路抑制信号情绪产生表情表达准备微表情的产生图2微表情的产生机制 Fig.2 The production mechanism of micro-expressions 2.3复杂表情应的表达信号交织在一起。Keltner等B认为，当一些学者关注“复杂表情”，以期能更好地解考虑到不同的模态时，我们就应该认可存在24种释“不太标准”的表情。一篇发表在PNAS上的颇情绪状态的独特表达。有影响力的文章对复杂表情的定义是：复杂表情既然情绪表达是多方面的，那么在表情提供是由基本表情组合而成的”。实验者要求参与者的信息不充分的情况下，就可以加入其他通道的学习原型表情，并且努力摆出原型表情的组合，信息，如肢体动作、皮肤温度、语言内容、语气语然后筛选出可以明确识别表情的图片。在此基础调、外周生理信号和中枢神经活动等。理论上而上，研究者对这些复杂表情的类别进行分类，得言，多模态信息互相补充可以得到更加完整的到了较高的准确率，认为该实验证明了22种情绪更加确定的信号，因此应能获得更好的情绪识别类别的表达和识别是一致的。结果，而很多实证研究也证明了这一点。如果多 Li等2从社交网络中收集了表情图片，招募模态信息能够让我们更准确地识别情绪，那么， 315名参与者对数以万计的图片进行标注，筛选对机器来说，只要能获得足够的多模态数据，就出多标签的表情图片，建立了一个复杂表情数据能够通过深度学习，建立良好的情绪预测模型。库RAF-ML。该数据库的标注采用的是6种基本情绪的标签。如果某个标签的选择人数超过20%， 3表情数据的演化则标定为存在该种情绪：如果有2个以上的标签从最初的6种基本表情到更多类型的表情，有20%人选择，则定义为多标签（复杂）情绪。这从摆拍表情到自然表情，从实验室场景中的表情个研究使用的是复杂表情的“操作性定义”。到自然场景(in-the-wild)中的表情，从静态表情图值得一提的是，虽然关于复杂情绪与表情的片到动态表情视频，从表情的单一面部动作模式研究工作大多是在基本情绪理论框架下开展的，到表情的多模态信息，从小样本到大样本，表情但是该理论的领袖人物Ekman早期并不认同“复数据库的建设取得了巨大的进展，这是情绪心理杂情绪”这个概念。Ekman认为在生理反应与行学家和情感计算科学家共同努力的结果。为表达上缺乏存在复杂表情的证据。在他看来，研究者提升机器识别人类情绪的准确性的工所谓复杂的情绪只是多个基本表情的序列呈现，作主要集中在基于表情数据库训练出一个计算快是混合(mixed)而非融合(blend)。速的、鲁棒性高的模型43，努力使机器能够基于 2.4表情的多模态信息表情准确分类表达者内心情绪的状态。显而易见在过去的20年里，对情绪识别的研究已经超的是，自动表情识别的准确性在很大程度上受制越了对6种情绪的静态描述，开启了一种多模态于数据库中样本标注的质量。的、动态的行为模式，涉及面部动作、发声、身体 3.1从摆拍表情到自发的自然表情运动、凝视、手势、头部运动、触摸，甚至气味早期的表情数据库里大多是摆拍(posed)的的描述情绪表达的方式。例如，凝视模式和头部原型表情，如CK+、JAFFE7、MUG、RaFD9。动作与尴尬0、自豪和敬畏B的体验，以及相近年来的表情数据库更加关注表情样本的自发性自主神经通路自主神经通路表情预表达 (大脑皮层运动区) 表情预表达 (大脑皮层运动区) 抑制信号抑制信号泄露终止非自主神经通路情绪产生表情表达准备情绪微表情微表情微表情的产生高风说险谎情等景 ( ) 图 2 微表情的产生机制 Fig. 2 The production mechanism of micro-expressions 2.3 复杂表情一些学者关注“复杂表情”，以期能更好地解释“不太标准”的表情。一篇发表在 PNAS 上的颇有影响力的文章对复杂表情的定义是：复杂表情是由基本表情组合而成的[27]。实验者要求参与者学习原型表情，并且努力摆出原型表情的组合，然后筛选出可以明确识别表情的图片。在此基础上，研究者对这些复杂表情的类别进行分类，得到了较高的准确率，认为该实验证明了 22 种情绪类别的表达和识别是一致的。 Li 等 [28] 从社交网络中收集了表情图片，招募 315 名参与者对数以万计的图片进行标注，筛选出多标签的表情图片，建立了一个复杂表情数据库 RAF-ML。该数据库的标注采用的是 6 种基本情绪的标签。如果某个标签的选择人数超过 20%，则标定为存在该种情绪；如果有 2 个以上的标签有 20% 人选择，则定义为多标签（复杂）情绪。这个研究使用的是复杂表情的“操作性定义”。值得一提的是，虽然关于复杂情绪与表情的研究工作大多是在基本情绪理论框架下开展的，但是该理论的领袖人物 Ekman 早期并不认同“复杂情绪”这个概念。Ekman[2] 认为在生理反应与行为表达上缺乏存在复杂表情的证据。在他看来，所谓复杂的情绪只是多个基本表情的序列呈现，是混合（mixed）而非融合（blend）。 2.4 表情的多模态信息在过去的 20 年里，对情绪识别的研究已经超越了对 6 种情绪的静态描述，开启了一种多模态的、动态的行为模式，涉及面部动作、发声、身体运动、凝视、手势、头部运动、触摸，甚至气味[29] 的描述情绪表达的方式。例如，凝视模式和头部动作与尴尬[30] 、自豪[31] 和敬畏[32] 的体验，以及相应的表达信号交织在一起。Keltner 等 [33] 认为，当考虑到不同的模态时，我们就应该认可存在 24 种情绪状态的独特表达。既然情绪表达是多方面的，那么在表情提供的信息不充分的情况下，就可以加入其他通道的信息，如肢体动作、皮肤温度、语言内容、语气语调、外周生理信号和中枢神经活动等。理论上而言，多模态信息互相补充可以得到更加完整的、更加确定的信号，因此应能获得更好的情绪识别结果，而很多实证研究也证明了这一点。如果多模态信息能够让我们更准确地识别情绪，那么，对机器来说，只要能获得足够的多模态数据，就能够通过深度学习，建立良好的情绪预测模型。 3 表情数据的演化从最初的 6 种基本表情到更多类型的表情，从摆拍表情到自然表情，从实验室场景中的表情到自然场景（in-the-wild）中的表情，从静态表情图片到动态表情视频，从表情的单一面部动作模式到表情的多模态信息，从小样本到大样本，表情数据库的建设取得了巨大的进展，这是情绪心理学家和情感计算科学家共同努力的结果。研究者提升机器识别人类情绪的准确性的工作主要集中在基于表情数据库训练出一个计算快速的、鲁棒性高的模型[34-35] ，努力使机器能够基于表情准确分类表达者内心情绪的状态。显而易见的是，自动表情识别的准确性在很大程度上受制于数据库中样本标注的质量。 3.1 从摆拍表情到自发的自然表情早期的表情数据库里大多是摆拍（posed）的原型表情，如 CK+[36] 、JAFFE[37] 、MUG[38] 、RaFD[39]。近年来的表情数据库更加关注表情样本的自发性第 17 卷智能系统学报 ·1042·

<<向上翻页向下翻页>>

点击下载：【人工智能】心理学视角下的自动表情识别