器检测到两个学习目标。最终的混合模态识别准确率均达到 82% 左右。就

点击下载：多模态情绪识别研究综述（华南师范大学：潘家辉1、何志鹏1、李自娜2、梁艳1、邱丽娜）

正在加载图片...

·640· 智能系统学报第15卷器检测到两个学习目标。最终的混合模态识别准反应与模态特征之间的对应关系，构建普适的稳确率均达到82%左右。健的情感模型是当前工程应用研究中急需解决且就应用型情感识别系统而言，较具代表性的具有挑战性的问题。文献[99]提出了一种归一化是2007年Kapoor等6提出的学习伴侣系统，该数据转换方法，将模态信号中依赖于个体的分量系统不仅使用面部表情，还结合了皮肤电导、姿势去除，构建不依赖于个体的共用特征空间，从而等信息。该系统通过识别用户是否处于失落状态消除模态数据特征个体差异性所带来的影响，实而自动调整呈现的学习内容，给用户提供了极大现了跨被试者、可迁移的非个体依赖的情感生理的协助。Liu等7提出了一种将眼动和脑电图状态识别，提出了更接近实际应用的情绪识别方法。相结合的多模态情绪识别框架，利用提取出的特目前大多的情绪识别模型训练需要花费大量征对3类（正面、中性和负面）情绪进行识别。他前期时间进行系统标定，这极大地限制了工程应们所提出的双模态深度自编码器能够充分利用脑用的场景，同时无标签多模态数据的获取相对比神经信号（脑电）与外围生理信息（眼球运动）的较容易，因此基于无标签样本的多模态学习对于互补性来提高模型的情绪识别准确率，最终的准工程应用具有重要意义。Du等2提出了一个多确率达到91.01%。视角深层生成多视图情绪识别模型，将无标签的半监督分类问题转化为一个专门的缺失数据输人工程应用的讨论与建议任务，其中丢失的视图被视为一个潜在变量，并要实现具有一定情绪识别功能的人机交互应在推理过程中被整合出来。用，建立自然的人机交互过程，需要满足数据高 6.3多模态在线系统设计质量获取、识别过程中准确性和鲁棒性、在线识当我们需要借助多种模态对情绪状态进行综别的时效性这3个方面的要求。因此在实际工程合分析时，首先工程应用过程中多种模态数据采应用方面，我们针对数据的获取与处理、系统应集仪器设备分别记录的每种模态信号在时间上必用模型泛化设计、实时在线系统设计等方面的挑须准确对应或同步。最直接方式是保证每种模态战，提出了操作性建议以及在实践应用需要考虑采集的频率一致，但在工程应用中要保证异质多的问题。源模态数据采集频率一致是不现实的。清华大学 6.1多模态情绪数据的获取与处理高小榕团队1]使用伪随机序列编码信号同时标情绪识别的实际应用过程中，如何快速准确记视频和脑电信号的数据同步方法，完成了眼动地采集高质量的多模态信号是一个关键问题。仪与脑电同步采集平台的搭建。 2017德国柏林工业大学的脑机接口研究团队发与多模态情绪识别离线算法分析不同，多模布了一款可同时采集脑电信号、近红外光谱，以态情绪识别在实际的工程应用中我们更强调系统及其他常规生理参数（如心电、肌电和加速度需要实时针对当前新的样本，不断学习新的特征等)的无线模块化硬件架构。类似的高精准、并保存大部分已经学习到的知识，适当调整模型便携式、可扩展性的多生理参数采集硬件架构，结构，从而不断提升模型的泛化能力。大连理工是多模态情绪识别研究走向工程应用是先决条件。大学赵亮提出一种多模态数据增量共聚类融使用多模态进行情绪识别的意义在于通过不合算法，设计了3种增量聚类策略，即簇创建、簇同模态之间的情绪信息互补，融合各模态潜在的合并和聚类划分，对多模态数据进行增量聚类融共享信息，进而提升情绪识别任务的有效性。但合，同时设计一种自适应的模态权重机制，在共混合了各种异质高维的特征，带来的最直接问题聚类融合过程中对模态权重进行动态调整以应对就是维数灾难，从而显著降低了模型的性能。同多模态数据处理的实时性问题。时，数据中包含的负相关特征，也将会极大影响 7未来展望模型识别的准确率，因此需要针对不同的数据源采用合适的降维方法，保留数量适当且分类效果本文对目前多模态情绪识别研究现状进行了好的特征。综述，包括情绪模型的描述、情绪诱发的范式设 6.2系统应用模型泛化设计计、按多模态的融合层次介绍了各层次下的融合情绪刺激反应普遍都存在着个体差异性和非策略、不同模态类型混合的情绪识别方案，论证平稳特性，即不同个体在面对同一刺激产生的情了多模态融合技术可以极大提高情绪识别效果，绪反应不尽相同，从这种差异中寻找稳定的情绪同时对多模态情绪识别方法转为工程技术应用提器检测到两个学习目标。最终的混合模态识别准确率均达到 82% 左右。就应用型情感识别系统而言，较具代表性的是 2007 年 Kapoor 等 [96] 提出的学习伴侣系统，该系统不仅使用面部表情,还结合了皮肤电导、姿势等信息。该系统通过识别用户是否处于失落状态而自动调整呈现的学习内容，给用户提供了极大的协助[23]。Liu 等 [97] 提出了一种将眼动和脑电图相结合的多模态情绪识别框架，利用提取出的特征对 3 类 (正面、中性和负面) 情绪进行识别。他们所提出的双模态深度自编码器能够充分利用脑神经信号 (脑电) 与外围生理信息 (眼球运动) 的互补性来提高模型的情绪识别准确率，最终的准确率达到 91.01%。 6 工程应用的讨论与建议要实现具有一定情绪识别功能的人机交互应用，建立自然的人机交互过程，需要满足数据高质量获取、识别过程中准确性和鲁棒性、在线识别的时效性这 3 个方面的要求。因此在实际工程应用方面，我们针对数据的获取与处理、系统应用模型泛化设计、实时在线系统设计等方面的挑战，提出了操作性建议以及在实践应用需要考虑的问题。 6.1 多模态情绪数据的获取与处理情绪识别的实际应用过程中，如何快速准确地采集高质量的多模态信号是一个关键问题。 2017 德国柏林工业大学的脑机接口研究团队发布了一款可同时采集脑电信号、近红外光谱，以及其他常规生理参数 (如心电、肌电和加速度等) 的无线模块化硬件架构[98]。类似的高精准、便携式、可扩展性的多生理参数采集硬件架构，是多模态情绪识别研究走向工程应用是先决条件。使用多模态进行情绪识别的意义在于通过不同模态之间的情绪信息互补，融合各模态潜在的共享信息，进而提升情绪识别任务的有效性。但混合了各种异质高维的特征，带来的最直接问题就是维数灾难，从而显著降低了模型的性能。同时，数据中包含的负相关特征，也将会极大影响模型识别的准确率，因此需要针对不同的数据源采用合适的降维方法，保留数量适当且分类效果好的特征。 6.2 系统应用模型泛化设计情绪刺激反应普遍都存在着个体差异性和非平稳特性，即不同个体在面对同一刺激产生的情绪反应不尽相同，从这种差异中寻找稳定的情绪反应与模态特征之间的对应关系，构建普适的稳健的情感模型是当前工程应用研究中急需解决且具有挑战性的问题。文献 [99] 提出了一种归一化数据转换方法，将模态信号中依赖于个体的分量去除，构建不依赖于个体的共用特征空间，从而消除模态数据特征个体差异性所带来的影响，实现了跨被试者、可迁移的非个体依赖的情感生理状态识别，提出了更接近实际应用的情绪识别方法。目前大多的情绪识别模型训练需要花费大量前期时间进行系统标定，这极大地限制了工程应用的场景，同时无标签多模态数据的获取相对比较容易，因此基于无标签样本的多模态学习对于工程应用具有重要意义。Du 等 [21] 提出了一个多视角深层生成多视图情绪识别模型，将无标签的半监督分类问题转化为一个专门的缺失数据输入任务，其中丢失的视图被视为一个潜在变量，并在推理过程中被整合出来。 6.3 多模态在线系统设计当我们需要借助多种模态对情绪状态进行综合分析时,首先工程应用过程中多种模态数据采集仪器设备分别记录的每种模态信号在时间上必须准确对应或同步。最直接方式是保证每种模态采集的频率一致，但在工程应用中要保证异质多源模态数据采集频率一致是不现实的。清华大学高小榕团队[100] 使用伪随机序列编码信号同时标记视频和脑电信号的数据同步方法，完成了眼动仪与脑电同步采集平台的搭建。与多模态情绪识别离线算法分析不同，多模态情绪识别在实际的工程应用中我们更强调系统需要实时针对当前新的样本，不断学习新的特征并保存大部分已经学习到的知识，适当调整模型结构，从而不断提升模型的泛化能力。大连理工大学赵亮[101] 提出一种多模态数据增量共聚类融合算法，设计了 3 种增量聚类策略，即簇创建、簇合并和聚类划分，对多模态数据进行增量聚类融合，同时设计一种自适应的模态权重机制，在共聚类融合过程中对模态权重进行动态调整以应对多模态数据处理的实时性问题。 7 未来展望本文对目前多模态情绪识别研究现状进行了综述，包括情绪模型的描述、情绪诱发的范式设计、按多模态的融合层次介绍了各层次下的融合策略、不同模态类型混合的情绪识别方案，论证了多模态融合技术可以极大提高情绪识别效果，同时对多模态情绪识别方法转为工程技术应用提 ·640· 智能系统学报第 15 卷

<<向上翻页向下翻页>>

点击下载：多模态情绪识别研究综述（华南师范大学：潘家辉1、何志鹏1、李自娜2、梁艳1、邱丽娜）