司研制的家用机器人ＡＢＩＯ狗，其能对外界刺激做出相应的反应．卡内基梅

正在加载图片...

·486 智能系统学报第8卷司研制的家用机器人ABIO狗，其能对外界刺激做提取信息，进行处理加工并加以理解，最终用于人机出相应的反应.卡内基梅隆大学研制的服务机器人交互.表情机器人依靠视觉技术能完成表情识别、人 Valerie也具有丰富的情感表达能力，其能根具周围脸识别、视线跟踪、头部姿势检测以及行为理解等任复杂的环境做出不同的表达. 务.Leonardo头部后方和上方安装有摄像头，可以获比较典型的情感模型是Mehrabia的PAD 取人脸、头部姿势、行为姿势等信息[).其他的表情 (please-arousal-dominance-model)模型.MT的Kis- 机器人例如H&F Robot-Ⅱ、Kismet、WE-4R等一般 mt的情感空间模型由激励、价和态这3个坐标轴也都采用相关的视觉技术，从而能使其完成目标识构成，且情感空间被分割成代表特定情感状态的区别、跟踪和定位等任务域.每个轴的参数由动机系统、行为系统以及感知系 2.5语音识别与合成技术统获取，通过这3个系统的综合就可以获得相应心语音识别与合成技术的发展，实现了人类与机理状态的情感坐标，与该情感坐标距离最近的情感器人之间的语音通信.语音识别，即让机器通过识别区域就会被激活，驱动机器人产生表情，而情感坐标与理解把输入的语音信号转换为相应命令的技术，与激活区域中心的距离就决定了所产生表情的幅它的基本方法主要有隐马尔可夫模型、人工神经网度.日本早稻田大学的WE4R机器人也有相似的情络等，典型的语音识别的实现方式如图12所示.语感空间，由3个矢量愉悦度(pleasantness),激活度音合成技术是表情机器人合成语音实现的关键，从 (activation)和确定性(certainty)组成的三维心理空早期的参数合成到拼接合成，继而到两者的结合，如间，如图11所示.该空间被划分为7个区域，分别代今语音合成技术使得表情机器人可以实现更加人性表7种情感状态化的语音合成.Jules、WE-4R、Kismet等都大多采用确定情绪唤醒了语音识别与合成技术，可以方便地实现语音交互功能15.可见语音识别和语音合成的结合对于表情向量E 机器人与人类之间的情感交互至关重要，激活度语音输入识别结果特征提取心境向量M 模式匹配模型库愉悦度愉悦图11WE-4R机器人的情感空间图12语音识别的实现 Fig.11 Emotional space of WE-4R robot Fig.12 The realization of automatic speech recognition 2.4传感技术、机器人视觉技术 3 未来研究趋势传感器能够把自然界的各种物理量和化学量等精确地变换为电信号，再经电子电路或计算机进行 3.1人工情感理论的进一步研究处理，从而对这些量进行监测或控制传感器的应用人工情感包括3个方面：情感识别、情感表达与使表情机器人具有不同的感知能力.例如，日本早稻情感理解.目前对于前面两者的研究成果显著，而对田大学研制的WE-4R机器人，具有嗅觉和触觉传感于后者却是收效甚微.根本原因在于，到目前为止，器，嗅觉传感器的使用可以使其识别酒精、氨气和香没有一个研究者能够准确地定义情感的哲学本质，烟的气味，通过触觉传感器可以分辨出抚摸、打击和没能创立一个全新的、科学的、数学化的情感理论，碰撞等接触动作u).德国Kaiserslautern大学开发的也没有建立一个更加可靠的数学情感模型.目前的情感机器人，只能进行一些简单的情感识别，或者模 ROMAN表情机器人，耳部安装了2支麦克风，使其拟人的某些情感表达方式，而并没有真正的情感理具有听觉功能.在其额头处安装了红外传感器，可用解能力因此人工情感理论，尤其是人工情感建模，于判断前方物体的距离同时其具有惯性传感器，能有待于进一步研究，而且多学科的贯穿融合有必要够分别测三自由度的加速和转角，对其头部的空间使之更加深入位置可以进行估计. 3.2机器人表情的多样化和丰富化人类有80%以上的信息是靠视觉获取的，让机人类是面部表情最丰富的生物.情感的表达离器人与人一样通过视觉来获取信息，是研究表情机不开表情，心理学家认为人的表情表达了50%以上器人的一个重要方面.机器人从客观事物的图像中司研制的家用机器人ＡＢＩＯ狗，其能对外界刺激做出相应的反应．卡内基梅隆大学研制的服务机器人Ｖａｌｅｒｉｅ也具有丰富的情感表达能力，其能根具周围复杂的环境做出不同的表达．比较典型的情感模型是Ｍｅｈｒａｂｉａ的ＰＡＤ（ｐｌｅａｓｅ⁃ａｒｏｕｓａｌ⁃ｄｏｍｉｎａｎｃｅ⁃ｍｏｄｅｌ）模型．ＭＩＴ的Ｋｉｓ⁃ ｍｅｔ的情感空间模型由激励、价和态这３个坐标轴构成，且情感空间被分割成代表特定情感状态的区域．每个轴的参数由动机系统、行为系统以及感知系统获取，通过这３个系统的综合就可以获得相应心理状态的情感坐标，与该情感坐标距离最近的情感区域就会被激活，驱动机器人产生表情，而情感坐标与激活区域中心的距离就决定了所产生表情的幅度．日本早稻田大学的ＷＥ⁃４Ｒ机器人也有相似的情感空间，由３个矢量愉悦度（ｐｌｅａｓａｎｔｎｅｓｓ），激活度（ａｃｔｉｖａｔｉｏｎ）和确定性（ｃｅｒｔａｉｎｔｙ）组成的三维心理空间，如图１１所示．该空间被划分为７个区域，分别代表７种情感状态．图１１ＷＥ⁃４Ｒ机器人的情感空间Ｆｉｇ．１１ＥｍｏｔｉｏｎａｌｓｐａｃｅｏｆＷＥ⁃４Ｒｒｏｂｏｔ２．４传感技术、机器人视觉技术传感器能够把自然界的各种物理量和化学量等精确地变换为电信号，再经电子电路或计算机进行处理，从而对这些量进行监测或控制．传感器的应用使表情机器人具有不同的感知能力．例如，日本早稻田大学研制的ＷＥ⁃４Ｒ机器人，具有嗅觉和触觉传感器，嗅觉传感器的使用可以使其识别酒精、氨气和香烟的气味，通过触觉传感器可以分辨出抚摸、打击和碰撞等接触动作［１３］．德国Ｋａｉｓｅｒｓｌａｕｔｅｒｎ大学开发的ＲＯＭＡＮ表情机器人，耳部安装了２支麦克风，使其具有听觉功能．在其额头处安装了红外传感器，可用于判断前方物体的距离．同时其具有惯性传感器，能够分别测三自由度的加速和转角，对其头部的空间位置可以进行估计．人类有８０％以上的信息是靠视觉获取的，让机器人与人一样通过视觉来获取信息，是研究表情机器人的一个重要方面．机器人从客观事物的图像中提取信息，进行处理加工并加以理解，最终用于人机交互．表情机器人依靠视觉技术能完成表情识别、人脸识别、视线跟踪、头部姿势检测以及行为理解等任务．Ｌｅｏｎａｒｄｏ头部后方和上方安装有摄像头，可以获取人脸、头部姿势、行为姿势等信息［１４］．其他的表情机器人例如Ｈ＆ＦＲｏｂｏｔ⁃Ⅱ、Ｋｉｓｍｅｔ、ＷＥ⁃４Ｒ等一般也都采用相关的视觉技术，从而能使其完成目标识别、跟踪和定位等任务．２．５语音识别与合成技术语音识别与合成技术的发展，实现了人类与机器人之间的语音通信．语音识别，即让机器通过识别与理解把输入的语音信号转换为相应命令的技术，它的基本方法主要有隐马尔可夫模型、人工神经网络等，典型的语音识别的实现方式如图１２所示．语音合成技术是表情机器人合成语音实现的关键，从早期的参数合成到拼接合成，继而到两者的结合，如今语音合成技术使得表情机器人可以实现更加人性化的语音合成．Ｊｕｌｅｓ、ＷＥ⁃４Ｒ、Ｋｉｓｍｅｔ等都大多采用了语音识别与合成技术，可以方便地实现语音交互功能［１５〛．可见语音识别和语音合成的结合对于表情机器人与人类之间的情感交互至关重要．图１２语音识别的实现Ｆｉｇ．１２Ｔｈｅｒｅａｌｉｚａｔｉｏｎｏｆａｕｔｏｍａｔｉｃｓｐｅｅｃｈｒｅｃｏｇｎｉｔｉｏｎ３未来研究趋势３．１人工情感理论的进一步研究人工情感包括３个方面：情感识别、情感表达与情感理解．目前对于前面两者的研究成果显著，而对于后者却是收效甚微．根本原因在于，到目前为止，没有一个研究者能够准确地定义情感的哲学本质，没能创立一个全新的、科学的、数学化的情感理论，也没有建立一个更加可靠的数学情感模型．目前的情感机器人，只能进行一些简单的情感识别，或者模拟人的某些情感表达方式，而并没有真正的情感理解能力．因此人工情感理论，尤其是人工情感建模，有待于进一步研究，而且多学科的贯穿融合有必要使之更加深入．３．２机器人表情的多样化和丰富化人类是面部表情最丰富的生物．情感的表达离不开表情，心理学家认为人的表情表达了５０％以上 ·４８６· 智能系统学报第８卷

<<向上翻页向下翻页>>

点击下载：【学术论文】仿人情感交互表情机器人研究现状及关键技术分析