正在加载图片...
第1期 孙吴等:基于语音识别的救援机器人听觉导航方法 ·73 多优秀的语音识别软件产品,在手机语音拨号、门 2机器人的听觉技术 禁身份识别和语音文本记录等方面都有了实际应 2.1听觉定位技术 用.清华大学语音技术与专用芯片设计课题组研发 人类的听觉系统是一个复杂、有机的信息处理 的非特定人汉语数码串连续语音识别系统的识别精 系统,它可以感受声音的强度和空间方位等信息 度达到94.8%(不定长数字串)和96.8%(定长数 同时,声波不受光照条件限制,并具有较强的衍射 字串):在有5%的拒识率情况下,系统识别率可以 能力,可以绕过障碍物传播。人耳位于头部的两 达到96.9%(不定长数字串)和98.7%(定长数字 侧,距离约20cm,由于声音到达双耳时有微小的 串),是目前国际最好的识别结果之一,其性能已 时间差、强度差和相位差,经过人脑的分析,即能 经接近实用水平. 辨别声音的方向,通常可以达到5°~15°的角精度, 进而确定声源的位置6.听觉上具有方向感这一 3基于语音识别的机器人的听觉导航 特性,使人可以在嘈杂环境中分辨出来自某个方向 3.1语音识别模块 的一个比较特殊的声音.同样,利用仿生的人工 本文以救援救灾为背景,对基于语音识别的移 耳,结合计算机信号处理和模式识别,移动机器人 动机器人听觉导航技术进行了研究.发生火灾或地 也可以实现基于听觉的导航.因此,在有声环境中 震的建筑物内,由于烟雾或墙体倒塌等原因,执行 使机器人具备听力可以弥补其他传感器视场有限且 搜救任务的移动机器人无法通过视觉、超声和红外 不能穿过非透光障碍物的局限,从而增加机器人在 等传感器直接发现建筑物内其他房间或不可见区域 未知环境可获取的环境信息的种类,提高机器人导 中呼救的目标,因此结合语音识别的听觉导航技术 航与决策的准确性 具有重要的实际应用价值.听觉传感器可弥补其他 在潜艇声纳装置中,音频信号的定位和测距功 传感器视场有限且不能穿过非透光障碍物的局 能已被广泛应用,而其在移动机器人的导航方面同 限2.基于语音识别的移动机器人听觉导航技 样具有重要的应用价值.文献8]在一个移动机器 术,在听觉导航的基础上加入了语音识别技术,使 人上安装了八个听觉传感器阵列,根据声音信号传 得机器人只追踪特定声音,例如“救命”、“来人”和 输的时间差,判断声源方向.文献9]中介绍了一 “Help”,而对其他声音无反应. 种带有声音导航系统的移动机器人,利用粒子滤波 本课题采用北京博创机器人技术有限公司开发 方法对声音信号进行分析,能够发现并接近发出声 的创意之星机器人,其所采用的ARM10 音的目标.东京大学2001年研制了具有听觉定位 MultiFlex2PXA270控制卡具有嵌入式的语音识别 系统的仿人机器人©,该系统能同时发现和区分 功能模块,只需要在模块属性对话框中以纯文本格 在同一个房间里的两个声源,并分别对其进行定 式添加“救命”、“来人”等特定词汇,即可实现对外 位.台湾交通大学的机电工程学院制作的以听觉为 界输入语音信号的对比识别,如图1所示. 移动引导的小型机器人四,该机器人以单片机为 Speerk fidret Property 控制核心,无须有线连接其他控制部分,其声源定 向误差在5°以内.我国内地从事这一领域研究的大 学和研究机构相对较少,大部分高校和研究院所都 是从信号处理的角度对声源定位技术进行研究,而 将其应用于机器人上的相对较少.近年来,哈尔滨 Bdate 工业大学、河北工业大学和华北电力大学都在开展 ⊙sd Meegitia Pt 机器人听觉技术研究工作 2.2语音识别技术 语音识别技术中的模板匹配法发展比较成熟, Cand 己达到了实用阶段.在模板匹配方法中,要经过四 图1语音识别软件界面 个步骤:特征提取、模板训练、模板分类和判决.常 Fig.1 Interface of speech recognition software 用的技术有三种:动态时间规整(DTW)、隐马尔可 夫(HMM)理论和矢量量化(VQ)技术.在此类技术 为了提高语音识别模块的灵敏度,系统中还在 的基础上,开发有中科院天语Pattek ASR SDK等很 输入麦克风前端配置了助听器,将声音识别范围扩第 1 期 孙 昊等: 基于语音识别的救援机器人听觉导航方法 2 机器人的听觉技术 2. 1 听觉定位技术 人类的听觉系统是一个复杂、有机的信息处理 系统,它可以感受声音的强度和空间方位等信息. 同时,声波不受光照条件限制,并具有较强的衍射 能力,可以绕过障碍物传播. 人耳位于头部的两 侧,距离约 20 cm,由于声音到达双耳时有微小的 时间差、强度差和相位差,经过人脑的分析,即能 辨别声音的方向,通常可以达到 5° ~ 15°的角精度, 进而确定声源的位置[6--7]. 听觉上具有方向感这一 特性,使人可以在嘈杂环境中分辨出来自某个方向 的一个比较特殊的声音. 同样,利用仿生的人工 耳,结合计算机信号处理和模式识别,移动机器人 也可以实现基于听觉的导航. 因此,在有声环境中 使机器人具备听力可以弥补其他传感器视场有限且 不能穿过非透光障碍物的局限,从而增加机器人在 未知环境可获取的环境信息的种类,提高机器人导 航与决策的准确性. 在潜艇声纳装置中,音频信号的定位和测距功 能已被广泛应用,而其在移动机器人的导航方面同 样具有重要的应用价值. 文献[8]在一个移动机器 人上安装了八个听觉传感器阵列,根据声音信号传 输的时间差,判断声源方向. 文献[9]中介绍了一 种带有声音导航系统的移动机器人,利用粒子滤波 方法对声音信号进行分析,能够发现并接近发出声 音的目标. 东京大学 2001 年研制了具有听觉定位 系统的仿人机器人[10],该系统能同时发现和区分 在同一个房间里的两个声源,并分别对其进行定 位. 台湾交通大学的机电工程学院制作的以听觉为 移动引导的小型机器人[11],该机器人以单片机为 控制核心,无须有线连接其他控制部分,其声源定 向误差在 5°以内. 我国内地从事这一领域研究的大 学和研究机构相对较少,大部分高校和研究院所都 是从信号处理的角度对声源定位技术进行研究,而 将其应用于机器人上的相对较少. 近年来,哈尔滨 工业大学、河北工业大学和华北电力大学都在开展 机器人听觉技术研究工作. 2. 2 语音识别技术 语音识别技术中的模板匹配法发展比较成熟, 已达到了实用阶段. 在模板匹配方法中,要经过四 个步骤: 特征提取、模板训练、模板分类和判决. 常 用的技术有三种: 动态时间规整( DTW) 、隐马尔可 夫( HMM) 理论和矢量量化( VQ) 技术. 在此类技术 的基础上,开发有中科院天语 Pattek ASR SDK 等很 多优秀的语音识别软件产品,在手机语音拨号、门 禁身份识别和语音文本记录等方面都有了实际应 用. 清华大学语音技术与专用芯片设计课题组研发 的非特定人汉语数码串连续语音识别系统的识别精 度达到 94. 8% ( 不定长数字串) 和 96. 8% ( 定长数 字串) ; 在有 5% 的拒识率情况下,系统识别率可以 达到 96. 9% ( 不定长数字串) 和 98. 7% ( 定长数字 串) ,是目前国际最好的识别结果之一,其性能已 经接近实用水平. 3 基于语音识别的机器人的听觉导航 3. 1 语音识别模块 本文以救援救灾为背景,对基于语音识别的移 动机器人听觉导航技术进行了研究. 发生火灾或地 震的建筑物内,由于烟雾或墙体倒塌等原因,执行 搜救任务的移动机器人无法通过视觉、超声和红外 等传感器直接发现建筑物内其他房间或不可见区域 中呼救的目标,因此结合语音识别的听觉导航技术 具有重要的实际应用价值. 听觉传感器可弥补其他 传感器视场有限且不能穿过非透光障碍物的局 限[12--15]. 基于语音识别的移动机器人听觉导航技 术,在听觉导航的基础上加入了语音识别技术,使 得机器人只追踪特定声音,例如“救命”、“来人”和 “Help”,而对其他声音无反应. 本课题采用北京博创机器人技术有限公司开发 的创意之星机器人, 其 所 采 用 的 ARM10 MultiFlex2--PXA270 控制卡具有嵌入式的语音识别 功能模块,只需要在模块属性对话框中以纯文本格 式添加“救命”、“来人”等特定词汇,即可实现对外 界输入语音信号的对比识别,如图 1 所示. 图 1 语音识别软件界面 Fig. 1 Interface of speech recognition software 为了提高语音识别模块的灵敏度,系统中还在 输入麦克风前端配置了助听器,将声音识别范围扩 ·73·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有