第 1 期孙昊等: 基于语音识别的救援机器人听觉导航方法 2 机器人的

正在加载图片...

第1期孙吴等：基于语音识别的救援机器人听觉导航方法 ·73 多优秀的语音识别软件产品，在手机语音拨号、门 2机器人的听觉技术禁身份识别和语音文本记录等方面都有了实际应 2.1听觉定位技术用.清华大学语音技术与专用芯片设计课题组研发人类的听觉系统是一个复杂、有机的信息处理的非特定人汉语数码串连续语音识别系统的识别精系统，它可以感受声音的强度和空间方位等信息度达到94.8%（不定长数字串）和96.8%（定长数同时，声波不受光照条件限制，并具有较强的衍射字串)：在有5%的拒识率情况下，系统识别率可以能力，可以绕过障碍物传播。人耳位于头部的两达到96.9%（不定长数字串）和98.7%（定长数字侧，距离约20cm,由于声音到达双耳时有微小的串)，是目前国际最好的识别结果之一，其性能已时间差、强度差和相位差，经过人脑的分析，即能经接近实用水平. 辨别声音的方向，通常可以达到5°~15°的角精度，进而确定声源的位置6.听觉上具有方向感这一 3基于语音识别的机器人的听觉导航特性，使人可以在嘈杂环境中分辨出来自某个方向 3.1语音识别模块的一个比较特殊的声音.同样，利用仿生的人工本文以救援救灾为背景，对基于语音识别的移耳，结合计算机信号处理和模式识别，移动机器人动机器人听觉导航技术进行了研究.发生火灾或地也可以实现基于听觉的导航.因此，在有声环境中震的建筑物内，由于烟雾或墙体倒塌等原因，执行使机器人具备听力可以弥补其他传感器视场有限且搜救任务的移动机器人无法通过视觉、超声和红外不能穿过非透光障碍物的局限，从而增加机器人在等传感器直接发现建筑物内其他房间或不可见区域未知环境可获取的环境信息的种类，提高机器人导中呼救的目标，因此结合语音识别的听觉导航技术航与决策的准确性具有重要的实际应用价值.听觉传感器可弥补其他在潜艇声纳装置中，音频信号的定位和测距功传感器视场有限且不能穿过非透光障碍物的局能已被广泛应用，而其在移动机器人的导航方面同限2.基于语音识别的移动机器人听觉导航技样具有重要的应用价值.文献8]在一个移动机器术，在听觉导航的基础上加入了语音识别技术，使人上安装了八个听觉传感器阵列，根据声音信号传得机器人只追踪特定声音，例如“救命”、“来人”和输的时间差，判断声源方向.文献9]中介绍了一 “Help”,而对其他声音无反应. 种带有声音导航系统的移动机器人，利用粒子滤波本课题采用北京博创机器人技术有限公司开发方法对声音信号进行分析，能够发现并接近发出声的创意之星机器人，其所采用的ARM10 音的目标.东京大学2001年研制了具有听觉定位 MultiFlex2PXA270控制卡具有嵌入式的语音识别系统的仿人机器人©，该系统能同时发现和区分功能模块，只需要在模块属性对话框中以纯文本格在同一个房间里的两个声源，并分别对其进行定式添加“救命”、“来人”等特定词汇，即可实现对外位.台湾交通大学的机电工程学院制作的以听觉为界输入语音信号的对比识别，如图1所示. 移动引导的小型机器人四，该机器人以单片机为 Speerk fidret Property 控制核心，无须有线连接其他控制部分，其声源定向误差在5°以内.我国内地从事这一领域研究的大学和研究机构相对较少，大部分高校和研究院所都是从信号处理的角度对声源定位技术进行研究，而将其应用于机器人上的相对较少.近年来，哈尔滨 Bdate 工业大学、河北工业大学和华北电力大学都在开展 ⊙sd Meegitia Pt 机器人听觉技术研究工作 2.2语音识别技术语音识别技术中的模板匹配法发展比较成熟， Cand 己达到了实用阶段.在模板匹配方法中，要经过四图1语音识别软件界面个步骤：特征提取、模板训练、模板分类和判决.常 Fig.1 Interface of speech recognition software 用的技术有三种：动态时间规整(DTW)、隐马尔可夫(HMM)理论和矢量量化(VQ)技术.在此类技术为了提高语音识别模块的灵敏度，系统中还在的基础上，开发有中科院天语Pattek ASR SDK等很输入麦克风前端配置了助听器，将声音识别范围扩第 1 期孙昊等: 基于语音识别的救援机器人听觉导航方法 2 机器人的听觉技术 2. 1 听觉定位技术人类的听觉系统是一个复杂、有机的信息处理系统，它可以感受声音的强度和空间方位等信息．同时，声波不受光照条件限制，并具有较强的衍射能力，可以绕过障碍物传播．人耳位于头部的两侧，距离约 20 cm，由于声音到达双耳时有微小的时间差、强度差和相位差，经过人脑的分析，即能辨别声音的方向，通常可以达到 5° ～ 15°的角精度，进而确定声源的位置［6--7］．听觉上具有方向感这一特性，使人可以在嘈杂环境中分辨出来自某个方向的一个比较特殊的声音．同样，利用仿生的人工耳，结合计算机信号处理和模式识别，移动机器人也可以实现基于听觉的导航．因此，在有声环境中使机器人具备听力可以弥补其他传感器视场有限且不能穿过非透光障碍物的局限，从而增加机器人在未知环境可获取的环境信息的种类，提高机器人导航与决策的准确性．在潜艇声纳装置中，音频信号的定位和测距功能已被广泛应用，而其在移动机器人的导航方面同样具有重要的应用价值．文献［8］在一个移动机器人上安装了八个听觉传感器阵列，根据声音信号传输的时间差，判断声源方向．文献［9］中介绍了一种带有声音导航系统的移动机器人，利用粒子滤波方法对声音信号进行分析，能够发现并接近发出声音的目标．东京大学 2001 年研制了具有听觉定位系统的仿人机器人［10］，该系统能同时发现和区分在同一个房间里的两个声源，并分别对其进行定位．台湾交通大学的机电工程学院制作的以听觉为移动引导的小型机器人［11］，该机器人以单片机为控制核心，无须有线连接其他控制部分，其声源定向误差在 5°以内．我国内地从事这一领域研究的大学和研究机构相对较少，大部分高校和研究院所都是从信号处理的角度对声源定位技术进行研究，而将其应用于机器人上的相对较少．近年来，哈尔滨工业大学、河北工业大学和华北电力大学都在开展机器人听觉技术研究工作． 2. 2 语音识别技术语音识别技术中的模板匹配法发展比较成熟，已达到了实用阶段．在模板匹配方法中，要经过四个步骤: 特征提取、模板训练、模板分类和判决．常用的技术有三种: 动态时间规整( DTW) 、隐马尔可夫( HMM) 理论和矢量量化( VQ) 技术．在此类技术的基础上，开发有中科院天语 Pattek ASR SDK 等很多优秀的语音识别软件产品，在手机语音拨号、门禁身份识别和语音文本记录等方面都有了实际应用．清华大学语音技术与专用芯片设计课题组研发的非特定人汉语数码串连续语音识别系统的识别精度达到 94. 8% ( 不定长数字串) 和 96. 8% ( 定长数字串) ; 在有 5% 的拒识率情况下，系统识别率可以达到 96. 9% ( 不定长数字串) 和 98. 7% ( 定长数字串) ，是目前国际最好的识别结果之一，其性能已经接近实用水平． 3 基于语音识别的机器人的听觉导航 3. 1 语音识别模块本文以救援救灾为背景，对基于语音识别的移动机器人听觉导航技术进行了研究．发生火灾或地震的建筑物内，由于烟雾或墙体倒塌等原因，执行搜救任务的移动机器人无法通过视觉、超声和红外等传感器直接发现建筑物内其他房间或不可见区域中呼救的目标，因此结合语音识别的听觉导航技术具有重要的实际应用价值．听觉传感器可弥补其他传感器视场有限且不能穿过非透光障碍物的局限［12--15］．基于语音识别的移动机器人听觉导航技术，在听觉导航的基础上加入了语音识别技术，使得机器人只追踪特定声音，例如“救命”、“来人”和 “Help”，而对其他声音无反应．本课题采用北京博创机器人技术有限公司开发的创意之星机器人，其所采用的 ARM10 MultiFlex2--PXA270 控制卡具有嵌入式的语音识别功能模块，只需要在模块属性对话框中以纯文本格式添加“救命”、“来人”等特定词汇，即可实现对外界输入语音信号的对比识别，如图 1 所示．图 1 语音识别软件界面 Fig． 1 Interface of speech recognition software 为了提高语音识别模块的灵敏度，系统中还在输入麦克风前端配置了助听器，将声音识别范围扩 ·73·

<<向上翻页向下翻页>>

点击下载：基于语音识别的救援机器人听觉导航方法