第12卷第4期 智能系统学报 Vol.12 No.4 2017年8月 CAAI Transactions on Intelligent Systems Aug.2017 D0I:10.11992/is.201607016 网络出版地址:http:/www.cnki.net/kcms/detail/23.1538.TP. 基于非受限路径自然语言处理中的机器人导航 张珂,陈奇 (华北电力大学电子与通信工程系,河北保定071003) 摘要:为了实现使用自然语言控制机器人完成自主导航任务,提出一种基于语义角色标注(SL)的语义提取方法, 用于提高机器人对路径自然语言理解的准确率。首先,收集了一个非受限的路径自然语言语料库,在深入研究路径 自然语言语料库的基础上,提出了8个语块对语料进行语块分析,完成语义角色标注:然后,对语料进行依存句法分 析,完成语义角色标注:接着,结合语块分析和依存句法分析,提出了一种基于语块分析和依存句法分析的语义角色 标注方法,实验结果得到的准确率、召回率、F,-值分别达到了98.22%、98.48%和98.35%:最后,基于语义提取结果在 机器人Nao平台上完成了机器人问路导航任务。 关键词:语义角色标注:路径自然语言:语块分析:依存句法分析:机器人问路导航 中图分类号:TP18文献标志码:A文章编号:1673-4785(2017)04-0482-09 中文引用格式:张珂,陈奇.非受限路径自然语言处理中的机器人导航[J].智能系统学报,2017,12(4):482-490. 英文引用格式:ZHANG Ke,CHEN Qi..Robot navigation based on non-restricted route natural language processing[J].CAAI transactions on intelligent systems,2017,12(4):482-490. Robot navigation based on non-restricted route natural language processing ZHANG Ke,CHEN Qi (Department of Electronic and Communication,North China Electric Power University Code,Baoding 071003,China) Abstract:In order to use a natural-language controlled robot to complete autonomous navigation,this paper proposes a semantic extraction method based on semantic role labeling (SRL),which is used to enhance the understanding of route natural language for robots.First,a non-restricted route natural language corpus is constructed.Then,based on thorough study of this corpus,eight chunks are put forward to analyze the data,which lays the foundation for SRL.Finally,an SRL based on chunking and dependency parsing is proposed.The experimental results of precision,recall,and F-measurements were 98.22%,98.48%,and 98.35%,respectively. Using the proposed SRL method,the robot Nao was able to accomplish navigation tasks by asking the way. Keywords:semantic role labeling;route natural language;chunking;dependency parsing;robot navigation by asking the way 人工智能正在成为我们日常生活中的一个重 在国外,针对英文的路径自然语言研究已经达 要组成部分。语言是人类交流的重要方法内容。 到了较高的水平,Yuan等在栅格地图的基础上提 如果能用自然语言控制机器人,那么机器人将可以 出了基于自然语言的路径提取算法,该算法通过改 由普通人随心所欲地操作。通过自然语言控制机 进的隐马尔可夫场算法在路径提取方面取得了较 器人比其他方法更简便,也更符合人类的交流习 好的结果:Kollar等)在Yuan工作的基础上增加了 惯,因此通过自然语言进行机器人问路导航是实现 对动词和介词的理解,增强了系统对自然语言的理 机器人导航任务的理想方法之一,对人工智能的发 解能力:Skubic等[3)提出了一种利用空间语言驱 展有重要的意义。 动机器人在室内环境完成任务的方法,在语块分析 的基础上,提出了一种参考-方向-目标(RDT)模 收稿日期:2016-07-18.网络出版日期: 基金项目:国家自然科学基金项目(61302163,61302105):河北省自然 型,并通过多个RDT模型建立RDT链完成导航 科学基金项目(F2015502062):中央高校基本科研经费项目 任务。 (2016MS99). 通信作者:张珂.E-mail:zhangke41616@126.com 在国内相关领域的研究还鲜有人涉及,目前的
第 12 卷第 4 期 智 能 系 统 学 报 Vol.12 №.4 2017 年 8 月 CAAI Transactions on Intelligent Systems Aug. 2017 DOI:10.11992 / tis.201607016 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP. 基于非受限路径自然语言处理中的机器人导航 张珂,陈奇 (华北电力大学 电子与通信工程系,河北 保定 071003) 摘 要:为了实现使用自然语言控制机器人完成自主导航任务,提出一种基于语义角色标注(SRL)的语义提取方法, 用于提高机器人对路径自然语言理解的准确率。 首先,收集了一个非受限的路径自然语言语料库,在深入研究路径 自然语言语料库的基础上,提出了 8 个语块对语料进行语块分析,完成语义角色标注;然后,对语料进行依存句法分 析,完成语义角色标注;接着,结合语块分析和依存句法分析,提出了一种基于语块分析和依存句法分析的语义角色 标注方法,实验结果得到的准确率、召回率、F1 ⁃值分别达到了 98.22%、98.48%和 98.35%;最后,基于语义提取结果在 机器人 Nao 平台上完成了机器人问路导航任务。 关键词:语义角色标注;路径自然语言;语块分析;依存句法分析;机器人问路导航 中图分类号:TP18 文献标志码:A 文章编号:1673-4785(2017)04-0482-09 中文引用格式:张珂,陈奇.非受限路径自然语言处理中的机器人导航[J]. 智能系统学报, 2017, 12(4): 482-490. 英文引用格式:ZHANG Ke,CHEN Qi. Robot navigation based on non⁃restricted route natural language processing [ J]. CAAI transactions on intelligent systems, 2017, 12(4): 482-490. Robot navigation based on non⁃restricted route natural language processing ZHANG Ke, CHEN Qi (Department of Electronic and Communication, North China Electric Power University Code, Baoding 071003, China) Abstract:In order to use a natural⁃language controlled robot to complete autonomous navigation, this paper proposes a semantic extraction method based on semantic role labeling ( SRL), which is used to enhance the understanding of route natural language for robots. First, a non⁃restricted route natural language corpus is constructed. Then, based on thorough study of this corpus, eight chunks are put forward to analyze the data, which lays the foundation for SRL. Finally, an SRL based on chunking and dependency parsing is proposed. The experimental results of precision, recall, and F1 ⁃measurements were 98.22%, 98.48%, and 98.35%, respectively. Using the proposed SRL method, the robot Nao was able to accomplish navigation tasks by asking the way. Keywords: semantic role labeling; route natural language; chunking; dependency parsing; robot navigation by asking the way 收稿日期:2016-07-18. 网络出版日期: 基金项目:国家自然科学基金项目( 61302163,61302105);河北省自然 科学基金项目(Ff2015502062);中央高校基本科研经费项目 (2016MS99). 通信作者:张珂. E⁃mail:zhangke41616@ 126.com. 人工智能正在成为我们日常生活中的一个重 要组成部分。 语言是人类交流的重要方法内容。 如果能用自然语言控制机器人,那么机器人将可以 由普通人随心所欲地操作。 通过自然语言控制机 器人比其他方法更简便,也更符合人类的交流习 惯,因此通过自然语言进行机器人问路导航是实现 机器人导航任务的理想方法之一,对人工智能的发 展有重要的意义。 在国外,针对英文的路径自然语言研究已经达 到了较高的水平,Yuan 等[1]在栅格地图的基础上提 出了基于自然语言的路径提取算法,该算法通过改 进的隐马尔可夫场算法在路径提取方面取得了较 好的结果;Kollar 等[2]在 Yuan 工作的基础上增加了 对动词和介词的理解,增强了系统对自然语言的理 解能力;Skubic 等[3-5] 提出了一种利用空间语言驱 动机器人在室内环境完成任务的方法,在语块分析 的基础上,提出了一种参考-方向-目标(RDT) 模 型,并通过多个 RDT 模型建立 RDT 链完成导航 任务。 在国内相关领域的研究还鲜有人涉及,目前的
第4期 张珂,等:基于非受限路径自然语言处理中的机器人导航 483· 机器人导航方式主要是基于米制地图[6-刀、拓扑地 1.2路径自然语言语料分词和词性标注 图)和混合地图9)的导航方式。这些方法在导航 分词和词性标注是中文自然语言处理的基础, 之前需要采集大量信息用于绘制地图,效率较低。 分词效果将对机器人问路导航任务产生直接影响。 张秀龙、李新德等0]提出了一种基于语块分析的 因此,本文使用目前国内分词准确率最高的NLPR 路径自然语言处理方法,其语块分析方法建立在少 汉语分词系统对收集到的语料进行分词和词性标 量语料基础上,且直接采用语块分析提取导航语义 注处理。 对语料的要求较高,因此该方法一般性较差,不适 合非受限环境下的路径语言导航任务。 本文提出了一种面向汉语的路径自然语言处 理方法,使用基于语块分析和依存句法分析的语义 角色标注方法进行语义角色标注,根据提取出的语 义角色获得导航语义信息,基于导航语义信息按顺 序生成若干个路径单元,最后所有路径单元按顺序 生成一条完整的导航路径,指导机器人完成导航任 图1摸拟环境俯视图 务。本文方法建立在收集的大量非受限语料基础 Fig.1 Top view of simulated environment 上,语块的选取更加合理,基于语块分析和依存句 法分析的语义角色标注方法可以得到更好的标注 准确率。从语义角色标注中提取语义是自然语言 处理领域最常用的方法之一,对于路径自然语言语 料的语义提取,这种方法也有很好的效果。 1路径自然语言语料收集和预处理 1.1路径自然语言语料收集 语料库是自然语言处理的基础,目前自然语 图2模拟环境视频截图 处理的主流方法是在大规模语料库的基础上通过 Fig.2 Video capture of simulated environment 机器学习获得较好的自然语言处理结果,因此收集 足够规模的路径自然语言语料库是解决路径自然 例句:机器人向左走到墙,然后直走到墙角,沿 语言导航的第一步。然而建立足够的专业语料库 墙向右走到门,进门直走到凳子旁。 需要大量人力、物力,由于国内针对路径自然语言 分词和词性标注结果:机器人/n向/p左/f走/ 的研究较少,因此没有专业的汉语路径自然语言语 v到/w墙/n,/wd然后/c直/d走/w到/、墙角/n,/ 料库。 wd沿/p墙/n向/p右/f走/y到/、门/n,/wd进/f 使用Webots for Nao搭建了10个3-D模拟环 门/n直/d走/v到/w凳子/n旁/f。/w叮 境,然后根据模拟环境录制10段视频并给出每个环 2路径自然语言的句法分析 境的俯视图,为机器人在每个环境中给定一个导航 任务(即给出机器人的初始位置和目标位置)。在 句法分析技术是自然语言处理中非常重要的 不告知任务细节的情况下,找100个不同年龄、不同 一个环节,它可以使计算机像人一样获得自然语言 职业的志愿者通过观看视频和俯视图,自由选择一 句子的完整句法信息,从而对下一步的语义分析和 条可以完成导航任务的路径并给出相应的自然语 语用分析提供完备而巨大的句法层次的帮助,让计 言路径描述,为了保证语料的一般性,选择的100个 算机理解人类的语言。 志愿者年龄分布从12~60岁,受教育程度从小学到 本文将基于句法分析的结果完成语义角色标 硕士,籍贯分布在全国各地。志愿者在非受限环境 注从而抽取语义。句法分析的准确率对语义角色 下自由选择描述语句,最终收集了1000条语料。 标注的结果影响非常大,因此如何提高句法分析的 图1和图2分别是一个环境的俯视图和视频截 准确率是所面临的一个重要问题。 图。该环境中的导航任务为:从卧室走到客厅的灯 本文分别采用语块分析和依存句法分析完成 旁。该任务的一条语料为:“机器人向右走到门,进 路径自然语言语料的句法分析任务。 门后沿墙向右走到墙角附近的灯旁”。 2.1语块分析 最终收集1000条路径自然语言语料,构成了 为了降低句法分析问题的复杂度,Abney[i]首 本文所采用的路径自然语言语料库。 先提出了浅层句法分析(又称语块分析)的概念
机器人导航方式主要是基于米制地图[6-7] 、拓扑地 图[8]和混合地图[9] 的导航方式。 这些方法在导航 之前需要采集大量信息用于绘制地图,效率较低。 张秀龙、李新德等[10-12]提出了一种基于语块分析的 路径自然语言处理方法,其语块分析方法建立在少 量语料基础上,且直接采用语块分析提取导航语义 对语料的要求较高,因此该方法一般性较差,不适 合非受限环境下的路径语言导航任务。 本文提出了一种面向汉语的路径自然语言处 理方法,使用基于语块分析和依存句法分析的语义 角色标注方法进行语义角色标注,根据提取出的语 义角色获得导航语义信息,基于导航语义信息按顺 序生成若干个路径单元,最后所有路径单元按顺序 生成一条完整的导航路径,指导机器人完成导航任 务。 本文方法建立在收集的大量非受限语料基础 上,语块的选取更加合理,基于语块分析和依存句 法分析的语义角色标注方法可以得到更好的标注 准确率。 从语义角色标注中提取语义是自然语言 处理领域最常用的方法之一,对于路径自然语言语 料的语义提取,这种方法也有很好的效果。 1 路径自然语言语料收集和预处理 1.1 路径自然语言语料收集 语料库是自然语言处理的基础,目前自然语言 处理的主流方法是在大规模语料库的基础上通过 机器学习获得较好的自然语言处理结果,因此收集 足够规模的路径自然语言语料库是解决路径自然 语言导航的第一步。 然而建立足够的专业语料库 需要大量人力、物力,由于国内针对路径自然语言 的研究较少,因此没有专业的汉语路径自然语言语 料库。 使用 Webots for Nao 搭建了 10 个 3⁃D 模拟环 境,然后根据模拟环境录制 10 段视频并给出每个环 境的俯视图,为机器人在每个环境中给定一个导航 任务(即给出机器人的初始位置和目标位置)。 在 不告知任务细节的情况下,找 100 个不同年龄、不同 职业的志愿者通过观看视频和俯视图,自由选择一 条可以完成导航任务的路径并给出相应的自然语 言路径描述,为了保证语料的一般性,选择的 100 个 志愿者年龄分布从 12~60 岁,受教育程度从小学到 硕士,籍贯分布在全国各地。 志愿者在非受限环境 下自由选择描述语句,最终收集了 1 000 条语料。 图 1 和图 2 分别是一个环境的俯视图和视频截 图。 该环境中的导航任务为:从卧室走到客厅的灯 旁。 该任务的一条语料为:“机器人向右走到门,进 门后沿墙向右走到墙角附近的灯旁”。 最终收集 1 000 条路径自然语言语料,构成了 本文所采用的路径自然语言语料库。 1.2 路径自然语言语料分词和词性标注 分词和词性标注是中文自然语言处理的基础, 分词效果将对机器人问路导航任务产生直接影响。 因此,本文使用目前国内分词准确率最高的 NLPIR 汉语分词系统对收集到的语料进行分词和词性标 注处理。 图 1 模拟环境俯视图 Fig.1 Top view of simulated environment 图 2 模拟环境视频截图 Fig.2 Video capture of simulated environment 例句:机器人向左走到墙,然后直走到墙角,沿 墙向右走到门,进门直走到凳子旁。 分词和词性标注结果:机器人/ n 向/ p 左/ f 走/ v 到/ v 墙/ n , / wd 然后/ c 直/ d 走/ v 到/ v 墙角/ n , / wd 沿/ p 墙/ n 向/ p 右/ f 走/ v 到/ v 门/ n , / wd 进/ vf 门/ n 直/ d 走/ v 到/ v 凳子/ n 旁/ f 。 / wj 2 路径自然语言的句法分析 句法分析技术是自然语言处理中非常重要的 一个环节,它可以使计算机像人一样获得自然语言 句子的完整句法信息,从而对下一步的语义分析和 语用分析提供完备而巨大的句法层次的帮助,让计 算机理解人类的语言。 本文将基于句法分析的结果完成语义角色标 注从而抽取语义。 句法分析的准确率对语义角色 标注的结果影响非常大,因此如何提高句法分析的 准确率是所面临的一个重要问题。 本文分别采用语块分析和依存句法分析完成 路径自然语言语料的句法分析任务。 2.1 语块分析 为了降低句法分析问题的复杂度,Abney [13] 首 先提出了浅层句法分析(又称语块分析) 的概念。 第 4 期 张珂,等:基于非受限路径自然语言处理中的机器人导航 ·483·
·484 智能系统学报 第12卷 语块分析能够在词法分析和语义分析中间架起一 PT[然后]O[直走到墙角]MT[,]PT[沿墙]PR[向 座桥梁。它并不要求得到完整的句法树,而只要求 右]DT[走到门]MT[,]PT[进门]SC[直走到凳子 识别句子中某些结构相对简单的独立成分。 旁]MT[。]PT 2.1.1语块的划分 2.1.2基于条件随机场(CRF)的语块分析 关于汉语语块的划分,至今没有一个公认权威 语块分析问题是一种分类问题,本文采用条件 的标准,很多专家都给出了自己的划分标准4-16)。 随机场进行语块分析。条件随机场,是一种鉴别式 由于本文针对路径自然语言,语言现象相对比 概率模型,是随机场的一种,它具有表达长距离依 较简单,通过分析路径自然语言语料,发现路径自 然语言主要内容由参考、方向、目标3个要素组成。 赖性和交叠性特征的能力,同时能够较好地解决标 例句1:机器人左转(方向转换模块,只有方 注偏置等问题,而且所有特征可以进行全局归一 向)。 化,能够求得全局的最优解。 例句2:机器走到桌子(无参考向目标前进模 CRF是一个在给定输入节点条件下计算输出节 块,只有目标)。 点条件概率的无向图模型。对于指定的节点输入值, 例句3:机器人走到沙发右边的花瓶旁边(根据 它能计算指定节点输出值的条件概率,其训练目标 参考向目标前进模块,包含参考和目标)。 是使得条件概率最大化。如一个中文词序列x=(机 例句4:机器人拿桌子上的书(根据参考寻找目 器人,向,左,走,到,墙),定义y为一个长度与x相等 标模块)。 的状态序列,y=(B-DT,I-DT,I-DT,B-MT,I-MT,I 以上4种情况是路径自然语言最常见的语言现 MT)。对于一个带有参数A={入1,入2,…,入n}的线性 象。为了更好地完成语料切分任务,又定义了如下 链。CRF将给定的输入序列x得到的状态序列条 几个非常见语块。 件概率定义为 例句5:机器人找到笔记本(直接寻找目标模 块,只有目标,且一般来说是最终目标)。 例句6:机器人沿墙直走(介词参考模块,只有 参考没有目标,一般来说目标在后面的语句中)。 式中:Z,(x)是归一化因子f(y1,,x,t)是整个观 例句7:机器人绕过沙发(空间转换模块)。 察序列和相应标记序列中位置为t和t-1标记的特 最终确定了7个包含语义的语块和1个边界语 征函数,入x是在训练中得到的并与每个特征f相关 块。具体情况见表1。 的权重值。 规定的7个语块有两个优点:1)语料库中的路 CRF模型的训练采用LBFGS方法,即在给定 径自然语言语料都可以由这7个语块切分,所以不 输入序列的情况下估计模型参数,把它们对应标注 会出现语义丢失的情况:2)语块的定义很清楚,语 序列构成的集合的条件概率最大化。 块之间的区别很明显,各个语块的特点也很明显, CRF模型的关键在于选择Markov阶数和特征 识别时不易出错。还有一个特殊的边界语块:标点 集合。通过CRF特征函数可以指定各种状态转换 符号语块,它不包含任何语义,但是它是很多不同 结构,这些状态转换结构具有不同的Markov阶数, 语块的默认边界,对提高语块分析的准确率有重要 即特征函数中出现输出标记的个数。高阶特征能 的作用。 把握更多的长度依赖关系,但也需要更大的训练开 表1语块定义 销,并带来更严重的数据稀疏问题。本文选择二阶 Table 1 Chunk definition CRF模型。 DT 方向转换 RT 所有特征模板由4类模板元素组成,即词本身 根据参考寻找目标 MT 无参考向目标行进 (W)、词性(P)、词的语块标注(C)、词的依存关系 ST 直接寻找目标 标注(D)。模板元素的下标数字即表示该模板元素 PR 介词参考 的相应词位置,下标为0即表示当前词,-i则表示 SC 空间转换 当前词的前数第i个词,+i则表示当前词的后数第i FR 根据参考向目标前进 个词。模板元素和下标数字构成单一特征模板,例 PT 标点符号 如:W。表示当前词,P,表示当前词的词性。单一特 根据定义的语块对原始语料库进行手动语块 征只考虑了单个因素,但是单个因素并不能完全表 标注,得到语块分析语料库。下面给出一个语料的 达上下文的语言现象。因此,可通过对单一特征进 语块分析结果:[机器人向左]DT[走到墙]MT[,] 行组合,构造一些复合特征。例如:C-/C。表示前
语块分析能够在词法分析和语义分析中间架起一 座桥梁。 它并不要求得到完整的句法树,而只要求 识别句子中某些结构相对简单的独立成分。 2.1.1 语块的划分 关于汉语语块的划分,至今没有一个公认权威 的标准,很多专家都给出了自己的划分标准[14-16] 。 由于本文针对路径自然语言,语言现象相对比 较简单,通过分析路径自然语言语料,发现路径自 然语言主要内容由参考、方向、目标 3 个要素组成。 例句 1:机器人左转( 方向转换模块,只有方 向)。 例句 2:机器走到桌子(无参考向目标前进模 块,只有目标)。 例句 3:机器人走到沙发右边的花瓶旁边(根据 参考向目标前进模块,包含参考和目标)。 例句 4:机器人拿桌子上的书(根据参考寻找目 标模块)。 以上 4 种情况是路径自然语言最常见的语言现 象。 为了更好地完成语料切分任务,又定义了如下 几个非常见语块。 例句 5:机器人找到笔记本(直接寻找目标模 块,只有目标,且一般来说是最终目标)。 例句 6:机器人沿墙直走(介词参考模块,只有 参考没有目标,一般来说目标在后面的语句中)。 例句 7:机器人绕过沙发(空间转换模块)。 最终确定了 7 个包含语义的语块和 1 个边界语 块。 具体情况见表 1。 规定的 7 个语块有两个优点:1)语料库中的路 径自然语言语料都可以由这 7 个语块切分,所以不 会出现语义丢失的情况;2) 语块的定义很清楚,语 块之间的区别很明显,各个语块的特点也很明显, 识别时不易出错。 还有一个特殊的边界语块:标点 符号语块,它不包含任何语义,但是它是很多不同 语块的默认边界,对提高语块分析的准确率有重要 的作用。 表 1 语块定义 Table 1 Chunk definition DT 方向转换 RT 根据参考寻找目标 MT 无参考向目标行进 ST 直接寻找目标 PR 介词参考 SC 空间转换 FR 根据参考向目标前进 PT 标点符号 根据定义的语块对原始语料库进行手动语块 标注,得到语块分析语料库。 下面给出一个语料的 语块分析结果:[机器人向左] DT[走到墙] MT[,] PT[然后]O[直走到墙角]MT[,] PT[沿墙] PR[向 右]DT[走到门] MT[,] PT[进门] SC[直走到凳子 旁]MT[。]PT 2.1.2 基于条件随机场(CRF)的语块分析 语块分析问题是一种分类问题,本文采用条件 随机场进行语块分析。 条件随机场,是一种鉴别式 概率模型,是随机场的一种,它具有表达长距离依 赖性和交叠性特征的能力,同时能够较好地解决标 注偏置等问题,而且所有特征可以进行全局归一 化,能够求得全局的最优解。 CRF 是一个在给定输入节点条件下计算输出节 点条件概率的无向图模型。 对于指定的节点输入值, 它能计算指定节点输出值的条件概率, 其训练目标 是使得条件概率最大化。 如一个中文词序列x = (机 器人,向,左,走,到,墙),定义 y 为一个长度与 x 相等 的状态序列, y = ( B⁃DT, I⁃DT, I⁃DT,B⁃MT, I⁃MT, I⁃ MT)。 对于一个带有参数 Λ= λ1 ,λ2 ,…,λn { } 的线性 链。 CRF 将给定的输入序列 x 得到的状态序列条 件概率定义为 PΛ(y | x) = 1 ZΛ(x) exp ∑ T i = 1 ∑k λk f k(yt-1 ,y [ t,x,t) ] 式中:ZΛ(x)是归一化因子,f k(yt-1 ,yt,x,t)是整个观 察序列和相应标记序列中位置为 t 和 t-1 标记的特 征函数,λK 是在训练中得到的并与每个特征 f k 相关 的权重值。 CRF 模型的训练采用 LBFGS 方法, 即在给定 输入序列的情况下估计模型参数,把它们对应标注 序列构成的集合的条件概率最大化。 CRF 模型的关键在于选择 Markov 阶数和特征 集合。 通过 CRF 特征函数可以指定各种状态转换 结构, 这些状态转换结构具有不同的 Markov 阶数, 即特征函数中出现输出标记的个数。 高阶特征能 把握更多的长度依赖关系, 但也需要更大的训练开 销, 并带来更严重的数据稀疏问题。 本文选择二阶 CRF 模型。 所有特征模板由 4 类模板元素组成,即词本身 (W)、词性(P)、词的语块标注(C)、词的依存关系 标注(D)。 模板元素的下标数字即表示该模板元素 的相应词位置,下标为 0 即表示当前词,-i 则表示 当前词的前数第 i 个词,+i 则表示当前词的后数第 i 个词。 模板元素和下标数字构成单一特征模板,例 如:W0 表示当前词,P1 表示当前词的词性。 单一特 征只考虑了单个因素,但是单个因素并不能完全表 达上下文的语言现象。 因此,可通过对单一特征进 行组合,构造一些复合特征。 例如:C-1 / C0 表示前 ·484· 智 能 系 统 学 报 第 12 卷
第4期 张珂,等:基于非受限路径自然语言处理中的机器人导航 .485. 数第1个词的语块标注与当前词的语块标注两个单 之后。 一特征的组合。P-1/P。/P,则表示前数第1个词的 根据以上定义,任何依存关系都可以由距离和 词性和当前词性和后数第1个词的词性3个单一特 方向两个因素决定。将每个词的标签定义为如下 征的组合。特征模板由所有的特征组成。 形式:[+/-]dPOS。其中“+”表示支配词在从属词 表2是语块分析的特征模板。其中,W2,W, 之后,“-”表示支配词在从属词之前,POS表示支配 W。,W1,W2表示5个独立的单一特征。 词的词性,“”表示从属词和支配词之间存在和支 表2语块分析的CRF特征模板 配词具有相同词性的数量。 Table 2 CRF feature template for chunking 2.2.2基于CRF的依存句法分析 W_2,W_1,Wo,W.1,W.2 当前词及其前后各两个词 类似于语块分析,依然使用CRF模型完成依存 句法分析。 P-2.P-1Po.PP.2 当前词及其前后各两个词的词性 根据本文定义的依存句法标注方式,当前词的 W_/Wo 前数第1个词与当前词 依存标签取决于位于其左或其右的支配词,而不是 Wo/W. 当前词与后数第1个词 前后多个词。由于依存句法经常会出现较长距离 前数第2个词的词性与前数 的依存关系,因此尽可能地将特征模板的范围定义 P-2/P 第一个词的词性 得更宽。根据上述特点,定义特征模板如下:W4, 前数第1个词的词性与 W-3,W-2,W-1,Wo,W1,W2,P-4,P-3,P-2,P1,Po, P-/Po 当前词的词性 P1,P2,P-2/P-1,P-1/Po,W-2/W-1o 当前词的词性和后数 Po/P 3路径自然语言的语义角色标注 第1个词的词性 语义角色标注是一种浅层语义分析,其目标是 后数第1个词的词性和后数 P./P.2 发现在一个给定的输入句子的每个谓词的论元 第2个词的词性 结构。 前数第2个词的词性和前数 P.2/P-/Po 自动语义角色标注是在句法分析的基础上进 第1个词的词性和当前词性 行的,本文分别使用了语块分析和依存句法分析, 前数第1个词的词性和 因此,语义角色标注方法也分为基于语块分析的语 P./Po/P. 当前词性和后数第1个词的词性 义角色标注和基于依存句法分析的语义角色标注。 3.1语义角色分类 当前词性和后数第1个词的 Po/P/P.2 词性和后数第2个词的词性 语义角色标注是获取句子层面语义的重要方 法,对于路径自然语言来说,其关键语义都包含在 定制好特征模板之后,通过训练得到相应的 某几个语义角色中。因此在语义角色标注的基础 CFR模型,使用该模型可以自动得到语块分析标注 上提取语义会比较容易。 结果。 语义角色分为核心语义角色和附加语义角色。 2.2依存句法分析 Arg+数字,表示核心语义角色(core argument),其中 在自然语言处理中,有时需要知道句子中词与 Arg0通常表示动作的施事,Agl通常表示动作的受 词之间的依存关系。用词与词之间的依存关系来 事,Ag2~Arg4根据谓语动词不同具有不同的语义 描述语言结构的框架称为依存语法。利用依存语 含义。AgM-*代表附属成分,这里的“*”表示附 法进行依存句法分析也是自然语言处理的重要手 属成分的功能,如表3所示。 段之一。 表3重要的附属成分类型 2.2.1依存句法问题转化为序列标注问题 Table 3 Important subsidiary types 依存句法问题可以看作一种分类问题。句子 语义角色标记 说明 中任意两个词都只存在3种依存关系[): 1)不存在依存关系; ADV 副词标记 2)存在向左的依存关系,即支配词在从属词 LOC 位置格 之前; 3)存在向右的依存关系,即支配词在从属词 DIR 指向标记
数第 1 个词的语块标注与当前词的语块标注两个单 一特征的组合。 P-1 / P0 / P+1则表示前数第 1 个词的 词性和当前词性和后数第 1 个词的词性 3 个单一特 征的组合。 特征模板由所有的特征组成。 表 2 是语块分析的特征模板。 其中,W-2 ,W-1 , W0 ,W+1 ,W+2表示 5 个独立的单一特征。 表 2 语块分析的 CRF 特征模板 Table 2 CRF feature template for chunking W-2 ,W-1 ,W0 ,W+1 ,W+2 当前词及其前后各两个词 P-2 ,P-1 ,P0 ,P+1 ,P+2 当前词及其前后各两个词的词性 W-1 / W0 前数第 1 个词与当前词 W0 / W+1 当前词与后数第 1 个词 P-2 / P-1 前数第 2 个词的词性与前数 第一个词的词性 P-1 / P0 前数第 1 个词的词性与 当前词的词性 P0 / P+1 当前词的词性和后数 第 1 个词的词性 P+1 / P+2 后数第 1 个词的词性和后数 第 2 个词的词性 P-2 / P-1 / P0 前数第 2 个词的词性和前数 第 1 个词的词性和当前词性 P-1 / P0 / P+1 前数第 1 个词的词性和 当前词性和后数第 1 个词的词性 P0 / P+1 / P+2 当前词性和后数第 1 个词的 词性和后数第 2 个词的词性 定制好特征模板之后,通过训练得到相应的 CFR 模型,使用该模型可以自动得到语块分析标注 结果。 2.2 依存句法分析 在自然语言处理中,有时需要知道句子中词与 词之间的依存关系。 用词与词之间的依存关系来 描述语言结构的框架称为依存语法。 利用依存语 法进行依存句法分析也是自然语言处理的重要手 段之一。 2.2.1 依存句法问题转化为序列标注问题 依存句法问题可以看作一种分类问题。 句子 中任意两个词都只存在 3 种依存关系[17] : 1)不存在依存关系; 2)存在向左的依存关系,即支配词在从属词 之前; 3)存在向右的依存关系,即支配词在从属词 之后。 根据以上定义,任何依存关系都可以由距离和 方向两个因素决定。 将每个词的标签定义为如下 形式:[+ / -]dPOS。 其中“ +”表示支配词在从属词 之后,“-”表示支配词在从属词之前,POS 表示支配 词的词性,“ d”表示从属词和支配词之间存在和支 配词具有相同词性的数量。 2.2.2 基于 CRF 的依存句法分析 类似于语块分析,依然使用 CRF 模型完成依存 句法分析。 根据本文定义的依存句法标注方式,当前词的 依存标签取决于位于其左或其右的支配词,而不是 前后多个词。 由于依存句法经常会出现较长距离 的依存关系,因此尽可能地将特征模板的范围定义 得更宽。 根据上述特点,定义特征模板如下:W-4 , W-3 ,W-2 ,W-1 ,W0 ,W+1 ,W+2 ,P-4 ,P-3 ,P-2 ,P-1 ,P0 , P+1 ,P+2 ,P-2 / P-1 ,P-1 / P0 ,W-2 / W-1 。 3 路径自然语言的语义角色标注 语义角色标注是一种浅层语义分析,其目标是 发现在一个给定的输入句子的每个谓词的论元 结构。 自动语义角色标注是在句法分析的基础上进 行的,本文分别使用了语块分析和依存句法分析, 因此,语义角色标注方法也分为基于语块分析的语 义角色标注和基于依存句法分析的语义角色标注。 3.1 语义角色分类 语义角色标注是获取句子层面语义的重要方 法,对于路径自然语言来说,其关键语义都包含在 某几个语义角色中。 因此在语义角色标注的基础 上提取语义会比较容易。 语义角色分为核心语义角色和附加语义角色。 Arg+数字,表示核心语义角色(core argument),其中 Arg0 通常表示动作的施事,Arg1 通常表示动作的受 事,Arg2 ~ Arg4 根据谓语动词不同具有不同的语义 含义。 ArgM-∗代表附属成分,这里的“∗”表示附 属成分的功能,如表 3 所示。 表 3 重要的附属成分类型 Table 3 Important subsidiary types 语义角色标记 说明 ADV 副词标记 LOC 位置格 DIR 指向标记 第 4 期 张珂,等:基于非受限路径自然语言处理中的机器人导航 ·485·
·486 智能系统学报 第12卷 根据表3语义角色类型进行手动标注,为语义 左后,右后),相隔为45°。如果语料中没有出现具 角色标注提供语料库。下面给出一个语料的语义 体的角度描述,例如:“向左转”,就默认为“向左 角色标注结果:[机器人]AO[向左]AM-DIR[走到] 转90°”。 V[墙]A1[,]O[然后]AM-ADV[直]AM-ADV[走 3)运动控制:从V中根据词性获取 到]V[墙角]A0[,]O[沿着墙]AM-LOC[向右] 导航任务谓词绝大多数都是“走”、“直行”等等 AM-DIR[走到]V[门][,]O[进]V[门]A1[直] 动词,有时候可能会出现“穿过”,“绕过”,“拿”这 AM-ADV[走到]V[凳子旁]A1[。]O 些词语。将表示行走的谓词统一为“走”,因为这些 本文将语义角色标注作为一个序列标注问题 词对导航的影响相同。 来解决,因此依然用CRF模型进行语义角色标注。 4)运动目标(可能有运动参考) 3.2基于语块分析的语义角色标注 A,和AM-LOC语义角色就是需要的运动目标, 基于语块分析的语义角色标注的模板需要有 但是对于导航任务来说,名词是较为复杂的模块, 所变化。最主要的是将语块分析的结果作为特征 因为它既可以作为运动目标也可以作为运动参考, 集添加到语义角色标注的特征模板当中。基于语 仅仅从语义角色和词性中获取不到清晰的导航信 块分析的语义角色标注特征模板定义如下:W-2, 息。本文提出一种基于依存关系提取路径自然语 W-1,Wo,W1,W2,P-2,P-1,Po,P1,P2,C-2,C-1, 言运动目标和运动参考模块的方法。对于路径自 Co,C1,C2,W/W_o:Wo/W1.P_/Po,Po/P:1,C-/ 然语言A,和LOC中的名词,包含以下几种情况: Co:Co/C.1,P-2/P-/Poo ①单个名词依存于动词,这种情况最简单。这 3.3基于依存句法分析的语义角色标注 个名词就是运动目标。例如“绕过桌子”,“桌子”依 将依存句法分析的结果作为特征集添加到新 存于动词“绕过”,“桌子”就是运动目标。 的特征模板,基于语块分析的语义角色标注特征模 ②单个名词并不依存于动词。例如“走到沙发 板定义如下:W-2,W1,Wo,W1,W2,P-2,P-1,Po, 旁”,依存关系为“沙发”依存于“旁”,这时“旁”依 P1,P2,D-2,D1,Do,D1,D2,W-/W-o,W/W+1, 存于动词“到”,可以根据这一特点提取到名词短语 P_/Po,Po/P:1,D-/Do,Do/D.1,P-2/P-/Poo “沙发旁”。“沙发旁”就是提取到的运动目标。 3.4基于语块分析和依存句法分析的SRL ③多个名词(多为两个名词)。对于多个名词, 定义新的特征模板,使用训练语料库训练模 绝大多数是两个名词。偶尔出现3个名词也可以被 型,基于语块分析和依存句法分析的语义角色标注 处理成单个名词。例如“沙发前面的桌子上的花 的特征模板定义如下:W1,W。,W1,P-1,P。,P1, 瓶”,可以将“沙发前面的桌子”看作一个名词,“花 C-1,Co,C+,D-1,Do,D+1o 瓶”看作一个名词,因此可以将多个名词的处理方 法简化为两个名词的处理方法。 4生成导航路径 对于两个名词,可能出现如下两种情况。 一条完整的路径可以由多个路径单元组成。 1)名词之间的依存关系是并列关系。 本文将路径分割为若干个路径单元,划分原则为每 例如“桌子和椅子”,这时可以将它看作单个名 个路径单元有且只有一个运动目标并且运动控制 词,通过下一步的分析得到正确的运动目标。例如 一定存在。根据这两个原则,在获取路径单元时可 “走到桌子和椅子前”,“桌子和椅子”依存于“前”, 以根据运动目标和运动控制模块是否都不为空来 “前”依存于动词“走到”,因此“桌子和椅子前”就 判断路径单元是否完整。 是运动目标。 一个路径单元由4个部分组成:运动主体、运动 2)名词之间存在依存关系。 方向、运动控制、运动目标(可能有运动参考)。这4 例如“拿桌子上的书”,“桌子上的书”被标注为 个部分都可以从不同的语义角色中提取。 A,“桌子”依存于“上”,“上”依存于“书”,“书”依 1)运动主体:从A。中根据词性(名词)直接获 存于动词“拿”。“桌子上”可以看作一个名词,此时 取,默认为“机器人”。 由于名词“书”依存于动词“拿”,所以“书”是运动 2)运动方向:从AM-DIR中根据词性提取,方向 目标,“桌子上”依存于名词“书”,它作为运动参考。 包括基本方向(方位词)和角度(量词),默认为“向 少量的运动目标存在于AM-LOC语义角色。 前”。 对于AM-LOC语义角色,首先根据其中的语块类型 规定8个基本方向(前,后,左,右,左前,右前, 确定其是运动参考或者是运动目标。对于“PR”语
根据表 3 语义角色类型进行手动标注,为语义 角色标注提供语料库。 下面给出一个语料的语义 角色标注结果:[机器人]A0[向左]AM⁃DIR[走到] V[墙] A1[,] O[然后] AM⁃ADV[直] AM⁃ADV[走 到]V[ 墙角] AO [,] O [ 沿着墙] AM⁃LOC [ 向右] AM⁃DIR[走到] V[门] [,] O[进] V[门] A1 [ 直] AM⁃ADV [走到]V[凳子旁]A1[。]O 本文将语义角色标注作为一个序列标注问题 来解决,因此依然用 CRF 模型进行语义角色标注。 3.2 基于语块分析的语义角色标注 基于语块分析的语义角色标注的模板需要有 所变化。 最主要的是将语块分析的结果作为特征 集添加到语义角色标注的特征模板当中。 基于语 块分析的语义角色标注特征模板定义如下:W-2 , W-1 ,W0 , W+1 , W+2 , P-2 , P-1 , P0 , P+1 , P+2 , C-2 , C-1 , C0 ,C+1 ,C+2 ,W-1 / W-0 ,W0 / W+ 1 ,P-1 / P0 ,P0 / P+ 1 ,C-1 / C0 ,C0 / C+ 1 ,P-2 / P-1 / P0 。 3.3 基于依存句法分析的语义角色标注 将依存句法分析的结果作为特征集添加到新 的特征模板,基于语块分析的语义角色标注特征模 板定义如下:W-2 ,W-1 ,W0 ,W+1 ,W+2 ,P-2 ,P-1 ,P0 , P+1 ,P+2 ,D-2 ,D-1 ,D0 ,D+1 ,D+2 , W-1 / W-0 , W0 / W+ 1 , P-1 / P0 ,P0 / P+ 1 ,D-1 / D0 ,D0 / D+ 1 ,P-2 / P-1 / P0 。 3.4 基于语块分析和依存句法分析的 SRL 定义新的特征模板,使用训练语料库训练模 型,基于语块分析和依存句法分析的语义角色标注 的特征模板定义如下:W-1 ,W0 ,W+1 ,P-1 ,P0 ,P+1 , C-1 ,C0 ,C+1 ,D-1 ,D0 ,D+1 。 4 生成导航路径 一条完整的路径可以由多个路径单元组成。 本文将路径分割为若干个路径单元,划分原则为每 个路径单元有且只有一个运动目标并且运动控制 一定存在。 根据这两个原则,在获取路径单元时可 以根据运动目标和运动控制模块是否都不为空来 判断路径单元是否完整。 一个路径单元由 4 个部分组成:运动主体、运动 方向、运动控制、运动目标(可能有运动参考)。 这 4 个部分都可以从不同的语义角色中提取。 1)运动主体:从 A0 中根据词性(名词) 直接获 取,默认为“机器人”。 2)运动方向:从 AM⁃DIR 中根据词性提取,方向 包括基本方向(方位词)和角度(量词),默认为“向 前”。 规定 8 个基本方向(前,后,左,右,左前,右前, 左后,右后),相隔为 45°。 如果语料中没有出现具 体的角度描述,例如: “ 向左转”,就默认为“ 向左 转 90°”。 3)运动控制:从 V 中根据词性获取 导航任务谓词绝大多数都是“走”、“直行”等等 动词,有时候可能会出现“穿过”,“绕过”,“拿” 这 些词语。 将表示行走的谓词统一为“走”,因为这些 词对导航的影响相同。 4)运动目标(可能有运动参考) A1 和 AM⁃LOC 语义角色就是需要的运动目标, 但是对于导航任务来说,名词是较为复杂的模块, 因为它既可以作为运动目标也可以作为运动参考, 仅仅从语义角色和词性中获取不到清晰的导航信 息。 本文提出一种基于依存关系提取路径自然语 言运动目标和运动参考模块的方法。 对于路径自 然语言 A1 和 LOC 中的名词,包含以下几种情况: ①单个名词依存于动词,这种情况最简单。 这 个名词就是运动目标。 例如“绕过桌子”,“桌子”依 存于动词“绕过”,“桌子”就是运动目标。 ②单个名词并不依存于动词。 例如“走到沙发 旁”,依存关系为“沙发”依存于“旁”,这时“旁” 依 存于动词“到”,可以根据这一特点提取到名词短语 “沙发旁”。 “沙发旁”就是提取到的运动目标。 ③多个名词(多为两个名词)。 对于多个名词, 绝大多数是两个名词。 偶尔出现 3 个名词也可以被 处理成单个名词。 例如“沙发前面的桌子上的花 瓶”,可以将“沙发前面的桌子”看作一个名词,“花 瓶”看作一个名词,因此可以将多个名词的处理方 法简化为两个名词的处理方法。 对于两个名词,可能出现如下两种情况。 1)名词之间的依存关系是并列关系。 例如“桌子和椅子”,这时可以将它看作单个名 词,通过下一步的分析得到正确的运动目标。 例如 “走到桌子和椅子前”,“桌子和椅子”依存于“前”, “前”依存于动词“走到”,因此“桌子和椅子前” 就 是运动目标。 2)名词之间存在依存关系。 例如“拿桌子上的书”,“桌子上的书”被标注为 A1 ,“桌子”依存于“上”,“上”依存于“书”,“书”依 存于动词“拿”。 “桌子上”可以看作一个名词,此时 由于名词“书” 依存于动词“拿”,所以“书” 是运动 目标,“桌子上”依存于名词“书”,它作为运动参考。 少量的运动目标存在于 AM⁃LOC 语义角色。 对于 AM⁃LOC 语义角色,首先根据其中的语块类型 确定其是运动参考或者是运动目标。 对于“PR”语 ·486· 智 能 系 统 学 报 第 12 卷
第4期 张珂,等:基于非受限路径自然语言处理中的机器人导航 ·487 块,其中的名词短语可以直接填充到运动参考模 了依存关系的标注准确率下降。但是对于某些语 块。对于“$C”语块,通过上述名词的处理方法填充 义角色标注识别,依存句法相比于语块分析有着更 到相应的模块。 好的效果,下一节将会详细阐述。 在生成的路径单元的基础上,按顺序将路径单 表5依存句法分析结果 元整合在一起,就生成了最终的导航路径。 Table 5 The result of dependency parsing % 5 实验结果与分析 实验指标 P R F 平均值 90.83 90.87 90.85 将语料库按照4:1的比例进行划分,其中80% 5.2语义角色标注结果 为训练语料,20%为测试语料。然后根据定义的特 实验3基于语块分析的SRL 征模板对训练语料库进行训练,得到相应的训练模 型,再用测试语料库测试得到的训练模型的准确率。 表6是基于语块分析的语义角色标注的结果。 从表6的结果中可以看出,基于语块分析的语义角 本文需要用到以下的实验指标: 正确识别的个体总数 色标注准确率、召回率、F,值分别达到了96.77%、 正确率(P)= ×100% 识别出的个体总数 97.78%、97.27%。 表6基于语块分析的SRL结果 正确识别的个体总数 召回率(F)= 测试集中存在的个体总数 ×100% Table 6 The result of SRL based on chunking % P·R·2 语义角色 P R F F1= ×100% P+R Ao 99.07 99.07 99.07 5.1句法分析结果 Av 98.92 99.64 99.28 实验1语块分析实验 AM-ADV 91.37 96.54 93.88 表4是各个语块分析结果。由表4可见,语块 AM-DIR 99.39 99.09 99.24 分析的准确率、召回率、F,值都非常高,说明之前确 定的分块类型是合理的,适用于路径自然语言处理 AM-LOC 97.56 95.24 99.39 领域。较高的语块分析准确率也很符合接下来在 V 96.22 96.62 96.42 语块分析的基础上进行语义角色标注的要求。 平均值 96.77 97.78 97.27 表4语块分析结果 实验4基于依存句法分析的SRL Table 4 The result of chunking % 表7是基于依存句法分析的语义角色标注结 语块类型 R F 果。通过和表6得到的结果对比发现,虽然基于依 DT 98.97 98.21 98.59 存句法分析的SRL的平均值比基于语块分析的 FR 100.00 85.71 92.31 SRL要低。但是对于A0、AM-ADV语义角色,基于 MT 93.00 87.64 90.24 依存句法分析的结果明显较好。 表7基于依存句法分析的SRL结果 PR 100.00 98.18 99.08 Table 7 The result of SRL based on dependency parsing PT 100.00 100.00 100.00 语义角色 F RT 90.20 97.87 93.88 Ao 100.00 100.00 100.00 SC 96.27 93.63 95.09 A 98.11 97.65 97.88 ST 90.85 86.58 88.66 AM-ADV 98.05 86.30 91.88 总计 97.12 95.38 96.24 AM-DIR 96.11 98.73 97.40 实验2依存句法分析实验 AM-LOC 89.13 82.00 85.42 表5是依存句法实验结果。本文直接用依存句 法自动标注的平均值表示依存句法分析结果。和 V 91.54 94.28 92.89 语块分析相比,它的准确率、召回率、F值都相对较 平均值 95.00 94.53 94.76 低。其原因有两点:1)依存句法的依存关系类型较 实验5基于语块分析和依存句法分析的SRL 多,而且其划分边界并不明显,导致了识别率下降: 通过分析表5和表6发现,对于自然语言处理 2)由于某些从属词和支配词之间的距离过长,导致 的语义角色标注任务,语块分析和依存句法分析都
块,其中的名词短语可以直接填充到运动参考模 块。 对于“SC”语块,通过上述名词的处理方法填充 到相应的模块。 在生成的路径单元的基础上,按顺序将路径单 元整合在一起,就生成了最终的导航路径。 5 实验结果与分析 将语料库按照 4 ∶ 1 的比例进行划分,其中 80% 为训练语料,20%为测试语料。 然后根据定义的特 征模板对训练语料库进行训练,得到相应的训练模 型,再用测试语料库测试得到的训练模型的准确率。 本文需要用到以下的实验指标: 正确率(P) = 正确识别的个体总数 识别出的个体总数 × 100% 召回率(F) = 正确识别的个体总数 测试集中存在的个体总数 × 100% F1 = P·R·2 P + R × 100% 5.1 句法分析结果 实验 1 语块分析实验 表 4 是各个语块分析结果。 由表 4 可见,语块 分析的准确率、召回率、F1值都非常高,说明之前确 定的分块类型是合理的,适用于路径自然语言处理 领域。 较高的语块分析准确率也很符合接下来在 语块分析的基础上进行语义角色标注的要求。 表 4 语块分析结果 Table 4 The result of chunking % 语块类型 P R F1 DT 98.97 98.21 98.59 FR 100.00 85.71 92.31 MT 93.00 87.64 90.24 PR 100.00 98.18 99.08 PT 100.00 100.00 100.00 RT 90.20 97.87 93.88 SC 96.27 93.63 95.09 ST 90.85 86.58 88.66 总计 97.12 95.38 96.24 实验 2 依存句法分析实验 表 5 是依存句法实验结果。 本文直接用依存句 法自动标注的平均值表示依存句法分析结果。 和 语块分析相比,它的准确率、召回率、F1值都相对较 低。 其原因有两点:1)依存句法的依存关系类型较 多,而且其划分边界并不明显,导致了识别率下降; 2)由于某些从属词和支配词之间的距离过长,导致 了依存关系的标注准确率下降。 但是对于某些语 义角色标注识别,依存句法相比于语块分析有着更 好的效果,下一节将会详细阐述。 表 5 依存句法分析结果 Table 5 The result of dependency parsing % 实验指标 P R F1 平均值 90.83 90.87 90.85 5.2 语义角色标注结果 实验 3 基于语块分析的 SRL 表 6 是基于语块分析的语义角色标注的结果。 从表 6 的结果中可以看出,基于语块分析的语义角 色标注准确率、召回率、F1 值分别达到了 96.77%、 97.78%、97.27%。 表 6 基于语块分析的 SRL 结果 Table 6 The result of SRL based on chunking % 语义角色 P R F1 A0 99.07 99.07 99.07 A1 98.92 99.64 99.28 AM⁃ADV 91.37 96.54 93.88 AM⁃DIR 99.39 99.09 99.24 AM⁃LOC 97.56 95.24 99.39 V 96.22 96.62 96.42 平均值 96.77 97.78 97.27 实验 4 基于依存句法分析的 SRL 表 7 是基于依存句法分析的语义角色标注结 果。 通过和表 6 得到的结果对比发现,虽然基于依 存句法分析的 SRL 的平均值比基于语块分析的 SRL 要低。 但是对于 A0、AM⁃ADV 语义角色,基于 依存句法分析的结果明显较好。 表 7 基于依存句法分析的 SRL 结果 Table 7 The result of SRL based on dependency parsing % 语义角色 P R F1 A0 100.00 100.00 100.00 A1 98.11 97.65 97.88 AM⁃ADV 98.05 86.30 91.88 AM⁃DIR 96.11 98.73 97.40 AM⁃LOC 89.13 82.00 85.42 V 91.54 94.28 92.89 平均值 95.00 94.53 94.76 实验 5 基于语块分析和依存句法分析的 SRL 通过分析表 5 和表 6 发现,对于自然语言处理 的语义角色标注任务,语块分析和依存句法分析都 第 4 期 张珂,等:基于非受限路径自然语言处理中的机器人导航 ·487·
·488 智能系统学报 第12卷 有其优点。 导航任务。本文希望将处理好的自然语言输入给 基于语块分析的语义角色标注的准确率的平 Nao机器人后,Nao机器人可以通过感知周围环境 均值更高,这是因为在语块划分时就已经做了初步 自主完成导航任务。本次实验所需要的图像识别 的语义切分工作。 模块通过使用机器人自带的landmark识别函数识 例如:“DT”语块一般就包含AM-DIR语义角 别特殊符号替代。 色,训练得到的模型也就更容易识别出AM-DIR语 图3是进行机器人导航实验的实际环境,导航 义角色。 需要识别的物体分别贴上了不同的landmark标签。 基于依存句法分析的语义角色标注虽然平均 准确率较低,但是其A。、AM-ADV等语义角色标注 准确率非常高,这是因为这些语义角色标注可以很 简单地由依存句法标注得到。 例如:A。语义角色,它一般就代表“机器人”,而 “机器人”往往就依存于第1个动词,其依存关系标 注为“+1V/SBV”。在将依存关系特征加入特征集 图3实际环境 之后,训练得到模型的语义角色标注准确率就更高。 Fig.3 Actual environment 为了融合依存句法和语块分析的优点,本文提 实验1机器人在简单无障碍的环境下完成 出一种基于语块分析和依存句法分析的融合语义 导航 角色标注方法。表8是基于语块分析和依存句法分 输入一段自然语言描述的路径导航任务:“机 析的语义角色标注结果。 器人向前走到盆栽,再向左走到电脑主机处右转找 通过分析准确率发现: 到吉他。”依次提取出路径单元,将路径单元中“运 1)基于依存句法分析的SRL的A。和AM-ADV 动目标”、“运动控制”、“运动目标和参考”信息输 语义角色准确率最高; 入,控制机器人依次完成每个路径单元的导航。在 2)基于语块分析的SRL的AM-LOC语义角色 行进过程中,机器人通过声纳确定前方是否有物 准确率最高。 体,再通过图像识别模块判断物体是障碍或者是运 3)基于语块和句法的SRL的A,、AM-DIR和V 动目标。 的语义角色准确率最高。 图4为实验1的机器人实际行走路线。 综上所述,基于语块加依存句法分析的SL平 D 均准确率最高。而且对于机器人导航任务来说,路 径单元主要由以下4个部分组成:谓词、方向词、参 考、目标。这4个部分正好分别在V、AM-DIR、A, 中。综合来看,使用第3种方法最合适。 表8基于语块分析和依存句法分析的SL结果 Table 8 The result of SRL based on chunking and dependency parsing clo 语义角色 P 及 F Ao 98.15 99.07 98.60 图4机器人实际行走路线1 A 99.46100.00 99.73 Fig.4 Robot walking route 1 AM-ADV 96.88 96.88 96.88 图4中A代表机器人,B代表盆栽,C代表电脑 AM-DIR 100.00 99.36 99.70 主机,D代表吉他。从图的机器人行进路线可以看 出,机器人在简单无障碍的环境下可以很轻松地按 AM-LOC 95.12 92.86 93.98 照抽取的语义信息向目标前进。 97.48 98.00 97.74 实验2机器人在复杂有且障碍环境下完成 平均值 96.77 98.48 98.35 导航 5.3机器人Nao导航实验 输入一段自然语言描述的路径导航任务:“机 在简单的室内环境中使用Nao机器人完成实际 器人向前走到床,向左走到椅子旁,再向右转,向前
有其优点。 基于语块分析的语义角色标注的准确率的平 均值更高,这是因为在语块划分时就已经做了初步 的语义切分工作。 例如:“DT” 语块一般就包含 AM⁃DIR 语义角 色,训练得到的模型也就更容易识别出 AM⁃DIR 语 义角色。 基于依存句法分析的语义角色标注虽然平均 准确率较低,但是其 A0 、AM⁃ADV 等语义角色标注 准确率非常高,这是因为这些语义角色标注可以很 简单地由依存句法标注得到。 例如:A0 语义角色,它一般就代表“机器人”,而 “机器人”往往就依存于第 1 个动词,其依存关系标 注为“+1V/ SBV”。 在将依存关系特征加入特征集 之后,训练得到模型的语义角色标注准确率就更高。 为了融合依存句法和语块分析的优点,本文提 出一种基于语块分析和依存句法分析的融合语义 角色标注方法。 表 8 是基于语块分析和依存句法分 析的语义角色标注结果。 通过分析准确率发现: 1)基于依存句法分析的 SRL 的 A0 和 AM⁃ADV 语义角色准确率最高; 2)基于语块分析的 SRL 的 AM⁃LOC 语义角色 准确率最高。 3)基于语块和句法的 SRL 的 A1 、AM⁃DIR 和 V 的语义角色准确率最高。 综上所述,基于语块加依存句法分析的 SRL 平 均准确率最高。 而且对于机器人导航任务来说,路 径单元主要由以下 4 个部分组成:谓词、方向词、参 考、目标。 这 4 个部分正好分别在 V、AM⁃DIR、A1 中。 综合来看,使用第 3 种方法最合适。 表 8 基于语块分析和依存句法分析的 SRL 结果 Table 8 The result of SRL based on chunking and dependency parsing % 语义角色 P R F1 A0 98.15 99.07 98.60 A1 99.46 100.00 99.73 AM⁃ADV 96.88 96.88 96.88 AM⁃DIR 100.00 99.36 99.70 AM⁃LOC 95.12 92.86 93.98 V 97.48 98.00 97.74 平均值 96.77 98.48 98.35 5.3 机器人 Nao 导航实验 在简单的室内环境中使用 Nao 机器人完成实际 导航任务。 本文希望将处理好的自然语言输入给 Nao 机器人后,Nao 机器人可以通过感知周围环境 自主完成导航任务。 本次实验所需要的图像识别 模块通过使用机器人自带的 landmark 识别函数识 别特殊符号替代。 图 3 是进行机器人导航实验的实际环境,导航 需要识别的物体分别贴上了不同的 landmark 标签。 图 3 实际环境 Fig.3 Actual environment 实验 1 机器人在简单无障碍的环境下完成 导航 输入一段自然语言描述的路径导航任务:“机 器人向前走到盆栽,再向左走到电脑主机处右转找 到吉他。”依次提取出路径单元,将路径单元中“运 动目标”、“运动控制”、“运动目标和参考” 信息输 入,控制机器人依次完成每个路径单元的导航。 在 行进过程中,机器人通过声纳确定前方是否有物 体,再通过图像识别模块判断物体是障碍或者是运 动目标。 图 4 为实验 1 的机器人实际行走路线。 图 4 机器人实际行走路线 1 Fig.4 Robot walking route 1 图 4 中 A 代表机器人,B 代表盆栽,C 代表电脑 主机,D 代表吉他。 从图的机器人行进路线可以看 出,机器人在简单无障碍的环境下可以很轻松地按 照抽取的语义信息向目标前进。 实验 2 机器人在复杂有且障碍环境下完成 导航 输入一段自然语言描述的路径导航任务:“机 器人向前走到床,向左走到椅子旁,再向右转,向前 ·488· 智 能 系 统 学 报 第 12 卷
第4期 张珂,等:基于非受限路径自然语言处理中的机器人导航 ·489 走到花瓶旁,向左走到沙发前,绕过沙发走到书 language for human-robot dialogs[J].IEEE transactions on 桌前。” systems,man,and cybernetics,part c:applications and 图5为实验2的机器人实际行走路线。 reviews,2004,34(2):154-167. [4]SKUBIC M,HUO Z,ALEXENKO T,et al.Testing an D assistive fetch robot with spatial language from older and younger adults C ]//RO-MAN,2013 IEEE.Gyeongju, South Korea,2013:697-702. [5]SKUBIC M,HUO Z,CARLSON L A,et al.Human-driven B spatial language for human-robot interaction [C]//AAAI Conference on Human-Robot Interaction in Elder Care.San C Francisco,USA,2011:32-34. [6]LI X,HUANG X,DEZERT J,et al.A successful applicat ion of DSmT in sonar grid map building and comparison with 图5机器人实际行走路线2 DST-based approach[J].International journal of innovative Fig.5 Robot walking route 2 computing,information and control,2007,3 (3): 图5中A代表机器人,B代表床,C代表椅子,D 539-549. 代表花瓶,E代表沙发,F代表书桌。在机器人预计 [7]LI X,DEZERT J,SMARANDACHE F,et al.Evidence 的行进路线上设置两个障碍:X代表大箱子,Y代表 support ing measure of similarity for reducing the complexity in informat ion fusion[J.Information sciences,2011,181 一个站在路线上的行人。从图中机器人行进路线 (10):1818-1835. 可以看出,机器人在较复杂有障碍的情况下依然可 [8]石朝侠,洪炳镕,周彤,等.大规模环境下的拓扑地图创 以避开障碍完成导航。 建与导航[J].机器人,2007,29(5):433-438. 6结束语 SHI Chaoxia,HONG Bingrong,ZHOU Tong,et al. Topological map building and navigation in large-scale 为了最终实现基于路径自然语言处理的机器 environment ents[J].Robot,2007,29(5):433-438. 人导航,本文分别提出了基于语块分析的语义角色 [9]庄严,徐晓东,王伟.移动机器人几何-拓扑混合地图的 标注方法、基于依存句法分析的语义角色标注方法 构建及自定位研究[J].控制与决策,2005,20(7): 815-818. 和基于语块分析和依存句法分析融合的语义角色 ZHUANG Yan,XU Xiaodong,WANG Wei.Mobile robot 标注方法。通过实验发现,基于语块分析和依存句 geometric-topological map building and self-localization[J]. 法分析融合的语义角色标注方法对路径自然语 Control and decision,2005,20(7):815-818. 有最好的处理结果。最后使用Nao机器人实现了在 [10]张秀龙,李新德,戴先中基于组块分析的路径自然语言 简单环境下完成基于路径自然语言处理的导航任 语义角色标注方法[J].东南大学学报:自然科学版, 务,验证了本文提出的方法是可行的。由于本文的 2012,42(z1):127-131. 数据集语料较为充足且在非受限条件下获得,保证 ZHANG Xiulong,LI Xingde,DAI Xianzhong.Semantic 了本文问路导航方法的适用性。在后续的研究中, role labeling method for route natural language based on 拟搭建更多较为复杂的环境,进一步提高方法的适 chunk parsing[J].Journal of southeast university:natural 应导航能力。 science edition,2012,42(zl):127-131. [11]李新德,张秀龙,戴先中.一种基于受限自然语言处理 参考文献: 的移动机器人视觉导航方法[J].机器人,2011,33 (6):742-749. [1]WEI Y,BRUNSKILL E,KOLLAR T,et al.Where to go: LI Xingde,ZHANG Xiulong,DAI Xianzhong.A visual Interpreting natural directions using global inference[C]// navigation method of mobile robot based on constrained IEEE International Conference on Robotics and Automation. natural language processing J].Robot,2011,33(6): Kobe,Japan,2009:3761-3767. 742-749. [2]KOLLAR T,TELLEX S,ROY D,et al.Toward [12]李新德,张秀龙.一种面向室内智能机器人导航的路径 understanding natural language directions[C]//2010 5th 自然语言处理方法[J].自动化学报,2012,40(2): ACM/IEEE International Conference on Human-Robot 289-305. Interaction(HRI).Osaka,Japan,2010:259-266. LI Xinde,ZHANG Xiulong.A route instruction method 3]SKUBIC M,PERZANOWSKI D,BLISARD S,et al.Spatial using natural language processing for indoor intelligent
走到花瓶旁, 向左走到沙发前, 绕过沙发走到书 桌前。” 图 5 为实验 2 的机器人实际行走路线。 图 5 机器人实际行走路线 2 Fig.5 Robot walking route 2 图 5 中 A 代表机器人,B 代表床,C 代表椅子,D 代表花瓶,E 代表沙发,F 代表书桌。 在机器人预计 的行进路线上设置两个障碍:X 代表大箱子,Y 代表 一个站在路线上的行人。 从图中机器人行进路线 可以看出,机器人在较复杂有障碍的情况下依然可 以避开障碍完成导航。 6 结束语 为了最终实现基于路径自然语言处理的机器 人导航,本文分别提出了基于语块分析的语义角色 标注方法、基于依存句法分析的语义角色标注方法 和基于语块分析和依存句法分析融合的语义角色 标注方法。 通过实验发现,基于语块分析和依存句 法分析融合的语义角色标注方法对路径自然语言 有最好的处理结果。 最后使用 Nao 机器人实现了在 简单环境下完成基于路径自然语言处理的导航任 务,验证了本文提出的方法是可行的。 由于本文的 数据集语料较为充足且在非受限条件下获得,保证 了本文问路导航方法的适用性。 在后续的研究中, 拟搭建更多较为复杂的环境,进一步提高方法的适 应导航能力。 参考文献: [1]WEI Y, BRUNSKILL E, KOLLAR T, et al. Where to go: Interpreting natural directions using global inference[C] / / IEEE International Conference on Robotics and Automation. Kobe, Japan, 2009: 3761-3767. [ 2 ] KOLLAR T, TELLEX S, ROY D, et al. Toward understanding natural language directions [ C] / / 2010 5th ACM/ IEEE International Conference on Human⁃Robot Interaction(HRI). Osaka, Japan, 2010: 259-266. [3] SKUBIC M, PERZANOWSKI D, BLISARD S, et al. Spatial language for human⁃robot dialogs[J]. IEEE transactions on systems, man, and cybernetics, part c: applications and reviews, 2004, 34(2): 154- 167. [4] SKUBIC M, HUO Z, ALEXENKO T, et al. Testing an assistive fetch robot with spatial language from older and younger adults [ C ] / / RO⁃MAN, 2013 IEEE. Gyeongju, South Korea, 2013: 697-702. [5]SKUBIC M, HUO Z, CARLSON L A, et al. Human⁃driven spatial language for human⁃robot interaction [ C] / / AAAI Conference on Human⁃Robot Interaction in Elder Care. San Francisco, USA, 2011: 32-34. [6]LI X, HUANG X, DEZERT J, et al. A successful applicat ion of DSmT in sonar grid map building and comparison with DST⁃based approach[ J]. International journal of innovative computing, information and control, 2007, 3 ( 3 ): 539-549. [7] LI X, DEZERT J, SMARANDACHE F, et al. Evidence support ing measure of similarity for reducing the complexity in informat ion fusion[J]. Information sciences, 2011, 181 (10): 1818-1835. [8]石朝侠,洪炳镕,周彤,等. 大规模环境下的拓扑地图创 建与导航[J]. 机器人, 2007, 29(5): 433-438. SHI Chaoxia, HONG Bingrong, ZHOU Tong, et al. Topological map building and navigation in large⁃scale environment ents[J]. Robot, 2007, 29(5): 433-438. [9]庄严,徐晓东,王伟.移动机器人几何-拓扑混合地图的 构建及自定位研究[ J]. 控制与决策, 2005, 20 ( 7): 815-818. ZHUANG Yan, XU Xiaodong, WANG Wei. Mobile robot geometric⁃topological map building and self⁃localization [ J]. Control and decision, 2005, 20(7): 815-818. [10]张秀龙,李新德,戴先中.基于组块分析的路径自然语言 语义角色标注方法[ J]. 东南大学学报: 自然科学版, 2012, 42(z1): 127-131. ZHANG Xiulong, LI Xingde, DAI Xianzhong. Semantic role labeling method for route natural language based on chunk parsing[J]. Journal of southeast university: natural science edition, 2012, 42(zl): 127-131. [11]李新德, 张秀龙, 戴先中.一种基于受限自然语言处理 的移动机器人视觉导航方法[ J]. 机器人, 2011, 33 (6): 742-749. LI Xingde, ZHANG Xiulong, DAI Xianzhong. A visual navigation method of mobile robot based on constrained natural language processing [ J]. Robot, 2011, 33 ( 6): 742-749. [12]李新德, 张秀龙.一种面向室内智能机器人导航的路径 自然语言处理方法[ J]. 自动化学报, 2012, 40 ( 2): 289-305. LI Xinde, ZHANG Xiulong. A route instruction method using natural language processing for indoor intelligent 第 4 期 张珂,等:基于非受限路径自然语言处理中的机器人导航 ·489·
·490· 智能系统学报 第12卷 robot navigation J].Acta automatica sinica,2012,40 [17]计峰,邱锡鹏.基于序列标注的中文依存句法分析方法 (2):289-305. [J].计算机应用与软件,2009,26(10):133-135. [13]ABNEY S P.Parsing by chunks M]//Principle-Based JI FENG,QIU XIPENG.A new Chinese dependence Parsing.Springer Netherlands,1991:257-278. analysis method based on sequence labeling model [J]. [14]周强,孙茂松,黄昌宁.汉语句子的组块分析体系[J]. Computer applications and software,2009,26(10): 计算机学报,1999,22(11):1158-1165. 133-135. ZHOU Qiang,SUN Maosong,HUANG Changning.Chunk 作者简介: parsing scheme for Chinese sentences[J].Chinese journal 张珂,男,1980年生,副教授,人工 of computers,1999,22(11):1158-1165. 智能学会会员,计算机学会会员。主要 [15]李素建,刘群.汉语组块的定义和获取[C]/全国计算 研究方向为电力智能信息处理、图像处 语言学联合学术会议.苏州,中国,2003:110-115. 理、自然语言处理、机器人认知。 LI SUJIAN,LIU QUN.Research on definition and acquisition of chunk C]//CCL 2016.Suzhou,China, 2003:110-115. [16]孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言 陈奇,男,1992年生,硕士研究生 学,2000,2(2):74-83 主要研究方向为自然语言处理。 SUN HONGLIN,YU SHIWEN.A summary of shallow parsing methods[J].Contemporary linguistics,2000,2 (2):74-83. The 18th International Conference on Intelligent Data Engineering and Automated Learning The International Conference on Intelligent Data Engineering and Automated Learning (IDEAL)is an annual international conference dedicated to emerging and challenging topics in intelligent data analysis,data mining and their associated learning systems and paradigms.Its core themes include:the Big Data challenges,Machine Learning,Data Mining,Information Retrieval and Management,Bio-and Neuro-Informatics,Bio-Inspired Models (including Neural Networks,Evolutionary Computation and Swarm Intelligence),Agents and Hybrid Intelligent Systems,and Real-world Applications of Intelligent Techniques.Other related and emerging themes and topics are also welcome. The conference provides a unique opportunity and stimulating forum for presenting and discussing the latest theoretical advances and real-world applications in Computational Intelligence and Intelligent Data Analysis.Authors and researchers are warmly invited to submit their latest findings and research work to the conference. The International Conference on Intelligent Data Engineering and Automated Learning (IDEAL)is an annual international conference dedicated to emerging and challenging topics in intelligent data analysis,data mining and their associated learning systems and paradigms.Its core themes include:the Big Data challenges,Machine Learning,Data Mining,Information Retrieval and Management,Bio-and Neuro-Informatics,Bio-Inspired Models (including Neural Networks,Evolutionary Computation and Swarm Intelligence),Agents and Hybrid Intelligent Systems,and Real-world Applications of Intelligent Techniques.Other related and emerging themes and topics are also welcome. Website:http://ideal2017.guet.edu.cn/ideal/
robot navigation [ J]. Acta automatica sinica, 2012, 40 (2): 289-305. [13] ABNEY S P. Parsing by chunks [ M] / / Principle⁃Based Parsing. Springer Netherlands, 1991: 257-278. [14]周强,孙茂松,黄昌宁.汉语句子的组块分析体系[ J]. 计算机学报, 1999, 22(11): 1158-1165. ZHOU Qiang ,SUN Maosong, HUANG Changning. Chunk parsing scheme for Chinese sentences[ J]. Chinese journal of computers, 1999, 22(11): 1158-1165. [15]李素建,刘群.汉语组块的定义和获取[C] / / 全国计算 语言学联合学术会议. 苏州,中国, 2003: 110-115. LI SUJIAN, LIU QUN. Research on definition and acquisition of chunk [ C] / / CCL 2016. Suzhou, China, 2003: 110-115. [16]孙宏林, 俞士汶.浅层句法分析方法概述[J]. 当代语言 学, 2000, 2(2): 74-83. SUN HONGLIN, YU SHIWEN. A summary of shallow parsing methods [ J]. Contemporary linguistics, 2000, 2 (2): 74-83. [17]计峰, 邱锡鹏. 基于序列标注的中文依存句法分析方法 [J]. 计算机应用与软件, 2009, 26(10): 133-135. JI FENG, QIU XIPENG. A new Chinese dependence analysis method based on sequence labeling model [ J]. Computer applications and software, 2009, 26 ( 10 ): 133-135. 作者简介: 张珂,男,1980 年生,副教授,人工 智能学会会员,计算机学会会员。 主要 研究方向为电力智能信息处理、图像处 理、自然语言处理、机器人认知。 陈奇,男,1992 年生,硕士研究生, 主要研究方向为自然语言处理。 The 18th International Conference on Intelligent Data Engineering and Automated Learning The International Conference on Intelligent Data Engineering and Automated Learning ( IDEAL) is an annual international conference dedicated to emerging and challenging topics in intelligent data analysis, data mining and their associated learning systems and paradigms. Its core themes include: the Big Data challenges, Machine Learning, Data Mining, Information Retrieval and Management, Bio⁃ and Neuro⁃Informatics, Bio⁃Inspired Models ( including Neural Networks, Evolutionary Computation and Swarm Intelligence), Agents and Hybrid Intelligent Systems, and Real⁃world Applications of Intelligent Techniques. Other related and emerging themes and topics are also welcome. The conference provides a unique opportunity and stimulating forum for presenting and discussing the latest theoretical advances and real⁃world applications in Computational Intelligence and Intelligent Data Analysis. Authors and researchers are warmly invited to submit their latest findings and research work to the conference. The International Conference on Intelligent Data Engineering and Automated Learning ( IDEAL) is an annual international conference dedicated to emerging and challenging topics in intelligent data analysis, data mining and their associated learning systems and paradigms. Its core themes include: the Big Data challenges, Machine Learning, Data Mining, Information Retrieval and Management, Bio⁃ and Neuro⁃Informatics, Bio⁃Inspired Models ( including Neural Networks, Evolutionary Computation and Swarm Intelligence), Agents and Hybrid Intelligent Systems, and Real⁃world Applications of Intelligent Techniques. Other related and emerging themes and topics are also welcome. Website:http: / / ideal2017.guet.edu.cn / ideal / ·490· 智 能 系 统 学 报 第 12 卷