正在加载图片...
·486 智能系统学报 第12卷 根据表3语义角色类型进行手动标注,为语义 左后,右后),相隔为45°。如果语料中没有出现具 角色标注提供语料库。下面给出一个语料的语义 体的角度描述,例如:“向左转”,就默认为“向左 角色标注结果:[机器人]AO[向左]AM-DIR[走到] 转90°”。 V[墙]A1[,]O[然后]AM-ADV[直]AM-ADV[走 3)运动控制:从V中根据词性获取 到]V[墙角]A0[,]O[沿着墙]AM-LOC[向右] 导航任务谓词绝大多数都是“走”、“直行”等等 AM-DIR[走到]V[门][,]O[进]V[门]A1[直] 动词,有时候可能会出现“穿过”,“绕过”,“拿”这 AM-ADV[走到]V[凳子旁]A1[。]O 些词语。将表示行走的谓词统一为“走”,因为这些 本文将语义角色标注作为一个序列标注问题 词对导航的影响相同。 来解决,因此依然用CRF模型进行语义角色标注。 4)运动目标(可能有运动参考) 3.2基于语块分析的语义角色标注 A,和AM-LOC语义角色就是需要的运动目标, 基于语块分析的语义角色标注的模板需要有 但是对于导航任务来说,名词是较为复杂的模块, 所变化。最主要的是将语块分析的结果作为特征 因为它既可以作为运动目标也可以作为运动参考, 集添加到语义角色标注的特征模板当中。基于语 仅仅从语义角色和词性中获取不到清晰的导航信 块分析的语义角色标注特征模板定义如下:W-2, 息。本文提出一种基于依存关系提取路径自然语 W-1,Wo,W1,W2,P-2,P-1,Po,P1,P2,C-2,C-1, 言运动目标和运动参考模块的方法。对于路径自 Co,C1,C2,W/W_o:Wo/W1.P_/Po,Po/P:1,C-/ 然语言A,和LOC中的名词,包含以下几种情况: Co:Co/C.1,P-2/P-/Poo ①单个名词依存于动词,这种情况最简单。这 3.3基于依存句法分析的语义角色标注 个名词就是运动目标。例如“绕过桌子”,“桌子”依 将依存句法分析的结果作为特征集添加到新 存于动词“绕过”,“桌子”就是运动目标。 的特征模板,基于语块分析的语义角色标注特征模 ②单个名词并不依存于动词。例如“走到沙发 板定义如下:W-2,W1,Wo,W1,W2,P-2,P-1,Po, 旁”,依存关系为“沙发”依存于“旁”,这时“旁”依 P1,P2,D-2,D1,Do,D1,D2,W-/W-o,W/W+1, 存于动词“到”,可以根据这一特点提取到名词短语 P_/Po,Po/P:1,D-/Do,Do/D.1,P-2/P-/Poo “沙发旁”。“沙发旁”就是提取到的运动目标。 3.4基于语块分析和依存句法分析的SRL ③多个名词(多为两个名词)。对于多个名词, 定义新的特征模板,使用训练语料库训练模 绝大多数是两个名词。偶尔出现3个名词也可以被 型,基于语块分析和依存句法分析的语义角色标注 处理成单个名词。例如“沙发前面的桌子上的花 的特征模板定义如下:W1,W。,W1,P-1,P。,P1, 瓶”,可以将“沙发前面的桌子”看作一个名词,“花 C-1,Co,C+,D-1,Do,D+1o 瓶”看作一个名词,因此可以将多个名词的处理方 法简化为两个名词的处理方法。 4生成导航路径 对于两个名词,可能出现如下两种情况。 一条完整的路径可以由多个路径单元组成。 1)名词之间的依存关系是并列关系。 本文将路径分割为若干个路径单元,划分原则为每 例如“桌子和椅子”,这时可以将它看作单个名 个路径单元有且只有一个运动目标并且运动控制 词,通过下一步的分析得到正确的运动目标。例如 一定存在。根据这两个原则,在获取路径单元时可 “走到桌子和椅子前”,“桌子和椅子”依存于“前”, 以根据运动目标和运动控制模块是否都不为空来 “前”依存于动词“走到”,因此“桌子和椅子前”就 判断路径单元是否完整。 是运动目标。 一个路径单元由4个部分组成:运动主体、运动 2)名词之间存在依存关系。 方向、运动控制、运动目标(可能有运动参考)。这4 例如“拿桌子上的书”,“桌子上的书”被标注为 个部分都可以从不同的语义角色中提取。 A,“桌子”依存于“上”,“上”依存于“书”,“书”依 1)运动主体:从A。中根据词性(名词)直接获 存于动词“拿”。“桌子上”可以看作一个名词,此时 取,默认为“机器人”。 由于名词“书”依存于动词“拿”,所以“书”是运动 2)运动方向:从AM-DIR中根据词性提取,方向 目标,“桌子上”依存于名词“书”,它作为运动参考。 包括基本方向(方位词)和角度(量词),默认为“向 少量的运动目标存在于AM-LOC语义角色。 前”。 对于AM-LOC语义角色,首先根据其中的语块类型 规定8个基本方向(前,后,左,右,左前,右前, 确定其是运动参考或者是运动目标。对于“PR”语根据表 3 语义角色类型进行手动标注,为语义 角色标注提供语料库。 下面给出一个语料的语义 角色标注结果:[机器人]A0[向左]AM⁃DIR[走到] V[墙] A1[,] O[然后] AM⁃ADV[直] AM⁃ADV[走 到]V[ 墙角] AO [,] O [ 沿着墙] AM⁃LOC [ 向右] AM⁃DIR[走到] V[门] [,] O[进] V[门] A1 [ 直] AM⁃ADV [走到]V[凳子旁]A1[。]O 本文将语义角色标注作为一个序列标注问题 来解决,因此依然用 CRF 模型进行语义角色标注。 3.2 基于语块分析的语义角色标注 基于语块分析的语义角色标注的模板需要有 所变化。 最主要的是将语块分析的结果作为特征 集添加到语义角色标注的特征模板当中。 基于语 块分析的语义角色标注特征模板定义如下:W-2 , W-1 ,W0 , W+1 , W+2 , P-2 , P-1 , P0 , P+1 , P+2 , C-2 , C-1 , C0 ,C+1 ,C+2 ,W-1 / W-0 ,W0 / W+ 1 ,P-1 / P0 ,P0 / P+ 1 ,C-1 / C0 ,C0 / C+ 1 ,P-2 / P-1 / P0 。 3.3 基于依存句法分析的语义角色标注 将依存句法分析的结果作为特征集添加到新 的特征模板,基于语块分析的语义角色标注特征模 板定义如下:W-2 ,W-1 ,W0 ,W+1 ,W+2 ,P-2 ,P-1 ,P0 , P+1 ,P+2 ,D-2 ,D-1 ,D0 ,D+1 ,D+2 , W-1 / W-0 , W0 / W+ 1 , P-1 / P0 ,P0 / P+ 1 ,D-1 / D0 ,D0 / D+ 1 ,P-2 / P-1 / P0 。 3.4 基于语块分析和依存句法分析的 SRL 定义新的特征模板,使用训练语料库训练模 型,基于语块分析和依存句法分析的语义角色标注 的特征模板定义如下:W-1 ,W0 ,W+1 ,P-1 ,P0 ,P+1 , C-1 ,C0 ,C+1 ,D-1 ,D0 ,D+1 。 4 生成导航路径 一条完整的路径可以由多个路径单元组成。 本文将路径分割为若干个路径单元,划分原则为每 个路径单元有且只有一个运动目标并且运动控制 一定存在。 根据这两个原则,在获取路径单元时可 以根据运动目标和运动控制模块是否都不为空来 判断路径单元是否完整。 一个路径单元由 4 个部分组成:运动主体、运动 方向、运动控制、运动目标(可能有运动参考)。 这 4 个部分都可以从不同的语义角色中提取。 1)运动主体:从 A0 中根据词性(名词) 直接获 取,默认为“机器人”。 2)运动方向:从 AM⁃DIR 中根据词性提取,方向 包括基本方向(方位词)和角度(量词),默认为“向 前”。 规定 8 个基本方向(前,后,左,右,左前,右前, 左后,右后),相隔为 45°。 如果语料中没有出现具 体的角度描述,例如: “ 向左转”,就默认为“ 向左 转 90°”。 3)运动控制:从 V 中根据词性获取 导航任务谓词绝大多数都是“走”、“直行”等等 动词,有时候可能会出现“穿过”,“绕过”,“拿” 这 些词语。 将表示行走的谓词统一为“走”,因为这些 词对导航的影响相同。 4)运动目标(可能有运动参考) A1 和 AM⁃LOC 语义角色就是需要的运动目标, 但是对于导航任务来说,名词是较为复杂的模块, 因为它既可以作为运动目标也可以作为运动参考, 仅仅从语义角色和词性中获取不到清晰的导航信 息。 本文提出一种基于依存关系提取路径自然语 言运动目标和运动参考模块的方法。 对于路径自 然语言 A1 和 LOC 中的名词,包含以下几种情况: ①单个名词依存于动词,这种情况最简单。 这 个名词就是运动目标。 例如“绕过桌子”,“桌子”依 存于动词“绕过”,“桌子”就是运动目标。 ②单个名词并不依存于动词。 例如“走到沙发 旁”,依存关系为“沙发”依存于“旁”,这时“旁” 依 存于动词“到”,可以根据这一特点提取到名词短语 “沙发旁”。 “沙发旁”就是提取到的运动目标。 ③多个名词(多为两个名词)。 对于多个名词, 绝大多数是两个名词。 偶尔出现 3 个名词也可以被 处理成单个名词。 例如“沙发前面的桌子上的花 瓶”,可以将“沙发前面的桌子”看作一个名词,“花 瓶”看作一个名词,因此可以将多个名词的处理方 法简化为两个名词的处理方法。 对于两个名词,可能出现如下两种情况。 1)名词之间的依存关系是并列关系。 例如“桌子和椅子”,这时可以将它看作单个名 词,通过下一步的分析得到正确的运动目标。 例如 “走到桌子和椅子前”,“桌子和椅子”依存于“前”, “前”依存于动词“走到”,因此“桌子和椅子前” 就 是运动目标。 2)名词之间存在依存关系。 例如“拿桌子上的书”,“桌子上的书”被标注为 A1 ,“桌子”依存于“上”,“上”依存于“书”,“书”依 存于动词“拿”。 “桌子上”可以看作一个名词,此时 由于名词“书” 依存于动词“拿”,所以“书” 是运动 目标,“桌子上”依存于名词“书”,它作为运动参考。 少量的运动目标存在于 AM⁃LOC 语义角色。 对于 AM⁃LOC 语义角色,首先根据其中的语块类型 确定其是运动参考或者是运动目标。 对于“PR”语 ·486· 智 能 系 统 学 报 第 12 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有