第2期 朱倩,等:汉语句子语义三维表示模型 ·123· 是指动作或在某一方向上对一物体做些什么,所有 义原具有层次性,分为实体、事件、属性、属性 概念都可以由少量作用于物体的原语动作来描述, 值、数量、数量值、句法特征、次要特征和动态角色等 这是概念从属理论的基本思想).CD理论希望对 类别.概念由义原描述,也具有层次性和分类.知网 常识进行系统而又具体地描写,并利用原语来便利 对每个事件义原给出了角色框架,列出了某一类事 推理,从而达到对语言的自动理解.但从另一方面 件发生时框架中的必要绝对角色 看,CD对常识描写是相当刻板和定式的 知网适合于汉语的语义分析,但知网也有以下 2)语义场理论(theory of field,.TF).TF是介于 不完善的地方: 单个词和整体词汇之间的一种活的现实.作为整体 ①知网强调了概念即义项之间的关系,但比义 的一部分,它们与词一样具有被并入一个更大的系 项更大的语义单位即语义块则没有提及, 统中去的特征,而又和词汇一样,具有被分成较小 ②知网给出事物类概念和事件类概念之间的关 单位的特性」 系,但对事件类概念之间的关系没有给出,不利于 汉语语义分析的着眼点在于分析出句中所有概 解决汉语主动词的确定问题」 念之间的关系.关系语义场强调的正是义项之间的 ③知网提出了73个语义角色来描述概念之间 关系,因而对汉语的语义分析可以借鉴语义场理 的关系,在事件义原的框架中以这73个语义角色 论 描述框架的必要语义角色,同时知网还提出了其符 3)格语法(case grammar,,CG),格语法的基本 号系统,用以在词典的语义定义和事物类义原的共 思想是:动词在句中起中心作用,参与动作的各个 性描述中描述概念之间的关系.对概念之间关系的 体称为语义格”,且格的数量是有限的.针对每个 描述存在2套描述体系,且这2套描述符号并不一 动词的义项,由可能的语义格”子集构成格框架, 致,不能很好对应 这一子集分为必要的和可选的2个集合. ④概念之间的关系描述还很不够,需补充 格语法最大的特点是承认语义在句法中的主导 5)概念层次网络(hierarchical netork of con- 作用,由格语法分析可以得到句子的深层语义结 cepts,.HNC).HNC理论的目标是以概念联想脉络 构,给出各成分的语义角色,对于确定正确的句法 为主线,建立一种模拟大脑语言感知过程的自然语 结构有很大帮助 言表达模式和计算机理解处理模式,使计算机获得 格语法在汉语分析中存在以下3个缺点: 消解模糊的能力] ①无法解决汉语的连动和兼语句式.格语法认 HNC建立的语句表述模式以句类为中心,所以 为动词在句中起中心作用,那么分析句子时首先要 可称之为句类体系.HNC定义的句类是指句子的语 确定句子的核心.汉语缺乏形态特征,作为核心的 义类型,而没有陈述句、疑问句、祈使句和感叹句之 主动词通常也缺乏形态特征.如何在有多个动词的 分.HNC建立了句类的表示式,句类表示式由语义 连动式和兼语式中找出句子的核心是汉语信息处理 块构成,语义块是句子的下一级语义构成单位.语义 的一个难题,也是格语法无法解决的问题 块是句类的函数,也就是说,语义块的含义取决于句 ②短语内部各成分间关系无法确定.格语法提 类,一个句子应该有几个什么样的语义块,这是由句 出的各种格关系都是名词性短语和动词之间的语义 类决定的.HNC发现,句类表示式存在有限的基元 关系,对于名词性短语内部和动词短语内部各成分 类型,总共有57种,称为基本句类 关系的确定没有给出 句类表示式是句子语义的基本框架,是句子所 ③汉语词汇语义分类标准不确定 表达的基本语义信息.在语言理解处理中,判定句子 4)知网(hownet).知网是一个以汉语和英语词 所属的句类,并辨认出该句类表示式中的各个语义 语所代表的概念为描述对象,以解释概念与概念之 块,是句子理解处理的一项基本内容.因此,以NC 间以及概念所具有的属性之间的关系为基本内容的 的句类体系为指导来开展句子语义研究,具有十分 常识知识库.知网借鉴了概念从属理论的原语概念, 重要的应用价值) 提出了1500多个义原,用来描述概念、概念之间的 6)形式语义学(逻辑语义学、自然语言逻辑). 关系及属性与属性之间的关系1 逻辑语义学着重研究自然语言这种符号系统的语义 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.htp://www.cnki.net© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 是指动作或在某一方向上对一物体做些什么 , 所有 概念都可以由少量作用于物体的原语动作来描述 , 这是概念从属理论的基本思想 [ 3 ] . CD 理论希望对 常识进行系统而又具体地描写 , 并利用原语来便利 推理 , 从而达到对语言的自动理解. 但从另一方面 看 , CD 对常识描写是相当刻板和定式的. 2)语义场理论 ( theory of field, TF) . TF是介于 单个词和整体词汇之间的一种活的现实. 作为整体 的一部分 , 它们与词一样具有被并入一个更大的系 统中去的特征 , 而又和词汇一样 , 具有被分成较小 单位的特性. 汉语语义分析的着眼点在于分析出句中所有概 念之间的关系. 关系语义场强调的正是义项之间的 关系 , 因而对汉语的语义分析可以借鉴语义场理 论 [ 4 ] . 3)格语法 ( case grammar, CG) . 格语法的基本 思想是 :动词在句中起中心作用 , 参与动作的各个 体称为“语义格 ”, 且格的数量是有限的. 针对每个 动词的义项 , 由可能的“语义格 ”子集构成格框架 , 这一子集分为必要的和可选的 2个集合. 格语法最大的特点是承认语义在句法中的主导 作用 , 由格语法分析可以得到句子的深层语义结 构 , 给出各成分的语义角色 , 对于确定正确的句法 结构有很大帮助. 格语法在汉语分析中存在以下 3个缺点 : ①无法解决汉语的连动和兼语句式. 格语法认 为动词在句中起中心作用 , 那么分析句子时首先要 确定句子的核心. 汉语缺乏形态特征 , 作为核心的 主动词通常也缺乏形态特征. 如何在有多个动词的 连动式和兼语式中找出句子的核心是汉语信息处理 的一个难题 , 也是格语法无法解决的问题. ②短语内部各成分间关系无法确定. 格语法提 出的各种格关系都是名词性短语和动词之间的语义 关系 , 对于名词性短语内部和动词短语内部各成分 关系的确定没有给出. ③汉语词汇语义分类标准不确定. 4)知网 ( hownet). 知网是一个以汉语和英语词 语所代表的概念为描述对象 , 以解释概念与概念之 间以及概念所具有的属性之间的关系为基本内容的 常识知识库. 知网借鉴了概念从属理论的原语概念 , 提出了 1 500多个义原 , 用来描述概念、概念之间的 关系及属性与属性之间的关系 [ 5 ] . 义原具有层次性 , 分为实体、事件、属性、属性 值、数量、数量值、句法特征、次要特征和动态角色等 类别. 概念由义原描述 , 也具有层次性和分类. 知网 对每个事件义原给出了角色框架 , 列出了某一类事 件发生时框架中的必要绝对角色. 知网适合于汉语的语义分析 , 但知网也有以下 不完善的地方 : ①知网强调了概念即义项之间的关系 , 但比义 项更大的语义单位即语义块则没有提及. ②知网给出事物类概念和事件类概念之间的关 系 , 但对事件类概念之间的关系没有给出 , 不利于 解决汉语主动词的确定问题. ③知网提出了 73个语义角色来描述概念之间 的关系 , 在事件义原的框架中以这 73 个语义角色 描述框架的必要语义角色 ; 同时知网还提出了其符 号系统 , 用以在词典的语义定义和事物类义原的共 性描述中描述概念之间的关系. 对概念之间关系的 描述存在 2套描述体系 , 且这 2套描述符号并不一 致 , 不能很好对应. ④概念之间的关系描述还很不够 , 需补充. 5)概念层次网络 ( hierarchical network of con2 cep ts, HNC). HNC理论的目标是以概念联想脉络 为主线 ,建立一种模拟大脑语言感知过程的自然语 言表达模式和计算机理解处理模式 ,使计算机获得 消解模糊的能力 [ 6 ] . HNC建立的语句表述模式以句类为中心 ,所以 可称之为句类体系. HNC定义的句类是指句子的语 义类型 ,而没有陈述句、疑问句、祈使句和感叹句之 分. HNC 建立了句类的表示式 ,句类表示式由语义 块构成 ,语义块是句子的下一级语义构成单位. 语义 块是句类的函数 ,也就是说 ,语义块的含义取决于句 类 ,一个句子应该有几个什么样的语义块 ,这是由句 类决定的. HNC 发现 ,句类表示式存在有限的基元 类型 ,总共有 57种 ,称为基本句类. 句类表示式是句子语义的基本框架 ,是句子所 表达的基本语义信息. 在语言理解处理中 ,判定句子 所属的句类 ,并辨认出该句类表示式中的各个语义 块 ,是句子理解处理的一项基本内容. 因此 ,以 HNC 的句类体系为指导来开展句子语义研究 ,具有十分 重要的应用价值 [ 7 ] . 6)形式语义学 (逻辑语义学、自然语言逻辑 ). 逻辑语义学着重研究自然语言这种符号系统的语义 第 2期 朱 倩 ,等 :汉语句子语义三维表示模型 ·123·