正在加载图片...
·126· 智能系统学报 第4卷 汇语义学.从词汇语义学看来,词汇不是词的有限的 所有特征 列表,而是高度系统化的结构 从词汇引申到句子,句子被认为反映概念和概 1)词语 念之间的相互关系,并形成一种概念结构.一个句子 选择词语的依据是建立大规模汉语语料库,按 所包含的独立于语言的东西,不是句子的语法结构 出现频率形成的词语表,而不是仅仅依据某一本现 也不是语义结构,而是它的概念结构.2个句子只要 成的词典.知识词典注意收集已经流行又有较固定 含义相同,就有相同的概念结构.所以,理解一个句 可能的词语,如因特网”、欧元”、“下载”、“点 子的关键在于提取句子的概念和概念结构 击”、“黑客等,但又不盲目求新 以义原为基础的理解系统,词汇只是概念的符 2)词项 号,从整体而言,在这样的系统里,没有词只有概念 词项,在多数语言学文献称为义项,至所以用词 最基本的概念集合组成义原集合,义原以动词为中 项取代义项,是突出语言层面.词项是对词语的定 心,相当于语言学研究者声称的语义角色 义,不同的词项给予不同的知识编号.词项的选择要 语义角色是指有关语言成分在所指的语句所表 经过精心考虑.一般很注意某一词项的现代的流通 达的事件中所扮演的参与者角色.从某种意义上说, 性.例如“曹在普通词典中至少有2个词项,一是 语义角色是语言学家对句子中有关结构成分之间的 “姓”,另一是辈”如用于“你曹”而知识词典最好 意义关系的一种分类.这种分类的粗细程度,可以因 只选择第1个词项 语言学家的认识或具体的应用目标的不同而不同, 3)词例 一般分3个层次):论元的语义角色(微观层次) 词例的选择主要是为那些具有多个词项提供例 语义格(仲观层次)、因中心词果宏观层次) 子.这些例子的要求是:强调例子的区别能力而不是 1)微观层次 它们的释义能力.它们的用途在于为消除歧义提供 在这一层级上,又分为基于特定动词的角色和 可靠的帮助.这里试以打的2个词项为例,一个 基于特定领域的角色2种 词项是“买”,另一个是辫编”,假设它们对应的知 前者根据特定动词的意义所指,来确定其论元 识编号分别为1和2,则对应知识1,可以给出词例 成分的语义角色.比如“吃的2个论元的语义角色 (符号“一表示打字):~酱油,张票,饭,去 分别是:吃者,所吃.这样,如果一种语言有1000多 ~瓶酒,醋~来了;则对应知识2,可以给出词例:~ 个动词,那么必将有2000多个语义角色 毛衣,~毛裤,双毛袜子,草鞋,~一条围巾,~ 后者根据各种特定的生活领域的具体场景,来 麻绳,~条辫子 确定有关场景要素的语义角色.这种方法在目前的 4)词性 信息抽取中比较流行.比如,在Stallard2报道的机 词性对句子结构分析和词项的选择有贡献.好 票订购信息系统中,有下列角色:出发城市、目的城 的词性标注就是通过采取适当的方法,根据上下文 市、起飞时间等 语境关系,消除句子中词的语法兼类,使得无论一个 2)中观层次 词兼有几种词性,在特定的场合下只保留其中最合 在Filmore3的语法理论中,先后用到下列格: 适的一种 施事格(AGE):事件的发起者; 3.3义原 经验格(EXPER):经历精神或心理等事件的经 从语言理解的心理学出发,以人类共有的对某 验者; 事物认识的概念出发,认为人们在认识客观事物过 受事格(OBJ):动作的承受者或状态」 程中,存在着某种义原(本体、概念基),义原是最基 源泉格(SOUR):物体移动的始点状态变化的 本的、不易于再分割的意义的最小单位.语言的理解 初状态 过程就是把语句映射到义原的过程.任何一种语言 目标格(GOAL):物体移动的终点,状态变化的 的词汇是离不开该种语言的,但概念是独立于语言 结果; 的.在这样一种思想知道下,词汇只是概念的符号, 处所格(LOG):动作或状态发生的场所; 代表着一组可能知道的,用于该词汇所表达概念的 时间格(TME):动作和状态所进行的时间; 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 汇语义学. 从词汇语义学看来 ,词汇不是词的有限的 列表 ,而是高度系统化的结构. 1)词语 选择词语的依据是建立大规模汉语语料库 ,按 出现频率形成的词语表 ,而不是仅仅依据某一本现 成的词典. 知识词典注意收集已经流行又有较固定 可能的词语 ,如“因特网 ”、“欧元 ”、“下载 ”、“点 击 ”、“黑客 ”等 ,但又不盲目求新. 2)词项 词项 ,在多数语言学文献称为义项 ,至所以用词 项取代义项 ,是突出语言层面. 词项是对词语的定 义 ,不同的词项给予不同的知识编号. 词项的选择要 经过精心考虑. 一般很注意某一词项的现代的流通 性. 例如“曹 ”在普通词典中至少有 2个词项 ,一是 “姓 ”,另一是“辈 ”如用于“尔曹 ”. 而知识词典最好 只选择第 1个词项. 3)词例 词例的选择主要是为那些具有多个词项提供例 子. 这些例子的要求是 :强调例子的区别能力而不是 它们的释义能力. 它们的用途在于为消除歧义提供 可靠的帮助. 这里试以“打 ”的 2个词项为例 ,一个 词项是“买 ”,另一个是“辫编 ”,假设它们对应的知 识编号分别为 1和 2,则对应知识 1,可以给出词例 (符号“~”表示“打 ”字 ) : ~酱油 , ~张票 , ~饭 ,去 ~瓶酒 ,醋 ~来了 ;则对应知识 2,可以给出词例 : ~ 毛衣 , ~毛裤 , ~双毛袜子 , ~草鞋 , ~一条围巾 , ~ 麻绳 , ~条辫子. 4)词性 词性对句子结构分析和词项的选择有贡献. 好 的词性标注就是通过采取适当的方法 ,根据上下文 语境关系 ,消除句子中词的语法兼类 ,使得无论一个 词兼有几种词性 ,在特定的场合下只保留其中最合 适的一种. 3. 3 义原 从语言理解的心理学出发 ,以人类共有的对某 事物认识的概念出发 ,认为人们在认识客观事物过 程中 ,存在着某种义原 (本体、概念基 ) ,义原是最基 本的、不易于再分割的意义的最小单位. 语言的理解 过程就是把语句映射到义原的过程. 任何一种语言 的词汇是离不开该种语言的 ,但概念是独立于语言 的. 在这样一种思想知道下 ,词汇只是概念的符号 , 代表着一组可能知道的 ,用于该词汇所表达概念的 所有特征. 从词汇引申到句子 ,句子被认为反映概念和概 念之间的相互关系 ,并形成一种概念结构. 一个句子 所包含的独立于语言的东西 ,不是句子的语法结构 , 也不是语义结构 ,而是它的概念结构. 2个句子只要 含义相同 ,就有相同的概念结构. 所以 ,理解一个句 子的关键在于提取句子的概念和概念结构. 以义原为基础的理解系统 ,词汇只是概念的符 号 ,从整体而言 ,在这样的系统里 ,没有词只有概念. 最基本的概念集合组成义原集合 ,义原以动词为中 心 ,相当于语言学研究者声称的语义角色. 语义角色是指有关语言成分在所指的语句所表 达的事件中所扮演的参与者角色. 从某种意义上说 , 语义角色是语言学家对句子中有关结构成分之间的 意义关系的一种分类. 这种分类的粗细程度 ,可以因 语言学家的认识或具体的应用目标的不同而不同. 一般分 3个层次 [ 11 ] :论元的语义角色 (微观层次 )、 语义格 (中观层次 )、因 —中心词 —果 (宏观层次 ). 1)微观层次 在这一层级上 ,又分为基于特定动词的角色和 基于特定领域的角色 2种. 前者根据特定动词的意义所指 ,来确定其论元 成分的语义角色. 比如“吃 ”的 2个论元的语义角色 分别是 :吃者 ,所吃. 这样 ,如果一种语言有 1 000 多 个动词 ,那么必将有 2 000多个语义角色. 后者根据各种特定的生活领域的具体场景 ,来 确定有关场景要素的语义角色. 这种方法在目前的 信息抽取中比较流行. 比如 ,在 Stallard [ 12 ]报道的机 票订购信息系统中 ,有下列角色 :出发城市、目的城 市、起飞时间等. 2)中观层次 在 Fillmore [ 13 ]的语法理论中 ,先后用到下列格 : 施事格 (AGE) :事件的发起者 ; 经验格 (EXPER) :经历精神或心理等事件的经 验者 ; 受事格 (OBJ) :动作的承受者或状态 ; 源泉格 (SOUR) :物体移动的始点状态变化的 初状态 ; 目标格 ( GOAL) :物体移动的终点 ,状态变化的 结果 ; 处所格 (LOG) :动作或状态发生的场所 ; 时间格 (TIME) :动作和状态所进行的时间 ; ·126· 智 能 系 统 学 报 第 4卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有