第2期 朱倩,等:汉语句子语义三维表示模型 ·125· 1)这音乐太棒了 子的语义信息,不但依赖于组成句子的词汇的义面 2)但愿人长久,千里共婵娟 信息语言,词序),而且还包含用有限的义原信息 它们不是对外部世界的描述,而是表达一种价 (体体)表示每个词的深层信息(客体)及义境信息 值观或主观愿望,所以,这些语句无所谓真.也无所 住体、上下文、背景、常识等).所以义面、义原、义 谓假,没有真值条件。 境三位一体,不可分离.句子语义的三维表示模型, 语言的第3个用途是运用语言办事,如: 类似于全息照片,可以使句子包含的信息更准确、更 3)你被开除了. 全面地表示出来,以便更精确地进行句子语义相似 4)陪审团一致裁定:被告无罪 度计算(如图1所示). 类似“裁定”、“生持婚礼”、结拜兄弟”等行 图1中,X轴表示词序列,是外延的(显性结 为,必须在特定的场合下,遵循特定的方式,运用特 构),称为语言空间、句子的表层结构:Y轴表示词的 定的言辞才能办到,离开了语言就办不成,被称为 义原信息,是内涵的隐性结构),称为概念空间、句 “信有所为”一般来说,这种行为或是恰当的或者 子的深层结构:Z轴表示句子的背景信息,包括主体 是不恰当的,也无所谓真假 的思维状态和上下文,称为知识空间.X、Y是客观 还有,句子的意思不能从字面得出,需要知识和 的、静态的、语言的内部信息;Z是主观的、动态的、 推理才能决定,如: 语言的外部信息: 5)鸡不吃了 语言主要是用来交流思想的,在言语交际过程 它有2个意思:鸡吃饱了”,“不吃鸡肉了”,理 中,交际双方能直接凭感官得到义面,而最后得到的 解鸡不吃了的语义要看上下文 是句义和话语义.义原和义境只是一个中介层面.它 以上的3种情形,统称为话语义 们能帮助分词,得出句子的层次结构,以协助词义遵 定义2话语义是言者在特定语境中所表达的 循义面提供的结构有规律地组合起来,从而得到句 意义 子的语义 话语义可以等同于句义,但也可能超越句义,有 义境 额外附加的意义,甚至与句义完全不同.话语义可被 看成是由命题组成的集合,然而,只有说出的命题才 构成话语义,此外却还有存储在记忆中未经表述的 命题 ”义面 虽然话语义并不等同于承载该话语的句义,但 听者总能从某个句义出发,借助知识,经推理而得到 话语所表达的命题.同时,它可以用与言者原来使用 图1句子语义三维表示模型 的句子不一定相同的一个或几个句子,把有关命题 Fig 1 The 3-dmensonal representative model of Chinese 表达出来。 sentence semantics 话语义是个别的意义、临时的意义,深层语义, 3.2义面 总之,句义虽不等同于话语所表达的命题,但命 在汉语语义自动分析中,词本身的语义信息是 题总可以通过句子表达出来,否则便永远无法表达 很重要的.根据组成性原则”,句子的字面意义是 命题了o1 由构成该句子的词的语义以及这些词之间的语义关 系组成的.因此,在语义分析中,义面(词汇语义)是 3汉语语义三维表示模型 基础,是一个汉语语言知识的词典,包括:词语、词 3.1模型描述 性、词项、词例 语言在本质上是主体以知觉的形式对世界的表 语言中的词汇具有高度系统化的结构,正是这 现,它具体地反映了主体对世界的感受程度及其富 种结构决定了词的意义和用法.这种结构包括词和 有个性的呈现方式.语言的排序深刻地揭示了主体 它的意义之间的关系以及个别词的内部结构.对这 对认识世界的认知模式.也就说,完整地表达一个句 种系统化的、与意义相关的结构的词汇研究叫做词 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved htp://www.cnki.ner© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 1) 这音乐太棒了. 2) 但愿人长久 ,千里共婵娟. 它们不是对外部世界的描述 ,而是表达一种价 值观或主观愿望 ,所以 ,这些语句无所谓真. 也无所 谓假 ,没有真值条件. 语言的第 3个用途是运用语言办事 ,如 : 3) 你被开除了. 4) 陪审团一致裁定 :被告无罪. 类似“裁定 ”、“主持婚礼 ”、“结拜兄弟 ”等行 为 ,必须在特定的场合下 ,遵循特定的方式 ,运用特 定的言辞才能办到 ,离开了语言就办不成 ,被称为 “言有所为 ”. 一般来说 ,这种行为或是恰当的或者 是不恰当的 ,也无所谓真假. 还有 ,句子的意思不能从字面得出 ,需要知识和 推理才能决定 ,如 : 5) 鸡不吃了. 它有 2个意思 :“鸡吃饱了 ”,“不吃鸡肉了 ”,理 解“鸡不吃了 ”的语义要看上下文. 以上的 3种情形 ,统称为话语义. 定义 2 话语义是言者在特定语境中所表达的 意义. 话语义可以等同于句义 ,但也可能超越句义 ,有 额外附加的意义 ,甚至与句义完全不同. 话语义可被 看成是由命题组成的集合 ,然而 ,只有说出的命题才 构成话语义 ,此外却还有存储在记忆中未经表述的 命题. 虽然话语义并不等同于承载该话语的句义 ,但 听者总能从某个句义出发 ,借助知识 ,经推理而得到 话语所表达的命题. 同时 ,它可以用与言者原来使用 的句子不一定相同的一个或几个句子 ,把有关命题 表达出来. 话语义是个别的意义、临时的意义 ,深层语义. 总之 ,句义虽不等同于话语所表达的命题 ,但命 题总可以通过句子表达出来 ,否则便永远无法表达 命题了 [ 10 ] . 3 汉语语义三维表示模型 3. 1 模型描述 语言在本质上是主体以知觉的形式对世界的表 现 ,它具体地反映了主体对世界的感受程度及其富 有个性的呈现方式. 语言的排序深刻地揭示了主体 对认识世界的认知模式. 也就说 ,完整地表达一个句 子的语义信息 ,不但依赖于组成句子的词汇的义面 信息 (语言 ,词序 ) ,而且还包含用有限的义原信息 (本体 )表示每个词的深层信息 (客体 )及义境信息 (主体、上下文、背景、常识等 ). 所以义面、义原、义 境三位一体 ,不可分离. 句子语义的三维表示模型 , 类似于全息照片 ,可以使句子包含的信息更准确、更 全面地表示出来 ,以便更精确地进行句子语义相似 度计算 (如图 1所示 ). 图 1中 , X 轴表示词序列 , 是外延的 (显性结 构 ) ,称为语言空间、句子的表层结构; Y轴表示词的 义原信息 ,是内涵的 (隐性结构 ) ,称为概念空间、句 子的深层结构; Z 轴表示句子的背景信息 ,包括主体 的思维状态和上下文 , 称为知识空间. X、Y是客观 的、静态的、语言的内部信息; Z 是主观的、动态的、 语言的外部信息. 语言主要是用来交流思想的 ,在言语交际过程 中 ,交际双方能直接凭感官得到义面 ,而最后得到的 是句义和话语义. 义原和义境只是一个中介层面. 它 们能帮助分词 ,得出句子的层次结构 ,以协助词义遵 循义面提供的结构有规律地组合起来 ,从而得到句 子的语义. 图 1 句子语义三维表示模型 Fig. 1 The 32dimensional rep resentative model of Chinese sentence semantics 3. 2 义面 在汉语语义自动分析中 ,词本身的语义信息是 很重要的. 根据“组成性原则 ”,句子的字面意义是 由构成该句子的词的语义以及这些词之间的语义关 系组成的. 因此 ,在语义分析中 ,义面 (词汇语义 )是 基础 ,是一个汉语语言知识的词典 ,包括 :词语、词 性、词项、词例. 语言中的词汇具有高度系统化的结构 ,正是这 种结构决定了词的意义和用法. 这种结构包括词和 它的意义之间的关系以及个别词的内部结构. 对这 种系统化的、与意义相关的结构的词汇研究叫做词 第 2期 朱 倩 ,等 :汉语句子语义三维表示模型 ·125·