·124· 智能系统学报 第4卷 模型.20世纪70年代初,蒙太格(R.Montague)创 可以相对孤立地考察字义和词义,比如在查阅 立的蒙太格语法就是自然语言逻辑的开端[) 字典时,可以机械地研究组字成词,组词成句后的句 形式语言的符号和它们所表示的概念之间的对 义,而不必考虑句子使用时涉及的语境因素.句义是 应关系是确定的,符号公式的结构反映它们的意义 一般的、稳定的意义,浅层语义,包括逻辑语义(真 把一个理论形式化后,就可以暂时完全撇开原来理 值条件义)和字面语义 论中的概念、命题的意义,而只从语言符号、公式结 思想的、客观的、不包括人的主观因素的那部分 构符号组合的形态)方面研究.意义是抽象的,往 内容,被许多哲学家称为命题也就是说,客观的思 往不容易精确地理解和掌握.而符号和公式是有穷的 想以命题的形式出现,一个命题或者真实地反映了 具体的对象,能够对其作更精确、更严格的研究,从 外部世界的某个现象,或者对某现象做出了不正确 而通过对具体对象的研究把握抽象的东西 的、虚假的描述.用逻辑的术语说,前者为“缜(T)”, 以形式化为目标的语言逻辑的问世,为人们提 后者为假(F)”,真和假统称为真值,所以,命题具 供了有效的参照系,从而使人们对自然语言的复杂 有真值.命题虽有内容,但无语音、语法外形.所以, 性有了比较清晰的认识.但形式化方法在自然语言逻 从物理特性上看,命题是与句子不同的概念,因为一 辑领域的缺陷与不足具体表现在以下3个方面: 个命题可以由任何语言表达,就是在一种语言里,也 ①形式化在语言逻辑领域不具备普遍的效力; 可通过多种句法途径来表达同一个命题.所以,命题 ②形式化方法不能彻底解决日常实际语用的恰 与表达命题的语言相对独立.命题没有英语的还是 当性问题; 汉语的区别,因为它只有语义特征,不具语言特 ③形式化方法不能取代自然语言的修辞现象 征 尽管存在众多的语义计算模型,研究人员也认 句子的真值条件是研究一个句子在什么场合下 识到了语境(住体、上下文、常识、背景等)在语义计 为真,在什么场合下为假.凡是陈述性的语句都具有 算中的重要性,但是目前还没有有效的结合语境的 真值条件.如果把真值条件当作句子的逻辑语义,就 语义计算模型 有了句子的真值条件义 由于自然语言文本占据了互联网的大半河山, 举例来说,根据如下模型M=<D,F>, 同时,在可预期的将来,对声音、影像、图片的检索仍 其中: 将严重依赖自然语言分析技术(正如近两年Google D=张三,李四,王五,小兵,大力,陈规}, 推出的图像与视像搜索引擎所做的那样),语言计 F(a)=张三,F(b)=李四,F(c=王五,F(d)= 算的重要性也就不言而喻了,可以预期,它将成为信 小兵,F(e)=大力,F(h)=陈规, 息科学技术中长期发展的战略制高点 F()=张三,李四,王五,小兵, F亿)={<张三,李四>,<王五,小兵>,<大 2汉语语义 力,陈规>,<张三,王五>,<小兵,大力>,< 语言是人赖以从事复杂思维的工具,思想是语 陈规,大力>} 言的内容(语义),两者相辅相成.但语言既不等同 因为F(a=张三∈F(H),所以,H(a=T 于说出的话,也不能等同于写下的句子 因为F(e)=大力年F(H),所以,H(a=F因为 语义研究是语言学研究的一个重要组成部分, <F(,F(h)>=<大力,陈规>∈FL),所, 也是自然语言处理中不可忽视的研究内容.语句所 L(eh)=T注意,并不是在说,陈述性句子的意义 表达的意义分为句义和话语义2部分 等同于真值条件义.果真是那样的话,必然会导致荒 21句义 谬的结论,即把所有取真值的句子视为同义,把所有 语言的一个主要用途是描述人的外部世界.句 取假的句子也视为同义.那么所以的陈述句总共就 子由字和词组成,字和词都是音义结合体,所以句子 只有2个句义了,因此,真值条件义只是陈述性句义 也就有了意义 的一个重要方面 定义1句义是字义和词义根据一定规则组合 22话语义 的产物. 语言的另一个用途是表达使用者的情绪,如: 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 模型. 20世纪 70 年代初 , 蒙太格 (R. Montague) 创 立的蒙太格语法就是自然语言逻辑的开端 [ 8 ] . 形式语言的符号和它们所表示的概念之间的对 应关系是确定的 , 符号公式的结构反映它们的意义. 把一个理论形式化后 , 就可以暂时完全撇开原来理 论中的概念、命题的意义 , 而只从语言符号、公式结 构 (符号组合的形态 ) 方面研究. 意义是抽象的 , 往 往不容易精确地理解和掌握. 而符号和公式是有穷的 具体的对象 , 能够对其作更精确、更严格的研究 , 从 而通过对具体对象的研究把握抽象的东西. 以形式化为目标的语言逻辑的问世 , 为人们提 供了有效的参照系 , 从而使人们对自然语言的复杂 性有了比较清晰的认识.但形式化方法在自然语言逻 辑领域的缺陷与不足具体表现在以下 3个方面 [ 9 ] : ①形式化在语言逻辑领域不具备普遍的效力 ; ②形式化方法不能彻底解决日常实际语用的恰 当性问题 ; ③形式化方法不能取代自然语言的修辞现象. 尽管存在众多的语义计算模型 ,研究人员也认 识到了语境 (主体、上下文、常识、背景等 )在语义计 算中的重要性 ,但是目前还没有有效的结合语境的 语义计算模型. 由于自然语言文本占据了互联网的大半河山 , 同时 ,在可预期的将来 ,对声音、影像、图片的检索仍 将严重依赖自然语言分析技术 (正如近两年 Google 推出的图像与视像搜索引擎所做的那样 ) ,语言计 算的重要性也就不言而喻了. 可以预期 ,它将成为信 息科学技术中长期发展的战略制高点. 2 汉语语义 语言是人赖以从事复杂思维的工具 ,思想是语 言的内容 (语义 ) ,两者相辅相成. 但语言既不等同 于说出的话 ,也不能等同于写下的句子. 语义研究是语言学研究的一个重要组成部分 , 也是自然语言处理中不可忽视的研究内容. 语句所 表达的意义分为句义和话语义 2部分. 2. 1 句义 语言的一个主要用途是描述人的外部世界. 句 子由字和词组成 ,字和词都是音义结合体 ,所以句子 也就有了意义. 定义 1 句义是字义和词义根据一定规则组合 的产物. 可以相对孤立地考察字义和词义 ,比如在查阅 字典时 ,可以机械地研究组字成词 ,组词成句后的句 义 ,而不必考虑句子使用时涉及的语境因素. 句义是 一般的、稳定的意义 ,浅层语义 ,包括逻辑语义 (真 值条件义 )和字面语义. 思想的、客观的、不包括人的主观因素的那部分 内容 ,被许多哲学家称为命题. 也就是说 ,客观的思 想以命题的形式出现 ,一个命题或者真实地反映了 外部世界的某个现象 ,或者对某现象做出了不正确 的、虚假的描述. 用逻辑的术语说 ,前者为“真 ( T) ”, 后者为“假 (F) ”,真和假统称为真值 ,所以 ,命题具 有真值. 命题虽有内容 ,但无语音、语法外形. 所以 , 从物理特性上看 ,命题是与句子不同的概念 ,因为一 个命题可以由任何语言表达 ,就是在一种语言里 ,也 可通过多种句法途径来表达同一个命题. 所以 ,命题 与表达命题的语言相对独立. 命题没有英语的还是 汉语的区别 ,因为它只有语义特征 ,不具语言特 征 [ 8 ] . 句子的真值条件是研究一个句子在什么场合下 为真 ,在什么场合下为假. 凡是陈述性的语句都具有 真值条件. 如果把真值条件当作句子的逻辑语义 ,就 有了句子的真值条件义. 举例来说 ,根据如下模型 M = < D, F >, 其中 : D = {张三 ,李四 ,王五 ,小兵 ,大力 ,陈规 }, F ( a) =张三 , F ( b) =李四 , F ( c) =王五 , F ( d) = 小兵 , F ( e) =大力 , F ( h) =陈规 , F (H) = { 张三 ,李四 ,王五 ,小兵 }, F (L ) = { <张三 ,李四 >, <王五 ,小兵 >, <大 力 ,陈规 >, <张三 ,王五 >, <小兵 ,大力 >, < 陈规 ,大力 >} 因为 F ( a) =张三 ∈ F (H) ,所以 , H ( a) = T; 因为 F ( e) =大力 | F (H) ,所以 , H ( a) = F;因为 < F ( e) , F ( h) > = < 大力 , 陈规 >∈ F (L ) , 所 , L ( e, h) = T; 注意 ,并不是在说 ,陈述性句子的意义 等同于真值条件义. 果真是那样的话 ,必然会导致荒 谬的结论 ,即把所有取真值的句子视为同义 ,把所有 取假的句子也视为同义. 那么所以的陈述句总共就 只有 2个句义了. 因此 ,真值条件义只是陈述性句义 的一个重要方面. 2. 2 话语义 语言的另一个用途是表达使用者的情绪 ,如 : ·124· 智 能 系 统 学 报 第 4卷