第1卷第2期 智能系统学报 Vol.1 N2 2 2006年10月 CAAI Transactions on Intelligent Systems 0ct.2006 基于语用的自然语言处理研究与应用初探 李蕾,周延泉,钟义信 (北京邮电大学智能科学技术研究中心,北京100876) 摘要:首先分析了语用信息的必要性和重要性,认为只有融入语用研究的自然语言处理技术才能显示“以人为本” 和智能化的特色,只有语用、语义和语法信息的研究都成熟了,才能使计算机真正获得自然语言所表达的信息,达到 与人类交流对话的水平.接着介绍了语用学的产生、发展和运用状况,剖析了存在的主要问题,提出了基于语用的自 然语言处理.然后结合典型应用背景奥运多语言信息服务示范终端“City Guide'"语音识别后文本的检错纠错需 求,探索并尝试了一种基于语用信息的自然语言处理检错纠错方法,并通过真实语料的测试来检验效果.结果表明, 当前算法可以使中文语音识别正确率提高29%. 关键词:自然语言处理;语用信息;语音识别检错纠错 中图分类号:TP391文献标识码:A文章编号:1673-4785(2006)02-0001-06 Pragmatic Information Based NLP Research and Application LI Lei,ZHOU Yamquan ,ZHONG Yi-xin (Center for Intelligence Science and Technology Research,Beijing University of Posts Telecommunications,Beijing 100876. China) Abstract:Pragmatic information is looked on as the next focus for natural language processing(NL P)re- search.The necessity and importance of pragmatic information are analyzed firstly.It is pointed out that NL P could be charaterized as humanity and intelligence only after pragmatic information are integrated into it.And only when syntactic,semantic and pragmatic information are all fully studied could computers un- derstand the information expressed in human natural language.Thus computers could really communicate with human.Then details of pragmatics research are introduced,including its origin,growing history and applications.Problems are also analyzed for its current status.As a result,pragmatic information based NL P is put forward.Then a grope research of this,i.e.the sentence error detection and correction in the application domain of "City Guide"Speech Recognition (SR)interface is reported.The "City Guide"is a demo terminal for the National 863 project of "Olympics Oriented Multilingual Information Service".A method containing pragmatic information analysis is studied and tested using realistic corpus.Results show that the precision of Chinese SR can be improved by 29%. Keywords natural language processing (NLP);pragmatic information;error detection and correction for SR 科学发展到今天,信息技术已经成为无处不在 忆、思维等许多不同心理活动的主要参与者.事实 的主流,而其中最能显示“以人为本”特色的,就是自 上,自然语言是一个复杂的系统,具有层次结构四 然语言处理技术.认知心理学研究表明,人类的自然 作为人类用来表达信息的工具,自然语言包括形式 语言包含了非常复杂的心理活动,同时也是知觉、记 结构所表达的语法信息、形式结构所包含的逻辑内 容所表达的语义信息、形式结构及其包含的逻辑内 收稿日期:20060516. 基金项目:因家自然科学基金资助项目(60575034):国家“863”资助 容一起所体现的、对于特定目的而言的语用信息.可 项目(2004AA117010,2005AA117010). 见,只有融入语用信息研究的自然语言处理技术才 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 1 卷第 2 期 智 能 系 统 学 报 Vol. 1 №. 2 2006 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2006 基于语用的自然语言处理研究与应用初探 李 蕾 ,周延泉 ,钟义信 (北京邮电大学 智能科学技术研究中心 ,北京 100876) 摘 要 :首先分析了语用信息的必要性和重要性 ,认为只有融入语用研究的自然语言处理技术才能显示“以人为本" 和智能化的特色 ,只有语用、语义和语法信息的研究都成熟了 ,才能使计算机真正获得自然语言所表达的信息 ,达到 与人类交流对话的水平. 接着介绍了语用学的产生、发展和运用状况 ,剖析了存在的主要问题 ,提出了基于语用的自 然语言处理. 然后结合典型应用背景 ———奥运多语言信息服务示范终端“CityGuide"语音识别后文本的检错纠错需 求 ,探索并尝试了一种基于语用信息的自然语言处理检错纠错方法 ,并通过真实语料的测试来检验效果. 结果表明 , 当前算法可以使中文语音识别正确率提高 29 %. 关键词 :自然语言处理 ;语用信息 ;语音识别检错纠错 中图分类号 : TP391 文献标识码 :A 文章编号 :167324785 (2006) 0220001206 Pragmatic Information Based NLP Research and Application L I Lei ,ZHOU Yan2quan ,ZHON G Yi2xin (Center for Intelligence Science and Technology Research , Beijing University of Posts & Telecommunications , Beijing 100876 , China) Abstract :Pragmatic information is looked on as t he next focus for nat ural language processing (NL P) re2 search. The necessity and importance of pragmatic information are analyzed firstly. It is pointed out t hat NL P could be charaterized as humanity and intelligence only after pragmatic information are integrated into it. And only when syntactic , semantic and pragmatic information are all f ully st udied could comp uters un2 derstand t he information expressed in human nat ural language. Thus comp uters could really communicate with human. Then details of pragmatics research are introduced , including its origin , growing history and applications. Problems are also analyzed for its current status. As a result , pragmatic information based NL P is p ut forward. Then a grope research of t his , i. e. t he sentence error detection and correction in t he application domain of“City Guide”Speech Recognition (SR) interface is reported. The“City Guide”is a demo terminal for the National 863 project of“Olympics Oriented Multilingual Information Service”. A met hod containing pragmatic information analysis is st udied and tested using realistic corp us. Results show t hat t he precision of Chinese SR can be improved by 29 %. Keywords :nat ural language processing (NL P) ; pragmatic information ; error detection and correction for SR 收稿日期 :2006205216. 基金项目 :国家自然科学基金资助项目(60575034) ;国家“863”资助 项目(2004AA117010 ,2005AA117010) . 科学发展到今天 ,信息技术已经成为无处不在 的主流 ,而其中最能显示“以人为本”特色的 ,就是自 然语言处理技术. 认知心理学研究表明 ,人类的自然 语言包含了非常复杂的心理活动 ,同时也是知觉、记 忆、思维等许多不同心理活动的主要参与者. 事实 上 ,自然语言是一个复杂的系统 ,具有层次结构[1 ] . 作为人类用来表达信息的工具 ,自然语言包括形式 结构所表达的语法信息、形式结构所包含的逻辑内 容所表达的语义信息、形式结构及其包含的逻辑内 容一起所体现的、对于特定目的而言的语用信息. 可 见 ,只有融入语用信息研究的自然语言处理技术才
·2 智能系统学报 第1卷 能最终实现科学技术人性化和智能化的目标 1.2语用学理论的运用 国内外关于自然语言处理与理解方法的研究, 语用学理论在外语教学、对外汉语教学、翻译研 长期专注于“语法”层次的研究:20世纪末期以来, 究、修辞学研究、汉语研究等领域得到了广泛运用. 人们认识到单纯在语法层次上的研究不能解决问 如在汉外翻译研究中,翻译的语用等值问题首先成 题,开始进到了“语义”的层次,最好的例子就是互联 为研究热点,其后“西译汉化”和“汉译西化”问题也 网络这几年的研究正在从WWW走向语义网Se 引起了热烈的讨论,语用学不断被推向翻译研究的 mantic Web.然而,自然语言是语法、语义、语用三 应用之中.而在修辞学领域,修辞学与语用学之间的 者的“有机统一体”,只从语法语义2个层次上研究 关系问题,以及二者在成功的会话交际中所起的重 也不能很满意地解决问题.语用研究的空缺已经日 要作用等成为研究热点,为语用学和修辞学提供了 益阻碍了自然语言处理的发展.只有语用、语义和语 新的研究和范围 法信息的研究都成熟了,才能真正通过分析获得自 在应用中产生了很多语用学的研究分支,如研 然语言所表达的信息,达到与人类交流对话的水平 究语言本身语用问题的语用语言学;研究语言和心 因此认为,未来的趋势是要充分研究和利用自然语 理认知关系的认知语用学,研究语用与文化关系的 言的语法、语义和语用信息.实际上,走向语法·语 跨文化语用学等.目前一个新的领域正在引起人们 义·语用三位一体的层次是必然的出路,语用作为 的注意,也是作者多年来思考和关注的一个问题,这 自然语言中体现效用价值的因素不可能因为困难总 就是语用学同形式语言学相结合的形式语用学,它 被回避,现在已经到了必须要面对的时候了: 研究语用的形式化,探讨语用学理论在人工智能和 计算机自然语言处理方面的作用3.s到 1语用学研究分析 我国汉语界的突出成就是对语境的研究.1991 年在山东大学召开了第二届全国语用学研讨会, 1.1语用学的由来和两大流派 1992年出版了第一部语境研究论文专集《语境研究 语用学研究始于语言哲学,其发展一直不被人 论文集》.此后在这个领域也作了很多研究,如区分 们重视.但语言学的历史证明,语言学作为一门科 语言与语境、修辞中零度与偏离的关系、抽象语义与 学,与社会有千丝万缕的联系,与人们的生活息息相 语境语义的关系、言内歧义与言外歧义的关系以及 关因而人们研究这方面的兴趣也就越来越浓厚.20 语境对对话理解的作用等6.刀 世纪60年代提出的“语言学是以人和社会作为实践 1.3基于全信息(语法、语义和语用信息)的自然语 对象的科学”的观点得到肯定,语用学也就被认为是 言处理方法的研究 继承和推动这种观点的重要力量而获得发展.直到 语用学的蓬勃兴起显示出其光明的发展前景, 1977年Journal of Pragmatics!21创f刊,以及1986年 但目前对语用的研究存在局限性,突出表现在: 国际语用学学会(the international pragmatics asso- 1)研究的领域多集中在语言学界,甚至包括哲 ciation,简称IPrA)的创立,标志着语用学学科地位 学界,针对自然语言处理的研究开展的很少.由于语 的确立 用分析难度大,几乎很少有研究者将其应用在自然 当今语用学多指语言学的语用学,主要分为两 语言处理领域,从而造成了当前自然语言处理中语 大流派:其一是英美学派,将语用学看成是语言学的 用研究的空白 一个分支,称为微观语用学,或是分相论;其二是欧 2)对语言中的某些语用现象进行了较为深入的 洲大陆学派,主张凡与语言的理解和使用有关的都 探讨,但没有形成系统的研究成果,不能为计算机处 是语用学的研究对象,将语用学看成是语言功能的 理自然能语言的迫切需要提供足够的语用知识,这 种综观,故称宏观语用学,或是综观论.分相论一 最终也必将影响语言学的健康发展 直是语用学界普遍接受的看法,认为指示语、前提、 基于此,北京邮电大学钟义信教授认为,将全信 会话含意、言语行为、会话结构等是语用学的基本研 息,即语用、语法、语义信息应用于信息科学是非常 究内容.而综观论则认为语言使用的过程实际上是 重要的,之后进一步提出将全信息应用于自然语言 为了顺应而不断做出语言选择的过程,在所有层面 理解,提出了“全信息自然语言理解方法论”,前瞻性 上都值得进行语用研究) 地指出和强调了自然语言处理中语用研究的重要 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
能最终实现科学技术人性化和智能化的目标. 国内外关于自然语言处理与理解方法的研究 , 长期专注于“语法”层次的研究 ;20 世纪末期以来 , 人们认识到单纯在语法层次上的研究不能解决问 题 ,开始进到了“语义”的层次 ,最好的例子就是互联 网络这几年的研究正在从 WWW 走向语义网 Se2 mantic Web. 然而 ,自然语言是语法、语义、语用三 者的“有机统一体”,只从语法语义 2 个层次上研究 也不能很满意地解决问题. 语用研究的空缺已经日 益阻碍了自然语言处理的发展. 只有语用、语义和语 法信息的研究都成熟了 ,才能真正通过分析获得自 然语言所表达的信息 ,达到与人类交流对话的水平. 因此认为 ,未来的趋势是要充分研究和利用自然语 言的语法、语义和语用信息. 实际上 ,走向语法 - 语 义 - 语用三位一体的层次是必然的出路 ,语用作为 自然语言中体现效用价值的因素不可能因为困难总 被回避 ,现在已经到了必须要面对的时候了. 1 语用学研究分析 1. 1 语用学的由来和两大流派 语用学研究始于语言哲学 ,其发展一直不被人 们重视. 但语言学的历史证明 ,语言学作为一门科 学 ,与社会有千丝万缕的联系 ,与人们的生活息息相 关 ,因而人们研究这方面的兴趣也就越来越浓厚. 20 世纪 60 年代提出的“语言学是以人和社会作为实践 对象的科学”的观点得到肯定 ,语用学也就被认为是 继承和推动这种观点的重要力量而获得发展. 直到 1977 年 Journal of Pragmatics [2 ] 创刊 ,以及 1986 年 国际语用学学会(t he international pragmatics asso2 ciation ,简称 IPrA) 的创立 ,标志着语用学学科地位 的确立. 当今语用学多指语言学的语用学 ,主要分为两 大流派 :其一是英美学派 ,将语用学看成是语言学的 一个分支 ,称为微观语用学 ,或是分相论 ;其二是欧 洲大陆学派 ,主张凡与语言的理解和使用有关的都 是语用学的研究对象 ,将语用学看成是语言功能的 一种综观 ,故称宏观语用学 ,或是综观论. 分相论一 直是语用学界普遍接受的看法 ,认为指示语、前提、 会话含意、言语行为、会话结构等是语用学的基本研 究内容. 而综观论则认为语言使用的过程实际上是 为了顺应而不断做出语言选择的过程 ,在所有层面 上都值得进行语用研究[3 ] . 1. 2 语用学理论的运用 语用学理论在外语教学、对外汉语教学、翻译研 究、修辞学研究、汉语研究等领域得到了广泛运用. 如在汉外翻译研究中 ,翻译的语用等值问题首先成 为研究热点 ,其后“西译汉化”和“汉译西化”问题也 引起了热烈的讨论 ,语用学不断被推向翻译研究的 应用之中. 而在修辞学领域 ,修辞学与语用学之间的 关系问题 ,以及二者在成功的会话交际中所起的重 要作用等成为研究热点 ,为语用学和修辞学提供了 新的研究和范围. 在应用中产生了很多语用学的研究分支 ,如研 究语言本身语用问题的语用语言学 ;研究语言和心 理认知关系的认知语用学 ;研究语用与文化关系的 跨文化语用学等. 目前一个新的领域正在引起人们 的注意 ,也是作者多年来思考和关注的一个问题 ,这 就是语用学同形式语言学相结合的形式语用学 ,它 研究语用的形式化 ,探讨语用学理论在人工智能和 计算机自然语言处理方面的作用[3 - 5 ] . 我国汉语界的突出成就是对语境的研究. 1991 年在山东大学召开了第二届全国语用学研讨会 , 1992 年出版了第一部语境研究论文专集《语境研究 论文集》. 此后在这个领域也作了很多研究 ,如区分 语言与语境、修辞中零度与偏离的关系、抽象语义与 语境语义的关系、言内歧义与言外歧义的关系以及 语境对对话理解的作用等[6 - 7 ] . 1. 3 基于全信息(语法、语义和语用信息) 的自然语 言处理方法的研究 语用学的蓬勃兴起显示出其光明的发展前景 , 但目前对语用的研究存在局限性 ,突出表现在 : 1) 研究的领域多集中在语言学界 ,甚至包括哲 学界 ,针对自然语言处理的研究开展的很少. 由于语 用分析难度大 ,几乎很少有研究者将其应用在自然 语言处理领域 ,从而造成了当前自然语言处理中语 用研究的空白. 2) 对语言中的某些语用现象进行了较为深入的 探讨 ,但没有形成系统的研究成果 ,不能为计算机处 理自然能语言的迫切需要提供足够的语用知识 ,这 最终也必将影响语言学的健康发展. 基于此 ,北京邮电大学钟义信教授认为 ,将全信 息 ,即语用、语法、语义信息应用于信息科学是非常 重要的 ,之后进一步提出将全信息应用于自然语言 理解 ,提出了“全信息自然语言理解方法论”,前瞻性 地指出和强调了自然语言处理中语用研究的重要 ·2 · 智 能 系 统 学 报 第 1 卷
第2期 李蕾,等:基于语用的自然语言处理研究与应用初探 。3 性8】.近年来,北邮智能科学技术研究中心在这方面 统的语用信息基础上,进一步处理的条件是要能够 进行了一系列面向实际应用的研究与开发,如基于 把语用信息用较好的方式描述出来.因此如何找到 理解的中文自动文摘、基于倾向判断的垃圾邮件过 好的描述方式也是一个关键问题.而为了实现对语 滤、基于全信息的中文信息抽取等,取得了一定的效 用信息方便高效的计算处理,极有必要找到语用信 果山.其中都有对语用信息的探讨,用到的方法 息的数值度量方法.基于这些,还需要进一步寻找和 有效用度空间、效用规则、文本分类等」 总结在自然语言处理系统中语用信息的分析使用方 法 2基于语用的自然语言处理 此外,语用信息与语法、语义信息的互动关系是 随着研究的展开和深入,人们越来越体会到语 否和谐,也是影响自然语言处理系统整体性能的关 用信息对于自然语言处理系统的重要作用.如果能 键问题.语用信息不是空中楼阁,它与语法、语义信 够将语用信息应用自如,必将克服很多现有系统无 息是密切联系在一起的,换句话说,语用信息是在语 法解决的难题,如歧义问题、倾向性问题、可信性问 法、语义信息基础之上才能存在、描述和使用的.因 题、有效性问题、领域可移植性问题等.但是相比于 此,明确他们之间的关系和互动方式,充分发挥整体 语法、语义信息的研究,语用信息的研究基础太薄弱 大于部分和的作用,才能最终实现对于自然语言的 了,已经成为影响自然语言处理系统性能提高的瓶 理解 颈.因此,对语用信息展开深入、细致、全面、基础的 文中结合一个典型应用背景,即国家“863"”项目 研究是当前十分必要、重要且紧急的任务 “奥运多语言综合信息服务”的典型示范系统 基于语用的自然语言处理的最大特色,在于它 “City Guide”,对基于语用的自然语言信息处理进行 能够模拟人类利用语用信息来解决问题.以搜索为 了初步的研究和探索.在分析处理语法信息和语义 例,在给定环境下搜索到达目标的途径时,对于各种 信息的基础上,研究实现了一种语用信息主导的语 可能途径不再是盲目的选择或系统地探索,而是先 音识别后语句检错纠错方法.“CityGuide”是在智能 估计不同途径对于到达目标而言的效用度,在比较 手机平台上实现的一个信息服务终端,支持语音输 效用度大小的基础上,选择最有希望的途径.因此, 入/输出,可为奥运期间来北京的参观旅游者提供住 盲目性比较小,成功的把握比较大.当然,获得语用 宿、交通、旅游等方面的多语言信息服务.目前该演 信息往往要付出一定的代价,但从发展的观点来看, 示系统主要支持单句语音输入,如“今天晚上还有房 随着技术本身的不断进步,代价将会越来越小,而由 间吗?”、“请问最近的车站在哪?”.但是测试过程中 此所带来的得益却会越来越多.因此,从长远来看, 的语音输入识别效果很差,达不到实用化的要求.初 充分利用语用信息是一个应当追求的目标.实际上 步实验结果表明,增加了语用分析的自然语言理解 可以认为这是自然语言处理理论发展的一个重要途 可以在一定程度上提高语音识别正确率,关键问题 径,也是一个重要的方向.但是也要注意:在机器上 就是如何更好的挖掘和使用语用信息 实现的语用和语言学界甚至哲学界所研究的语用不 3 语用信息主导的语音识别后语句检 同,不能完全陷入哲学界和语言学界关于“语用”问 题的争论中 错纠错 对自然语言处理中的语用信息展开深入的研 “City Guide”为了克服移动终端屏幕小、使用不 究,至少应当包括语用信息的确定、描述、度量、分析 方便的问题,采用了语音人机交互方式.语音方式具 使用方法及其与语法信息和语义信息的关系等.简 有自然、方便、快速的特点,目前支持语音功能的人 单地说,自然语言处理中的语用信息就是指自然语 机对话系统已经成为科研和产业界关注的重点.但 言所携带的、针对自然语言处理系统的应用目标而 是语音识别引擎的正确性比较低,如何才能有效地 言的信息.而自然语言处理系统的应用目标是多种 提高和确保人机对话的正确性和有效性就成为主要 多样的,由此语用信息也不能一概而论,必须要找到 的问题.对此,文中认为语用信息的作用是必不可少 分析和确定各种语用信息的基本原则和基本方法, 的,只有当机器充分理解了用户的对话目的和对话 进一步找到确定语用信息相关因素以及多种因素如 内容,才能克服语音识别引擎的错误,保证对话的正 何协调统一的基本方法.在确定了自然语言处理系 确顺利进行 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
性[8 ] . 近年来 ,北邮智能科学技术研究中心在这方面 进行了一系列面向实际应用的研究与开发 ,如基于 理解的中文自动文摘、基于倾向判断的垃圾邮件过 滤、基于全信息的中文信息抽取等 ,取得了一定的效 果[9 - 11 ] . 其中都有对语用信息的探讨 ,用到的方法 有效用度空间、效用规则、文本分类等. 2 基于语用的自然语言处理 随着研究的展开和深入 ,人们越来越体会到语 用信息对于自然语言处理系统的重要作用. 如果能 够将语用信息应用自如 ,必将克服很多现有系统无 法解决的难题 ,如歧义问题、倾向性问题、可信性问 题、有效性问题、领域可移植性问题等. 但是相比于 语法、语义信息的研究 ,语用信息的研究基础太薄弱 了 ,已经成为影响自然语言处理系统性能提高的瓶 颈. 因此 ,对语用信息展开深入、细致、全面、基础的 研究是当前十分必要、重要且紧急的任务. 基于语用的自然语言处理的最大特色 ,在于它 能够模拟人类利用语用信息来解决问题. 以搜索为 例 ,在给定环境下搜索到达目标的途径时 ,对于各种 可能途径不再是盲目的选择或系统地探索 ,而是先 估计不同途径对于到达目标而言的效用度 ,在比较 效用度大小的基础上 ,选择最有希望的途径. 因此 , 盲目性比较小 ,成功的把握比较大. 当然 ,获得语用 信息往往要付出一定的代价 ,但从发展的观点来看 , 随着技术本身的不断进步 ,代价将会越来越小 ,而由 此所带来的得益却会越来越多. 因此 ,从长远来看 , 充分利用语用信息是一个应当追求的目标. 实际上 可以认为这是自然语言处理理论发展的一个重要途 径 ,也是一个重要的方向. 但是也要注意 :在机器上 实现的语用和语言学界甚至哲学界所研究的语用不 同 ,不能完全陷入哲学界和语言学界关于“语用”问 题的争论中. 对自然语言处理中的语用信息展开深入的研 究 ,至少应当包括语用信息的确定、描述、度量、分析 使用方法及其与语法信息和语义信息的关系等. 简 单地说 ,自然语言处理中的语用信息就是指自然语 言所携带的、针对自然语言处理系统的应用目标而 言的信息. 而自然语言处理系统的应用目标是多种 多样的 ,由此语用信息也不能一概而论 ,必须要找到 分析和确定各种语用信息的基本原则和基本方法 , 进一步找到确定语用信息相关因素以及多种因素如 何协调统一的基本方法. 在确定了自然语言处理系 统的语用信息基础上 ,进一步处理的条件是要能够 把语用信息用较好的方式描述出来. 因此如何找到 好的描述方式也是一个关键问题. 而为了实现对语 用信息方便高效的计算处理 ,极有必要找到语用信 息的数值度量方法. 基于这些 ,还需要进一步寻找和 总结在自然语言处理系统中语用信息的分析使用方 法. 此外 ,语用信息与语法、语义信息的互动关系是 否和谐 ,也是影响自然语言处理系统整体性能的关 键问题. 语用信息不是空中楼阁 ,它与语法、语义信 息是密切联系在一起的 ,换句话说 ,语用信息是在语 法、语义信息基础之上才能存在、描述和使用的. 因 此 ,明确他们之间的关系和互动方式 ,充分发挥整体 大于部分和的作用 ,才能最终实现对于自然语言的 理解. 文中结合一个典型应用背景 ,即国家“863”项目 “奥 运多语 言综合信 息服务”的 典型示范 系统 “City Guide”,对基于语用的自然语言信息处理进行 了初步的研究和探索. 在分析处理语法信息和语义 信息的基础上 ,研究实现了一种语用信息主导的语 音识别后语句检错纠错方法.“City Guide”是在智能 手机平台上实现的一个信息服务终端 ,支持语音输 入/ 输出 ,可为奥运期间来北京的参观旅游者提供住 宿、交通、旅游等方面的多语言信息服务. 目前该演 示系统主要支持单句语音输入 ,如“今天晚上还有房 间吗 ?”“、请问最近的车站在哪 ?”. 但是测试过程中 的语音输入识别效果很差 ,达不到实用化的要求. 初 步实验结果表明 ,增加了语用分析的自然语言理解 可以在一定程度上提高语音识别正确率 ,关键问题 就是如何更好的挖掘和使用语用信息. 3 语用信息主导的语音识别后语句检 错纠错 “City Guide”为了克服移动终端屏幕小、使用不 方便的问题 ,采用了语音人机交互方式. 语音方式具 有自然、方便、快速的特点 ,目前支持语音功能的人 机对话系统已经成为科研和产业界关注的重点. 但 是语音识别引擎的正确性比较低 ,如何才能有效地 提高和确保人机对话的正确性和有效性就成为主要 的问题. 对此 ,文中认为语用信息的作用是必不可少 的 ,只有当机器充分理解了用户的对话目的和对话 内容 ,才能克服语音识别引擎的错误 ,保证对话的正 确顺利进行. 第 2 期 李 蕾 ,等 :基于语用的自然语言处理研究与应用初探 ·3 ·
4 智能系统学报 第1卷 传统语音识别的方法无论是基于统计的模型还 响类别含义的词语 是基于规则的模型,主要是针对音节信号进行处理 那么人机对话过程中的语用信息是什么?从信 和识别,对识别的内容并不进行正确性分析.如用户 息服务提供和信息获取的角度看,人机对话的目的 输入“叫辆出租车”,结果显示却可能出现“较量出租 是为用户提供方便的信息和服务,这种服务通常是 车”,由于“叫辆”和“较量”在发音上有一定的相似 面向某些特定领域的,因此语用信息要具体分析到 性,采用语音识别的方法很难做出正确的判断,但是 所提供信息服务的领域内容,详细考察应用领域的 如果换一种处理思路,采用自然语言理解的方法分 特点,用户使用这些信息服务的需求是如何表达的, 析结果内容,则很容易判断出“较量出租车”不符合 用户使用服务时的环境如何等,而这些都是与语法 人们的用法,是一个错误的结果.这个例子显示了人信息和语义信息密不可分的.前面提到的语用信息 们对人机对话系统认识的一个误区,人们常常认为, 分析方法中,效用度空间方法比较抽象,效用规则方 系统的关键技术是语音识别、语音合成、机器翻译 法难以处理多变的语音识别错误,而文本分类方法 等,但通过例子不难看出,问题的难度最终不在语音 线条比较粗,不能很好的满足需要.为此,本文的语 表层结构的识别-合成,而在它的核心·明确语用 用分析算法是以语义类作为基础目标进行的,主要 的自然语言理解 考察在某种应用目的下,当前语句中一个词语与周 文中在语音识别引擎以后引入一个自然语言理 围环境的协调适应能力.事实上,心理学研究已经证 解模块,综合语法、语义和语用信息对语音识别结果 实上下文对句子理解有重大作用山.作为知识库,本 进行分析、检错和纠错.语法信息方面,主要分析了 文面向特定领域的应用场景,建立了常识标准下的 功能性词语(如祈使性词语、疑问词语等)在语句中 语用描述库,主要考虑以下情况: 的习惯性位置以及不同发音的词语和词语组合在语 1)一个语句范围内,核心词与核心词之间的协 音识别过程中的稳定程度.语义信息方面,根据 调能力 “City Guide”系统功能把语句含义分成了9类:饭馆 2)一个语句范围内,核心词与必要的普通词之 就餐、购买衣服、讨价还价、旅馆住宿、问路、修理、打 间的协调能力. 车、就医、寻人/物.并且为每一类语句建立了一个初 一期课题从最简单的二维环境入手,采用统计 始的核心词列表.所谓核心词,是指某一类语句中出 方法考察2个词语的协调能力(定义如下),更高维 现的能够揭示其含义的关键词.与其相对应的普通 数的环境还可以基于二维环境来扩展 词则是指在各个类别的语句中都可能出现,不太影 Harmoney (word word)Goal=-occurence(Gaal wordword co occurence (word.,wordi) co-occurence (word wordi) occurence (word)occurence (wordi)-co -occurence (word:,wordj) co-occurence Goalk wordword accurence (word)occurence (word)-co-occurence(word.,wordj) 其中分开写的2个因子中,第2个因子考察2 基础上才能分析和表达.语用知识库可由统计方法 个词语出现在同一语句中的频度,第一个因子考察 自动获得,需要收集训练语料.在一期课题的语料基 2个词语都出现且共同揭示某个语义类的能力, 础上,还可以借助公用搜索擎的帮助,自动获得更 word,、word表示不同的2个词语,Goal表示某语 多典型语料库 义目标,co-occurence(word,word表示两词语同 语句的检错纠错算法就是综合语法、语义和语 时出现的所有语句数目,co-ccurence(Goalk,wor 用信息对各个词语进行可信度评估,如式)所示: d,word)表示两词语同时出现、并且揭示该语义目 Reliability (word)Syntactic(wordi)+ 标的语句数目,occurence(word)和occurence(wor Semantic(wordi)+Pragmatic(word).(1) d)分别表示单个词语出现的语句数目」 式中:word,是语句中第i个词语,该语句中共有 可见,语用信息必须在语法信息和语义信息的 个词语,Reliability(word)是第i个词语的可信 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
传统语音识别的方法无论是基于统计的模型还 是基于规则的模型 ,主要是针对音节信号进行处理 和识别 ,对识别的内容并不进行正确性分析. 如用户 输入“叫辆出租车”,结果显示却可能出现“较量出租 车”,由于“叫辆”和“较量”在发音上有一定的相似 性 ,采用语音识别的方法很难做出正确的判断 ,但是 如果换一种处理思路 ,采用自然语言理解的方法分 析结果内容 ,则很容易判断出“较量出租车”不符合 人们的用法 ,是一个错误的结果. 这个例子显示了人 们对人机对话系统认识的一个误区 ,人们常常认为 , 系统的关键技术是语音识别、语音合成、机器翻译 等 ,但通过例子不难看出 ,问题的难度最终不在语音 表层结构的识别 - 合成 ,而在它的核心 - 明确语用 的自然语言理解. 文中在语音识别引擎以后引入一个自然语言理 解模块 ,综合语法、语义和语用信息对语音识别结果 进行分析、检错和纠错. 语法信息方面 ,主要分析了 功能性词语(如祈使性词语、疑问词语等) 在语句中 的习惯性位置以及不同发音的词语和词语组合在语 音识别过程中的稳定程度. 语义信息方面 ,根据 “City Guide”系统功能把语句含义分成了 9 类 :饭馆 就餐、购买衣服、讨价还价、旅馆住宿、问路、修理、打 车、就医、寻人/ 物. 并且为每一类语句建立了一个初 始的核心词列表. 所谓核心词 ,是指某一类语句中出 现的能够揭示其含义的关键词. 与其相对应的普通 词则是指在各个类别的语句中都可能出现 ,不太影 响类别含义的词语. 那么人机对话过程中的语用信息是什么 ? 从信 息服务提供和信息获取的角度看 ,人机对话的目的 是为用户提供方便的信息和服务 ,这种服务通常是 面向某些特定领域的 ,因此语用信息要具体分析到 所提供信息服务的领域内容 ,详细考察应用领域的 特点 ,用户使用这些信息服务的需求是如何表达的 , 用户使用服务时的环境如何等 ,而这些都是与语法 信息和语义信息密不可分的. 前面提到的语用信息 分析方法中 ,效用度空间方法比较抽象 ,效用规则方 法难以处理多变的语音识别错误 ,而文本分类方法 线条比较粗 ,不能很好的满足需要. 为此 ,本文的语 用分析算法是以语义类作为基础目标进行的 ,主要 考察在某种应用目的下 ,当前语句中一个词语与周 围环境的协调适应能力. 事实上 ,心理学研究已经证 实上下文对句子理解有重大作用[1 ] . 作为知识库 ,本 文面向特定领域的应用场景 ,建立了常识标准下的 语用描述库 ,主要考虑以下情况 : 1) 一个语句范围内 ,核心词与核心词之间的协 调能力. 2) 一个语句范围内 ,核心词与必要的普通词之 间的协调能力. 一期课题从最简单的二维环境入手 ,采用统计 方法考察 2 个词语的协调能力 (定义如下) ,更高维 数的环境还可以基于二维环境来扩展. Harmoney ( word i , word j) | Goal k = co - occurence ( Goal k , word i , word j) co - occurence ( word i , word j) × co - occurence ( word i , word j) occurence ( word i) + occurence ( word j) - co - occurence ( word i , word j) = co - occurence ( Goal k , word i , word j) occurence ( word i) + occurence ( word j) - co - occurence ( word i , word j) . 其中分开写的 2 个因子中 ,第 2 个因子考察 2 个词语出现在同一语句中的频度 ,第一个因子考察 2 个词语都出现且共同揭示某个语义类的能力 , wordi 、wordj 表示不同的 2 个词语 , Goalk 表示某语 义目标 , co - occurence( wordi , wordj 表示两词语同 时出现的所有语句数目 , co - occurence ( Goalk , wor2 di , wordj) 表示两词语同时出现、并且揭示该语义目 标的语句数目 , occurence( wordi) 和 occurence ( wor2 di) 分别表示单个词语出现的语句数目. 可见 ,语用信息必须在语法信息和语义信息的 基础上才能分析和表达. 语用知识库可由统计方法 自动获得 ,需要收集训练语料. 在一期课题的语料基 础上 ,还可以借助公用搜索引擎的帮助 ,自动获得更 多典型语料库. 语句的检错纠错算法就是综合语法、语义和语 用信息对各个词语进行可信度评估 ,如式(1) 所示 : Reli abilit y ( word i) = S y ntactic ( word i) + Sem antic ( word i) + Pr agmatic ( word i) . (1) 式中 :wordi 是语句中第 i 个词语 ,该语句中共有| s| 个词语 , Reli abilit y ( wordi ) 是第 i 个词语的可信 ·4 · 智 能 系 统 学 报 第 1 卷
第2期 李蕾,等:基于语用的自然语言处理研究与应用初探 度,包括对第i个词语的全信息的考察.Syntactic 表1测试结果 (word)表示语法信息度量,Semantic(word)表示 Table 1 Testing results 语义信息度量,Semantic(word,)表示语用信息度 项 目 数值 量.本期课题中的综合加权采用“等权"”规则,还比较 总测试句子数 1872 简单,今后还需要对各个部分的作用和加权进行深 (人工判定)语音识别正确的句子数 663 (人工判定)语音识别错误的句子数 1209 入研究 语音识别正确率 35.4% 通过比较发现一个语句中可信度最小的词汇就 (本模块判定)语音识别错误的句子数 959 是被认为出错概率最高的词汇,也就是纠错的重点 本模块纠正正确的句子数 544 纠错的基础一方面是找到可能出错的点,另一方面 纠正正确率 56.7% 是找到确信正确的点,二者结合才有可能做到较好 语音识别+本模块正确的句子数 1207 语音识别+本模块正确率 64.4% 的纠错.因此,对于语句中可信度很高的词语也要加 比未使用本模块时的正确率提高 29% 以充分利用.根据词语可信度的度量可以大体确定 一个语句中可能正确的点.根据确信点所需要的全 由于目前实现的仅是单句功能,所以语句越长 信息环境来修正语音识别结果.修正过程中可能存 可利用的全信息元素就越多,对语句的处理就可能 在歧义现象,目前的解决方法主要是通过计算词语 越深入;反之,语句越短,能利用的信息很少,几乎连 的汉字内码距离来确定最为接近的纠正结果,因为 其目的都很难确定,这样的错误很难纠正,也是实验 一方面本期课题中无法直接获得词语音节特征,另 中造成纠错失败的重要原因.目前克服这个问题只 一方面汉字内码的编排确是遵循一定的音节顺序 能依靠声音距离.长远的解决方法应该是超越单句 的 功能,以连续对话的信息服务方式进行人机交互,这 显然文中算法是面向特定的应用场景实现的, 样便可提供充足的上下文环境,保证机器更好的理 全信息知识库也都是根据特定应用目的建立的.因 解人的需求 此,实用化存在的一个最大的问题就是领域可移植 性.为此,文中设计实现了一个学习与训练模块,能 5结束语 够根据用户所提供的特定领域语料进行自学习.如 文中在追潮语用学发展历史、剖析其现状的基 果再有后续的人工参与,就能生成高质量的领域知 础上,分析了基于语用的自然语言处理研究的重要 识库,从而可以方便地完成领域移植」 性和必要性,认为它必将是下一步自然语言处理的 4测试 研究重点,并对其主要研究内容进行了初步讨论.进 步面向“City Guide”应用领域做了具体的研究,设 文中算法采用VC编程在PC机环境下实现. 计实现了综合分析语法、语义和语用信息的自然语 为了确定该方法对语音识别后文本的正确率提高是 言处理的语句检错纠错算法,其中重点增加了语用 否有作用,采取大规模真实语音识别后文本作为测 信息的表达和分析.测试结果表明,该算法可以在一 试用例,编制专门的测试程序,测试了纠错效果 定程度上提高语音识别的正确率.作为起点,文中的 测试环境 工作给人以足够的信息和勇气,人们将会继续对语 硬件 用信息展开深入扎实的研究,也期待有更多的研究 计算机主频P42.0GHz,内存512MB,硬盘 者加入 80 GB 操作系统:WindowsXP+SP2 参考文献: 开发平台:VC6.0 [1]王,汪安圣.认知心理学[M].北京:北京大学出版 语音识别:IBM Viavoice中文版(自由下载) 社,1997 语音录入环境:普通办公室工作环境,有背景噪 [2 Journal of Pragamatics EB/OL ]http:/www.science- 音(电脑、空调、人员对话、走路等),也有突发的干 direct.com/science/journal/03782166. 扰,如电话来电的声音、门开关的声音等 [3]何自然,吴亚新.语用学概略[B/OL],中国语言学研 测试结果如表1所示 http:/www.pragmaticschina.com,2005.9. 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
度 ,包括对第 i 个词语的全信息的考察. S y nt actic ( wordi) 表示语法信息度量 , S emantic ( wordi) 表示 语义信息度量 , S em antic ( wordi) 表示语用信息度 量. 本期课题中的综合加权采用“等权”规则 ,还比较 简单 ,今后还需要对各个部分的作用和加权进行深 入研究. 通过比较发现一个语句中可信度最小的词汇就 是被认为出错概率最高的词汇 ,也就是纠错的重点. 纠错的基础一方面是找到可能出错的点 ,另一方面 是找到确信正确的点 ,二者结合才有可能做到较好 的纠错. 因此 ,对于语句中可信度很高的词语也要加 以充分利用. 根据词语可信度的度量可以大体确定 一个语句中可能正确的点. 根据确信点所需要的全 信息环境来修正语音识别结果. 修正过程中可能存 在歧义现象 ,目前的解决方法主要是通过计算词语 的汉字内码距离来确定最为接近的纠正结果 ,因为 一方面本期课题中无法直接获得词语音节特征 ,另 一方面汉字内码的编排确是遵循一定的音节顺序 的. 显然文中算法是面向特定的应用场景实现的 , 全信息知识库也都是根据特定应用目的建立的. 因 此 ,实用化存在的一个最大的问题就是领域可移植 性. 为此 ,文中设计实现了一个学习与训练模块 ,能 够根据用户所提供的特定领域语料进行自学习. 如 果再有后续的人工参与 ,就能生成高质量的领域知 识库 ,从而可以方便地完成领域移植. 4 测 试 文中算法采用 VC 编程在 PC 机环境下实现. 为了确定该方法对语音识别后文本的正确率提高是 否有作用 ,采取大规模真实语音识别后文本作为测 试用例 ,编制专门的测试程序 ,测试了纠错效果. 测试环境 : 硬件 : 计算机主频 P4 2. 0 GHz ,内存 512MB ,硬盘 80 GB 操作系统 : WindowsXP + SP2 开发平台 : VC6. 0 语音识别 :IBM Viavoice 中文版(自由下载) 语音录入环境 :普通办公室工作环境 ,有背景噪 音(电脑、空调、人员对话、走路等) ,也有突发的干 扰 ,如电话来电的声音、门开关的声音等. 测试结果如表 1 所示. 表 1 测试结果 Table 1 Testing results 项 目 数值 总测试句子数 1 872 (人工判定) 语音识别正确的句子数 663 (人工判定) 语音识别错误的句子数 1 209 语音识别正确率 35. 4 % (本模块判定) 语音识别错误的句子数 959 本模块纠正正确的句子数 544 纠正正确率 56. 7 % 语音识别 + 本模块正确的句子数 1 207 语音识别 + 本模块正确率 64. 4 % 比未使用本模块时的正确率提高 29 % 由于目前实现的仅是单句功能 ,所以语句越长 , 可利用的全信息元素就越多 ,对语句的处理就可能 越深入 ;反之 ,语句越短 ,能利用的信息很少 ,几乎连 其目的都很难确定 ,这样的错误很难纠正 ,也是实验 中造成纠错失败的重要原因. 目前克服这个问题只 能依靠声音距离. 长远的解决方法应该是超越单句 功能 ,以连续对话的信息服务方式进行人机交互 ,这 样便可提供充足的上下文环境 ,保证机器更好的理 解人的需求. 5 结束语 文中在追溯语用学发展历史、剖析其现状的基 础上 ,分析了基于语用的自然语言处理研究的重要 性和必要性 ,认为它必将是下一步自然语言处理的 研究重点 ,并对其主要研究内容进行了初步讨论. 进 一步面向“City Guide”应用领域做了具体的研究 ,设 计实现了综合分析语法、语义和语用信息的自然语 言处理的语句检错纠错算法 ,其中重点增加了语用 信息的表达和分析. 测试结果表明 ,该算法可以在一 定程度上提高语音识别的正确率. 作为起点 ,文中的 工作给人以足够的信息和勇气 ,人们将会继续对语 用信息展开深入扎实的研究 ,也期待有更多的研究 者加入. 参考文献 : [1 ]王 ,汪安圣. 认知心理学[ M ]. 北京 :北京大学出版 社 ,1997. [2 ]Journal of Pragamatics [ EB/ OL ]. http :/ / www. science2 direct. com/ science/ journal/ 03782166. [3 ]何自然 ,吴亚新. 语用学概略 [ EB/ OL ]. 中国语言学研 究会 http :/ / www. pragmaticschina. com ,2005. 9. 第 2 期 李 蕾 ,等 :基于语用的自然语言处理研究与应用初探 ·5 ·
6 智能系统学报 第1卷 HE Ziran,WU Yaxin.Pragmatics overview EB/OL ] [10]刘建毅,张鹏飞,王枞.高性能电子邮件过滤系统的设 China Association of Linguistics,http //www.pragmat- 计与实现[J].计算机应用研究,2005,22(4):224.225. icschina.com,2005.9. LIU Jianyi,ZHANG Pengfei,WANG Cong.Design [4]刘淑芬.试论语法分析中句法语义语用的三位一体性 and implementation of high performance email filtering [U].唐山师范学院学报,2005,27(6):38.40. system[J].China Academic Journal Electronic Publish- LIU Shufen.A tentative exposition of trinity of syntax, ing House,2005,22(4):224.225 semantics and pragmatics in grammatical analysis [J ] [11]李蕾,周延泉,王菁华.基于全信息的中文信息抽取系 Journal of Tangshan Teachers College,2005,27(6):38- 统及应用[U].北京邮电大学学报,2005,28(6):48,51 40. LI Lei,ZHOU YanQuan,ANG Jinghua,et al.Com- [5]孙建华.语境与语用歧义卫].河南大学学报(社会科学 prehensive information based Chinese information ex- 版).2004,44(4):142.144 traction system and application[J].Journal of Beijing SUN Jianhua.Context and pragmatic ambiguity [J ] University of Posts and Telecommunications,2005,28 Journal of Henan University (Social Science),2004,44 (6):48.51. (4):142.144. 作者简介: [6]白解红.语境与语用研究卩].湖南师范大学社会科学学 李蕾,女,1974年生,讲师,毕业于 报,2000,29(3):88-92 北京邮电大学.主要研究方向为自然语言 BAI Jiehong.On context and the use of language [J ] 处理及信息抽取.发表学术论文多篇.E Journal of Social Science of Hunan Normal University, mail lilei @nlu.caai.cn 2000,29(3):88-92. [7]任万芳.预设语境歧义0].张家口师专学报.2003.19 (4):24-30. REN Wanfang.Presupposition,context and ambiguity [J ]Journal of Zhangjiakou Teachers College,2003,19 周延泉,女,1970年,副教授,毕业于 (4):24-30. 西北工业大学研究方向为智能信息处理 [8]ZHONG Yixin.Comprehensive information based meth- 移动信息服务,发表学术论文多篇。 odology for NLU:theory and application [J].IN FOR- MATION,2004,7(5):641-646. [9]李蕾,钟义信.自动文摘系统中基于全信息词典的复杂 语句分析方法及其实现U].电子学报.2000,28(8):104 钟义信,男,1940年生,教授,博士生 -106. 导师,中国人工智能学会理事长.主要研究 LI Lei,ZHON G Yixin.CIL based algorithm simplifying 方向为信息科学、人工智能和神经网络,已 analysis of complex Chinese sentences [J ]Acta Elec- 在国内外发表多篇著作和论文: tronica Sinica,2000,28(8):104-106. 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
HE Ziran , WU Yaxin. Pragmatics overview [ EB/ OL ]. China Association of Linguistics , http :/ / www. pragmat2 icschina. com , 2005. 9. [4 ]刘淑芬. 试论语法分析中句法语义语用的三位一体性 [J ]. 唐山师范学院学报 , 2005 ,27 (6) :38 - 40. L IU Shufen. A tentative exposition of trinity of syntax , semantics and pragmatics in grammatical analysis [J ]. Journal of Tangshan Teachers College , 2005 ,27 (6) :38 - 40. [5 ]孙建华. 语境与语用歧义[J ]. 河南大学学报 (社会科学 版) . 2004 ,44 (4) :142 - 144. SUN Jianhua. Context and pragmatic ambiguity [J ]. Journal of Henan University ( Social Science) , 2004 ,44 (4) :142 - 144. [6 ]白解红. 语境与语用研究[J ]. 湖南师范大学社会科学学 报 ,2000 ,29 (3) :88 - 92. BAI Jiehong. On context and the use of language [J ]. Journal of Social Science of Hunan Normal University , 2000 ,29 (3) :88 - 92. [7 ]任万芳. 预设、语境、歧义[J ]. 张家口师专学报. 2003. 19 (4) :24 - 30. REN Wanfang. Presupposition , context and ambiguity [J ]. Journal of Zhangjiakou Teachers College , 2003 , 19 (4) :24 - 30. [8 ]ZHON G Yixin. Comprehensive information based meth2 odology for NLU : theory and application [J ]. INFOR2 MA TION , 2004 ,7 (5) :641 - 646. [9 ]李 蕾 ,钟义信. 自动文摘系统中基于全信息词典的复杂 语句分析方法及其实现[J ]. 电子学报. 2000 ,28 (8) :104 - 106. L I Lei , ZHON G Yixin. CIL based algorithm simplifying analysis of complex Chinese sentences [J ]. Acta Elec2 tronica Sinica , 2000 ,28 (8) :104 - 106. [10 ]刘建毅 ,张鹏飞 ,王 枞. 高性能电子邮件过滤系统的设 计与实现[J ]. 计算机应用研究 ,2005 ,22 (4) :224 - 225. L IU Jianyi , ZHAN G Pengfei , WAN G Cong. Design and implementation of high performance email filtering system[J ]. China Academic Journal Electronic Publish2 ing House , 2005 ,22 (4) :224 - 225. [11 ]李 蕾 ,周延泉 ,王菁华. 基于全信息的中文信息抽取系 统及应用[J ]. 北京邮电大学学报 ,2005 ,28 (6) :48 - 51. L I Lei , ZHOU YanQuan , AN G Jinghua , et al. Com2 prehensive information based Chinese information ex2 traction system and application [J ]. Journal of Beijing University of Posts and Telecommunications , 2005 ,28 (6) :48 - 51. 作者简介 : 李 蕾 ,女 ,1974 年生 ,讲师 ,毕业于 北京邮电大学. 主要研究方向为自然语言 处理及信息抽取. 发表学术论文多篇. E2 mail :lilei @nlu. caai. cn. 周延泉 ,女 ,1970 年 ,副教授 ,毕业于 西北工业大学. 研究方向为智能信息处理 移动信息服务 ,发表学术论文多篇. 钟义信 ,男 ,1940 年生 ,教授 ,博士生 导师 ,中国人工智能学会理事长. 主要研究 方向为信息科学、人工智能和神经网络 ,已 在国内外发表多篇著作和论文. ·6 · 智 能 系 统 学 报 第 1 卷