正在加载图片...
第1卷第2期 智能系统学报 Vol.1 N2 2 2006年10月 CAAI Transactions on Intelligent Systems 0ct.2006 基于语用的自然语言处理研究与应用初探 李蕾,周延泉,钟义信 (北京邮电大学智能科学技术研究中心,北京100876) 摘要:首先分析了语用信息的必要性和重要性,认为只有融入语用研究的自然语言处理技术才能显示“以人为本” 和智能化的特色,只有语用、语义和语法信息的研究都成熟了,才能使计算机真正获得自然语言所表达的信息,达到 与人类交流对话的水平.接着介绍了语用学的产生、发展和运用状况,剖析了存在的主要问题,提出了基于语用的自 然语言处理.然后结合典型应用背景奥运多语言信息服务示范终端“City Guide'"语音识别后文本的检错纠错需 求,探索并尝试了一种基于语用信息的自然语言处理检错纠错方法,并通过真实语料的测试来检验效果.结果表明, 当前算法可以使中文语音识别正确率提高29%. 关键词:自然语言处理;语用信息;语音识别检错纠错 中图分类号:TP391文献标识码:A文章编号:1673-4785(2006)02-0001-06 Pragmatic Information Based NLP Research and Application LI Lei,ZHOU Yamquan ,ZHONG Yi-xin (Center for Intelligence Science and Technology Research,Beijing University of Posts Telecommunications,Beijing 100876. China) Abstract:Pragmatic information is looked on as the next focus for natural language processing(NL P)re- search.The necessity and importance of pragmatic information are analyzed firstly.It is pointed out that NL P could be charaterized as humanity and intelligence only after pragmatic information are integrated into it.And only when syntactic,semantic and pragmatic information are all fully studied could computers un- derstand the information expressed in human natural language.Thus computers could really communicate with human.Then details of pragmatics research are introduced,including its origin,growing history and applications.Problems are also analyzed for its current status.As a result,pragmatic information based NL P is put forward.Then a grope research of this,i.e.the sentence error detection and correction in the application domain of "City Guide"Speech Recognition (SR)interface is reported.The "City Guide"is a demo terminal for the National 863 project of "Olympics Oriented Multilingual Information Service".A method containing pragmatic information analysis is studied and tested using realistic corpus.Results show that the precision of Chinese SR can be improved by 29%. Keywords natural language processing (NLP);pragmatic information;error detection and correction for SR 科学发展到今天,信息技术已经成为无处不在 忆、思维等许多不同心理活动的主要参与者.事实 的主流,而其中最能显示“以人为本”特色的,就是自 上,自然语言是一个复杂的系统,具有层次结构四 然语言处理技术.认知心理学研究表明,人类的自然 作为人类用来表达信息的工具,自然语言包括形式 语言包含了非常复杂的心理活动,同时也是知觉、记 结构所表达的语法信息、形式结构所包含的逻辑内 容所表达的语义信息、形式结构及其包含的逻辑内 收稿日期:20060516. 基金项目:因家自然科学基金资助项目(60575034):国家“863”资助 容一起所体现的、对于特定目的而言的语用信息.可 项目(2004AA117010,2005AA117010). 见,只有融入语用信息研究的自然语言处理技术才 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net第 1 卷第 2 期 智 能 系 统 学 报 Vol. 1 №. 2 2006 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2006 基于语用的自然语言处理研究与应用初探 李 蕾 ,周延泉 ,钟义信 (北京邮电大学 智能科学技术研究中心 ,北京 100876) 摘 要 :首先分析了语用信息的必要性和重要性 ,认为只有融入语用研究的自然语言处理技术才能显示“以人为本" 和智能化的特色 ,只有语用、语义和语法信息的研究都成熟了 ,才能使计算机真正获得自然语言所表达的信息 ,达到 与人类交流对话的水平. 接着介绍了语用学的产生、发展和运用状况 ,剖析了存在的主要问题 ,提出了基于语用的自 然语言处理. 然后结合典型应用背景 ———奥运多语言信息服务示范终端“CityGuide"语音识别后文本的检错纠错需 求 ,探索并尝试了一种基于语用信息的自然语言处理检错纠错方法 ,并通过真实语料的测试来检验效果. 结果表明 , 当前算法可以使中文语音识别正确率提高 29 %. 关键词 :自然语言处理 ;语用信息 ;语音识别检错纠错 中图分类号 : TP391 文献标识码 :A 文章编号 :167324785 (2006) 0220001206 Pragmatic Information Based NLP Research and Application L I Lei ,ZHOU Yan2quan ,ZHON G Yi2xin (Center for Intelligence Science and Technology Research , Beijing University of Posts & Telecommunications , Beijing 100876 , China) Abstract :Pragmatic information is looked on as t he next focus for nat ural language processing (NL P) re2 search. The necessity and importance of pragmatic information are analyzed firstly. It is pointed out t hat NL P could be charaterized as humanity and intelligence only after pragmatic information are integrated into it. And only when syntactic , semantic and pragmatic information are all f ully st udied could comp uters un2 derstand t he information expressed in human nat ural language. Thus comp uters could really communicate with human. Then details of pragmatics research are introduced , including its origin , growing history and applications. Problems are also analyzed for its current status. As a result , pragmatic information based NL P is p ut forward. Then a grope research of t his , i. e. t he sentence error detection and correction in t he application domain of“City Guide”Speech Recognition (SR) interface is reported. The“City Guide”is a demo terminal for the National 863 project of“Olympics Oriented Multilingual Information Service”. A met hod containing pragmatic information analysis is st udied and tested using realistic corp us. Results show t hat t he precision of Chinese SR can be improved by 29 %. Keywords :nat ural language processing (NL P) ; pragmatic information ; error detection and correction for SR 收稿日期 :2006205216. 基金项目 :国家自然科学基金资助项目(60575034) ;国家“863”资助 项目(2004AA117010 ,2005AA117010) . 科学发展到今天 ,信息技术已经成为无处不在 的主流 ,而其中最能显示“以人为本”特色的 ,就是自 然语言处理技术. 认知心理学研究表明 ,人类的自然 语言包含了非常复杂的心理活动 ,同时也是知觉、记 忆、思维等许多不同心理活动的主要参与者. 事实 上 ,自然语言是一个复杂的系统 ,具有层次结构[1 ] . 作为人类用来表达信息的工具 ,自然语言包括形式 结构所表达的语法信息、形式结构所包含的逻辑内 容所表达的语义信息、形式结构及其包含的逻辑内 容一起所体现的、对于特定目的而言的语用信息. 可 见 ,只有融入语用信息研究的自然语言处理技术才
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有