正在加载图片...
第2期 李蕾,等:基于语用的自然语言处理研究与应用初探 。3 性8】.近年来,北邮智能科学技术研究中心在这方面 统的语用信息基础上,进一步处理的条件是要能够 进行了一系列面向实际应用的研究与开发,如基于 把语用信息用较好的方式描述出来.因此如何找到 理解的中文自动文摘、基于倾向判断的垃圾邮件过 好的描述方式也是一个关键问题.而为了实现对语 滤、基于全信息的中文信息抽取等,取得了一定的效 用信息方便高效的计算处理,极有必要找到语用信 果山.其中都有对语用信息的探讨,用到的方法 息的数值度量方法.基于这些,还需要进一步寻找和 有效用度空间、效用规则、文本分类等」 总结在自然语言处理系统中语用信息的分析使用方 法 2基于语用的自然语言处理 此外,语用信息与语法、语义信息的互动关系是 随着研究的展开和深入,人们越来越体会到语 否和谐,也是影响自然语言处理系统整体性能的关 用信息对于自然语言处理系统的重要作用.如果能 键问题.语用信息不是空中楼阁,它与语法、语义信 够将语用信息应用自如,必将克服很多现有系统无 息是密切联系在一起的,换句话说,语用信息是在语 法解决的难题,如歧义问题、倾向性问题、可信性问 法、语义信息基础之上才能存在、描述和使用的.因 题、有效性问题、领域可移植性问题等.但是相比于 此,明确他们之间的关系和互动方式,充分发挥整体 语法、语义信息的研究,语用信息的研究基础太薄弱 大于部分和的作用,才能最终实现对于自然语言的 了,已经成为影响自然语言处理系统性能提高的瓶 理解 颈.因此,对语用信息展开深入、细致、全面、基础的 文中结合一个典型应用背景,即国家“863"”项目 研究是当前十分必要、重要且紧急的任务 “奥运多语言综合信息服务”的典型示范系统 基于语用的自然语言处理的最大特色,在于它 “City Guide”,对基于语用的自然语言信息处理进行 能够模拟人类利用语用信息来解决问题.以搜索为 了初步的研究和探索.在分析处理语法信息和语义 例,在给定环境下搜索到达目标的途径时,对于各种 信息的基础上,研究实现了一种语用信息主导的语 可能途径不再是盲目的选择或系统地探索,而是先 音识别后语句检错纠错方法.“CityGuide”是在智能 估计不同途径对于到达目标而言的效用度,在比较 手机平台上实现的一个信息服务终端,支持语音输 效用度大小的基础上,选择最有希望的途径.因此, 入/输出,可为奥运期间来北京的参观旅游者提供住 盲目性比较小,成功的把握比较大.当然,获得语用 宿、交通、旅游等方面的多语言信息服务.目前该演 信息往往要付出一定的代价,但从发展的观点来看, 示系统主要支持单句语音输入,如“今天晚上还有房 随着技术本身的不断进步,代价将会越来越小,而由 间吗?”、“请问最近的车站在哪?”.但是测试过程中 此所带来的得益却会越来越多.因此,从长远来看, 的语音输入识别效果很差,达不到实用化的要求.初 充分利用语用信息是一个应当追求的目标.实际上 步实验结果表明,增加了语用分析的自然语言理解 可以认为这是自然语言处理理论发展的一个重要途 可以在一定程度上提高语音识别正确率,关键问题 径,也是一个重要的方向.但是也要注意:在机器上 就是如何更好的挖掘和使用语用信息 实现的语用和语言学界甚至哲学界所研究的语用不 3 语用信息主导的语音识别后语句检 同,不能完全陷入哲学界和语言学界关于“语用”问 题的争论中 错纠错 对自然语言处理中的语用信息展开深入的研 “City Guide”为了克服移动终端屏幕小、使用不 究,至少应当包括语用信息的确定、描述、度量、分析 方便的问题,采用了语音人机交互方式.语音方式具 使用方法及其与语法信息和语义信息的关系等.简 有自然、方便、快速的特点,目前支持语音功能的人 单地说,自然语言处理中的语用信息就是指自然语 机对话系统已经成为科研和产业界关注的重点.但 言所携带的、针对自然语言处理系统的应用目标而 是语音识别引擎的正确性比较低,如何才能有效地 言的信息.而自然语言处理系统的应用目标是多种 提高和确保人机对话的正确性和有效性就成为主要 多样的,由此语用信息也不能一概而论,必须要找到 的问题.对此,文中认为语用信息的作用是必不可少 分析和确定各种语用信息的基本原则和基本方法, 的,只有当机器充分理解了用户的对话目的和对话 进一步找到确定语用信息相关因素以及多种因素如 内容,才能克服语音识别引擎的错误,保证对话的正 何协调统一的基本方法.在确定了自然语言处理系 确顺利进行 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net性[8 ] . 近年来 ,北邮智能科学技术研究中心在这方面 进行了一系列面向实际应用的研究与开发 ,如基于 理解的中文自动文摘、基于倾向判断的垃圾邮件过 滤、基于全信息的中文信息抽取等 ,取得了一定的效 果[9 - 11 ] . 其中都有对语用信息的探讨 ,用到的方法 有效用度空间、效用规则、文本分类等. 2 基于语用的自然语言处理 随着研究的展开和深入 ,人们越来越体会到语 用信息对于自然语言处理系统的重要作用. 如果能 够将语用信息应用自如 ,必将克服很多现有系统无 法解决的难题 ,如歧义问题、倾向性问题、可信性问 题、有效性问题、领域可移植性问题等. 但是相比于 语法、语义信息的研究 ,语用信息的研究基础太薄弱 了 ,已经成为影响自然语言处理系统性能提高的瓶 颈. 因此 ,对语用信息展开深入、细致、全面、基础的 研究是当前十分必要、重要且紧急的任务. 基于语用的自然语言处理的最大特色 ,在于它 能够模拟人类利用语用信息来解决问题. 以搜索为 例 ,在给定环境下搜索到达目标的途径时 ,对于各种 可能途径不再是盲目的选择或系统地探索 ,而是先 估计不同途径对于到达目标而言的效用度 ,在比较 效用度大小的基础上 ,选择最有希望的途径. 因此 , 盲目性比较小 ,成功的把握比较大. 当然 ,获得语用 信息往往要付出一定的代价 ,但从发展的观点来看 , 随着技术本身的不断进步 ,代价将会越来越小 ,而由 此所带来的得益却会越来越多. 因此 ,从长远来看 , 充分利用语用信息是一个应当追求的目标. 实际上 可以认为这是自然语言处理理论发展的一个重要途 径 ,也是一个重要的方向. 但是也要注意 :在机器上 实现的语用和语言学界甚至哲学界所研究的语用不 同 ,不能完全陷入哲学界和语言学界关于“语用”问 题的争论中. 对自然语言处理中的语用信息展开深入的研 究 ,至少应当包括语用信息的确定、描述、度量、分析 使用方法及其与语法信息和语义信息的关系等. 简 单地说 ,自然语言处理中的语用信息就是指自然语 言所携带的、针对自然语言处理系统的应用目标而 言的信息. 而自然语言处理系统的应用目标是多种 多样的 ,由此语用信息也不能一概而论 ,必须要找到 分析和确定各种语用信息的基本原则和基本方法 , 进一步找到确定语用信息相关因素以及多种因素如 何协调统一的基本方法. 在确定了自然语言处理系 统的语用信息基础上 ,进一步处理的条件是要能够 把语用信息用较好的方式描述出来. 因此如何找到 好的描述方式也是一个关键问题. 而为了实现对语 用信息方便高效的计算处理 ,极有必要找到语用信 息的数值度量方法. 基于这些 ,还需要进一步寻找和 总结在自然语言处理系统中语用信息的分析使用方 法. 此外 ,语用信息与语法、语义信息的互动关系是 否和谐 ,也是影响自然语言处理系统整体性能的关 键问题. 语用信息不是空中楼阁 ,它与语法、语义信 息是密切联系在一起的 ,换句话说 ,语用信息是在语 法、语义信息基础之上才能存在、描述和使用的. 因 此 ,明确他们之间的关系和互动方式 ,充分发挥整体 大于部分和的作用 ,才能最终实现对于自然语言的 理解. 文中结合一个典型应用背景 ,即国家“863”项目 “奥 运多语 言综合信 息服务”的 典型示范 系统 “City Guide”,对基于语用的自然语言信息处理进行 了初步的研究和探索. 在分析处理语法信息和语义 信息的基础上 ,研究实现了一种语用信息主导的语 音识别后语句检错纠错方法.“City Guide”是在智能 手机平台上实现的一个信息服务终端 ,支持语音输 入/ 输出 ,可为奥运期间来北京的参观旅游者提供住 宿、交通、旅游等方面的多语言信息服务. 目前该演 示系统主要支持单句语音输入 ,如“今天晚上还有房 间吗 ?”“、请问最近的车站在哪 ?”. 但是测试过程中 的语音输入识别效果很差 ,达不到实用化的要求. 初 步实验结果表明 ,增加了语用分析的自然语言理解 可以在一定程度上提高语音识别正确率 ,关键问题 就是如何更好的挖掘和使用语用信息. 3 语用信息主导的语音识别后语句检 错纠错 “City Guide”为了克服移动终端屏幕小、使用不 方便的问题 ,采用了语音人机交互方式. 语音方式具 有自然、方便、快速的特点 ,目前支持语音功能的人 机对话系统已经成为科研和产业界关注的重点. 但 是语音识别引擎的正确性比较低 ,如何才能有效地 提高和确保人机对话的正确性和有效性就成为主要 的问题. 对此 ,文中认为语用信息的作用是必不可少 的 ,只有当机器充分理解了用户的对话目的和对话 内容 ,才能克服语音识别引擎的错误 ,保证对话的正 确顺利进行. 第 2 期 李 蕾 ,等 :基于语用的自然语言处理研究与应用初探 ·3 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有