第4卷第2期 智能系统学报 Vol 4 Ng 2 2009年4月 CAA I Transactions on Intelligent Systems Apr 2009 汉语句子语义三维表示模型 朱倩,程显毅,韩飞 江苏大学计算机科学与通信工程学院,江苏镇江212013) 摘要:如何表示和计算汉语句子的语义一直是自然语言理解的主要目标之一,在分析现有国内外关于语义表示研 究成果基础上,提出了汉语句子语义的三维表示模型,即“义面一义原一义境模型.该模型可以使句子包含的信息 更准确、更全面地表示出来,为汉语语义知识建模和语义计算的研究提供一种新的思路 关键词:自然语言理解:语义:义面:义原:义境 中图分类号:TP3194文献标识码:A文章编号:1673-4785(2009)02-0122-09 A three-dmensional represen tative model of Chinese sen tence semantics ZHU Q ian,CHENG Xian-yi,HAN Fei (School of Computer Science and Telecommunications Engineering,Jiangsu University,Zhenjiang 212013,China) Abstract:How to exp ress and calculate the Chinese sentence semantic has alays been one of the main goals in the aspect of natural language understanding Based on the analysis of the research on the semantic at home and a- board,the three-diensional model is proposed to exp ress Chinese sentence semantic,that is"word semantics word ontobgy-context"model The model can express the infomation which were contained by the sentencesmore accu- rately It is provide a new method for the research ofmaking a model of Chinese semantic knowledge and calculat- ing the semantic Keywords:natural language understanding semantic;word semantic;word ontology,context 随着互联网以及大规模数据存储体系的迅猛发已经取得了一定的成果山,但是对于中文的语义分 展,人类已经进入名副其实的海量信息时代.然而,析则相对落后.其中主要的原因在于,相对于印欧语 拥有海量数据仅仅意味着人类拥有全面、深入、方便言,中文没有那么丰富的形态变化,中文的词类与句 地驾驭这些海量数据中所蕴涵知识的潜在可能性. 法功能不是一一对应的,中文的词、短语、句子之间 现实状况是,目前对海量数据的操作主要还在信息的界限是模糊的.除此而外甚至可能是更重要的原 检索阶段,根本谈不上构建于其上的知识组织、总结 因在于,中文的结构更加依赖于语义的制约2) 及分析,彻底扭转此被动局面的惟一途径是,信息处 理必须跨越到语义计算 1传统语义计算模型 语义计算(语义分析)指的是将自然语言句子 合适的语义表示是有效语义计算成功的一半, 转化为反映这个句子意义(即句义)的某种形式化 目前,有如下几种有影响的语义表示模型: 表示.即将人类能够理解的自然语言转化为计算机 1)概念从属理论(conceptual depend-一ency, 能够理解的形式语言,做到人与机器的互相沟通.然 CD).CD理论认为,人在理解自然语言时依赖的是 而,限于目前的技术水平,印欧语言在这方面的研究 潜在的概念表述,而不是具体的词或句子.人们总 是用以前遇到的更简单、更基本的事来理解现在所 收稿日期:2008-12-16 基金项目:因家自然科学基金资助项目(60702056) 遇到的事情.因此,当计算机理解自然语言时,也 通信作者:朱倩.E1mai让calmez四@126cam 要依赖事件的概念表述而不是特定的词或句.概念 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 第 4卷第 2期 智 能 系 统 学 报 Vol. 4 №. 2 2009年 4月 CAA I Transactions on Intelligent System s Ap r. 2009 汉语句子语义三维表示模型 朱 倩 ,程显毅 ,韩 飞 (江苏大学 计算机科学与通信工程学院 ,江苏 镇江 212013) 摘 要 :如何表示和计算汉语句子的语义一直是自然语言理解的主要目标之一. 在分析现有国内外关于语义表示研 究成果基础上 ,提出了汉语句子语义的三维表示模型 ,即“义面 —义原 —义境 ”模型. 该模型可以使句子包含的信息 更准确、更全面地表示出来 ,为汉语语义知识建模和语义计算的研究提供一种新的思路. 关键词 :自然语言理解 ;语义 ;义面 ;义原 ;义境 中图分类号 : TP319. 4 文献标识码 : A 文章编号 : 167324785 (2009) 0220122209 A three2dimensional representative model of Chinese sentence semantics ZHU Q ian, CHENG Xian2yi, HAN Fei ( School of Computer Science and Telecommunications Engineering, Jiangsu University, Zhenjiang 212013, China) Abstract:How to exp ress and calculate the Chinese sentence semantic has always been one of the main goals in the aspect of natural language understanding. Based on the analysis of the research on the semantic at home and a2 board, the three2dimensionalmodel is p roposed to exp ress Chinese sentence semantic, that i“s word semantics2word ontology2context”model. The model can exp ress the information which were contained by the sentencesmore accu2 rately. It is p rovide a new method for the research of making a model of Chinese semantic knowledge and calculat2 ing the semantic. Keywords: natural language understanding; semantic; word semantic; word ontology; context 收稿日期 : 2008212216. 基金项目 :国家自然科学基金资助项目 (60702056). 通信作者 :朱 倩. E2mail: callmezq@126. com. 随着互联网以及大规模数据存储体系的迅猛发 展 ,人类已经进入名副其实的海量信息时代. 然而 , 拥有海量数据仅仅意味着人类拥有全面、深入、方便 地驾驭这些海量数据中所蕴涵知识的潜在可能性. 现实状况是 ,目前对海量数据的操作主要还在信息 检索阶段 ,根本谈不上构建于其上的知识组织、总结 及分析. 彻底扭转此被动局面的惟一途径是 ,信息处 理必须跨越到语义计算. 语义计算 (语义分析 )指的是将自然语言句子 转化为反映这个句子意义 (即句义 )的某种形式化 表示. 即将人类能够理解的自然语言转化为计算机 能够理解的形式语言 ,做到人与机器的互相沟通. 然 而 ,限于目前的技术水平 ,印欧语言在这方面的研究 已经取得了一定的成果 [ 1 ] ,但是对于中文的语义分 析则相对落后. 其中主要的原因在于 ,相对于印欧语 言 ,中文没有那么丰富的形态变化 ,中文的词类与句 法功能不是一一对应的 ,中文的词、短语、句子之间 的界限是模糊的. 除此而外 ,甚至可能是更重要的原 因在于 ,中文的结构更加依赖于语义的制约 [ 2 ] . 1 传统语义计算模型 合适的语义表示是有效语义计算成功的一半. 目前 ,有如下几种有影响的语义表示模型 : 1) 概念从属理论 ( concep tual depend—ency, CD). CD理论认为 , 人在理解自然语言时依赖的是 潜在的概念表述 , 而不是具体的词或句子. 人们总 是用以前遇到的更简单、更基本的事来理解现在所 遇到的事情. 因此 , 当计算机理解自然语言时 , 也 要依赖事件的概念表述而不是特定的词或句. 概念