正在加载图片...
第5期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·791. 基元如何表达可拓知识和解决语义二义性问题,是 表1KDML符号及其含义 未来解决某一领域的矛盾问题的基础研究。 Table 1 Symbols and meanings of KDML 符号 属性关系 1可拓信息元库 “受事/内容/领属物等一事件”关系 在“可拓信息-知识-智能形式化”体系[)研究 “施事/经验者/关系主体一事件、工具一事件”关系 中提出了该体系的主要功能模块:信息元库、知识表 “部件一整体”关系 @ 示库、可拓策略库。为了实现该体系,信息元库的建 “场所一事件、时间一事件”关系 “属性一宿主”关系 立是首要工作。 & “材料一成品”关系 信息元库集成了领域的基础知识,是支持策略 相关关系 生成系统的基础库。由于信息元库容量庞大,且其 表示不存在的关系 中涉及领域繁杂,又有非结构化组织,对于许多的复 例如: 杂情况根本不存在查询结果,必要时,仍需要查询整 W_C=大学生 个信息元库,查询效率极低。本文将分别建立信息 G_C=N 物元、信息事元、信息关系元模型,并将其存储在信 E_C= 息元库中,每次查询时先在信息元库中查询:若不能 W E college student 得出查询结果,再进行可拓变换,这样可提高查询 G_E=N 效率。 E_E= 2知网的理论概述 DEF=humanI人,*studyI学,educationI教育 这个概念的含义是:大学生是N范畴。是“人” 2.1知网的知识网络体系 类别的一员,是施行“学”行为的,属于教育领域类 知网是一个以英、汉双语所代表的概念以及概 概念。 念的特征为基础,以揭示概念与概念之间以及概念 所具有的特性之间的关系为基本内容的常识知识 3基于知网的信息元的构造方法 库[。知网知识库中的概念是通过义原与义原之 知网的哲学思想:世界上一切事物(物质的,精 间的关系来描述的。 神的或事情)都在一定的时间和空间内不停地运动 知网所描述的概念之间的关系有:上下位关系、 和变化。它们通常是从一种状态变化到另一种状 同义关系、反义关系、对义关系、部件一整体关系、属 态,并通常由其属性值的改变来体现。这一思想 性一宿主关系、材料一成品关系、施事/经验者/关系 与可拓学的思想有异曲同工之妙。初步的研究显 主体一事件关系、受事/内容/领属物、属性关系、实 示,将可拓学与知网这2个中国原创的理论和应用 体一值关系、事件一角色关系、相关关系。这些关系 工具相结合,研究解决矛盾问题的策略生成问题,可 形成了一个网状的知识系统,进而使计算机对其可 为策略生成研究提供一种新的思路。 由于知网本身就是一个具有语义的通识知识 进行操作。 库,可以借助知网中义原及其语义关系的表达方式, 2.2知网知识库描述语言 对信息元的结构进行重新构造。 知网知识库描述语言是一种面向计算机的结构 3.1信息物元的构造 化描述语言)。为了实现计算这一设计目标,知网 信息物元,是指具体对象、其特征和量值构成的 的创立者进行了2个工作:1)将概念分解为义原, 有序三元组,而知网中的义原均为概念,并非具体的 并形成一套完整的分类体系;2)将义原通过各种关 对象,所以,对信息物元并不需要基于知网进行重新 系的组织表达一个概念。因为知网中的每个义原都 改造,仍然使用可拓学中对于物元的定义。例如: 表示一个唯一的特定的意义,这样就能解决自然语 「学生A, name, 张三 言处理的语义的歧义性问题。 M= sex, 18 在知网知识库描述语言(KDML)2000版中,通 sourcePlace, 广东广州 过一些特定的符号来描述义原之间的关系的。如表 3.2信息关系元的构造 1所示。 信息关系元主要描述的是信息物元和信息事元基元如何表达可拓知识和解决语义二义性问题,是 未来解决某一领域的矛盾问题的基础研究。 1 可拓信息元库 在“可拓信息-知识-智能形式化”体系[3] 研究 中提出了该体系的主要功能模块:信息元库、知识表 示库、可拓策略库。 为了实现该体系,信息元库的建 立是首要工作。 信息元库集成了领域的基础知识,是支持策略 生成系统的基础库。 由于信息元库容量庞大,且其 中涉及领域繁杂,又有非结构化组织,对于许多的复 杂情况根本不存在查询结果,必要时,仍需要查询整 个信息元库,查询效率极低。 本文将分别建立信息 物元、信息事元、信息关系元模型,并将其存储在信 息元库中,每次查询时先在信息元库中查询;若不能 得出查询结果,再进行可拓变换,这样可提高查询 效率。 2 知网的理论概述 2.1 知网的知识网络体系 知网是一个以英、汉双语所代表的概念以及概 念的特征为基础,以揭示概念与概念之间以及概念 所具有的特性之间的关系为基本内容的常识知识 库[4] 。 知网知识库中的概念是通过义原与义原之 间的关系来描述的。 知网所描述的概念之间的关系有:上下位关系、 同义关系、反义关系、对义关系、部件—整体关系、属 性—宿主关系、材料—成品关系、施事/ 经验者/ 关系 主体—事件关系、受事/ 内容/ 领属物、属性关系、实 体—值关系、事件—角色关系、相关关系。 这些关系 形成了一个网状的知识系统,进而使计算机对其可 进行操作。 2.2 知网知识库描述语言 知网知识库描述语言是一种面向计算机的结构 化描述语言[5] 。 为了实现计算这一设计目标,知网 的创立者进行了 2 个工作:1) 将概念分解为义原, 并形成一套完整的分类体系;2)将义原通过各种关 系的组织表达一个概念。 因为知网中的每个义原都 表示一个唯一的特定的意义,这样就能解决自然语 言处理的语义的歧义性问题。 在知网知识库描述语言(KDML)2000 版中,通 过一些特定的符号来描述义原之间的关系的。 如表 1 所示。 表 1 KDML 符号及其含义 Table 1 Symbols and meanings of KDML 符号 属性关系 $ “受事/ 内容/ 领属物等—事件”关系 ∗ “施事/ 经验者/ 关系主体—事件、工具—事件”关系 % “部件—整体”关系 @ “场所—事件、时间—事件”关系 & “属性—宿主”关系 ? “材料—成品”关系 # 相关关系 ^ 表示不存在的关系 例如: W_C = 大学生 G_C = N E_C = W_E = college student G_E = N E_E = DEF = human | 人,∗study | 学,education | 教育 这个概念的含义是:大学生是 N 范畴。 是“人” 类别的一员,是施行“学”行为的,属于教育领域类 概念。 3 基于知网的信息元的构造方法 知网的哲学思想:世界上一切事物(物质的,精 神的或事情)都在一定的时间和空间内不停地运动 和变化。 它们通常是从一种状态变化到另一种状 态,并通常由其属性值的改变来体现[2] 。 这一思想 与可拓学的思想有异曲同工之妙。 初步的研究显 示,将可拓学与知网这 2 个中国原创的理论和应用 工具相结合,研究解决矛盾问题的策略生成问题,可 为策略生成研究提供一种新的思路。 由于知网本身就是一个具有语义的通识知识 库,可以借助知网中义原及其语义关系的表达方式, 对信息元的结构进行重新构造。 3.1 信息物元的构造 信息物元,是指具体对象、其特征和量值构成的 有序三元组,而知网中的义原均为概念,并非具体的 对象,所以,对信息物元并不需要基于知网进行重新 改造,仍然使用可拓学中对于物元的定义。 例如: M = 学生 A, name, 张三 sex, 18 sourcePlace, 广东广州 é ë ê ê ê ù û ú ú ú 3.2 信息关系元的构造 信息关系元主要描述的是信息物元和信息事元 第 5 期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·791·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有