第2卷第6期 智能系统学报 Vol.2 N26 2007年12月 CAAI Transactions on Intelligent Systems Dec.2007 基于本体的可拓知识链获取 陈文伟 (海军兵种指挥学院,广东广州510431) 摘要:相对于静态的知识,定义了基于可拓变换的可拓知识,可拓知识是变化的知识.在可拓知识定理(从知识中 获取可拓知识)和可拓推理公式的基础上,证明了基于集合的可拓知识定理和基于本体的可拓知识链定理.通过实 例,在多维层次数据中,获取问题产生原因的可拓知识链 关键词:可拓变换:可拓知识:集合:本体:可拓知识链 中图分类号:TP18文献标识码:A文章编号:1673-4785(2007)060068-04 Acquisition of an extensional knowledge chain based on ontology CHEN Wemwei (Naval Arms Command Academy,Guangzhou 510431,China) Abstract:This paper begins with a definition of extensional knowledge based on extensional transforma- tions.Extensional knowledge is mutative knowledge relative to static knowledge.Based on the theorem of extensional knowledge and the formula for extensional knowledge reasoning,a theorem of extensional knowledge based on sets and a theorem of an extensional knowledge chain based on ontology were proven. Using a case study,the process for generating an extensional knowledge chain in multi-dimensional hiber- archical data was analyzed. Key words :extensional transformation;extensional knowledge;set;ontology;extensional knowledge chain 识蕴含型知识、可扩型知识、共轭型知识和变换的 1可拓变换与可拓知识概念 蕴含型知识共6种类型.文中主要研究的可拓知识 1.1可拓变换概念 类型是变换的蕴含型知识。 定义1在可拓学中,可拓变换定义为对象 可拓变换可能由某个条件(原因)产生或者可拓 、v∈M、A、R、k、U(即物元、事元、关系元、准则、 变换会引起某个结果,与可拓变换有关的具有因果 论域中的任一个对象),将对象u改变为对象v的变 关系的规则式,统称为变换的蕴含型知识. 换T称为可拓变换.记作 1)可拓变换Tu由某一条件或原因所引起: Tu v. 1) Condition→Tru=y. (3) 1.2可拓变换形式逻辑表示 ①条件Condition可能是某一事实F=f,具体 式()中将对象u变为对象v,实际上完成了u 表示为 自身变为~“,并使v成为真.这样,可拓变换可以用 F=f→Tau= (4) 形式逻辑表示. ②条件Condition可能是另一个可拓变换 定义2可拓变换形式逻辑表示为 Ta=b,具体表示为 Tu=v~u∧v. 2) Taa=b→Tml=v. (5) 1.3可拓知识概念和定义 此时,在可拓学中,可拓变换T,称为可拓变换 可拓学中可拓知识包括:发散型知识、相关型知 T。的传导变换 收稿日期:2007-0523. ③涤件Condition可能是一个算子A求出变量 基金项目:国家自然科学基金资助项目(70671013) X的值,表示为 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 2 卷第 6 期 智 能 系 统 学 报 Vol. 2 №. 6 2007 年 12 月 CAAI Transactions on Intelligent Systems Dec. 2007 基于本体的可拓知识链获取 陈文伟 (海军兵种指挥学院 ,广东 广州 510431) 摘 要 :相对于静态的知识 ,定义了基于可拓变换的可拓知识 ,可拓知识是变化的知识. 在可拓知识定理 (从知识中 获取可拓知识)和可拓推理公式的基础上 ,证明了基于集合的可拓知识定理和基于本体的可拓知识链定理. 通过实 例 ,在多维层次数据中 ,获取问题产生原因的可拓知识链. 关键词 :可拓变换 ;可拓知识 ;集合 ;本体 ;可拓知识链 中图分类号 : TP18 文献标识码 :A 文章编号 :167324785 (2007) 0620068204 Acquisition of an extensional knowledge chain based on ontology CH EN Wen2wei (Naval Arms Command Academy , Guangzhou 510431 ,China) Abstract :This paper begins wit h a definition of extensional knowledge based on extensional transforma2 tions. Extensional knowledge is mutative knowledge relative to static knowledge. Based on t he t heorem of extensional knowledge and t he formula for extensional knowledge reasoning , a t heorem of extensional knowledge based on sets and a t heorem of an extensional knowledge chain based on ontology were proven. Using a case st udy , t he process for generating an extensional knowledge chain in multi2dimensional hiber2 archical data was analyzed. Keywords :extensional transformation ; extensional knowledge ; set ; ontology ; extensional knowledge chain 收稿日期 :2007205223. 基金项目 :国家自然科学基金资助项目(70671013) . 1 可拓变换与可拓知识概念 1. 1 可拓变换概念 定义 1 在可拓学中 , 可拓变换定义为对象 u、v ∈{ M、A 、R、k、U} (即物元、事元、关系元、准则、 论域中的任一个对象) ,将对象 u 改变为对象 v 的变 换 T 称为可拓变换. 记作 Tu = v. (1) 1. 2 可拓变换形式逻辑表示 式(1) 中将对象 u 变为对象 v ,实际上完成了 u 自身变为~u ,并使 v 成为真. 这样 ,可拓变换可以用 形式逻辑表示. 定义 2 可拓变换形式逻辑表示为 Tu = v ∴~ u ∧v. (2) 1. 3 可拓知识概念和定义 可拓学中可拓知识包括 :发散型知识、相关型知 识、蕴含型知识、可扩型知识、共轭型知识和变换的 蕴含型知识共 6 种类型. 文中主要研究的可拓知识 类型是变换的蕴含型知识. 可拓变换可能由某个条件(原因) 产生或者可拓 变换会引起某个结果 ,与可拓变换有关的具有因果 关系的规则式 ,统称为变换的蕴含型知识. 1) 可拓变换 T u 由某一条件或原因所引起 : Condition → Tu u = v. (3) ①条件 Condition 可能是某一事实 F = f ,具体 表示为 F = f → Tu u = v. (4) ②条件 Condition 可能是另一个可拓变换 Ta a = b,具体表示为 Ta a = b → Tu u = v. (5) 此时 ,在可拓学中 ,可拓变换 Tu 称为可拓变换 T a 的传导变换. ③条件 Condition 可能是一个算子 A 求出变量 X 的值 ,表示为 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第6期 陈文伟:基于本体的可拓知识链获取 ·69· Ax)=b→Tmu=v 6) 则成立可拓知识 2)可拓变换T。可能产生一个结果: TBB=A→P 16) Toa b-result (7) 以上2条可拓知识定理,提出了从数据挖掘出 结果result同样可能是一个事实,或者是另一 的知识中,若存在条件的可拓变换及结论的可拓变 个可拓变换. 换,就能够获得相应的的可拓知识变化的知识).变 定义3包含可拓变换的规则知识(因果关系 化的知识比静态的知识更有价值, 式)称为“变换的蕴含型知识”类型的可拓知识 2.2可拓知识推理 在式3)~7)中,式(5)是典型的可拓知识的代 按照形式逻辑的知识推理定义,即假言推理为 表形式 P∧P→g2. (17) 1.4可拓知识与知识的对比 定义4可拓知识的推理定义为 1)知识:知识在人工智能中一般表示成规则形 (Tmu=u)∧[(T.u=u 式,即 (Tv =v)1 H.T =v) 18) P→0. 该公式的正确性证明见文献1], 式中:P与Q均为事实(变量的取值),它表示事实 P是事实Q的原因,事实Q是事实P的结果.知识 3 基于集合的可拓知识 只体现了P与Q的静态关系, 在集合论中有集合蕴含关系,定义如下 2)可拓知识:在可拓知识中,规则式中包括了 定义5若集合P和Q存在关系P三Q,对于 可拓变换,而可拓变换将一对象变换成另一个对象, 任意的对象x,若x∈P,则x∈Q,表示蕴含关系为 体现了变化的持点 p→Q. (19) 公式(5)表示可拓变换T。把a变换为b,引起 由此定义,可以得到定理3 了另一个可拓变换T.把变成V,这种可拓知识完 定理3基于集合的可拓知识)对于可拓变换 全体现了变化的情况,故可拓知识是变化知识,相对 Ta=b和可拓变换Te=f,若存在集合关系aSe, 而言,人工智能中不涉及变换的知识,是静态知识. b≤f,则存在可拓知识: 也可以说,可拓知识是知识的推广,是一种更有 Taa=b→Te=f (20) 价值的知识1.5) 简写为T。→T,并称可拓变换T。与T。是同类可拓 2可拓知识与可拓推理的基础理论 变换,即2个可拓变换前的对象{a,e以与2个可拓变 换后的对象{b,}均在各同类集合中 知识与可拓知识之间是有关系的,作者证明了 证明 如下2个可拓知识定理 )由于a三e,由定义5可知,存在蕴含关系 2.1可拓知识定理(从知识中获取可拓知识) a-e. 21U 定理1对于2类规则: 2)由于b三f,同样存在蕴含关系 A→P 8) b→f 22 B→N (9) 根据定理1可知,对于式21)和22,存在可拓 若存在条件的可拓变换 变换Ta=b和Te=f,则存在可拓知识 TaB =A. (10) Taa=b·Tee=f 并存在结论的可拓变换 4 11) 基于本体的可拓知识链 TxN P. 则成立可拓知识 本体(ontology,是目前研究最多的知识表示形 TBB=A→TNN=P (12) 式,是共享概念的规范化说明,本体在概念分类层次 该定理的证明见文献1/: 的基础上,加入了关系、公理、规则来表示概念之间 定理2对于2条同类规则: 的关系 A→P, (13) 定义6(本体)本体由概念、关系、函数、公理 C∧B+P 14) 和实例等5类基本元素构成,表示为 若存在可拓变换 O:=[C、R、F、A、I] (23) TaB A, (15) 式中:C为概念,R为关系,F为函数,A为公理,为 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.htp://www.cnki.nei
A ( x) = b → Tu u = v. (6) 2) 可拓变换 Ta 可能产生一个结果 : Ta a = b →result. (7) 结果 result 同样可能是一个事实 ,或者是另一 个可拓变换. 定义 3 包含可拓变换的规则知识 (因果关系 式) 称为“变换的蕴含型知识”类型的可拓知识. 在式(3) ~(7) 中 ,式(5) 是典型的可拓知识的代 表形式. 1. 4 可拓知识与知识的对比 1) 知识 :知识在人工智能中一般表示成规则形 式 ,即 P →Q. 式中 : P 与 Q 均为事实 (变量的取值) ,它表示事实 P 是事实 Q 的原因 ,事实 Q 是事实 P 的结果. 知识 只体现了 P 与 Q 的静态关系. 2) 可拓知识 : 在可拓知识中 ,规则式中包括了 可拓变换 ,而可拓变换将一对象变换成另一个对象 , 体现了变化的持点. 公式(5) 表示可拓变换 Ta 把 a 变换为 b ,引起 了另一个可拓变换 Tu 把 u 变成 V ,这种可拓知识完 全体现了变化的情况 ,故可拓知识是变化知识 ,相对 而言 ,人工智能中不涉及变换的知识 ,是静态知识. 也可以说 ,可拓知识是知识的推广 ,是一种更有 价值的知识[1 - 5 ] . 2 可拓知识与可拓推理的基础理论 知识与可拓知识之间是有关系的 ,作者证明了 如下 2 个可拓知识定理. 2. 1 可拓知识定理(从知识中获取可拓知识) 定理 1 对于 2 类规则 : A → P , (8) B →N , (9) 若存在条件的可拓变换 TB B = A , (10) 并存在结论的可拓变换 TN N = P , (11) 则成立可拓知识 TB B = A → TN N = P. (12) 该定理的证明见文献[1 ]. 定理 2 对于 2 条同类规则 : A → P , (13) C ∧B → P , (14) 若存在可拓变换 TB B = A , (15) 则成立可拓知识 TB B = A → P. (16) 以上 2 条可拓知识定理 ,提出了从数据挖掘出 的知识中 ,若存在条件的可拓变换及结论的可拓变 换 ,就能够获得相应的的可拓知识(变化的知识) . 变 化的知识比静态的知识更有价值. 2. 2 可拓知识推理 按照形式逻辑的知识推理定义 ,即假言推理为 P ∧( P →Q) ┣Q. (17) 定义 4 可拓知识的推理定义为 ( Tu u = u′) ∧[ ( Tu u = u′) → ( u T v v = v′) ] ┣( u T v v = v′) . (18) 该公式的正确性证明见文献[1 ]. 3 基于集合的可拓知识 在集合论中有集合蕴含关系 ,定义如下. 定义 5 若集合 P 和 Q 存在关系 P Α Q ,对于 任意的对象 x ,若 x ∈P ,则 x ∈Q ,表示蕴含关系为 P →Q. (19) 由此定义 ,可以得到定理 3. 定理 3 (基于集合的可拓知识) 对于可拓变换 Ta a = b和可拓变换 Tee = f ,若存在集合关系 a Αe , b Α f ,则存在可拓知识 : Ta a = b → Tee = f . (20) 简写为 Ta →Te ,并称可拓变换 Ta 与 Te 是同类可拓 变换 ,即 2 个可拓变换前的对象{ a , e}与 2 个可拓变 换后的对象{ b, f }均在各同类集合中. 证明 1) 由于 a Αe ,由定义 5 可知 ,存在蕴含关系 a →e. (21) 2) 由于 b Α f ,同样存在蕴含关系 b →f . (22) 根据定理 1 可知 ,对于式(21) 和(22) ,存在可拓 变换 Ta a = b和 Tee = f ,则存在可拓知识 Ta a = b → Tee = f . 4 基于本体的可拓知识链 本体(ontology) 是目前研究最多的知识表示形 式 ,是共享概念的规范化说明 ,本体在概念分类层次 的基础上 ,加入了关系、公理、规则来表示概念之间 的关系. 定义 6 (本体) 本体由概念、关系、函数、公理 和实例等 5 类基本元素构成 ,表示为 O : = [ C、R、F、A 、I]. (23) 式中 :C为概念 , R 为关系 , F 为函数 , A 为公理 , I 为 第 6 期 陈文伟 :基于本体的可拓知识链获取 ·69 · © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
·70· 智能系统学报 第2卷 实例.关系R有4种:subclass-of(或kind-of,子 行原因分析,从中获取可拓知识链.数据仓库中的多 类)part-of(部分)、instance-of(实例)和attribute- 维数据中含层次粒度的大量数据,对发现的问题进 of(属性). 行原因分析主要是通过进行多维数据的钻取操作」 本体概念树的层次关系主要是subclass-of关 在每一次钻取中进行一次可拓变换,获得出现问题 系,即树的下层概念是上层概念的子集,如图1所 原因的深层数据.数据仓库中的多维层次粒度和数 示 据集合是符合本体概念树的层次关系 我国航空公司的数据仓库的多维分析中发现了 概念1 “北京到西南地区总周转量相对去年出现负增长”的 Sub-of Sub-of 问题,该问题的本体概念树如图2所示 概念1山 慨念12 西南地区航空总周转量 Sub-of Sub-of Sub-of Sub-of 概念111 概念12 概念121 概念122 客运总周转量 货运总周转量 图1本体概念树 Fig.I Conception tree of ontology 昆明 重庆 总周转量 总周转量 概念11的是概念1的子集,而概念111的是概 念11的子集,依此类推 根据本体概念树的特点和定理3,可以得到定 150座机200-300座机 总周转量 总周转量 理4和定理5. 定理4本体概念层次关系中,下层概念的可 图2西南地区航空总周转量的本体概念树 拓变换T:与上层概念的同类可拓变换T,存在蕴 Fig.2 Conception tree of ontology for overall revolving 含关系: quantum of southwest airways Ta→Ta (24) 该问题在本体树的根节点上的可拓变换表示为 该关系表明T:是主动可拓变换,Tm是传导可 T西南总量今年总周转量·去年总周转量)= 拓变换。 19.9(负增长) 证明本体概念层次关系中,下层概念集合S 通过下钻到本体树下层,空运总周转量节点上 与上层概念集合S存在蕴含关系:Sa∈Sm 的可拓变换为 根据定理3可知,下层概念集合S:中的可拓变 T西南客运今年客运总周转量·去年客运总周转量)= 换T:与上层概念集合S。中的同类可拓变换T。存 在可拓变换的蕴含关系,即可拓知识: -19.4(负增长). 再下钻到昆明客运总周转量节点上的可拓变换 Ta→Ta 定理5基于本体的可拓知识链)在本体概念 为 树中,叶节点中的可拓变换与各级上层节点中 T昆明客运(今年总周转量·去年总周转量)= 的同类可拓变换T:之间形成了可拓知识链,即 .16.5(负增长). T6→T1→T3→…→Toot.(25) 再下钻到昆明150座机与200300座机的总 证明由定理3可知,本体概念树的上下两层 周转量2个结点上的可拓变换分别为 的同类可拓变换都存在蕴含关系可拓知识).由本 1s0座机(今年总周转量、去年总周转量)= 体概念树叶节点开始,逐层向上到本体概念树的根 、 6.83(负增长), 节点,将同类可拓变换连接起来,就形成式25的可 T200~300座机(今年总周转量,去年总周转量= 拓知识链 -6.9(负增长) 可拓知识链表明,根节点的可拓变换T是由 根据定理5,可得到可拓知识链为 叶节点的可拓变换T。引起的传导可拓变换 Ts0座机人T200~300座机→T昆明客运→ 5多维数据中原因分析的可拓知识链 T西南客运→T西南总量, 获取实例 该可拓知识链说明出现西南地区总周转量相对 去年出现较大负增长,原因主要是昆明地区150座 在我国航空公司数据仓库中,对发现的问题进 机和200~300座机相对去年出现较大负增长造成 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
实例. 关系 R 有 4 种 : subclass2of (或 kind2of , 子 类) 、part2of (部分) 、instance2of (实例) 和 attribute2 of (属性) . 本体概念树的层次关系主要是 subclass2of 关 系 ,即树的下层概念是上层概念的子集 ,如图 1 所 示. 图 1 本体概念树 Fig. 1 Conception tree of ontology 概念 11 的是概念 1 的子集 ,而概念 111 的是概 念 11 的子集 ,依此类推. 根据本体概念树的特点和定理 3 ,可以得到定 理 4 和定理 5. 定理 4 本体概念层次关系中 ,下层概念的可 拓变换 Td 与上层概念的同类可拓变换 T u ,存在蕴 含关系 : Td → Tu . (24) 该关系表明 Td 是主动可拓变换 , Tu 是传导可 拓变换. 证明 本体概念层次关系中 ,下层概念集合 S d 与上层概念集合 S u 存在蕴含关系 :S d ΑS u . 根据定理 3 可知 ,下层概念集合 S d 中的可拓变 换 Td 与上层概念集合 S u 中的同类可拓变换 T u 存 在可拓变换的蕴含关系 ,即可拓知识 : Td → Tu . 定理 5 (基于本体的可拓知识链) 在本体概念 树中 ,叶节点中的可拓变换 T0 与各级上层节点中 的同类可拓变换 Ti 之间形成了可拓知识链 ,即 T0 → T1 → T2 → …… → Troot . (25) 证明 由定理 3 可知 ,本体概念树的上下两层 的同类可拓变换都存在蕴含关系 (可拓知识) . 由本 体概念树叶节点开始 ,逐层向上到本体概念树的根 节点 ,将同类可拓变换连接起来 ,就形成式(25) 的可 拓知识链. 可拓知识链表明 ,根节点的可拓变换 Troot 是由 叶节点的可拓变换 T0 引起的传导可拓变换. 5 多维数据中原因分析的可拓知识链 获取实例 在我国航空公司数据仓库中 ,对发现的问题进 行原因分析 ,从中获取可拓知识链. 数据仓库中的多 维数据中含层次粒度的大量数据 ,对发现的问题进 行原因分析主要是通过进行多维数据的钻取操作. 在每一次钻取中进行一次可拓变换 ,获得出现问题 原因的深层数据. 数据仓库中的多维层次粒度和数 据集合是符合本体概念树的层次关系. 我国航空公司的数据仓库的多维分析中发现了 “北京到西南地区总周转量相对去年出现负增长”的 问题 ,该问题的本体概念树如图 2 所示. 图 2 西南地区航空总周转量的本体概念树 Fig. 2 Conception tree of ontology for overall revolving quantum of southwest airways 该问题在本体树的根节点上的可拓变换表示为 T西南总量 (今年总周转量 - 去年总周转量) = - 19. 9 (负增长) . 通过下钻到本体树下层 ,空运总周转量节点上 的可拓变换为 T西南客运 (今年客运总周转量 - 去年客运总周转量) = - 19. 4 (负增长) . 再下钻到昆明客运总周转量节点上的可拓变换 为 T昆明客运 (今年总周转量 - 去年总周转量) = - 16. 5 (负增长) . 再下钻到昆明 150 座机与 200~300 座机的总 周转量 2 个结点上的可拓变换分别为 T150座机 (今年总周转量 - 去年总周转量) = - 6. 83 (负增长) , T200~300座机 (今年总周转量 - 去年总周转量) = - 6. 9 (负增长) . 根据定理 5 ,可得到可拓知识链为 T150座机 ∧ T200~300座机 → T昆明客运 → T西南客运 → T西南总量 . 该可拓知识链说明出现西南地区总周转量相对 去年出现较大负增长 ,原因主要是昆明地区 150 座 机和 200~300 座机相对去年出现较大负增长造成 ·70 · 智 能 系 统 学 报 第 2 卷 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第6期 陈文伟:基于本体的可拓知识链获取 ·71· 的.而该可拓知识链的获得是从问题结论的可拓变 换,T西南总量出现负增长,通过多维数据钻取,逆向找 参考文献: 它的前提可拓变换,再向下钻取,一直到最底层(叶 [1]陈文伟.挖掘变化知识的可拓数据挖掘研究卩].中国工 节点)中的可拓变换,T1s0座机及T2o0~300座机出现大的 程科学,2006,8(11):70.73. 负增长,该叶节点的可拓变换才是本体根节点问题 CHEN Wenwei.The research of the new technique of 的根本原因 mining the mutative knowledge with extension data min- 在向下钻取过程,有时也能发现新问题,如在搜 ing[J ]Engineering Science of China,2006,8(11):70- 73. 索货运总周转量时,发现东南地区出现了一个大负 [2]陈文伟,数据仓库与数据挖掘教程[M].北京:清华大学 增长,这是除西南地区出现负增长外新发现的问题, 出版社,2006. 可以在寻找西南地区航空总周转量的根本原因之 [3]陈文伟,杨春燕,黄金才.可拓知识与可拓知识推理U] 后,再去寻找东南地区出现货运总周转量出现负增 哈尔滨工业大学学报,2006,38(7):1094.1096 长的原因 CHEN Wenwei,YANG Chunyan,HUANG Jincai.Re- 除了寻找负增长以外,还可以寻找正增长的原 search on extension knowledge and extension knowledge 因.即从正、负2个方面寻找问题产生的原因,这样 reasoning[J].Journal of Harbin Institute of Technology, 可以得到更大的决策支持」 2006,38(7):1094-1096 寻找问题原因让计算机自动完成,必须建立多 [4]陈文伟,黄金才.从数据挖掘到可拓数据挖掘U],智能技 维层次数据的本体概念树,并在树中进行深度优先 术,2006,1(2):50.52 CHEN Wenwei,HUANG Jincai.From datamining to 搜索,来发现问题并找到所有原因 extension datamining[J].Intelligent Technology,2006,1 6结束语 (2):50-52 [5]杨春燕,蔡文.可拓工程[M].北京:科学出版社,2007. 数据挖掘是从数据中挖掘知识,可拓数据挖掘 作者简介: 是挖掘可拓知识.知识是静态的,而可拓知识是变化 陈文伟,男,1940年生,教授,国防 的知识.可拓知识定理帮助人们从知识及相关的可 科技大学博士生导师,中国人工智能学 拓变换中获取可拓知识.基于本体的可拓知识链定 会机器学习专业委员会副主任,中国人 理帮助人们在数据仓库中多维层次数据中获取可拓 工智能学会可拓工程专业委员会副主 知识链.目前,数据仓库的问题原因分析基本上是在 任,主要研究方向为决策支持系统、机 器学习、可拓工程、数据仓库与数据挖 人的指导下,对多维层次数据进行钻取操作,找到问 掘.获国家科技进步奖二等奖1项,军 题发生的原因.若在多维层次数据中建立本体概念 队科技进步奖二、三等奖多项 树,就可以让计算机沿着本体概念树进行深度优先 Email :chenww9 @21cn.com 搜索,既可以发现问题,又能自动找到各问题的所有 原因,这项工作是很有意义的 2008年IEEE计算机科学与软件工程国际会议 2008 International Conference on Computer Science and Soft ware Engineering 2008 International Conference on Computer Science and Software Engineering (CSSE 2008)will be held on December 12~ 14,2008 in Wuhan,China.The conference proceedings will be published by IEEE Computer Society,all papers accepted will be included in IEEE Xplore and cited by EI. Topics of interests include,but not limited to Computer Science:1)artificial intelligence;2)computer graphics;3)computer application;4)distributed and parallel compu- ting;5)database technology;6)embedded programming;7)grid computing;8)information security;9)scientific computing; 10)human computer interface. Software Engineering:1)data mining;2)project management;3)requirement analysis;4)software standards and design; 5)programming methodology;6)software testing and quality control;7)web based services;8)software maintenance;9)simula- tion and modeling. http //www.highsci.org/csse 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net
的. 而该可拓知识链的获得是从问题结论的可拓变 换 , T西南总量 出现负增长 ,通过多维数据钻取 ,逆向找 它的前提可拓变换 ,再向下钻取 ,一直到最底层 (叶 节点) 中的可拓变换 , T150座机 及 T200~300座机 出现大的 负增长 ,该叶节点的可拓变换才是本体根节点问题 的根本原因. 在向下钻取过程 ,有时也能发现新问题 ,如在搜 索货运总周转量时 ,发现东南地区出现了一个大负 增长 ,这是除西南地区出现负增长外新发现的问题 , 可以在寻找西南地区航空总周转量的根本原因之 后 ,再去寻找东南地区出现货运总周转量出现负增 长的原因. 除了寻找负增长以外 ,还可以寻找正增长的原 因. 即从正、负 2 个方面寻找问题产生的原因 ,这样 可以得到更大的决策支持. 寻找问题原因让计算机自动完成 ,必须建立多 维层次数据的本体概念树 ,并在树中进行深度优先 搜索 ,来发现问题并找到所有原因. 6 结束语 数据挖掘是从数据中挖掘知识 ,可拓数据挖掘 是挖掘可拓知识. 知识是静态的 ,而可拓知识是变化 的知识. 可拓知识定理帮助人们从知识及相关的可 拓变换中获取可拓知识. 基于本体的可拓知识链定 理帮助人们在数据仓库中多维层次数据中获取可拓 知识链. 目前 ,数据仓库的问题原因分析基本上是在 人的指导下 ,对多维层次数据进行钻取操作 ,找到问 题发生的原因. 若在多维层次数据中建立本体概念 树 ,就可以让计算机沿着本体概念树进行深度优先 搜索 ,既可以发现问题 ,又能自动找到各问题的所有 原因 ,这项工作是很有意义的. 参考文献 : [1 ]陈文伟. 挖掘变化知识的可拓数据挖掘研究[J ]. 中国工 程科学 ,2006 ,8 (11) :70 - 73. CHEN Wenwei. The research of the new technique of mining the mutative knowledge with extension data min2 ing[J ]. Engineering Science of China , 2006 ,8 (11) :70 - 73. [2 ]陈文伟. 数据仓库与数据挖掘教程[ M ]. 北京 :清华大学 出版社 ,2006. [3 ]陈文伟 ,杨春燕 ,黄金才. 可拓知识与可拓知识推理[J ]. 哈尔滨工业大学学报 ,2006 ,38 (7) :1094 - 1096. CHEN Wenwei , YAN G Chunyan , HUAN G Jincai. Re2 search on extension knowledge and extension knowledge reasoning[J ]. Journal of Harbin Institute of Technology , 2006 ,38 (7) :1094 - 1096. [4 ]陈文伟 ,黄金才. 从数据挖掘到可拓数据挖掘[J ]. 智能技 术 , 2006 ,1 (2) :50 - 52. CHEN Wenwei , HUAN G Jincai. From datamining to extension datamining[J ]. Intelligent Technology , 2006 ,1 (2) :50 - 52. [5 ]杨春燕 ,蔡 文. 可拓工程[ M]. 北京 :科学出版社 ,2007. 作者简介 : 陈文伟 ,男 ,1940 年生 ,教授 ,国防 科技大学博士生导师 ,中国人工智能学 会机器学习专业委员会副主任 ,中国人 工智能学会可拓工程专业委员会副主 任 ,主要研究方向为决策支持系统、机 器学习、可拓工程、数据仓库与数据挖 掘. 获国家科技进步奖二等奖 1 项 ,军 队科技进步奖二、三等奖多项. E2mail :chenww9 @21cn. com. 2008 年 IEEE 计算机科学与软件工程国际会议 2008 International Conference on Computer Science and Software Engineering 2008 International Conference on Computer Science and Software Engineering (CSSE 2008) will be held on December 12~ 14 , 2008 in Wuhan , China. The conference proceedings will be published by IEEE Computer Society , all papers accepted will be included in IEEE Xplore and cited by EI. Topics of interests include ,but not limited to Computer Science :1) artificial intelligence ;2) computer graphics;3) computer application ;4) distributed and parallel compu2 ting ;5) database technology ; 6) embedded programming ; 7) grid computing ; 8) information security ; 9) scientific computing ; 10) human computer interface. Software Engineering :1) data mining ; 2) project management ; 3) requirement analysis; 4) software standards and design ; 5) programming methodology ;6) software testing and quality control ;7) web2based services;8) software maintenance ;9) simula2 tion and modeling. http :/ / www. highsci. org/ csse. 第 6 期 陈文伟 :基于本体的可拓知识链获取 ·71 · © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net