正在加载图片...
·70· 智能系统学报 第2卷 实例.关系R有4种:subclass-of(或kind-of,子 行原因分析,从中获取可拓知识链.数据仓库中的多 类)part-of(部分)、instance-of(实例)和attribute- 维数据中含层次粒度的大量数据,对发现的问题进 of(属性). 行原因分析主要是通过进行多维数据的钻取操作」 本体概念树的层次关系主要是subclass-of关 在每一次钻取中进行一次可拓变换,获得出现问题 系,即树的下层概念是上层概念的子集,如图1所 原因的深层数据.数据仓库中的多维层次粒度和数 示 据集合是符合本体概念树的层次关系 我国航空公司的数据仓库的多维分析中发现了 概念1 “北京到西南地区总周转量相对去年出现负增长”的 Sub-of Sub-of 问题,该问题的本体概念树如图2所示 概念1山 慨念12 西南地区航空总周转量 Sub-of Sub-of Sub-of Sub-of 概念111 概念12 概念121 概念122 客运总周转量 货运总周转量 图1本体概念树 Fig.I Conception tree of ontology 昆明 重庆 总周转量 总周转量 概念11的是概念1的子集,而概念111的是概 念11的子集,依此类推 根据本体概念树的特点和定理3,可以得到定 150座机200-300座机 总周转量 总周转量 理4和定理5. 定理4本体概念层次关系中,下层概念的可 图2西南地区航空总周转量的本体概念树 拓变换T:与上层概念的同类可拓变换T,存在蕴 Fig.2 Conception tree of ontology for overall revolving 含关系: quantum of southwest airways Ta→Ta (24) 该问题在本体树的根节点上的可拓变换表示为 该关系表明T:是主动可拓变换,Tm是传导可 T西南总量今年总周转量·去年总周转量)= 拓变换。 19.9(负增长) 证明本体概念层次关系中,下层概念集合S 通过下钻到本体树下层,空运总周转量节点上 与上层概念集合S存在蕴含关系:Sa∈Sm 的可拓变换为 根据定理3可知,下层概念集合S:中的可拓变 T西南客运今年客运总周转量·去年客运总周转量)= 换T:与上层概念集合S。中的同类可拓变换T。存 在可拓变换的蕴含关系,即可拓知识: -19.4(负增长). 再下钻到昆明客运总周转量节点上的可拓变换 Ta→Ta 定理5基于本体的可拓知识链)在本体概念 为 树中,叶节点中的可拓变换与各级上层节点中 T昆明客运(今年总周转量·去年总周转量)= 的同类可拓变换T:之间形成了可拓知识链,即 .16.5(负增长). T6→T1→T3→…→Toot.(25) 再下钻到昆明150座机与200300座机的总 证明由定理3可知,本体概念树的上下两层 周转量2个结点上的可拓变换分别为 的同类可拓变换都存在蕴含关系可拓知识).由本 1s0座机(今年总周转量、去年总周转量)= 体概念树叶节点开始,逐层向上到本体概念树的根 、 6.83(负增长), 节点,将同类可拓变换连接起来,就形成式25的可 T200~300座机(今年总周转量,去年总周转量= 拓知识链 -6.9(负增长) 可拓知识链表明,根节点的可拓变换T是由 根据定理5,可得到可拓知识链为 叶节点的可拓变换T。引起的传导可拓变换 Ts0座机人T200~300座机→T昆明客运→ 5多维数据中原因分析的可拓知识链 T西南客运→T西南总量, 获取实例 该可拓知识链说明出现西南地区总周转量相对 去年出现较大负增长,原因主要是昆明地区150座 在我国航空公司数据仓库中,对发现的问题进 机和200~300座机相对去年出现较大负增长造成 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net实例. 关系 R 有 4 种 : subclass2of (或 kind2of , 子 类) 、part2of (部分) 、instance2of (实例) 和 attribute2 of (属性) . 本体概念树的层次关系主要是 subclass2of 关 系 ,即树的下层概念是上层概念的子集 ,如图 1 所 示. 图 1 本体概念树 Fig. 1 Conception tree of ontology 概念 11 的是概念 1 的子集 ,而概念 111 的是概 念 11 的子集 ,依此类推. 根据本体概念树的特点和定理 3 ,可以得到定 理 4 和定理 5. 定理 4 本体概念层次关系中 ,下层概念的可 拓变换 Td 与上层概念的同类可拓变换 T u ,存在蕴 含关系 : Td → Tu . (24) 该关系表明 Td 是主动可拓变换 , Tu 是传导可 拓变换. 证明 本体概念层次关系中 ,下层概念集合 S d 与上层概念集合 S u 存在蕴含关系 :S d ΑS u . 根据定理 3 可知 ,下层概念集合 S d 中的可拓变 换 Td 与上层概念集合 S u 中的同类可拓变换 T u 存 在可拓变换的蕴含关系 ,即可拓知识 : Td → Tu . 定理 5 (基于本体的可拓知识链) 在本体概念 树中 ,叶节点中的可拓变换 T0 与各级上层节点中 的同类可拓变换 Ti 之间形成了可拓知识链 ,即 T0 → T1 → T2 → …… → Troot . (25) 证明 由定理 3 可知 ,本体概念树的上下两层 的同类可拓变换都存在蕴含关系 (可拓知识) . 由本 体概念树叶节点开始 ,逐层向上到本体概念树的根 节点 ,将同类可拓变换连接起来 ,就形成式(25) 的可 拓知识链. 可拓知识链表明 ,根节点的可拓变换 Troot 是由 叶节点的可拓变换 T0 引起的传导可拓变换. 5 多维数据中原因分析的可拓知识链 获取实例 在我国航空公司数据仓库中 ,对发现的问题进 行原因分析 ,从中获取可拓知识链. 数据仓库中的多 维数据中含层次粒度的大量数据 ,对发现的问题进 行原因分析主要是通过进行多维数据的钻取操作. 在每一次钻取中进行一次可拓变换 ,获得出现问题 原因的深层数据. 数据仓库中的多维层次粒度和数 据集合是符合本体概念树的层次关系. 我国航空公司的数据仓库的多维分析中发现了 “北京到西南地区总周转量相对去年出现负增长”的 问题 ,该问题的本体概念树如图 2 所示. 图 2 西南地区航空总周转量的本体概念树 Fig. 2 Conception tree of ontology for overall revolving quantum of southwest airways 该问题在本体树的根节点上的可拓变换表示为 T西南总量 (今年总周转量 - 去年总周转量) = - 19. 9 (负增长) . 通过下钻到本体树下层 ,空运总周转量节点上 的可拓变换为 T西南客运 (今年客运总周转量 - 去年客运总周转量) = - 19. 4 (负增长) . 再下钻到昆明客运总周转量节点上的可拓变换 为 T昆明客运 (今年总周转量 - 去年总周转量) = - 16. 5 (负增长) . 再下钻到昆明 150 座机与 200~300 座机的总 周转量 2 个结点上的可拓变换分别为 T150座机 (今年总周转量 - 去年总周转量) = - 6. 83 (负增长) , T200~300座机 (今年总周转量 - 去年总周转量) = - 6. 9 (负增长) . 根据定理 5 ,可得到可拓知识链为 T150座机 ∧ T200~300座机 → T昆明客运 → T西南客运 → T西南总量 . 该可拓知识链说明出现西南地区总周转量相对 去年出现较大负增长 ,原因主要是昆明地区 150 座 机和 200~300 座机相对去年出现较大负增长造成 ·70 · 智 能 系 统 学 报 第 2 卷 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有