D0I:10.13374/1.issnl00103.2008.07.049 第30卷第7期 北京科技大学学报 Vol.30 No.7 2008年7月 Journal of University of Science and Technology Beijing Jul.2008 基于结构模型的知识发现技术 范玉妹)单平) 艾冬梅)张德政) 1)北京科技大学应用科学学院,北京1000832)北京科技大学信息工程学院,北京100083 摘要将一种结构建模方法用于分析知识结构中概念之间的关系,并将其用于中医医案解析,有效地获取医案中隐含的深 层次的辨证论治规律。医案实例分析结果表明,由结构分析所得到的结构模型,不仅可根据系统中少量的、零散的已知概念关 系推导出其他的大多数未知的概念之间的关系,并可使得已有结构关系凸现出来·结构的图分析可展现症状的关联度和重要 程度,分析结果得到了医案验证和专家肯定 关键词系统分析:知识获取:结构建模:;中医 分类号N945.1 Knowledge discovery based on structural modeling FAN Yumei),SHA N Ping2).AI Dongmei),ZHA NG Dez heng2) 1)School of Applied Science.University of Science and Technology Beijing.Beijing 100083.China 2)School of Information Engineering.University of Science and Technology Beijing.Beijing 100083.China ABSTRACI A structure model was used to analyze the relations between concepts in knowledge structure and parse the medical records of traditional Chinese medicine to gain connotative rules of treatment based on syndrome differentiation effectively.The ana- lytic results of medical record examples show that the structure model gained by structural analysis can not only discover many un- known relations by few scattered existing information,but also protrude existing structural relations.The picture analysis of structure displays the correlation degree and importance of symptoms,and the results have been validated by medical records and affirmed by experts. KEY WORDS system analysis:knowledge acquisition:structural modeling:traditional Chinese medicine 名老中医学术思想与临床经验是通过传承、实 层次多维度,从知识构建的角度来看,复杂的知识 践以及创新而形成的独特的知识体系,知识隐含在 结构可以利用系统分析方法来探索知识结构中概念 名老中医辨证施治过程以及所形成的医案之中.有 之间的关系[2],结构分析结果体现在结构模型中, 效地获取医案中的知识山,深层次挖掘隐藏在诊疗 该模型代表着认知结果或复杂知识结构的显化,结 过程中的隐性知识,最大限度地获取与保留名医数 构模型描述了系统概念之间的关系,记录了人们对 十年积累的诊疗经验,是实现中医传承的关键,名 系统的定性的认识,同时在认识过程中它又是激发 老中医的知识体系大多由技巧、经验和过程等隐性 进一步认识的媒介,结构分析就是一个分析过程、 知识为主,包含辨证论治、理法方药等多个层次,知 学习过程,更是一个知识获取的过程 识结构复杂多变,已有数据挖掘技术,对于非结构 中医医案分析就是一个关于某种疾病知识构建 化、知识关系复杂的中医知识挖掘与获取难以奏效, 的过程,通过知识构建来再现名老中医临床施治情 中医知识体系依附于人体生理与病理过程,是一个 景,探索辨证思维过程,进而获取疾病诊疗的知识, 复杂的系统,其复杂性不仅是处方用药规律的复杂 结构建模]是通过人机交互来完成认知获取知识 多变,更为突出的是表现为理法方药内在联系的多 的过程,通过分解、列举、集结、结构化、扩大、分类与 收稿日期:2007-06-18修回日期:2007-08-18 基金项目:国家“十五“科技攻关项目(N。.2004BA721A01H07):北京市自然科学基金资助项目(No.4062022) 作者简介:范玉妹(l948一),女,教授,E-mail:Isffym@vip.sina-com
基于结构模型的知识发现技术 范玉妹1) 单 平2) 艾冬梅1) 张德政2) 1) 北京科技大学应用科学学院北京100083 2) 北京科技大学信息工程学院北京100083 摘 要 将一种结构建模方法用于分析知识结构中概念之间的关系并将其用于中医医案解析有效地获取医案中隐含的深 层次的辨证论治规律.医案实例分析结果表明由结构分析所得到的结构模型不仅可根据系统中少量的、零散的已知概念关 系推导出其他的大多数未知的概念之间的关系并可使得已有结构关系凸现出来.结构的图分析可展现症状的关联度和重要 程度分析结果得到了医案验证和专家肯定. 关键词 系统分析;知识获取;结构建模;中医 分类号 N945∙1 Knowledge discovery based on structural modeling FA N Y umei 1)SHA N Ping 2)AI Dongmei 1)ZHA NG Dez heng 2) 1) School of Applied ScienceUniversity of Science and Technology BeijingBeijing100083China 2) School of Information EngineeringUniversity of Science and Technology BeijingBeijing100083China ABSTRACT A structure model was used to analyze the relations between concepts in knowledge structure and parse the medical records of traditional Chinese medicine to gain connotative rules of treatment based on syndrome differentiation effectively.T he analytic results of medical record examples show that the structure model gained by structural analysis can not only discover many unknown relations by few scattered existing informationbut also protrude existing structural relations.T he picture analysis of structure displays the correlation degree and importance of symptomsand the results have been validated by medical records and affirmed by experts. KEY WORDS system analysis;knowledge acquisition;structural modeling;traditional Chinese medicine 收稿日期:2007-06-18 修回日期:2007-08-18 基金项目:国家“十五”科技攻关项目(No.2004BA721A01H07);北京市自然科学基金资助项目(No.4062022) 作者简介:范玉妹(1948—)女教授E-mail:lsffym@vip.sina.com 名老中医学术思想与临床经验是通过传承、实 践以及创新而形成的独特的知识体系知识隐含在 名老中医辨证施治过程以及所形成的医案之中.有 效地获取医案中的知识[1]深层次挖掘隐藏在诊疗 过程中的隐性知识最大限度地获取与保留名医数 十年积累的诊疗经验是实现中医传承的关键.名 老中医的知识体系大多由技巧、经验和过程等隐性 知识为主包含辨证论治、理法方药等多个层次知 识结构复杂多变.已有数据挖掘技术对于非结构 化、知识关系复杂的中医知识挖掘与获取难以奏效. 中医知识体系依附于人体生理与病理过程是一个 复杂的系统其复杂性不仅是处方用药规律的复杂 多变更为突出的是表现为理法方药内在联系的多 层次多维度.从知识构建的角度来看复杂的知识 结构可以利用系统分析方法来探索知识结构中概念 之间的关系[2].结构分析结果体现在结构模型中 该模型代表着认知结果或复杂知识结构的显化.结 构模型描述了系统概念之间的关系记录了人们对 系统的定性的认识同时在认识过程中它又是激发 进一步认识的媒介.结构分析就是一个分析过程、 学习过程更是一个知识获取的过程. 中医医案分析就是一个关于某种疾病知识构建 的过程通过知识构建来再现名老中医临床施治情 景探索辨证思维过程进而获取疾病诊疗的知识. 结构建模[3] 是通过人机交互来完成认知获取知识 的过程通过分解、列举、集结、结构化、扩大、分类与 第30卷 第7期 2008年 7月 北 京 科 技 大 学 学 报 Journal of University of Science and Technology Beijing Vol.30No.7 Jul.2008 DOI:10.13374/j.issn1001-053x.2008.07.049
第7期 范玉妹等:基于结构模型的知识发现技术 ,833 抽象以及分组等过程将隐性的思维过程转化为显性 而无反馈上位集NF(s)中的概念不可达s·(2)有 知识构建和知识获取过程,结构建模的分析过程在 一些概念可到达s,即影响s,这些概念构成s的 原理上与医案解读有着相似之处,因此,结构建模 “下位集”D(s),(3)有一些概念既不被s:影响,也 分析可以作为医案知识获取方法用于医案解读分 不影响s,这些概念构成s1的“无关集”V(s),(4) 析,根据提供的部分医案内部知识节点的关系,运 有一些概念与S的关系不清楚,这些概念构成s:的 用结构模型本身的分析逻辑,通过推理求出其他未 “无知集”UNK(s)各部分关系如图1所示. 知知识节点之间关系,不断地重复这个过程可以根 F(s) NF(s,) 据认知规律利用人机交互过程,把人脑中隐含的中 医知识结构模型逐步地引导出来, s,) UNK(s,) 本文将结构建模分析技术用于我国著名肝病中 医专家钱英教授诊治的肝病医案分析,利用结构模 D(s) 型分析技术进行隐性知识的获取的实验研究,以验 证该方法的有效性[) 图1各部分的关系 1结构建模 Fig.1 Relation of all parts 隐含的、具有复杂结构的中医理论体系显化于 D(s:)中的概念都可达si,s可达NF(s)中所 知识结构之中就构成了中医知识结构模型,结构建 有的概念,s与F(s:)中的概念是相互可达的,s:到 模的过程是结构分析的过程,这个过程把主观世界 D(s:)中的概念一定是不可达的,否则这个概念应该 中不可见的分析过程以及思维建构过程变成了计算 属于F(s),NF(s)到s一定是不可达的,否则这个 机世界中可见的形象分析过程和形象构建过程,它 概念也应该属于F(s)·同时,由于可达具有传递 也是一个创新的过程,利用人的知识和已有的实例, 性,D(s)中的概念可达F(s)和NF(s)中的概念 通过交互来启发],在中医知识模型中,模型的节 (D(s)→s→F(s)/NF(s),同理,F(s)中的概念 点是由知识结构中的概念组成,对应于中医药理论 可达NF(s)中的概念(F(s:)→sNF(s),F(s) 中的证、症、因、机以及方药等常用中医诊疗术语, 中的概念自身可达(F(s)→s:→F(s:) 本文采用基于核心要素的结构建模方法[],其基本 取与其他概念关系最多的那个概念为核心概 原理是在已知系统的一个初始关系矩阵的前提下, 念,记为ser·核心概念初始有反馈上位集F(se), 能根据少量已知关系推导出其他的绝大多数未知关 初始无反馈上位集NF(se),初始下位集D(ser) 系,从而建立起系统的结构模型.本文对其算法进 和初始无知集UNK°(sr)的关系如图2所示. 行了简化并予以实现,提出了相应的结构模型建模 NFO UNK D 与知识获取方法,医案来自国家科技攻关课题“基 MNENF 0 MruNs 于信息挖掘技术的名老中医临床诊疗经验及传承方 MEUNK 法研究”综合数据库门,结构建模所涉及的初始关 系可由大量医案和中医专家给出 UNK MUNK.UNK 如果以领域知识中的一种和一类知识作为概 MoLNK 念,以知识之间的关联作为概念之间的关系,则领域 图2四个部分的划分 知识实质上形成了一个知识系统[].系统可以表示 Fig.2 Partition of four parts 为(S,M1)其中S={s1,s2,…,sn}表示具有不同 内涵的知识的集合,称之为知识点或概念,M1= 图中1为可达,0为不可达,其中加重边框的是 (s,S)表示不同概念之间关系的集合·系统S的 三个部分的内部关系,重要的是着色的九个子矩阵, 关系矩阵M=[m],m=l表明概念i可达概念 其中浅灰色的是无知集中的概念和其他部分的关 j,并且可达具有传递性,对任一概念s,其他概念s 系,其余三个是深灰色的, (≠)属于的下列集合之一[0:(1)s可到达 对于浅灰色的部分,无知集中的概念和其他部 一些概念,即$:要影响它们,这些概念构成s:的“上 分的关系依据以下变换规则:如果m=1或 位集”,此时又细分为有反馈上位集F(s)和无反馈 mu=1,那么sa∈NF,mker u=1,mker=0 上位集NF(s),反馈上位集F(s)的概念亦可达s, (即mm=l表明NF中有一概念可达UNK的一个
抽象以及分组等过程将隐性的思维过程转化为显性 知识构建和知识获取过程.结构建模的分析过程在 原理上与医案解读有着相似之处.因此结构建模 分析可以作为医案知识获取方法用于医案解读分 析.根据提供的部分医案内部知识节点的关系运 用结构模型本身的分析逻辑通过推理求出其他未 知知识节点之间关系不断地重复这个过程可以根 据认知规律利用人机交互过程把人脑中隐含的中 医知识结构模型逐步地引导出来. 本文将结构建模分析技术用于我国著名肝病中 医专家钱英教授诊治的肝病医案分析利用结构模 型分析技术进行隐性知识的获取的实验研究以验 证该方法的有效性[4]. 1 结构建模 隐含的、具有复杂结构的中医理论体系显化于 知识结构之中就构成了中医知识结构模型.结构建 模的过程是结构分析的过程这个过程把主观世界 中不可见的分析过程以及思维建构过程变成了计算 机世界中可见的形象分析过程和形象构建过程它 也是一个创新的过程利用人的知识和已有的实例 通过交互来启发[5].在中医知识模型中模型的节 点是由知识结构中的概念组成对应于中医药理论 中的证、症、因、机以及方药等常用中医诊疗术语. 本文采用基于核心要素的结构建模方法[6]其基本 原理是在已知系统的一个初始关系矩阵的前提下 能根据少量已知关系推导出其他的绝大多数未知关 系从而建立起系统的结构模型.本文对其算法进 行了简化并予以实现提出了相应的结构模型建模 与知识获取方法.医案来自国家科技攻关课题“基 于信息挖掘技术的名老中医临床诊疗经验及传承方 法研究”综合数据库[7].结构建模所涉及的初始关 系可由大量医案和中医专家给出. 如果以领域知识中的一种和一类知识作为概 念以知识之间的关联作为概念之间的关系则领域 知识实质上形成了一个知识系统[8].系统可以表示 为( SM1).其中 S={s1s2…sn}表示具有不同 内涵的知识的集合称之为知识点或概念M1= {( sisj)}表示不同概念之间关系的集合.系统 S 的 关系矩阵 M=[ mij ].mij=1表明概念 i 可达概念 j并且可达具有传递性.对任一概念 si其他概念 sj ( i≠ j)属于 si 的下列集合之一[9—10]:(1) si 可到达 一些概念即 si 要影响它们这些概念构成 si 的“上 位集”此时又细分为有反馈上位集 F( si)和无反馈 上位集 NF( si)反馈上位集 F( si)的概念亦可达 si 而无反馈上位集 NF( si)中的概念不可达 si.(2) 有 一些概念可到达 si即影响 si这些概念构成 si 的 “下位集” D( si).(3) 有一些概念既不被 si 影响也 不影响 si这些概念构成 si 的“无关集” V ( si).(4) 有一些概念与 si 的关系不清楚这些概念构成 si 的 “无知集”UNK( si).各部分关系如图1所示. 图1 各部分的关系 Fig.1 Relation of all parts D( si)中的概念都可达 sisi 可达 NF( si)中所 有的概念si 与 F( si)中的概念是相互可达的si 到 D( si)中的概念一定是不可达的否则这个概念应该 属于 F( si)NF( si)到 si 一定是不可达的否则这个 概念也应该属于 F( si).同时由于可达具有传递 性D( si)中的概念可达 F( si)和 NF ( si)中的概念 ( D( si)→si→F( si)/NF( si))同理F( si)中的概念 可达 NF( si)中的概念(F( si)→si→NF( si))F( si) 中的概念自身可达(F( si)→si→F( si)). 取与其他概念关系最多的那个概念为核心概 念记为 sker.核心概念初始有反馈上位集F 0( sker) 初始无反馈上位集 NF 0( sker)初始下位集 D 0( sker) 和初始无知集 UNK 0( sker)的关系如图2所示. 图2 四个部分的划分 Fig.2 Partition of four parts 图中1为可达0为不可达其中加重边框的是 三个部分的内部关系重要的是着色的九个子矩阵 其中浅灰色的是无知集中的概念和其他部分的关 系其余三个是深灰色的. 对于浅灰色的部分无知集中的概念和其他部 分的关系依据以下变换规则:如果 mnu =1 或 mf u=1那 么 su ∈ NFmker u =1muker =0 (即 mnu=1表明 NF 中有一概念可达 UNK 的一个 第7期 范玉妹等: 基于结构模型的知识发现技术 ·833·
.834 北京科技大学学报 第30卷 概念su,于是有sker→NF(sker)→su,核心概念Sker可 入什么”,记初始矩阵 达概念su,所以无知集中的su∈NF,keru=1, 1 概念i可达概念j muker=0). M=[mij],mi 一1否则 同理,如果m4=1或md=1,那么su∈D, 步骤3求核心概念。核心概念取其他概念到 mker u=1,mker=0;如果mun=1或mh=1,而且 达该概念和由该概念出发到达其他概念最多的那个 mm≤0,mj≤0,m≤0,mud≤0,那么su∈V, 概念,即矩阵中概念所在行和列中数值1最多的那 对于深灰色的部分:如果md=1,那么sn∈F, 个概念 sa∈F,mker=l,mker d=1;如果m时=1,那么sn∈ 步骤4把除核心概念之外的全部其他系统概 念分为四个部分NF°、F°、UNK°和D°,如图2所 F,mka=1;如果mfa=1,那么sa∈F,mkerd=1. 示.未定的有12个子矩阵,其他部分由定义和可达 通过上述变换,初始矩阵中的1己全部利用,结 性均已确定为0或1. 果矩阵中的绝大部分值都已确定,仍未知的可分为 步骤5用矩阵中已有的1,按照变换规则尽可 两部分.第1部分包括MF,F,M,v和Mn,D,子 能地确定未知的部分,比如Mp,U中有m=1,则 矩阵中未知概念的消除采用与系统整体关系矩阵同 根据变换规则,概念j应属于MF.如MF,D中有 样的方法进行处理;第2部分包括Mv,Nr和Mn,v, m可=1,则概念i和概念j都应属于F,每个子阵的 它们所在的下面两个矩阵 变化直到其中所有的概念小于等于0时为止 MNF.NF MNF.V Mv,v My,D 步骤6经过上述变换,结果矩阵中判断子阵 My.NF My.v- Mp.v MD.D Mp,P、M,v和Mn.D是否还有一1.若有则采用 具有同样的结构 与系统整体关系矩阵同样的方法处理,即把它们各 A 自看成一个小系统,返回步骤3. LX B 步骤7判断子阵Mv,F和Mo,v中是否还有 由于它是可达矩阵,所以 一1,若有则需要通过求解自蕴含方程来确定其值, A0「A0 A 此过程需要人机交互获得一些初始值 LX BLX B LXA+BX 步骤8至此能获得值的概念均已获得,如若 (1) 还有一1,则用人机交互的方式消除,转至步骤5,反 则得XA十BX=X,这就是自蕴含方程,需要人机 复迭代直至最终得到系统的可达矩阵. 交互求解X, 在建模过程中涉及的人机交互信息,既可采用 3基于结构模型的知识获取 专家的意见来补充概念间的联系,也可利用中医常 根据上述算法就我国中医肝病专家钱英教授诊 识知识库来补充所需概念间的关系,这种建模方法 断肝病医案进行了分析·在所分析的病例中病人主 可以发挥已有知识和计算机的优势,将专家头脑中 要症状为脉沉细、舌质淡、苔白厚、舌下静脉粗、手末 隐含的知识通过交互来逐步获取,把人和计算机单 梢暗和眠差,钱英教授认为肝藏血,主疏泄,达阳气 独都不能完成的工作交给人机结合系统,发挥系统 于四末,慢性肝病患者,常有痰、瘀阻于肝络,出现手 功能的优势 背末梢发暗,舌下静脉曲张、增粗亦往往为肝络不 2结构模型算法 通之表现,人体为统一的整体,有诸内必形诸外,体 内血液循环受阻亦必形之于外,验之临床,从西医 利用初始矩阵中已有的数字1,按照变换规则 角度凡有以上指征者往往伴有明显肝纤维化或早期 尽可能地确定矩阵中的数字一1,辅之以人机交互, 肝硬化,利用中医知识库对医案的分析,得到了医 从而获得系统的可达矩阵, 案中主要的已知关系],并给出了与症状相关的主 步骤1生成系统概念.通过专家医案分析,已 要病因机概念,如图3所示, 知的相关症状、病因机分析和诊断概念生成系统的 图3中凡是有箭头连接的两个症状视为有关 概念S={s1,s2,…,sn}, 系2],设为1,且关系是有方向的.比如虚证有箭头 步骤2建立初始矩阵,初始关系矩阵的建立 指向气血两虚,则二者有关系,值为1,关系是由虚 是基于中医常识知识库,或通过人机交互由中医专 证到气血两虚的,其他没有箭头相连的均设为一1, 家输入中医概念或术语之间的关系,“知道什么,输 表示关系未定,在进行结构建模分析以前,已知的
概念 su于是有 sker→NF( sker)→su核心概念 sker可 达概念 su所以无知集中的 su ∈ NFmker u =1 muker=0). 同理如果 muf =1或 mud =1那么 su ∈ D mker u=1muker=0;如果 mun=1或 mdu=1而且 mnu≤0mf u≤0muf≤0mud≤0那么 su∈ V . 对于深灰色的部分:如果 mnd=1那么 sn∈F sd∈Fmuker=1mker d=1;如果 mnf=1那么 sn∈ Fmuker=1;如果 mf d=1那么 sd∈Fmker d=1. 通过上述变换初始矩阵中的1已全部利用结 果矩阵中的绝大部分值都已确定仍未知的可分为 两部分.第1部分包括 MNFNFMV V 和 MDD子 矩阵中未知概念的消除采用与系统整体关系矩阵同 样的方法进行处理;第2部分包括 MV NF和 MDV 它们所在的下面两个矩阵 MNFNF MNFV MV NF MV V MV V MV D MDV MDD 具有同样的结构 A 0 X B . 由于它是可达矩阵所以 A 0 X B A 0 X B = A 2 0 XA+BX B = A 0 X B (1) 则得 XA+ BX= X这就是自蕴含方程需要人机 交互求解 X. 在建模过程中涉及的人机交互信息既可采用 专家的意见来补充概念间的联系也可利用中医常 识知识库来补充所需概念间的关系.这种建模方法 可以发挥已有知识和计算机的优势将专家头脑中 隐含的知识通过交互来逐步获取把人和计算机单 独都不能完成的工作交给人机结合系统发挥系统 功能的优势. 2 结构模型算法 利用初始矩阵中已有的数字1按照变换规则 尽可能地确定矩阵中的数字—1辅之以人机交互 从而获得系统的可达矩阵. 步骤1 生成系统概念.通过专家医案分析已 知的相关症状、病因机分析和诊断概念生成系统的 概念 S={s1s2…sn}. 步骤2 建立初始矩阵.初始关系矩阵的建立 是基于中医常识知识库或通过人机交互由中医专 家输入中医概念或术语之间的关系“知道什么输 入什么”.记初始矩阵 M=[ mij ]mij= 1 概念 i 可达概念 j —1 否则 步骤3 求核心概念.核心概念取其他概念到 达该概念和由该概念出发到达其他概念最多的那个 概念即矩阵中概念所在行和列中数值1最多的那 个概念. 步骤4 把除核心概念之外的全部其他系统概 念分为四个部分 NF 0、F 0、UNK 0 和 D 0如图2所 示.未定的有12个子矩阵其他部分由定义和可达 性均已确定为0或1. 步骤5 用矩阵中已有的1按照变换规则尽可 能地确定未知的部分.比如 MNFU中有 mij=1则 根据变换规则概念 j 应属于 MF.如 MNFD中有 mij=1则概念 i 和概念 j 都应属于 F.每个子阵的 变化直到其中所有的概念小于等于0时为止. 步骤6 经过上述变换结果矩阵中判断子阵 MNFNF、MV V 和 MDD是否还有—1.若有则采用 与系统整体关系矩阵同样的方法处理即把它们各 自看成一个小系统返回步骤3. 步骤7 判断子阵 MV NF和 MDV 中是否还有 —1.若有则需要通过求解自蕴含方程来确定其值 此过程需要人机交互获得一些初始值. 步骤8 至此能获得值的概念均已获得.如若 还有—1则用人机交互的方式消除转至步骤5反 复迭代直至最终得到系统的可达矩阵. 3 基于结构模型的知识获取 根据上述算法就我国中医肝病专家钱英教授诊 断肝病医案进行了分析.在所分析的病例中病人主 要症状为脉沉细、舌质淡、苔白厚、舌下静脉粗、手末 梢暗和眠差.钱英教授认为肝藏血主疏泄达阳气 于四末慢性肝病患者常有痰、瘀阻于肝络出现手 背末梢发暗.舌下静脉曲张、增粗亦往往为肝络不 通之表现.人体为统一的整体有诸内必形诸外体 内血液循环受阻亦必形之于外.验之临床从西医 角度凡有以上指征者往往伴有明显肝纤维化或早期 肝硬化.利用中医知识库对医案的分析得到了医 案中主要的已知关系[11]并给出了与症状相关的主 要病因机概念如图3所示. 图3中凡是有箭头连接的两个症状视为有关 系[12]设为1且关系是有方向的.比如虚证有箭头 指向气血两虚则二者有关系值为1关系是由虚 证到气血两虚的.其他没有箭头相连的均设为—1 表示关系未定.在进行结构建模分析以前已知的 ·834· 北 京 科 技 大 学 学 报 第30卷
第7期 范玉妹等:基于结构模型的知识发现技术 ,835 Q苔白 损,脾虚→气血两虚,乏力也多了两个出度:乏力→ 痛甚 血虚,乏力→气血两虚,此外还增加了关系:脉细→ 湿郁阻络 邪盛人里 实证 湿邪为病 血虚,气阴两虚→诸虚劳损, 伤寒 脉细 可见,结果图提高了血虚、诸虚劳损、脾虚、气血 痰湿 两虚和乏力的入度,依据结构建模分析结果可以看 里证 气血两虚 诸虚 O脉沉 食积 劳损 出,本医案以气阴两虚、脉细、虚证、血虚四个概念出 (眠差血虚 虚证 入度最大,与医案所定气阴两虚为病机的主要方面 的结论一致,由此可见,基于结构建模的知识获取 热证O ● 气阴两虚 阴虚火旺 不仅能得到已有系统中未知的、不确切的知识,并可 乏力 口脉数 以很直观地看出新增加的关系,所得到的新的概念 关系经专家论证符合中医理论,与此同时,结构建 图3初始关系图 模分析所得到的新的概念联系为理解医案和分析名 Fig.3 Initial relations 老中医诊断思路提供了指导, 相关症状、病因机分析和诊断概念包括乏力、里证、 4结语 脉沉、脉数、脉细、眠差、脾虚、气血两虚、气阴两虚、 热证、伤寒、食积、湿邪为病、湿郁阻络、实证、苔白、 中医知识许多来自经验,不同知识之间又形成 痰湿、痛甚、邪盛入里、血虚、虚证、阴虚火旺和诸虚 了纵横交错的关联关系,利用结构模型能根据少量 劳损,设其索引为0~22.医案按语给出病机分析与 的已知关系推导出其他的绝大多数未知关系,并可 治疗是痰湿致肝络不通、湿郁阻络、气阴两虚,其中 以很直观地看出新增加的关系,本文的理论与方法 以气阴两虚为病机的主要方面,凡有以上依据者,疏 不仅限于中医领域,在其他领域也有好的应用前景, 通肝络为重要治法,用益气养阴、化湿通络之法 以领域中的一种或一类知识作为一个概念,以知识 治疗· 之间的关联作为概念之间的关系,则可将其作为一 经过程序运算[13],可确定核心概念为虚证, 个知识系统进行分析推理, F(er)为空;NF(e):7,19,22;D°(sa):0,4,6, 参考文献 8:UNK°(a):1,2,3,5,9,10,11,12,13,14,15, 16,17,18,21.经过变换之后的结果关系图,如图4. [1]Helene A F,Xavier G F.Working memory and acquisition of im- plicit knowledge by imagery training,without actual task perfor- 9苔白 mance.Neurascience.2006.139(1):401 邪盛入里 实证 湿郁阻络 [2]James D,Il-Yeol S,loanna L.An analysis of structural validity in 湿邪为病 痛甚 伤寒 entity relationship modeling-Data Knowl Eng.2003.47(2): 167 食积 痰湿 脉沉 里证 脉细 诸虚劳损 眠差血成 [3]Zhang H J.Wu Y J.Song LL.System method for structural 气血两虚泳 modeling.J Heilongjiang Inst Technol,2006.20(2):68 <虚证 热证 (张海君,武玉婧,宋雨丽·系统结构模型的生成黑龙江工程学 脾 阴虚火旺 院学报,2006,20(2):68) 气阴两虚 [4]Yee L.Wu W Z.Zhang W X.Knowledge acquisition in incom 乏力 O脉数 plete information systems:a rough set approach European./Op er Res,2006,168(1):164 图4结果关系图 [5]Katharina M.Michacl I.Peter B.et al.Knowledge discovery Fig.4 Result relations and knowledge validation in intensive care.Artif Intell Med. 2000,19(3):225 比较图3和图4可以看出:血虚多了四个入度, [6]Su C T,Chen L S.Yuehwern Y.Knowledge acquisition through 即增加了关系:气阴两虚→血虚,乏力→血虚,脾虚 information granulation for imbalanced data.Expert Syst Appl. →血虚,脉细→血虚.诸虚劳损多了三个入度,增加 2006,31(3):531 的关系为:气阴两虚→诸虚劳损,乏力诸虚劳损, [7]Dang YZ.Wang Z T.A kernel element transposition method for 脾虚→诸虚劳损,气血两虚也增加了两个入度,增 structural modeling in systems analysis.J Syst Eng.1997,12 (4):1 加的关系为:脾虚→气血两虚,乏力→气血两虚,脾 (党延忠,王众托·系统分析中结构建模的核心变换法·系统工 虚增加了三个出度,即脾虚→血虚,脾虚→诸虚劳 程学报,1997,12(4):1)
图3 初始关系图 Fig.3 Initial relations 相关症状、病因机分析和诊断概念包括乏力、里证、 脉沉、脉数、脉细、眠差、脾虚、气血两虚、气阴两虚、 热证、伤寒、食积、湿邪为病、湿郁阻络、实证、苔白、 痰湿、痛甚、邪盛入里、血虚、虚证、阴虚火旺和诸虚 劳损设其索引为0~22.医案按语给出病机分析与 治疗是痰湿致肝络不通、湿郁阻络、气阴两虚其中 以气阴两虚为病机的主要方面凡有以上依据者疏 通肝络为重要治法用益气养阴、化湿通络之法 治疗. 经过程序运算[13]可确定核心概念为虚证. F 0( sker)为空;NF 0( sker):71922;D 0( sker):046 8;UNK 0( sker):12359101112131415 16171821.经过变换之后的结果关系图如图4. 图4 结果关系图 Fig.4 Result relations 比较图3和图4可以看出:血虚多了四个入度 即增加了关系:气阴两虚→血虚乏力→血虚脾虚 →血虚脉细→血虚.诸虚劳损多了三个入度增加 的关系为:气阴两虚→诸虚劳损乏力→诸虚劳损 脾虚→诸虚劳损.气血两虚也增加了两个入度增 加的关系为:脾虚→气血两虚乏力→气血两虚.脾 虚增加了三个出度即脾虚→血虚脾虚→诸虚劳 损脾虚→气血两虚.乏力也多了两个出度:乏力→ 血虚乏力→气血两虚.此外还增加了关系:脉细→ 血虚气阴两虚→诸虚劳损. 可见结果图提高了血虚、诸虚劳损、脾虚、气血 两虚和乏力的入度.依据结构建模分析结果可以看 出本医案以气阴两虚、脉细、虚证、血虚四个概念出 入度最大与医案所定气阴两虚为病机的主要方面 的结论一致.由此可见基于结构建模的知识获取 不仅能得到已有系统中未知的、不确切的知识并可 以很直观地看出新增加的关系所得到的新的概念 关系经专家论证符合中医理论.与此同时结构建 模分析所得到的新的概念联系为理解医案和分析名 老中医诊断思路提供了指导. 4 结语 中医知识许多来自经验不同知识之间又形成 了纵横交错的关联关系利用结构模型能根据少量 的已知关系推导出其他的绝大多数未知关系并可 以很直观地看出新增加的关系.本文的理论与方法 不仅限于中医领域在其他领域也有好的应用前景. 以领域中的一种或一类知识作为一个概念以知识 之间的关联作为概念之间的关系则可将其作为一 个知识系统进行分析推理. 参 考 文 献 [1] Helene A FXavier G F.Working memory and acquisition of implicit knowledge by imagery trainingwithout actual task performance.Neuroscience2006139(1):401 [2] James DI-l Yeol SIoanna L.An analysis of structural validity in entity-relationship modeling.Data Knowl Eng200347(2): 167 [3] Zhang H JWu Y JSong L L.System method for structural modeling.J Heilongjiang Inst Technol200620(2):68 (张海君武玉婧宋丽丽.系统结构模型的生成.黑龙江工程学 院学报200620(2):68) [4] Yee LWu W ZZhang W X.Knowledge acquisition in incomplete information systems:a rough set approach European.J Oper Res2006168(1):164 [5] Katharina MMichael IPeter Bet al.Knowledge discovery and knowledge validation in intensive care. A rtif Intell Med 200019(3):225 [6] Su C TChen L SYuehwern Y.Knowledge acquisition through information granulation for imbalanced data.Expert Syst Appl 200631(3):531 [7] Dang Y ZWang Z T.A kernel element transposition method for structural modeling in systems analysis.J Syst Eng199712 (4):1 (党延忠王众托.系统分析中结构建模的核心变换法.系统工 程学报199712(4):1) 第7期 范玉妹等: 基于结构模型的知识发现技术 ·835·
,836 北京科技大学学报 第30卷 [8]Yang B R,Zhou Y.Inner mechanisms'research of knowledge tural modeling.Syst Eng Electron.2005,27(3):453 discovery system.J Univ Sci Technol Beijing.2002,24(2): (张宾,龚俊华,贺昌政,基于客观系统分析的解释结构模型 345 系统工程与电子技术,200527(3):453) (杨柄儒,周颖.知识发现系统内在机理·北京科技大学学报, [12]Emmanuel J.Christian D.A modified PLS path modeling algo- 2002,24(2):345) rithm handling reflective categorical variables and a new model [9]Azuma 0.Ikuo K.Correction procedures for flexible interpretive building strategy.Comput Stat Data Anal.2007.51 (8): structural modeling.IEEE Trans Syst Man Cybern.1989.19 3666 (1):85 [13]Wang Y H.Zhang S K.Liu Y,et al.Ripple effect analysis of [10]Wang Y L.System Engineering.Beijing:China Machine software architecture evolution based on reachability matrix.J Press,2003:76 Software,2004,15(8):1107 (汪应洛系统工程.北京:机械工业出版社,2003.76) (王映辉,张世琨,刘瑜,等基于可达矩阵的软件体系结构演 [11]Zhang B.Gong J H.He C Z.OSA-based interpretative strue- 化波及效应分析.软件学报.2004,15(8):1107) (上接第825页) framework:from intuition to institution.Acad Manage Rev, [12]Ma Q G.Li A.E commerce and firm informationalization:em- 1999,24(3):522 pirical study on the effects of organizational learning.JInd Eng [18]Edmondson A.The view through a different lens:investigating Eng Manage,2004,18(2):11 organizational learning at the group level of analysis Proceed- (马庆国,李艾,电子商务与企业信息化组织学习效应实证研 ings of 3rd International Coherence on Organizational Learn 究.管理工程学报,2004,18(2):11) ing.Lancaster,1999.299 [13]Day George S.The capabilities of market-driven organizations. [19]Santons.On the Management of Knowledge:from the Trans- JMarketing.1994.(10):37 parency of Co-location and Cosetting to the Quandary of Disper- [14]Bell M.Pavitt K.The development of technological capabilities sion and Differentiation.Working Paper.1997 /Trade,Technology,and International Competitiveness. [20]Tsai C T.Organizational Factors,Creativity of Organiza- Working Paper.1995 tional Members and Organizational Innovation.[Disserta- [15]Dess GG.Measuring organizational performance in the absence tion]Taipei:Taiwan University,1997 of objective measures:the case of the privately held firm and (蔡启通。组织因素,组织成员整体创造性与组织创新之关系 conglomerate business unit.Strategic Manage J.1984.5:265 [学位论文]台北:台湾大学,1997) [16]Huber G P.Organizational learning:the contributing processes [21]Goh S,Richards G.Benchmarking the learning capability of or and the literatures.Organ Sci.1991.9:88 ganizations.Eur Manage J.1997,15(5):575 [17]Crossan M.Lane H.White R.An organizational learning
[8] Yang B RZhou Y.Inner mechanisms’research of knowledge discovery system.J Univ Sci Technol Beijing200224(2): 345 (杨炳儒周颖.知识发现系统内在机理.北京科技大学学报 200224(2):345) [9] Azuma OIkuo K.Correction procedures for flexible interpretive structural modeling.IEEE T rans Syst Man Cybern198919 (1):85 [10] Wang Y L. System Engineering.Beijing:China Machine Press2003:76 (汪应洛.系统工程.北京:机械工业出版社2003:76) [11] Zhang BGong J HHe C Z.OSA-based interpretative structural modeling.Syst Eng Electron200527(3):453 (张宾龚俊华贺昌政.基于客观系统分析的解释结构模型. 系统工程与电子技术200527(3):453) [12] Emmanuel JChristian D.A modified PLS path modeling algorithm handling reflective categorical variables and a new model building strategy. Comput Stat Data A nal200751(8): 3666 [13] Wang Y HZhang S KLiu Yet al.Ripple-effect analysis of software architecture evolution based on reachability matrix.J Software200415(8):1107 (王映辉张世琨刘瑜等.基于可达矩阵的软件体系结构演 化波及效应分析.软件学报200415(8):1107) (上接第825页) [12] Ma Q GLi A.E commerce and firm informationalization:empirical study on the effects of organizational learning.J Ind Eng Eng Manage200418(2):11 (马庆国李艾.电子商务与企业信息化组织学习效应实证研 究.管理工程学报200418(2):11) [13] DayGeorge S.The capabilities of market-driven organizations. J Marketing1994(10):37 [14] Bell MPavitt K.The development of technological capabilities ∥ T rade Technology and International Competitiveness. Working Paper1995 [15] Dess G G.Measuring organizational performance in the absence of objective measures:the case of the privately held firm and conglomerate business unit.Strategic Manage J19845:265 [16] Huber G P.Organizational learning:the contributing processes and the literatures.Organ Sci19919:88 [17] Crossan MLane H White R. An organizational learning framework:from intuition to institution.Acad Manage Rev 199924(3):522 [18] Edmondson A.The view through a different lens:investigating organizational learning at the group level of analysis∥ Proceedings of 3rd International Coherence on Organiz ational Learning.Lancaster1999299 [19] Santons.On the Management of Knowledge:f rom the T ransparency of Co-location and Cosetting to the Quandary of Dispersion and Dif ferentiation.Working Paper1997 [20] Tsai C T. Organiz ational FactorsCreativity of Organiz ational Members and Organiz ational Innov ation. [ Dissertation].Taipei:Taiwan University1997 (蔡启通.组织因素、组织成员整体创造性与组织创新之关系 [学位论文].台北:台湾大学1997) [21] Goh SRichards G.Benchmarking the learning capability of organizations.Eur Manage J199715(5):575 ·836· 北 京 科 技 大 学 学 报 第30卷