第7期 范玉妹等:基于结构模型的知识发现技术 ,833 抽象以及分组等过程将隐性的思维过程转化为显性 而无反馈上位集NF(s)中的概念不可达s·(2)有 知识构建和知识获取过程,结构建模的分析过程在 一些概念可到达s,即影响s,这些概念构成s的 原理上与医案解读有着相似之处,因此,结构建模 “下位集”D(s),(3)有一些概念既不被s:影响,也 分析可以作为医案知识获取方法用于医案解读分 不影响s,这些概念构成s1的“无关集”V(s),(4) 析,根据提供的部分医案内部知识节点的关系,运 有一些概念与S的关系不清楚,这些概念构成s:的 用结构模型本身的分析逻辑,通过推理求出其他未 “无知集”UNK(s)各部分关系如图1所示. 知知识节点之间关系,不断地重复这个过程可以根 F(s) NF(s,) 据认知规律利用人机交互过程,把人脑中隐含的中 医知识结构模型逐步地引导出来, s,) UNK(s,) 本文将结构建模分析技术用于我国著名肝病中 医专家钱英教授诊治的肝病医案分析,利用结构模 D(s) 型分析技术进行隐性知识的获取的实验研究,以验 证该方法的有效性[) 图1各部分的关系 1结构建模 Fig.1 Relation of all parts 隐含的、具有复杂结构的中医理论体系显化于 D(s:)中的概念都可达si,s可达NF(s)中所 知识结构之中就构成了中医知识结构模型,结构建 有的概念,s与F(s:)中的概念是相互可达的,s:到 模的过程是结构分析的过程,这个过程把主观世界 D(s:)中的概念一定是不可达的,否则这个概念应该 中不可见的分析过程以及思维建构过程变成了计算 属于F(s),NF(s)到s一定是不可达的,否则这个 机世界中可见的形象分析过程和形象构建过程,它 概念也应该属于F(s)·同时,由于可达具有传递 也是一个创新的过程,利用人的知识和已有的实例, 性,D(s)中的概念可达F(s)和NF(s)中的概念 通过交互来启发],在中医知识模型中,模型的节 (D(s)→s→F(s)/NF(s),同理,F(s)中的概念 点是由知识结构中的概念组成,对应于中医药理论 可达NF(s)中的概念(F(s:)→sNF(s),F(s) 中的证、症、因、机以及方药等常用中医诊疗术语, 中的概念自身可达(F(s)→s:→F(s:) 本文采用基于核心要素的结构建模方法[],其基本 取与其他概念关系最多的那个概念为核心概 原理是在已知系统的一个初始关系矩阵的前提下, 念,记为ser·核心概念初始有反馈上位集F(se), 能根据少量已知关系推导出其他的绝大多数未知关 初始无反馈上位集NF(se),初始下位集D(ser) 系,从而建立起系统的结构模型.本文对其算法进 和初始无知集UNK°(sr)的关系如图2所示. 行了简化并予以实现,提出了相应的结构模型建模 NFO UNK D 与知识获取方法,医案来自国家科技攻关课题“基 MNENF 0 MruNs 于信息挖掘技术的名老中医临床诊疗经验及传承方 MEUNK 法研究”综合数据库门,结构建模所涉及的初始关 系可由大量医案和中医专家给出 UNK MUNK.UNK 如果以领域知识中的一种和一类知识作为概 MoLNK 念,以知识之间的关联作为概念之间的关系,则领域 图2四个部分的划分 知识实质上形成了一个知识系统[].系统可以表示 Fig.2 Partition of four parts 为(S,M1)其中S={s1,s2,…,sn}表示具有不同 内涵的知识的集合,称之为知识点或概念,M1= 图中1为可达,0为不可达,其中加重边框的是 (s,S)表示不同概念之间关系的集合·系统S的 三个部分的内部关系,重要的是着色的九个子矩阵, 关系矩阵M=[m],m=l表明概念i可达概念 其中浅灰色的是无知集中的概念和其他部分的关 j,并且可达具有传递性,对任一概念s,其他概念s 系,其余三个是深灰色的, (≠)属于的下列集合之一[0:(1)s可到达 对于浅灰色的部分,无知集中的概念和其他部 一些概念,即$:要影响它们,这些概念构成s:的“上 分的关系依据以下变换规则:如果m=1或 位集”,此时又细分为有反馈上位集F(s)和无反馈 mu=1,那么sa∈NF,mker u=1,mker=0 上位集NF(s),反馈上位集F(s)的概念亦可达s, (即mm=l表明NF中有一概念可达UNK的一个抽象以及分组等过程将隐性的思维过程转化为显性 知识构建和知识获取过程.结构建模的分析过程在 原理上与医案解读有着相似之处.因此结构建模 分析可以作为医案知识获取方法用于医案解读分 析.根据提供的部分医案内部知识节点的关系运 用结构模型本身的分析逻辑通过推理求出其他未 知知识节点之间关系不断地重复这个过程可以根 据认知规律利用人机交互过程把人脑中隐含的中 医知识结构模型逐步地引导出来. 本文将结构建模分析技术用于我国著名肝病中 医专家钱英教授诊治的肝病医案分析利用结构模 型分析技术进行隐性知识的获取的实验研究以验 证该方法的有效性[4]. 1 结构建模 隐含的、具有复杂结构的中医理论体系显化于 知识结构之中就构成了中医知识结构模型.结构建 模的过程是结构分析的过程这个过程把主观世界 中不可见的分析过程以及思维建构过程变成了计算 机世界中可见的形象分析过程和形象构建过程它 也是一个创新的过程利用人的知识和已有的实例 通过交互来启发[5].在中医知识模型中模型的节 点是由知识结构中的概念组成对应于中医药理论 中的证、症、因、机以及方药等常用中医诊疗术语. 本文采用基于核心要素的结构建模方法[6]其基本 原理是在已知系统的一个初始关系矩阵的前提下 能根据少量已知关系推导出其他的绝大多数未知关 系从而建立起系统的结构模型.本文对其算法进 行了简化并予以实现提出了相应的结构模型建模 与知识获取方法.医案来自国家科技攻关课题“基 于信息挖掘技术的名老中医临床诊疗经验及传承方 法研究”综合数据库[7].结构建模所涉及的初始关 系可由大量医案和中医专家给出. 如果以领域知识中的一种和一类知识作为概 念以知识之间的关联作为概念之间的关系则领域 知识实质上形成了一个知识系统[8].系统可以表示 为( SM1).其中 S={s1s2…sn}表示具有不同 内涵的知识的集合称之为知识点或概念M1= {( sisj)}表示不同概念之间关系的集合.系统 S 的 关系矩阵 M=[ mij ].mij=1表明概念 i 可达概念 j并且可达具有传递性.对任一概念 si其他概念 sj ( i≠ j)属于 si 的下列集合之一[9—10]:(1) si 可到达 一些概念即 si 要影响它们这些概念构成 si 的“上 位集”此时又细分为有反馈上位集 F( si)和无反馈 上位集 NF( si)反馈上位集 F( si)的概念亦可达 si 而无反馈上位集 NF( si)中的概念不可达 si.(2) 有 一些概念可到达 si即影响 si这些概念构成 si 的 “下位集” D( si).(3) 有一些概念既不被 si 影响也 不影响 si这些概念构成 si 的“无关集” V ( si).(4) 有一些概念与 si 的关系不清楚这些概念构成 si 的 “无知集”UNK( si).各部分关系如图1所示. 图1 各部分的关系 Fig.1 Relation of all parts D( si)中的概念都可达 sisi 可达 NF( si)中所 有的概念si 与 F( si)中的概念是相互可达的si 到 D( si)中的概念一定是不可达的否则这个概念应该 属于 F( si)NF( si)到 si 一定是不可达的否则这个 概念也应该属于 F( si).同时由于可达具有传递 性D( si)中的概念可达 F( si)和 NF ( si)中的概念 ( D( si)→si→F( si)/NF( si))同理F( si)中的概念 可达 NF( si)中的概念(F( si)→si→NF( si))F( si) 中的概念自身可达(F( si)→si→F( si)). 取与其他概念关系最多的那个概念为核心概 念记为 sker.核心概念初始有反馈上位集F 0( sker) 初始无反馈上位集 NF 0( sker)初始下位集 D 0( sker) 和初始无知集 UNK 0( sker)的关系如图2所示. 图2 四个部分的划分 Fig.2 Partition of four parts 图中1为可达0为不可达其中加重边框的是 三个部分的内部关系重要的是着色的九个子矩阵 其中浅灰色的是无知集中的概念和其他部分的关 系其余三个是深灰色的. 对于浅灰色的部分无知集中的概念和其他部 分的关系依据以下变换规则:如果 mnu =1 或 mf u=1那 么 su ∈ NFmker u =1muker =0 (即 mnu=1表明 NF 中有一概念可达 UNK 的一个 第7期 范玉妹等: 基于结构模型的知识发现技术 ·833·