第4卷第4期 智能系统学报 Vol.4 No.4 2009年8月 CAAI Transactions on Intelligent Systems Ag.2009 doi:10.3969/i.i8sn.1673-4785.2009.04.008 适应变化环境的元知识的研究 陈文伟2,黄金才,毕季明 (1.国防科技大学信息系统与管理学院,湖南长沙410073:2.海军兵种指挥学院作战指挥系,广东广州510431) 摘要:元知识是描述、使用一般知识的知识,具有变化的特点.提出了用变换产生式,即可拓知识作为元知识的一 种新的表示形式.它比一般用规则式表示的元知识更适应变化环境.在解决矛盾问题中用新元知识描述解决矛盾的 本质是目标变换(T)或条件变换(T),引起了关联函数值(Tx)的变换;知识发现中用新元知识说明属性约简变 换T。是依赖于算子Ascr(C:)的计算结果,基于粗糙集的知识获取是依赖于算子Ap(E:,Y)的计算结果;专家系 统中用新元知识作为控制知识推理的运行更体现了变化的特点,这些应用例子表明了用变换产生式作为元知识的 一种新的表示形式更适应变化环境. 关键词:元知识;变换产生式;可拓知识;矛盾问题;知识发现;专家系统 中图分类号:TP181文献标识码:A文章编号:16734785(2009)04033104 A study on meta-knowledge suitable for a changing environment CHEN Wen-wei2,HUANG Jin-cai',BI Ji-ming? (1.College of Information System and Management,National University of Defense Technology,Changsha 410073,China;2.Depart- ment of Campaign and Command,Naval Arms Command Academy,Guangzhou 510431,China) Abstract:Meta-knowledge is a form of knowledge for describing and applying general knowledge.It is in a contin- ually changing state.The authors proposed a new method to represent meta-knowledge using transform-production, or extension knowledge.Compared with traditional meta-knowledge representational methods using rule implication, extension knowledge is more suitable for changing environments.In solving contradictory problems with new meta- knowledge,in essence,goal-transform (Tc)or condition-transform (T)triggers the transform of a related function's value (TK).The application of new meta-knowledge to knowledge discovery in a database shows that the transform of attribute reduction (T)depends on the computational result of operator Ase(C).Knowledge acquisition based on a rough set is dependent on the computational value of operator Aupdow(E:,Y).Extension knowledge is also suitable for representing meta-knowledge in order to control the operation of expert systems.It is obvious that the new method,which employs transform-production to represent meta-knowledge,plays an instruc- tive role in summarizing and solving such problems. Keywords:meta-knowledge;transform production;extension knowledge;contradictory question;knowledge dis- covery in database;expert system 元知识是知识的知识,是对一般知识的描述、概 的环境「14, 括、处理、使用的知识.提出一种新的元知识表示形 1适应变化环境的元知识概念 式,即可拓知识可拓知识是以可拓变换为基础,是 可拓变换的产生式,它具有变化的特点,能适应变化 在可拓学中,可拓变换定义为对对象(物元、事 元、关系元)的变换,表示成 收稿日期:2008-1105. Tu =v. 基金项目:国家自然科学基金资助项目(70671031). 即可拓变换T,将对象u变为对象. 通信作者:陈文伟.E-mai:chenww9@21cm.com
332 智能系统学报 第4卷 可拓变换可能由某个条件(原因)产生或者会 一次可拓知识,关联函数的值是逐步增加的,经过若 引起某个结果,与可拓变换有关的具有因果关系的 干次计算后,会使K0,最终使 规则式,统称为可拓知识. 矛盾问题得到解决 1)可拓变换T由某一条件或原因所引起. 2.2解决“图形媒体与文本媒体”矛盾问题的元知识 Condition→(T.u=v). 图形与文本是2种不同媒体.矢量图形是在平 条件Condition可能是某一事实F=f,或是一个算子 面上展示各种图元素之间的分布关系,便于人的宏 A,求出变量X的值A(x)=b,或是另一个可拓变换 观思维和表达.但是,它不能反应出图元素之间的前 Tna=b,具体表示为 后顺序,不便于有序的说明和表达.在作战中,一般 (T.a=b)→(T.u=v). 利用图形来制定作战方案,它能体现宏观的平面布 式中:可拓变换T.称为可拓变换T。的传导变换。 局.但是,在下达命令的时候,需要有序的表达,用图 2)可拓变换T.产生一个结果 形来下达命令就不合适了,为解决这个矛盾问题,就 (T.a=b)→result 必须将图形转换成为文本,文本是有前后顺序的,它 结果result同样可能是一个事实,或者是另一个可 适合以作战命令形式下达, 拓变换 图形基元与文本基元分别表示为 可见,可拓知识是包含可拓变换的规则知识,在 MA=(图形A,图元0:,信息山:), 人工智能中,一般知识是事实(变量的取值)的规则 Mg=(文本B,句子,信息) 形式,即:P→Q,知识只体现了P与Q的静态关 这种图形A与文本B媒体的转换表示成宏观的可 系.而可拓知识中的可拓变换将一对象变换成另一 拓变换形式为 个对象,体现了变化的持点[58] T (M)=Mg. 图形A包括多个图元0:,如圆点、直线、颜色等组 2解决矛盾问题的元知识 成.从一个图元0:找到另外一个图元0,需要通过 2.1解决矛盾问题的可拓模型和可拓知识 图元之间的关系的知识推理来完成,知识表示为 矛盾问题是问题P的条件L不能实现问题的目 IF(0:)THEN(w;):ACT(g:). 标G.量化矛盾问题P的不相容性用关联函数 含义是若前提条件中的图元:已知,则通过执 K(P)0,即 Te(0:)=0+1 关联函数发生质的变化,使矛盾问题得到解决, 文本是由句子组成,句子是由词组成.在作战文 解决矛盾问题的可拓模型包括3部分: 本中的句子s:一般由固定词sC:和变化的词sd:(关 1)量化矛盾问题P.对不同的问题需要利用不 键文字)组合而成.固定的词在文本中形成了固定 同的原理,建立判别矛盾问题是否解决的关联函数 的格式和顺序.变化的词(关键文字)是随不同的作 K(P),在解决矛盾问题的过程中,关联函数值是逐 战方案而变化的.具体表示为 步变化的,设第i步关联函数值为K。 B=U=U (se:+sd). 2)找出化解矛盾问题的目标变换Tc或条件变 由图形转换成文本的关键在于将图元信息, 换T,它将引起关联函数值的变换Tx(P的可拓知 变换成文本中变化词sd的信息,表示为 识.这同样需要利用原理来建立,它们也是逐步进行 Tt(山:)=: 的.这样,解决矛盾问题的可拓知识为 图形与文本媒体转换矛盾问题的可拓模型为 (TG(G:)=Gi)V(TL(Li)=Li) 1)关联函数 (TxP(K)=K+1). 一幅图形中的图元总数设为N.图形转换成文 该可拓知识得到的关联函数值的变换TxP需 本是逐个取出图元中的信息放人文本中形成词信 要通过计算使K:+1>K:,这样才能保证矛盾问题的 息.这样转换的关联函数设计为 解决. K =i-N. 该可拓知识是解决矛盾问题的核心,它说明了 式中:变量i为已完成图文转换的图元数目.每完成 解决矛盾问题的途径和可能性. 一个图元的寻找和信息获取,需要进行累加,即i=i+ 3)设计算法,反复运行该可拓知识,且每运行 1.当K<0时,将继续进行图文转换,直到K=0时为
第4期 陈文伟,等:适应变化环境的元知识的研究 ·333· 止 该可拓知识概括了属性约简的原理和本质,是 2)确定解决矛盾问题的可拓变换和可拓知识, 属性约简的元知识 解决矛盾问题的可拓知识表示为 3.2数据挖掘的元知识 (Te(0:)=0+l)Λ(T(u+1)=v41)→ 数据挖掘是从大量数据中获取知识,这些知识 (T(K)=K+1). 实质上是这些数据的高度浓缩,但仍保留了数据的 该可拓知识表示:经过图元心:到图元0+1的可 本质.这里讨论基于粗糙集理论的数据挖掘方法的 拓变换与图元信息山:+1到文本词信息":+1的可拓变 元知识.该方法是通过条件属性集E:与决策属性集 换,共同完成了一个新图元0+1的信息转换,它使关 Y之间的上下近似关系来获取知识.为此要建立一 联函数值提高到K+1 个求解集合E,和Y之间上下近似关系的算子Apm 3)算法 1)Apm(E:,Y)算子的计算过程如下: 当K:<0时,反复计算可拓知识,通过2个可拓 ①求条件属性集C中的等价类E:; 变换引起关联函数可拓变换,检查关联函数的值是 ②求结论属性集D中的等价类Y 否提高到K=0.当K=0时,结束图文转换,输出文 2)求E,和Y,之间的交集,分别有3种情况: 本信息,即Out(B). ①E:nY=E; ②E∩Y≠E≠0: 3知识发现的元知识 ③E:nY=0. 知识发现(KDD)是从数据中发现有用知识的 该算子对前2种情况能生成2类规则知识,它 整个过程.KDD过程包括为3部分:数据准备(包括 实际上是从数据库D中获取规则知识的数据挖掘 属性约简)、数据挖掘及结果的解释和评估.下面讨 变换,表示为 论基于粗糙集的属性约简和数据挖掘的元知识, TDM (D)=(E;Y). 3.1属性约简的元知识 3)基于粗糙集的数据挖掘方法的可拓知识, 属性约简问题是在数据库中保持分类效果不变 数据挖掘的可拓变换Tpw是算子Ap(E:,Y) 的情况下,删除多余的属性.它的基础理论主要是粗 的计算结果引起的,从中可得到2条可拓知识: 糙集理论和信息论.按粗糙集理论,需要对数据库中 (Apdw(E:,y)=E:) 的每个条件属性计算其重要度SG,为此引入计算 →(T(Da)=(E→Y), 重要度算子AsG·对条件属性集C中的任一属性C: (Apm(E:,y)≠E)A(Apm(E:,Y)≠0) 相对决策属性D,计算其重要度Asr(C:), →Tom(Da)=(E→y),C) AsGr(C:)算子计算过程如下: 式中:可信度C为C=IE:nY:I/八E:l. 1)计算条件属性集(C-{C:})的等价集; 这2条可拓知识是粗糙集获取知识的原理和本 2)计算决策属性的D等价集; 质的说明,是粗糙集数据挖掘的元知识, 3)计算正域Pos(C-{C:},D); 4)计算依赖度y(C-{C:},D); 4专家系统的元知识 5)计算C:的重要度SGF(C-C:},D) 专家系统中的元知识主要是用来对专家系统运 在粗糙集属性约简中,若SGF(C,C,D)=0,表 行的控制,用可拓知识来表示控制专家系统运行的 示属性C:关于D是可省的,即可以对属性C:进行约 元知识是很合适的.专家系统一般采用逆向推理,它 简.用可拓变换表示属性约简变换,如下式: 运行控制的元知识主要包括:指定目标开始推理:检 Tne(C)=(C-{C:}). 查当前变量是否处于推理树的叶结点,若是,则进行 该约简变换Te是在算子AsGn(C:)计算出 提问;提问回答符合要求时,推理进行回朔;提问回 AsGr(C:)=0时,才进行的变换。 答不符合要求时,继续提问;目标求出值后,停止推 算子AsGr与可拓变换Te之间的因果关系可以 理或转向另一推理树的目标等.下面对其中部分元 表示为可拓知识: 知识改写为可拓知识表示形式,更能体现变化的特 Ascr (C;)=0-Trcdne (C)=(C-Ci). 点: 该可拓知识表示为:若算子Ascs对C:属性计算 1)叶结点提问处理:当推理过程中发现当前结点 出重要度SGF(C:)为零时,进行对属性C:的约简变 x是叶结点o时,将叶结点变换成给定叶结点的提问 换。 句,元知识表示为
.334 智能系统学报 第4卷 (Compare(x,x)=yes)→ [2]陈文伟,杨春燕,黄金才.可拓知识与可拓知识推理[J] (Tuee(xo)=(question(xo)=“提问句”)). 哈尔滨工业大学学报,2006,38(7):1094-1096 2)叶结点用户回答正确处理:当用户回答的值 CHEN Wenwei,Yang Chunyan,HUANG Jincai.Research (user)属于叶结点取值v(o)的范围时,推理进行回 on extension knowledge and extension knowledge reasoning [J].Journal of Harbin Institute of Technology,2006,38 溯,即将上层结点x置换叶结点0,元知识表示为 (7):1094-1096. (Compare(v(user),v(x))=yes) [3]陈文伟.基于本体的可拓知识链获取[J].智能系统学 (Tp(x)=x'). 报,2007,2(6):68-71. 3)叶结点用户回答不正确处理:当用户回答的 CHEN Wenwei.Extension knowledge link acquisition based 值v(user)不属于叶结点取值v(o)的范围时,则继 on ontology[J].CAAI Transactions on Intelligent Systems, 续提问,元知识表示为 2007,2(6):68-71. (Compare(v(user),v(xo))=no) [4]蔡文,杨春燕,陈文伟,李兴森.可拓集与可拓数据挖 (Te(x)=(question(x)=“提问句”). 据M].北京:科学出版社,2008:23-25. 4)单推理树推理控制:当目标结点G通过推理 [5]杨春燕,蔡文.可拓工程[M],北京:科学出版社, 2007:56-58. 求出值vc时,停止推理.元知识表示为 [6]陈文伟.数据挖掘的可拓知识与元知识[C]//中国人工 Check(v(G)=ve)→(Tp(x=G)=Rp). 智能进展.哈尔滨,2007:942-946. 5)多推理树推理控制:当一个推理树的目标结 CHEN Wenwei.Extension knowledge and meta knowledge of 点G通过推理求出给定值vG时,控制推理机从该 date mining[C]//Progress of Artificial Intelligence in Chi- 推理树转向另一推理树i的目标结点G:,元知识表 na.Harbin,2007:942-946. 示为 [7]陈文伟.数据仓库与数据挖掘教程[M].北京:清华大学 Check(v(G)=vc)(Tm(G)=G;). 出版社,2006:37-51. 用可拓知识即变换产生式来表示专家系统中的 [8]陈文伟,廖建文.决策支持系统其开发[M].3版.北京: 元知识,比原来采用的元知识表示更能体现变化的 清华大学出版社,2008:16-21. 特点,也便利专家系统程序容易控制专家系统有效 作者简介: 运行. 陈文伟,男,1940年生,教授,博士 生导师,中国人工智能学会机器学习专 5结束语 业委员会副主任,中国人工智能学会可 拓工程专业委员会副主任.主要研究方 通过以上的研究可知,解决矛盾问题或者知识 向为决策支持系统、机器学习、可拓工 发现问题都是一个过程,用可拓知识作为元知识来 程、数据仓库与数据挖掘.获国家科技 描述,既适应了变化的需求,又起到了把定量问题进 进步奖二等奖1项,军队科技进步奖二、三等奖多项.发表学 行定性化描述,浓缩了具体的定量计算过程.在专家 术论文98篇. 系统中的元知识用可拓知识表示,更突出了运行专 黄金才,男,1972年生,副教授,博 家系统的控制效果.可拓知识作为元知识的一种新 士,中国机器学习学会常务委员和副秘 的表示形式,是对元知识的扩充,既能有效地把握问 书长,湖南青年系统工程与管理研究会 题的本质,又能有效地起到指导和控制系统的运行 副会长,CCML2004程序委员会主席.主 的效果.可拓知识作为元知识的表示形式具有广泛 要研究方向为决策支持、数据挖掘和作 战模拟负责主持军队重点项目5项, 的应用前景 发表学术论文23篇,被I检索13篇. 参考文献: 毕季明,男,1972年生,讲师,主要 研究方向为决策支持、指挥决策.发表 [1]陈文伟.挖据变化知识的可拓数据挖掘研究[J].中国 学术论文12篇. 工程科学,2006,8(11):70-73. CHEN Wenwei.The research of mining the mutative knowl- edge with extension data mining[J].Engineering Science in China,2006,8(11):70-73