【知识工程】基于权值最大圈的概念格构造算法.pdf_大学文库

第11卷第4期智能系统学报 Vol.11 No.4 2016年8月 CAAI Transactions on Intelligent Systems Aug.2016 D0I:10.11992/is.201606006 网络出版地址：http://www.cnki.net/kcms/detail,/23.1538.TP.20160808.0830.014.html 基于权值最大圈的概念格构造算法毛华，刘祎超 (河北大学数学与信息科学学院，河北保定071002) 摘要：概念格作为一种有效的知识发现与数据处理的工具，在许多领域得到了广泛应用。寻找形式背景下的所有概念是概念格理论研究的一个基本问题。对于一个给定的形式背景，在属性拓扑图的基础上，结合图论的思想，给出了一种概念格的构造算法。算法过程如下：首先，构造弱化的属性拓扑图：其次，通过寻找弱化的属性拓扑图中的每个权值最大圈方法来生成概念，形式背景的所有概念被生成：最后，构造出概念格。通过分析说明此算法复杂度比以往的一些算法复杂度低。此外，用一个实例验证了这一算法的有效性与正确性。为知识获取提供了有益的思路与方法。关键词：形式背景：概念格：概念：权值：最大圈：属性拓扑：数据处理中图分类号：TP18文献标志码：A文章编号：1673-4785(2016)04-0519-07 中文引用格式：毛华，刘祎超.基于权值最大圈的概念格构造算法[J].智能系统学报，2016,11(4)：519-525. 英文引用格式：MAO Hua,LIU Yichao..An algorithm for concept lattice construction based on maximum cycles of weight values [J].CAAI Transactions on Intelligent Systems,2016,11(4):519-525. An algorithm for concept lattice construction based on maximum cycles of weight values MAO Hua,LIU Yichao (School of Mathematics and Information Science,Hebei University,Baoding 071002,China) Abstract:As an effective tool for knowledge discovery and data processing,the concept lattice has been widely ap- plied in many fields.Searching all concepts in a formal context is a basic problem for research into concept lattice theory.On the basis of attribute topology and combined with the idea of graph theory,an algorithm to construct a concept lattice in a fixed formal context is given.The process is as follows:firstly,a weakened attribute topology was built up;then,by applying the method of searching the maximum cycle with a weight in the above weakened attribute topology,all of the formal context concepts were obtained;finally the concept lattice was established.Sub- sequent analysis illustrated that the algorithm can reduce complexity compared with some existing algorithms.In ad- dition,using an example,the accuracy and validity of the algorithm was verified.The result presents a useful idea and method for knowledge acquisition. Keywords:formal context;concept lattice;concept;weight value;maximum cycle;attributes topology;data pro- cessing 概念格是对背景中属性、对象及其关系进行识处理的数学工具2-)引。目前，概念格已经广泛应分析研究的理论。它提供了一种支持数据分析和知用于数据挖掘)]、信息处理)、软件工程6和其他方面-】。概念格理论的研究不仅能用于解决知识收稿日期：2016-06-02.网络出版日期：2016-08-08. 发现领域中所涉及的关联规则、蕴含规则、分类规则基金项目：国家自然科学基金项目(61572011)：河北省自然科学基金项目(A2013201119). 的提取，还能够实现对信息的有机组织、减少冗余通信作者：刘袆超.E-mail:1026074348@q4-com 度、简化信息表，所以对概念格理论及其算法的研究

第１１卷第４期智能系统学报Ｖｏｌ．１１ №．４２０１６年８月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＡｕｇ．２０１６ＤＯＩ：１０．１１９９２／ｔｉｓ．２０１６０６００６网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１６０８０８．０８３０．０１４．ｈｔｍｌ基于权值最大圈的概念格构造算法毛华，刘祎超（河北大学数学与信息科学学院，河北保定０７１００２）摘要：概念格作为一种有效的知识发现与数据处理的工具，在许多领域得到了广泛应用。寻找形式背景下的所有概念是概念格理论研究的一个基本问题。对于一个给定的形式背景，在属性拓扑图的基础上，结合图论的思想，给出了一种概念格的构造算法。算法过程如下：首先，构造弱化的属性拓扑图；其次，通过寻找弱化的属性拓扑图中的每个权值最大圈方法来生成概念，形式背景的所有概念被生成；最后，构造出概念格。通过分析说明此算法复杂度比以往的一些算法复杂度低。此外，用一个实例验证了这一算法的有效性与正确性。为知识获取提供了有益的思路与方法。关键词：形式背景；概念格；概念；权值；最大圈；属性拓扑；数据处理中图分类号：ＴＰ１８文献标志码：Ａ文章编号：１６７３－４７８５（２０１６）０４－０５１９－０７中文引用格式：毛华，刘祎超．基于权值最大圈的概念格构造算法［Ｊ］．智能系统学报，２０１６，１１（４）：５１９－５２５．英文引用格式：ＭＡＯＨｕａ，ＬＩＵＹｉｃｈａｏ．Ａｎａｌｇｏｒｉｔｈｍｆｏｒｃｏｎｃｅｐｔｌａｔｔｉｃｅｃｏｎｓｔｒｕｃｔｉｏｎｂａｓｅｄｏｎｍａｘｉｍｕｍｃｙｃｌｅｓｏｆｗｅｉｇｈｔｖａｌｕｅｓ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１６，１１（４）：５１９－５２５．ＡｎａｌｇｏｒｉｔｈｍｆｏｒｃｏｎｃｅｐｔｌａｔｔｉｃｅｃｏｎｓｔｒｕｃｔｉｏｎｂａｓｅｄｏｎｍａｘｉｍｕｍｃｙｃｌｅｓｏｆｗｅｉｇｈｔｖａｌｕｅｓＭＡＯＨｕａ，ＬＩＵＹｉｃｈａｏ（ＳｃｈｏｏｌｏｆＭａｔｈｅｍａｔｉｃｓａｎｄＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅ，ＨｅｂｅｉＵｎｉｖｅｒｓｉｔｙ，Ｂａｏｄｉｎｇ０７１００２，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ａｓａｎｅｆｆｅｃｔｉｖｅｔｏｏｌｆｏｒｋｎｏｗｌｅｄｇｅｄｉｓｃｏｖｅｒｙａｎｄｄａｔａｐｒｏｃｅｓｓｉｎｇ，ｔｈｅｃｏｎｃｅｐｔｌａｔｔｉｃｅｈａｓｂｅｅｎｗｉｄｅｌｙａｐ⁃ ｐｌｉｅｄｉｎｍａｎｙｆｉｅｌｄｓ．Ｓｅａｒｃｈｉｎｇａｌｌｃｏｎｃｅｐｔｓｉｎａｆｏｒｍａｌｃｏｎｔｅｘｔｉｓａｂａｓｉｃｐｒｏｂｌｅｍｆｏｒｒｅｓｅａｒｃｈｉｎｔｏｃｏｎｃｅｐｔｌａｔｔｉｃｅｔｈｅｏｒｙ．Ｏｎｔｈｅｂａｓｉｓｏｆａｔｔｒｉｂｕｔｅｔｏｐｏｌｏｇｙａｎｄｃｏｍｂｉｎｅｄｗｉｔｈｔｈｅｉｄｅａｏｆｇｒａｐｈｔｈｅｏｒｙ，ａｎａｌｇｏｒｉｔｈｍｔｏｃｏｎｓｔｒｕｃｔａｃｏｎｃｅｐｔｌａｔｔｉｃｅｉｎａｆｉｘｅｄｆｏｒｍａｌｃｏｎｔｅｘｔｉｓｇｉｖｅｎ．Ｔｈｅｐｒｏｃｅｓｓｉｓａｓｆｏｌｌｏｗｓ：ｆｉｒｓｔｌｙ，ａｗｅａｋｅｎｅｄａｔｔｒｉｂｕｔｅｔｏｐｏｌｏｇｙｗａｓｂｕｉｌｔｕｐ；ｔｈｅｎ，ｂｙａｐｐｌｙｉｎｇｔｈｅｍｅｔｈｏｄｏｆｓｅａｒｃｈｉｎｇｔｈｅｍａｘｉｍｕｍｃｙｃｌｅｗｉｔｈａｗｅｉｇｈｔｉｎｔｈｅａｂｏｖｅｗｅａｋｅｎｅｄａｔｔｒｉｂｕｔｅｔｏｐｏｌｏｇｙ，ａｌｌｏｆｔｈｅｆｏｒｍａｌｃｏｎｔｅｘｔｃｏｎｃｅｐｔｓｗｅｒｅｏｂｔａｉｎｅｄ；ｆｉｎａｌｌｙｔｈｅｃｏｎｃｅｐｔｌａｔｔｉｃｅｗａｓｅｓｔａｂｌｉｓｈｅｄ．Ｓｕｂ⁃ ｓｅｑｕｅｎｔａｎａｌｙｓｉｓｉｌｌｕｓｔｒａｔｅｄｔｈａｔｔｈｅａｌｇｏｒｉｔｈｍｃａｎｒｅｄｕｃｅｃｏｍｐｌｅｘｉｔｙｃｏｍｐａｒｅｄｗｉｔｈｓｏｍｅｅｘｉｓｔｉｎｇａｌｇｏｒｉｔｈｍｓ．Ｉｎａｄ⁃ ｄｉｔｉｏｎ，ｕｓｉｎｇａｎｅｘａｍｐｌｅ，ｔｈｅａｃｃｕｒａｃｙａｎｄｖａｌｉｄｉｔｙｏｆｔｈｅａｌｇｏｒｉｔｈｍｗａｓｖｅｒｉｆｉｅｄ．Ｔｈｅｒｅｓｕｌｔｐｒｅｓｅｎｔｓａｕｓｅｆｕｌｉｄｅａａｎｄｍｅｔｈｏｄｆｏｒｋｎｏｗｌｅｄｇｅａｃｑｕｉｓｉｔｉｏｎ．Ｋｅｙｗｏｒｄｓ：ｆｏｒｍａｌｃｏｎｔｅｘｔ；ｃｏｎｃｅｐｔｌａｔｔｉｃｅ；ｃｏｎｃｅｐｔ；ｗｅｉｇｈｔｖａｌｕｅ；ｍａｘｉｍｕｍｃｙｃｌｅ；ａｔｔｒｉｂｕｔｅｓｔｏｐｏｌｏｇｙ；ｄａｔａｐｒｏ⁃ ｃｅｓｓｉｎｇ收稿日期：２０１６－０６－０２．网络出版日期：２０１６－０８－０８．基金项目：国家自然科学基金项目（６１５７２０１１）；河北省自然科学基金项目（Ａ２０１３２０１１１９）．通信作者：刘祎超．Ｅ⁃ｍａｉｌ：１０２６０７４３４８＠ｑｑ．ｃｏｍ．概念格［１］是对背景中属性、对象及其关系进行分析研究的理论。它提供了一种支持数据分析和知识处理的数学工具［２－３］。目前，概念格已经广泛应用于数据挖掘［４］、信息处理［５］、软件工程［６］和其他方面［７－８］。概念格理论的研究不仅能用于解决知识发现领域中所涉及的关联规则、蕴含规则、分类规则的提取，还能够实现对信息的有机组织、减少冗余度、简化信息表，所以对概念格理论及其算法的研究

520 智能系统学报第11卷具有重要的意义。表1形式背景(O,M,) 概念是人类进行知识表达的一种手段，数据 Table 1 Formal context(O,M,I) 库知识发现的过程就是将数据库中蕴含的知识对像a b c d e f 形式化成有用的概念的过程。对形式背景的表示及寻找背景下的所有概念是概念格理论研究 2 3 的基本问题。近年来许多学者从图论的方面对 4 概念格进行研究，例如，张涛等[9提出用属性拓 5 扑图来表示形式背景，并在此属性拓扑图的基础 6 上进行概念计算：A.Bery等[io将形式背景构造表1对应的形式背景的概念格见图1。成二部图，利用团的思想生成概念：此外，李立峰等[口利用弦二部图对概念格进行表示，其中判 (123456,) 断弦二部图中是否有圈，是判断弦二部图的关 (123,b)124.a）(24.d34,e)135.c) 键。这也证实图论特别是图中的圈，在概念格的 (12.ab)(13.bc)(24,adg 研究中之重要。 (1,abe)(2.abdg)(3,bce)(4.adeg)(5.cf) 本文结合图论的知识，将形式背景以属性拓扑图表示出来，通过构造弱化的属性拓扑图，然后寻找 (d,abcdefgh) 弱化的属性拓扑图中的权值地之最大圈，用以生成图1B(0,M,) 概念，从而构造出概念格，并结合实例分析了这一算 Fig.1 B(O,M,I) 法的有效性。说明1本文所讨论的形式背景中不含有满足 1基本概念以下条件的属性和对象，m∈M,m'=0或m'=②； g∈0，g=M或g'=☑。本节将回顾概念格与图论的一些性质和定 1.2图论义，关于概念格的更多内容参见文献[12]，有关定义21)称数学结构G={V(G),E(G), 图论详细内容参见文献[13]，并且简单描述形式山。为一个图，其中V(G)为非空集合，中c是从集合背景的属性拓扑图表示方法，更多详细内容参见 E(G)到V(G)xV(G)的一个映射，则称G是一个以文献[9,14]。 V(G)为顶集合，以E(G)为边集合的有向图，V(G) 1.1概念格中的元素称为G的顶点。E(G)中的元素称为G的定义1 边，中c称为G的关联函数。若中e(e)=(u,v),e∈ 1)形式背景(0，M,)是一个三元组，其中0是 E(G),(u,v)eV(G)xV(G),简写成e=w,称u是有对象集，M是属性集，I c0 xM。O和M中的元素分向边e的尾，v是有向边e的头。擦掉有向图中的箭别称为对象和属性。头，则得到无向图。 2)设ACO且BCM,定义 2)在顶边交错链P=oe11e2…ez中，e:∈ A'={m∈Ml(VgeA),glm} E(G),i=1,2,…,k,yeV(G),j=1,2,…,k,且e,= B'={g∈0l(meB),glm}; 若A'=B且B'=A,则元素对(A,B)是一个 -1:,则称P是G的一条道路，其中允许u,=心，或 e:=e,i有。称o是p的起点，是p的终点。各顶相概念。A为概念(A,B)的外延，B为概念(A,B) 异的道路称为轨道：起点与终点重合的轨道称为圈。的内涵。形式背景(O,M,)的所有概念的集合 3)在一个无向图中，只有一个顶的圈叫做自用B(0,M,I)表示，称B(0,M,I)为(0，M,I) 环；c(e1)=中c(e2)=(u,v),则称e,与e2是重边。的概念格。说明2由上述定义可知自环、重边均为圈。 3)对于B(O,M,I)中的概念(A1,B,)和 1.3属性拓扑图 (A2,B2),如果A,二A2,我们写作(A1,B,)≤ 定义3设(O,M,I)是一个形式背景。按如下 (A2,B2)。很容易看到(B(0,M,I);≤)是一个完备格。规则构造属性拓扑图(A(O,M,I),o): 例1形式背景(0，M,I),其中0={1,2,3,4， 1)设m1,m2∈M且m1≠m2o 5,6},M={a,b,c,d,e,fg{,关系I如表1所示。 ①若m'1正m'2,m'2立m',且m',∩m'2≠0，则用 “←→”连接m,和m2;

具有重要的意义。概念是人类进行知识表达的一种手段，数据库知识发现的过程就是将数据库中蕴含的知识形式化成有用的概念的过程。对形式背景的表示及寻找背景下的所有概念是概念格理论研究的基本问题。近年来许多学者从图论的方面对概念格进行研究，例如，张涛等［９］提出用属性拓扑图来表示形式背景，并在此属性拓扑图的基础上进行概念计算；Ａ．Ｂｅｒｒｙ等［１０］将形式背景构造成二部图，利用团的思想生成概念；此外，李立峰等［１１］利用弦二部图对概念格进行表示，其中判断弦二部图中是否有圈，是判断弦二部图的关键。这也证实图论特别是图中的圈，在概念格的研究中之重要。本文结合图论的知识，将形式背景以属性拓扑图表示出来，通过构造弱化的属性拓扑图，然后寻找弱化的属性拓扑图中的权值ｗ之最大圈，用以生成概念，从而构造出概念格，并结合实例分析了这一算法的有效性。１基本概念本节将回顾概念格与图论的一些性质和定义，关于概念格的更多内容参见文献［１２］，有关图论详细内容参见文献［１３］，并且简单描述形式背景的属性拓扑图表示方法，更多详细内容参见文献［９，１４］。１．１概念格定义１１）形式背景（Ｏ，Ｍ，Ｉ）是一个三元组，其中Ｏ是对象集，Ｍ是属性集，Ｉ ÍＯ ´Ｍ。Ｏ和Ｍ中的元素分别称为对象和属性。２）设Ａ⊆Ｏ且Ｂ⊆Ｍ，定义Ａ′ ＝｛ｍ ÎＭ｜（"ｇ ÎＡ），ｇＩｍ｝Ｂ′ ＝｛ｇ ÎＯ｜（"ｍ ÎＢ），ｇＩｍ｝；若Ａ′ ＝Ｂ且Ｂ′ ＝Ａ，则元素对（Ａ，Ｂ）是一个概念。Ａ为概念（Ａ，Ｂ）的外延，Ｂ为概念（Ａ，Ｂ）的内涵。形式背景（Ｏ，Ｍ，Ｉ）的所有概念的集合用 β （Ｏ，Ｍ，Ｉ）表示，称 β （Ｏ，Ｍ，Ｉ）为（Ｏ，Ｍ，Ｉ）的概念格。３）对于 β （Ｏ，Ｍ，Ｉ）中的概念（Ａ１，Ｂ１）和（Ａ２，Ｂ２），如果Ａ１ ÍＡ２，我们写作（Ａ１，Ｂ１） ≤ （Ａ２，Ｂ２）。很容易看到（ β （Ｏ，Ｍ，Ｉ）；≤）是一个完备格。例１形式背景（Ｏ，Ｍ，Ｉ），其中Ｏ＝｛１，２，３，４，５，６｝，Ｍ＝｛ａ，ｂ，ｃ，ｄ，ｅ，ｆ，ｇ｝，关系Ｉ如表１所示。表１形式背景（Ｏ，Ｍ，Ｉ）Ｔａｂｌｅ１Ｆｏｒｍａｌｃｏｎｔｅｘｔ（Ｏ，Ｍ，Ｉ）对像ａｂｃｄｅｆｇ１ ´ ´ ´ ２ ´ ´ ´ ´ ３ ´ ´ ´ ４ ´ ´ ´ ´ ５ ´ ´ ６ ´ 表１对应的形式背景的概念格见图１。图１ β （Ｏ，Ｍ，Ｉ）Ｆｉｇ．１ β （Ｏ，Ｍ，Ｉ）说明１本文所讨论的形式背景中不含有满足以下条件的属性和对象，ｍ ÎＭ，ｍ′ ＝Ｏ或ｍ′ ＝ Æ；ｇ ÎＯ，ｇ′＝Ｍ或ｇ′＝ Æ。１．２图论定义２１）称数学结构Ｇ＝｛Ｖ（Ｇ），Ｅ（Ｇ）， ψＧ｝为一个图，其中Ｖ（Ｇ）为非空集合，ψＧ是从集合Ｅ（Ｇ）到Ｖ（Ｇ）´Ｖ（Ｇ）的一个映射，则称Ｇ是一个以Ｖ（Ｇ）为顶集合，以Ｅ（Ｇ）为边集合的有向图，Ｖ（Ｇ）中的元素称为Ｇ的顶点。Ｅ（Ｇ）中的元素称为Ｇ的边， ψＧ称为Ｇ的关联函数。若 ψＧ（ｅ）＝（ｕ，ｖ），ｅ Î Ｅ（Ｇ），（ｕ，ｖ）ÎＶ（Ｇ）´Ｖ（Ｇ），简写成ｅ＝ｕｖ，称ｕ是有向边ｅ的尾，ｖ是有向边ｅ的头。擦掉有向图中的箭头，则得到无向图。２）在顶边交错链Ｐ＝ｖ０ｅ１ｖ１ｅ２ … ｖｋｅｋ中，ｅｉ Î Ｅ（Ｇ），ｉ＝１，２，…，ｋ，ｖｊ ÎＶ（Ｇ），ｊ＝１，２，…，ｋ，且ｅｉ＝ｖｉ－１ｖｉ，则称Ｐ是Ｇ的一条道路，其中允许ｖｉ＝ｖｊ或ｅｉ＝ｅｊ，ｉ ¹ｊ。称ｖ０是ｐ的起点，ｖｋ是ｐ的终点。各顶相异的道路称为轨道；起点与终点重合的轨道称为圈。３）在一个无向图中，只有一个顶的圈叫做自环； ψＧ（ｅ１）＝ ψＧ（ｅ２）＝（ｕ，ｖ），则称ｅ１与ｅ２是重边。说明２由上述定义可知自环、重边均为圈。１．３属性拓扑图定义３设（Ｏ，Ｍ，Ｉ）是一个形式背景。按如下规则构造属性拓扑图（Ａ（Ｏ，Ｍ，Ｉ），ｗ）：１）设ｍ１，ｍ２ÎＭ且ｍ１≠ｍ２。 ①若ｍ′１ Ëｍ′２，ｍ′２ Ëｍ′１且ｍ′１ ∩ｍ′２ ¹Æ，则用 “«”连接ｍ１和ｍ２； ·５２０· 智能系统学报第１１卷

第4期毛华，等：基于权值最大圈的概念格构造算法 ·521. ②若m'1cm'2且m',∩m'2≠0，则用“→”连接之间再添加一条边e,(图中用虚线表示)，并且令 m,和m2表示为m2→m1; e1的权值也为o(u,v)。 ③若m',∩m'2=g,则m,和m2没有边连接。完成1)~3)后得到的加权无向图称为弱化的 2)设(A(0,M,I),w)为(0，M,I)的属性拓扑属性拓扑图，用(R(O,M,I),w)表示。图，e(m,m)∈E(A(0,M,I),o)),E(A(0,M,I), 此外，显然，在上述3)中的e与e,是重边。 w)为(A(0,M,I),w)的边集，e(m:,m)上的权值用例3下面图3为图2所对应的(A(O,M,I), (m,m)表示，心(m,m)为属性m:和m之间的公心)之弱化的属性拓扑图。共对象{g1,g2,…,gn}的集合，称w(m:,m）为m:和 m之间的权值。 24 4,6 3)设m∈M,b∈M,若与m连接的边均为非单 {1,2,4} 24} 2.45 向入边，即与m连接的边均为m→b或m←b,则称 2) {4 m为顶层属性，顶层属性的集合用T表示。例2图2为表1形式背景(0，M,I)对应的属多 4124 3 性拓扑图。 h 3,4 {2,4} 123 3 2.4号 {2,41 5 (2 {4 {13.5 4得图3(R(O,M,I),w) {4 1,2 3 Fig3(R(O,M,I),w】 1,3 定义4设(0，M,I)是一个形式背景，(R(0, {3 M,),心)是(O,M,I)对应的弱化的属性拓扑图， 5 {m1,m2,…,m,}cM且{m1,m2,…,mw}'≠，若不存 f 在任意m。∈M,m.是{m1,m2,…,m.},使得{m1, 图2(A(0,M,I),w) m2,…,m}'={m1,m2,…,m4,m。}',则称Y={m1, Fig.2 (A(O,M,I),w) m2,…,ma}为权值w({m1,m2,…,m%})的最大圈。引理1设(0，M,)是一个形式背景，(A(0, 例如图3中，Y={bdga}为权值{2}的最大圈。 M,I),w)为(O,M,I)的属性拓扑图，若m∈T,则说明3为了描述方便，有时将w(m,m)简写 (m',m)∈β(0，M,I)。为W。 2.2算法过程 2概念格的构造对于给定的形式背景(O,M,I),构造概念格的在搜索概念的过程中，为了不受方向的限制，首过程如下：先进行属性拓扑图弱化，将有向图变为无向图，实际输入形式背景(O,M,I)以及W(R(O,M,I), 上目前结合图论生成概念格的算法，都是在无向图 0)={w1,02,…,0n},0,≠0，T,s,n=1,2,…, 的基础上进行的。其次，给出弱化后属性拓扑图关 MI 于某个权值的最大圈的定义。最后，给出利用权值 2o 的最大圈构造概念算法，并进行算法分析。输出所有概念B(0,M,I)1{(0,0),(0,M)}。 2.1弱化的属性拓扑图 1)对于(O,M,I),绘制属性拓扑图，根据属性设(O,M,)是一个形式背景，按照如下规则对拓扑图中的箭头指向，确定顶层属性集合T。属性拓扑图进行弱化： 2)将属性拓扑图转化为弱化的属性拓扑图。 1)去掉属性拓扑图中的方向，得一无向图。 3)①初始将W(R(O,M,I),0)赋值给W,对任 2)若m在(A(0,M,I),w)中为顶层属性，则在 1)中的无向图中，加一个以m为顶点的自环。意两，求n,=1,2,1。者 3)若在1)中的无向图中，包含权值w(u,v)的 0,∩w,=⑦或0：∩w=0,此处w:,0,地，∈W(R(0, 只有一条边e,其中，u、u为e的两个端点，则在u与

②若ｍ′１Ìｍ′２且ｍ′１∩ｍ′２¹Æ，则用“®” 连接ｍ１和ｍ２表示为ｍ２®ｍ１； ③若ｍ′１∩ｍ′２＝ Æ，则ｍ１和ｍ２没有边连接。２）设（Ａ（Ｏ，Ｍ，Ｉ），ｗ）为（Ｏ，Ｍ，Ｉ）的属性拓扑图，ｅ（ｍｉ，ｍｊ）ÎＥ（Ａ（Ｏ，Ｍ，Ｉ），ｗ）），Ｅ（Ａ（Ｏ，Ｍ，Ｉ），ｗ）为（Ａ（Ｏ，Ｍ，Ｉ），ｗ）的边集，ｅ（ｍｉ，ｍｊ）上的权值用ｗ（ｍｉ，ｍｊ）表示，ｗ（ｍｉ，ｍｊ）为属性ｍｉ和ｍｊ之间的公共对象｛ｇ１，ｇ２，…，ｇｎ｝的集合，称ｗ（ｍｉ，ｍｊ）为ｍｉ和ｍｊ之间的权值。３）设ｍ ÎＭ，ｂ ÎＭ，若与ｍ连接的边均为非单向入边，即与ｍ连接的边均为ｍ ®ｂ或ｍ «ｂ，则称ｍ为顶层属性，顶层属性的集合用Ｔ表示。例２图２为表１形式背景（Ｏ，Ｍ，Ｉ）对应的属性拓扑图。图２（Ａ（Ｏ，Ｍ，Ｉ），ｗ）Ｆｉｇ．２（Ａ（Ｏ，Ｍ，Ｉ），ｗ）引理１设（Ｏ，Ｍ，Ｉ）是一个形式背景，（Ａ（Ｏ，Ｍ，Ｉ），ｗ）为（Ｏ，Ｍ，Ｉ）的属性拓扑图，若ｍ ÎＴ，则（ｍ′，ｍ）Îβ（Ｏ，Ｍ，Ｉ）。２概念格的构造在搜索概念的过程中，为了不受方向的限制，首先进行属性拓扑图弱化，将有向图变为无向图，实际上目前结合图论生成概念格的算法，都是在无向图的基础上进行的。其次，给出弱化后属性拓扑图关于某个权值的最大圈的定义。最后，给出利用权值的最大圈构造概念算法，并进行算法分析。２．１弱化的属性拓扑图设（Ｏ，Ｍ，Ｉ）是一个形式背景，按照如下规则对属性拓扑图进行弱化：１）去掉属性拓扑图中的方向，得一无向图。２）若ｍ在（Ａ（Ｏ，Ｍ，Ｉ），ｗ）中为顶层属性，则在１）中的无向图中，加一个以ｍ为顶点的自环。３）若在１）中的无向图中，包含权值ｗ（ｕ，ｖ）的只有一条边ｅ，其中，ｕ、ｖ为ｅ的两个端点，则在ｕ与ｖ之间再添加一条边ｅ１（图中用虚线表示），并且令ｅ１的权值也为ｗ（ｕ，ｖ）。完成１）～３）后得到的加权无向图称为弱化的属性拓扑图，用（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）表示。此外，显然，在上述３）中的ｅ与ｅ１是重边。例３下面图３为图２所对应的（Ａ（Ｏ，Ｍ，Ｉ），ｗ）之弱化的属性拓扑图。图３（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）Ｆｉｇ．３（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）定义４设（Ｏ，Ｍ，Ｉ）是一个形式背景，（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）是（Ｏ，Ｍ，Ｉ）对应的弱化的属性拓扑图，｛ｍ１，ｍ２，…，ｍｈ｝ÍＭ且｛ｍ１，ｍ２，…，ｍｈ｝¢¹Æ，若不存在任意ｍａ ÎＭ，ｍａ Ï｛ｍ１，ｍ２，…，ｍｈ｝，使得｛ｍ１，ｍ２，…，ｍｈ｝¢＝｛ｍ１，ｍ２，…，ｍｈ，ｍａ｝ ¢，则称Ｙ＝｛ｍ１，ｍ２，…，ｍｈ｝为权值ｗ（｛ｍ１，ｍ２，…，ｍｈ｝¢）的最大圈。例如图３中，Ｙ＝｛ｂｄｇａ｝为权值｛２｝的最大圈。说明３为了描述方便，有时将ｗ（ｍｉ，ｍｊ）简写为ｗ。２．２算法过程对于给定的形式背景（Ｏ，Ｍ，Ｉ），构造概念格的过程如下：输入形式背景（Ｏ，Ｍ，Ｉ）以及Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）＝｛ｗ１，ｗ２， …，ｗｎ｝，ｗｒ ¹ｗｓ，ｒ，ｓ，ｎ＝１，２， …，Ｍ２２。输出所有概念 β （Ｏ，Ｍ，Ｉ）＼｛（Ｏ，Æ），（Æ，Ｍ）｝。１）对于（Ｏ，Ｍ，Ｉ），绘制属性拓扑图，根据属性拓扑图中的箭头指向，确定顶层属性集合Ｔ。２）将属性拓扑图转化为弱化的属性拓扑图。３）①初始将Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）赋值给Ｗｒ，对任意ｗｉ，ｗｊ ÎＷｒ，求ｗｉ ∩ｗｊ，ｉ，ｊ＝１，２，…，Ｍ２２。若ｗｉ∩ｗｊ＝ Æ或ｗｉ∩ｗｊ＝ｗｔ，此处ｗｉ，ｗｊ，ｗｔÎＷ（Ｒ（Ｏ，第４期毛华，等：基于权值最大圈的概念格构造算法 ·５２１·

.522. 智能系统学报第11卷 1)由一条边构成，也即自环： M,I),w),ij,t=1,2,…, ，。则进行4)。 2)由两条边构成，也即重边： ②若：∩0=w,0,W(R(0,M,),0),i,j,t= 3)由3条或3条以上的边构成，也即非自环非 ,则将W,={,,∩0，=，e,,6 1,2,…,2 重边的圈。证明由定义2中3)可知，自环是只有一个顶 W(R(O,M,I),o),0,EW(R(0,M,I),e)}添加到点的圈；重边是由两个顶点的圈：由定义2中3)可 W(R(O,M,I),w)中。将W,赋值给W,执行①。知，非自环非重边的圈之顶点个数大于2。 4)取maxw,,开始寻找边上权值包含w,的最当圈只有一个顶点时，根据定义2中3)可知，大圈，记录权值心，最大圈的顶点为Y,对应概念为此时的圈为一个自环： C={(A,B):A=w,B=Y}。当圈有两个顶点时，根据定义2中3)可知，此 5)①根据4)的原则，若W中存在0+1，s=1,2, 时的圈为重边； …,|MP,则选定0+1，重复4)。当圈的顶点个数大于2时，符合定义2中2)。 ②若W中不存在0+1，则停止。因此，圈有且仅有自环、重边、非自环非重边的若W(R(0,M,I),w)中的元素满足3)中的①，圈3种情况。若心，∩心，=0，或0：∩心=0，此处0：，0,0，∈W(R 定理1设(0，M,I)是一个形式背景，(R(0, M,I),w)是(O,M,I)对应的弱化的属性拓扑图，权 (0,M,),w),i,j,t=1,2,…, 1M2I 2 ,则能够进行值最大圈一定能够生成一个概念。 4)、5),又因为W(R(0,M,I),w)是有限的，因此证明由引理2可知，弱化的属性拓扑图的权有限步后算法可以停止。值w最大圈有且仅有3种情况，下面关于这3种情若W(R(0,M,I),w)中的元素满足w:∩心= 况分别说明。 M,此 1)当圈为自环时 ,0,gW(R(0,M,),0),i,t=1,2,…, 2 m∈M,圈Y={m},由弱化的属性拓扑图的构造时会将新生成的w,添加到W(R(O,M,I),0)中，由 1)可知，有meT。根据引理1，(m',m)∈β(0，M, 于w,地，心，c0,0为有限的，因此经过有限步后 I)。而m'=w(m,m),因此，((m,m),m)∈β(0，一定可以进行3)中①，因此有限步后算法可停止。 M,I)。 2.3算法分析 2)当圈为重边时根据文献[9]，可以看出1)的复杂度为 m1,m2∈M,圈Y={m1,m2},由弱化的属性拓扑 0门：步骤2将属性拓扑图弱化，首先判断每图的构造2)可知，不存在其他权值为w(m1,m2)的边，即不存在其他顶m,m∈M,使w(m1,m2)∈ 个属性是否为顶层属性，其复杂度为O(|M),其 0(m,m),i有，i≥3，j≥1。这就是说，除m1,m2 次需要判断是否为不能构成权值心的最大圈，其复外，不存在其他属性所拥有的对象集包含w(m, 杂度为0 (MP (MP 2 ,所以2)的复杂度为02)： m2),所以(w(m1,m2),Y)eβ(0，M,)。 3)=当圈的顶点个数大于等于3时若是3)中①，首先对W中任意两元素取交，有 m1,m2,…,m:∈M,i≥3，若圈Y={m1,m2,… orD个元素，进行og 次，若是3)中②， m},证明过程与第2种情况类似，易证(0(m1, m2),Y)∈β(0，M,I)。对新生成的集合W,重复次3)，最多重复0次，所引理3设W(R(0,M,I),0)是一个集族，则以3)的复杂度为0 (01Wn12 ,其中W,伪元素任意的其中0：，0，0，∈W(R(0,M,I),0),0.生W 2 IM2| 最多的集合；4)中，每到一个属性节点最多需要判 ((0,M,),0),,u=1,2,,2,它们之间断M1次该节点是否在当前权值w的最大圈中，的关系有且仅有以下3种情况之一发生：最多判断M饮，所以4)的复杂度为0(|M2):5) 1)0:∩w:=0; 的复杂度为0(|OW.)。 2)0:∩0；=0，因此，整个算法的复杂度为O(2wK10)。 3)0:∩0；=10u9 引理2圈有且仅有以下3种情况：证明根据文献[15]，可得若W(R(0,M,I)

Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ＝１，２，…，Ｍ２２。则进行４）。 ②若ｗｉ∩ｗｊ＝ｗｔ，ｗｔÏＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ＝１，２，…，Ｍ２２，则将Ｗｒｒ＝｛ｗｔ：ｗｉ∩ｗｊ＝ｗｔ，ｗｉ，ｗｊ，Î Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｗｔ ÏＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）｝添加到Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中。将Ｗｒｒ赋值给Ｗｒ，执行①。４）取ｍａｘ êｗｓ ú，开始寻找边上权值包含ｗｓ的最大圈，记录权值ｗｓ最大圈的顶点为Ｙ，对应概念为Ｃ＝｛（Ａ，Ｂ）：Ａ＝ｗｓ，Ｂ＝Ｙ｝。５）①根据４）的原则，若Ｗ中存在ｗｓ＋１，ｓ＝１，２， …， êＭ ú ２，则选定ｗｓ＋１，重复４）。 ②若Ｗ中不存在ｗｓ＋１，则停止。若Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中的元素满足３）中的①，若ｗｉ∩ｗｊ＝ Æ，或ｗｉ∩ｗｊ＝ｗｔ，此处ｗｉ，ｗｊ，ｗｔ ÎＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ＝１，２，…，Ｍ２２，则能够进行４）、５），又因为êＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ） ú是有限的，因此有限步后算法可以停止。若Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中的元素满足ｗｉ ∩ｗｊ＝ｗｔ，ｗｔÏＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ＝１，２，…，Ｍ２２，此时会将新生成的ｗｔ添加到Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中，由于ｗｒ¹ｗｓ，ｗｔ ÍＯ，êＯ ú为有限的，因此经过有限步后一定可以进行３）中①，因此有限步后算法可停止。２．３算法分析根据文献［９］，可以看出１）的复杂度为ＯＭ２２ æ è ç ö ø ÷ ；步骤２将属性拓扑图弱化，首先判断每个属性是否为顶层属性，其复杂度为Ｏ( Ｍ ) ，其次需要判断是否为不能构成权值ｗ的最大圈，其复杂度为ＯＭ２２ æ è ç ö ø ÷ ，所以２）的复杂度为ＯＭ２２ æ è ç ö ø ÷ ；若是３）中 ①，首先对Ｗ中任意两元素取交，有Ｏ( Ｗ ) 个元素，进行ＯＷ２２ æ è ç ö ø ÷ 次，若是３）中②，对新生成的集合Ｗｒｒ重复次３），最多重复êＯ ú次，所以３）的复杂度为ＯＯＷｒｒ２２ æ è ç ö ø ÷ ，其中êＷｒｒ ú为元素最多的集合；４）中，每到一个属性节点最多需要判断êＭ ú－１次该节点是否在当前权值ｗ的最大圈中，最多判断êＭ ú次，所以４）的复杂度为ＯＭ２ ( ) ；５）的复杂度为ＯＯＷｒｒ ( ) 。因此，整个算法的复杂度为Ｏ２Ｍ × Ｏ ( ) 。引理２圈有且仅有以下３种情况：１）由一条边构成，也即自环；２）由两条边构成，也即重边；３）由３条或３条以上的边构成，也即非自环非重边的圈。证明由定义２中３）可知，自环是只有一个顶点的圈；重边是由两个顶点的圈；由定义２中３）可知，非自环非重边的圈之顶点个数大于２。当圈只有一个顶点时，根据定义２中３）可知，此时的圈为一个自环；当圈有两个顶点时，根据定义２中３）可知，此时的圈为重边；当圈的顶点个数大于２时，符合定义２中２）。因此，圈有且仅有自环、重边、非自环非重边的圈３种情况。定理１设（Ｏ，Ｍ，Ｉ）是一个形式背景，（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）是（Ｏ，Ｍ，Ｉ）对应的弱化的属性拓扑图，权值最大圈一定能够生成一个概念。证明由引理２可知，弱化的属性拓扑图的权值ｗ最大圈有且仅有３种情况，下面关于这３种情况分别说明。１）当圈为自环时ｍ ÎＭ，圈Ｙ＝｛ｍ｝，由弱化的属性拓扑图的构造１）可知，有ｍ ÎＴ。根据引理１，（ｍ′，ｍ） Îβ（Ｏ，Ｍ，Ｉ）。而ｍ′ ＝ｗ（ｍ，ｍ），因此，（ｗ（ｍ，ｍ），ｍ）Îβ（Ｏ，Ｍ，Ｉ）。２）当圈为重边时ｍ１，ｍ２ÎＭ，圈Ｙ＝｛ｍ１，ｍ２｝，由弱化的属性拓扑图的构造２）可知，不存在其他权值为ｗ（ｍ１，ｍ２）的边，即不存在其他顶ｍｉ，ｍｊ ÎＭ，使ｗ（ｍ１，ｍ２） Í ｗ（ｍｉ，ｍｊ），ｉ ¹ｊ，ｉ≥３，ｊ≥１。这就是说，除ｍ１，ｍ２外，不存在其他属性所拥有的对象集包含ｗ（ｍ１，ｍ２），所以（ｗ（ｍ１，ｍ２），Ｙ）Îβ（Ｏ，Ｍ，Ｉ）。３）＝当圈的顶点个数大于等于３时ｍ１，ｍ２， … ，ｍｉÎＭ，ｉ≥３，若圈Ｙ＝｛ｍ１，ｍ２， … ｍｉ｝，证明过程与第２种情况类似，易证（ｗ（ｍ１，ｍ２），Ｙ）Îβ（Ｏ，Ｍ，Ｉ）。引理３设Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）是一个集族，则任意的其中ｗｉ，ｗｊ，ｗｔ ÎＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｗｕ ÏＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ，ｕ＝１，２，…，Ｍ２２，它们之间的关系有且仅有以下３种情况之一发生：１）ｗｉ∩ｗｊ＝ Æ；２）ｗｉ∩ｗｊ＝ｗｔ；３）ｗｉ∩ｗｊ＝ｗｕ。证明根据文献［１５］，可得若Ｗ（Ｒ（Ｏ，Ｍ，Ｉ）， ·５２２· 智能系统学报第１１卷

第4期毛华，等：基于权值最大圈的概念格构造算法 ·523· w)是一个集族，则对于任意的0：，0,0，∈W(R(0, 余概念的产生必然导致算法的储存空间的增加，引 M,I),o),0.eW(R(0,M,I),0),i,j,t,u=1,2,…, 发空间复杂度的加大 11有且仅有，n,=⑦，n=,或w,n,9 本文算法用图论中的权值与最大圈结合来寻找 2 概念，由于不会重复对同一权值寻找其相应的最大 w.,3种情况之一发生：圈，因此不会有冗余概念的产生。从而，必然在概念定理2设(0，M,)是一个形式背景，(R(O, 寻找中，降低数据的储存空间，空间复杂度较张涛等 M,I),w)是(O,M,1)对应的弱化的属性拓扑图，通的方法减少成为显然之事。过权值0最大圈算法一定能够得到B(O,M,I)1 2)Bemy等[o]将形式背景构造成二部图，利用 {(0,0),(0,M)}。团的思想生成概念，其计算每个概念的复杂度为证明由引理3可知集族W(R(O,M,I),o)中 0(|M2)。的权值之间有且仅有3种情况，对于任意的0：，心，对于弱化的属性拓扑图产生概念有： w,∈W(R(O,M,I),w),0.W(R(O,M,I),e）,i,j, 1)对于只含有一个顶点属性的情况，由引理1 t,u=1,2,…, r以下对引理3中的3种情况分可知，属性m为某个概念的内涵。在弱化的属性拓 2 扑图中属性m构成一个自环时，本文计算每个概念别说明。的复杂度 (1M2) 1)w:∩w,=0 2 说明任意3个属性之间没有公共对象，根据属 2)对于至少含有两个顶点属性的情况，本文计性拓扑图的构造过程，其弱化的属性拓扑图为定理算每个概念的算法复杂度O(|MP)。 1的第2种情况，得到的W(R(0,M,I),0)能够包以上两种情形说明，当情形1)时，本文算法的括所有概念的外延，因此，依次搜索W(R(O,M,I), 复杂度小于Bey等的：当情形2)时，本文算法的复 o)中的每一个权值w最大圈，即可得到B(O,M,)\ 杂度与Bemy等的相同。这说明，对于情形1)，本文 {(0,0),(0,M)}。的算法优于Bery等的，虽然在其他情况（也就是情 2)0:∩0=0，w,∈W(R(0,M,I),0),i,j,t=1, 形2))，本文的算法与Be四等的具有相同的时间复 2,…,IMP,说明得到的W(R(O,M,I),w)能够包杂度。括所有概念的外延，符合定理的第2、3种情况。因再有，由图论知识可知，每一个团必包含至少一此，依次搜索W(R(O,M,I),o)中的每一个权值e 个圈，所以在判断团的过程中必然存在对圈的判断最大圈，即可得到B(0,M,I)1{(0,⑦)，(0，M)}。过程，当一个团中含有两个以上圈时，此时对团的判 3)若0：∩w=0,0,W(R(0,M,I),0）,i,j, 定过程会重复圈的判断过程。因此，Berry等的方法 t=1,2,…,MP,则说明当前W(R(O,M,),o) 会造成数据存储量过大。而本文算法，不会对相同中不能包含所有概念的外延，将W,={w,:心：∩0 权值的圈进行重复判断与存储，因此，降低了数据存 =0,w,是W(R(O,M,I),0)}添加到W中，只需储空间复杂度。对W,中的任意两个元素取交集即可，由于引0是 3)李立峰等仅是从理论方面指出弦二部图有限的，因此一定会有0：∩w,=0,0,∈W(R(0, 的概念格表示，并没有给出算法过程。所以他们的 M,I),0),i,j,t=1,2,…,|MP,此时说明得到的方法只是理论过程，而无法直接实现。 W(R(O,M,I),0)能够包括所有概念的外延，并本文中不仅给出了理论分析，并且将理论的内且W(R(O,M,I),w)中的元素对应的最大圈符容通过一个可行的算法加以实现，故此，本文的思想合定理1的第2、3种情况。因此，依次搜索W(R 和方法可操作性强，易于直接理解与实现。 (O,M,),0)中的每一个权值w最大圈，即可得由以上1)~3)的分析可以看出，本文给出的算到B(0,M,I)1{(0,0),(0,M)}。法与已有算法相比，计算出全部概念的时间复杂度以上说明了本算法的正确性。下面将通过与已并不低于以往的算法，基本相同。在数据存储空间有的图论方法构造概念格的相关著名算法或方法的方面，本文给出的算法与已有算法相比，空间复杂度比较，分析得出本算法的优势。降低。这样必然使得本算法在整个计算过程能在占 1)张涛等14)在属性拓扑的基础上给出概念计用更小内存的情况下完成，同时也就对计算机器系算方法，实际上是将图论中已有的深度优先算法应统的运行空间降低了要求。因此本文算法要优于其用于概念的寻找，如此可能导致产生冗余概念。冗他一些已有算法或方法

ｗ）是一个集族，则对于任意的ｗｉ，ｗｊ，ｗｔÎＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｗｕÏＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ，ｕ＝１，２，…，Ｍ２２有且仅有ｗｉ ∩ｗｊ＝ Æ、ｗｉ ∩ｗｊ＝ｗｔ或ｗｉ ∩ｗｊ＝ｗｕ，３种情况之一发生：定理２设（Ｏ，Ｍ，Ｉ）是一个形式背景，（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）是（Ｏ，Ｍ，Ｉ）对应的弱化的属性拓扑图，通过权值ｗ最大圈算法一定能够得到 β （Ｏ，Ｍ，Ｉ）＼｛（Ｏ，Æ），（Æ，Ｍ）｝。证明由引理３可知集族Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中的权值之间有且仅有３种情况，对于任意的ｗｉ，ｗｊ，ｗｔÎＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｗｕÏＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ，ｕ＝１，２，…，Ｍ２２以下对引理３中的３种情况分别说明。１）ｗｉ∩ｗｊ＝ Æ 说明任意３个属性之间没有公共对象，根据属性拓扑图的构造过程，其弱化的属性拓扑图为定理１的第２种情况，得到的Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）能够包括所有概念的外延，因此，依次搜索Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中的每一个权值ｗ最大圈，即可得到β（Ｏ，Ｍ，Ｉ）＼｛（Ｏ，Æ），（Æ，Ｍ）｝。２）ｗｉ∩ｗｊ＝ｗｔ，ｗｔÎＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ＝１，２，…， êＭ ú ２，说明得到的Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）能够包括所有概念的外延，符合定理的第２、３种情况。因此，依次搜索Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中的每一个权值ｗ最大圈，即可得到 β（Ｏ，Ｍ，Ｉ）＼｛（Ｏ，Æ），（Æ，Ｍ）｝。３）若ｗｉ∩ｗｊ＝ｗｔ，ｗｔÏＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ＝１，２，…， êＭ ú ２，则说明当前Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中不能包含所有概念的外延，将Ｗｒ＝｛ｗｔ：ｗｉ∩ｗｊ＝ｗｔ，ｗｔ ÏＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）｝添加到Ｗ中，只需对Ｗｒ中的任意两个元素取交集即可，由于êＯ ú是有限的，因此一定会有ｗｉ∩ｗｊ＝ｗｔ，ｗｔ ÎＷ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ），ｉ，ｊ，ｔ＝１，２，…， êＭ ú ２，此时说明得到的Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）能够包括所有概念的外延，并且Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中的元素对应的最大圈符合定理１的第２、３种情况。因此，依次搜索Ｗ（Ｒ（Ｏ，Ｍ，Ｉ），ｗ）中的每一个权值ｗ最大圈，即可得到 β（Ｏ，Ｍ，Ｉ）＼｛（Ｏ，Æ），（ Æ，Ｍ）｝。以上说明了本算法的正确性。下面将通过与已有的图论方法构造概念格的相关著名算法或方法的比较，分析得出本算法的优势。１）张涛等［１４］在属性拓扑的基础上给出概念计算方法，实际上是将图论中已有的深度优先算法应用于概念的寻找，如此可能导致产生冗余概念。冗余概念的产生必然导致算法的储存空间的增加，引发空间复杂度的加大。本文算法用图论中的权值与最大圈结合来寻找概念，由于不会重复对同一权值寻找其相应的最大圈，因此不会有冗余概念的产生。从而，必然在概念寻找中，降低数据的储存空间，空间复杂度较张涛等的方法减少成为显然之事。２）Ｂｅｒｒｙ等［１０］将形式背景构造成二部图，利用团的思想生成概念，其计算每个概念的复杂度为ＯＭ２ ( ) 。对于弱化的属性拓扑图产生概念有：１）对于只含有一个顶点属性的情况，由引理１可知，属性ｍ为某个概念的内涵。在弱化的属性拓扑图中属性ｍ构成一个自环时，本文计算每个概念的复杂度ＯＭ２２ æ è ç ö ø ÷ 。２）对于至少含有两个顶点属性的情况，本文计算每个概念的算法复杂度ＯＭ２ ( ) 。以上两种情形说明，当情形１）时，本文算法的复杂度小于Ｂｅｒｒｙ等的；当情形２）时，本文算法的复杂度与Ｂｅｒｒｙ等的相同。这说明，对于情形１），本文的算法优于Ｂｅｒｒｙ等的，虽然在其他情况（也就是情形２）），本文的算法与Ｂｅｒｒｙ等的具有相同的时间复杂度。再有，由图论知识可知，每一个团必包含至少一个圈，所以在判断团的过程中必然存在对圈的判断过程，当一个团中含有两个以上圈时，此时对团的判定过程会重复圈的判断过程。因此，Ｂｅｒｒｙ等的方法会造成数据存储量过大。而本文算法，不会对相同权值的圈进行重复判断与存储，因此，降低了数据存储空间复杂度。３）李立峰等［１１］仅是从理论方面指出弦二部图的概念格表示，并没有给出算法过程。所以他们的方法只是理论过程，而无法直接实现。本文中不仅给出了理论分析，并且将理论的内容通过一个可行的算法加以实现，故此，本文的思想和方法可操作性强，易于直接理解与实现。由以上１）～３）的分析可以看出，本文给出的算法与已有算法相比，计算出全部概念的时间复杂度并不低于以往的算法，基本相同。在数据存储空间方面，本文给出的算法与已有算法相比，空间复杂度降低。这样必然使得本算法在整个计算过程能在占用更小内存的情况下完成，同时也就对计算机器系统的运行空间降低了要求。因此本文算法要优于其他一些已有算法或方法。第４期毛华，等：基于权值最大圈的概念格构造算法 ·５２３·

３实例结合实例，说明第２．２节中的算法有效性。以表２为形式背景（Ｏ１，Ｍ１，Ｉ１），进行概念的搜索，该背景从ＵＣＩ机器学习数据库中，随机选取ＢＬＯＧ⁃ ＧＥＲ数据集的前４０个对象进行试验，整理后得到如表２所示的形式背景。表２（Ｏ１，Ｍ１，Ｉ１）Ｔａｂｌｅ２Ｆｏｒｍａｌｃｏｎｔｅｘｔ（Ｏ１，Ｍ１，Ｉ１）对像ａ１ａ２ａ３ａ４ａ５ａ６ａ７１ ´ ´ ´ ２ ´ ´ ´ ３ ´ ´ ´ ４ ´ ´ ´ ５ ´ ´ ´ ６ ´ ´ ７ ´ ´ ８ ´ ´ ´ ９ ´ ´ １０ ´ ´ 其中，ａ１代表博主高学历，ａ２代表博主中等学历，ａ３代表博主低学历，ａ４代表政治立场为左派，ａ５代表政治立场中立，ａ６代表政治立场为右派，ａ７代表博客被当地媒体转载。根据１），按照定义３中１）得到以表２为形式背景的属性拓扑图，如图４。根据２），按照定义４，构造出弱化的属性拓扑图（Ｒ（Ｏ１，Ｍ１，Ｉ１），ｗ），如图５。图４（Ａ（Ｏ１，Ｍ１，Ｉ１），ｗ）Ｆｉｇ．４（Ａ（Ｏ１，Ｍ１，Ｉ１），ｗ）根据３），Ｗ＝｛ｗ（ａ１，ａ１），ｗ（ａ２，ａ２），ｗ（ａ３，ａ３），ｗ（ａ４，ａ４），ｗ（ａ６，ａ６），ｗ（ａ７，ａ７），ｗ（ａ１，ａ４），ｗ（ａ１，ａ６），ｗ（ａ１，ａ７），ｗ（ａ２，ａ４），ｗ（ａ２，ａ５），ｗ（ａ２，ａ６），ｗ（ａ２，ａ７），ｗ（ａ３，ａ４），ｗ（ａ３，ａ６），ｗ（ａ４，ａ７），ｗ（ａ５，ａ７），ｗ（ａ６，ａ７）｝。对于任意两个ｗ（ａｉ，ａｊ）求交集，ｉ，ｊ＝１，２，…，７，根据３）中②，可以发现存在ｗ（ａ１，ａ１）∩ ｗ（ａ４，ａ７）＝ｗ（ａ１，ａ４）∩ ｗ（ａ４，ａ７）＝ …＝｛１｝及ｗ（ａ１，ａ１） ∩ ｗ（ａ６，ａ７）＝ｗ（ａ１，ａ７） ∩ ｗ（ａ６，ａ７）＝ … ＝｛３｝，｛１｝，｛３｝ÏＷ，将｛１｝与｛３｝添加到Ｗ，重复３）。对｛｛１｝，｛３｝｝进行步骤３）中②，｛１｝∩｛３｝＝ Æ ，进行４）。图５（Ｒ（Ｏ１，Ｍ１，Ｉ１），ｗ）Ｆｉｇ．５（Ｒ（Ｏ１，Ｍ１，Ｉ１），ｗ）根据４），Ｗ＝｛ｗ（ａ１，ａ１），ｗ（ａ２，ａ２），ｗ（ａ３，ａ３），ｗ（ａ４，ａ４），ｗ（ａ６，ａ６），ｗ（ａ７，ａ７），ｗ（ａ１，ａ４），ｗ（ａ１，ａ６），ｗ（ａ１，ａ７），ｗ（ａ２，ａ４），ｗ（ａ２，ａ５），ｗ（ａ２，ａ６），ｗ（ａ２，ａ７），ｗ（ａ３，ａ４），ｗ（ａ３，ａ６），ｗ（ａ４，ａ７），ｗ（ａ５，ａ７），ｗ（ａ６，ａ７），｛１｝，｛３｝｝。因为６＝ êｗ（ａ７，ａ７）ú≥４＝ êｗ（ａ１，ａ１）ú＝ êｗ（ａ２，ａ２）ú＝ êｗ（ａ４，ａ４）ú＝ êｗ（ａ６，ａ６）ú≥３＝ êｗ（ａ２，ａ７）ú＝ êｗ（ａ４，ａ７） ú≥２ êｗ（ａ１，ａ４） ú ＝ êｗ（ａ１，ａ６） ú ＝ êｗ（ａ１，ａ７） ú ＝ êｗ（ａ２，ａ５） ú ＝ êｗ（ａ３，ａ３） ú ＝ êｗ（ａ６，ａ７）ú≥１＝ êｗ（ａ２，ａ６） ú ＝ êｗ（ａ２，ａ４） ú ＝ êｗ（ａ３，ａ４） ú＝ êｗ（ａ３，ａ６） ú＝ êｗ（ａ５，ａ７） ú ＝ ê｛１｝ ú ＝ ê ｛３｝ú，所首先寻找包含ｗ（ａ７，ａ７）＝｛１，２，３，４，５，８｝的最大圈，Ｙ１＝｛ａ７｝，对应的概念为（１２３４５８，ａ７）。根据５）中①，依次选择Ｗ中的其他元素重复４），概念分别为（１３７９，ａ１），（２４５１０，ａ２），（１５８９，ａ４），（３４６７，ａ６），（２４５，ａ２ａ７），（１５８，ａ４ａ７），（１９，ａ１ａ４），（３７，ａ１ａ６），（１３，ａ１ａ７），（２１０，ａ２ａ５），（６８，ａ３），（３４，ａ６ａ７），（４，ａ２ａ６ａ７），（５，ａ２ａ４ａ７），（８，ａ３ａ４ａ７），（６，ａ３ａ６），（２，ａ２ａ５ａ７），（１，ａ１ａ４ａ７），（３，ａ１ａ６ａ７）。根据５）中②，停止。最后添加（１２３４５６７８９１０，Æ）和（Æ，ａ１ａ２ａ３ａ４ａ５ａ６ａ７）后，得到概念格 β （Ｏ１，Ｍ１，Ｉ１）＝｛（１２３４５６７８９１０，Æ），（１２３４５８，ａ７），（１３７９，ａ１），（２４５１０，ａ２），（１５８９，ａ４），（３４６７，ａ６），（２４５，ａ２ａ７），（１５８，ａ４ａ７），（１９，ａ１ａ４），（３７，ａ１ａ６），（１３，ａ１ａ７），（２１０，ａ２ａ５），（６８，ａ３），（３４，ａ６ａ７），（４，ａ２ａ６ａ７），（５，ａ２ａ４ａ７），（８，ａ３ａ４ａ７），（６，ａ３ａ６），（２，ａ２ａ５ａ７），（１，ａ１ａ４ａ７），（３，ａ１ａ６ａ７），（Æ， ·５２４· 智能系统学报第１１卷

ａ１ａ２ａ３ａ４ａ５ａ６ａ７）｝。在本实例中，步骤２），弱化属性拓扑图，以ｗ（ａ１，ａ１）为例进行复杂度计算，判断是否有ｗ（ａ１，ａ１）Íｗ（ａｉ，ａｊ），其中ｉ，ｊ＝１，２，…，１６，对于ｗ（ａ１，ａ１）进行１６次比较可得ａ１为顶层属性。对每个ｗ ÎＷ重复上述比较过程，可得到弱化的属性拓扑图。３）对任意两个元素ｗｉ，ｗｊÎＷ，ｉ，ｊ＝１，２，…，１６，取交集，此过程需要进行１８ × １７２次，得到Ｗ È｛１｝È ｛３｝，对｛｛１｝，｛３｝｝执行步骤３）中②，此过程进行１次，可以看出符合３）中①，可转４）。４）取Ｗ中的元素ｗ（ａ７，ａ７），判断ｗ（ａ７，ａ７）Íｗ（ａｉ，ａｊ）其中ｉ，ｊ＝１，２，…，２０，每个元素比较２０次，寻找最大圈，得到概念（１２３４５８，ａ７）。５）依次取Ｗ中的其他元素，重复４），在此例Ｗ中的１８个元素，４）需要重复１８次。在复杂度上，本文算法与张涛等的算法相同。并且利用张涛等的算法对（Ｏ１，Ｍ１，Ｉ１）进行概念的计算，得到的概念格与本文算法的结果相同。从而说明了本文算法的有效性与正确性。４结束语本文结合图论的知识，将形式背景对应的属性拓扑图弱化，提出了一种利用权值最大圈寻找概念的算法。与现有的算法比较，本文提出一种新的思路来搜索概念，此外通过弱化的属性拓扑图，对于概念的可视化也得到了很好的体现；通过实例可知，该方法能够有效地构造概念格，为知识获取和数据处理提供了一种有益的思想。通过分析可知，虽然本文提出的算法产生全部概念的空间复杂度降低，但由于其时间复杂度仍为指数级，因此对于数据量较大的情况，计算时间方面需要进一步研究，以便提高应用其进行数据分析的效率。参考文献：［１］ＷＩＬＬＥＲ．Ｒｅｓｔｒｕｃｔｕｒｉｎｇｌａｔｔｉｃｅｔｈｅｏｒｙ：ａｎａｐｐｒｏａｃｈｂａｓｅｄｏｎｈｉｅｒａｒｃｈｉｅｓｏｆｃｏｎｃｅｐｔｓ［Ｍ］／／ＲＩＶＡＬＩ．ＯｒｄｅｒｅｄＳｅｔｓ．Ｄｏｒｄｒｅｃｈｔ：Ｓｐｒｉｎｇｅｒ，１９８２．［２］ＢＥＬＯＨＬＡＶＥＫＲ，ＳＩＧＭＵＮＤＥ，ＺＡＣＰＡＬＪ．ＥｖａｌｕａｔｉｏｎｏｆＩＰＡＱｑｕｅｓｔｉｏｎｎａｉｒｅｓｓｕｐｐｏｒｔｅｄｂｙｆｏｒｍａｌｃｏｎｃｅｐｔａｎａｌｙｓｉｓ［Ｊ］．Ｉｎｆｏｒｍａｔｉｏｎｓｃｉｅｎｃｅｓ，２０１１，１８１（１０）：１７７４－１７８６．［３］ＮＧＵＹＥＮＴＴ，ＨＵＩＳＣ，ＣＨＡＮＧＫｕｉｙｕ．Ａｌａｔｔｉｃｅ－ｂａｓｅｄａｐｐｒｏａｃｈｆｏｒｍａｔｈｅｍａｔｉｃａｌｓｅａｒｃｈｕｓｉｎｇｆｏｒｍａｌｃｏｎｃｅｐｔａｎａｌ⁃ ｙｓｉｓ［Ｊ］．Ｅｘｐｅｒｔｓｙｓｔｅｍｓｗｉｔｈａｐｐｌｉｃａｔｉｏｎｓ，２０１２，３９（５）：５８２０－５８２８．［４］王旭杨，李明．基于概念格的数据挖掘方法研究［Ｊ］．计算机应用，２００５，２５（４）：８２７－８２９．ＷＡＮＧＸｕｙａｎｇ，ＬＩＭｉｎｇ．Ｍｅｔｈｏｄｏｆｄａｔａｍｉｎｉｎｇｂａｓｅｄｏｎｃｏｎｃｅｐｔｌａｔｔｉｃｅ［Ｊ］．Ｃｏｍｐｕｔｅｒａｐｐｌｉｃａｔｉｏｎｓ，２００５，２５（４）：８２７－８２９．［５］ＳＩＦＦＭ，ＲＥＰＳＴ．Ｉｄｅｎｔｉｆｙｉｎｇｍｏｄｕｌｅｓｖｉａｃｏｎｃｅｐｔａｎａｌｙｓｉｓ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＳｏｆｔｗａｒｅＭａｉｎｔｅｎａｎｃｅ．Ｗａｓｈｉｎｇｔｏｎ，ＤＣ，ＵＳＡ：ＩＥＥＥＣｏｍｐｕｔｅｒＳｏｃｉ⁃ ｅｔｙ，１９９７：１７０－１７９．［６］ＦＥＲＪＡＮＩＦ，ＥＬＬＯＵＭＩＳ，ＪＡＯＵＡＡ，ｅｔａｌ．Ｆｏｒｍａｌｃｏｎｔｅｘｔｃｏｖｅｒａｇｅｂａｓｅｄｏｎｉｓｏｌａｔｅｄｌａｂｅｌｓ：ａｎｅｆｆｉｃｉｅｎｔｓｏｌｕｔｉｏｎｆｏｒｔｅｘｔｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎ［Ｊ］．Ｉｎｆｏｒｍａｔｉｏｎｓｃｉｅｎｃｅｓ，２０１２，１８８：１９８－２１４．［７］邓君，马晓君，张巨峰，等．基于概念格的实体档案馆用户行为研究［Ｊ］．图书情报工作，２０１４，５８（１２）：１０９－１１７．ＤＥＮＧＪｕｎ，ＭＡＸｉａｏｊｕｎ，ＺＨＡＮＧＪｕｆｅｎｇ，ｅｔａｌ．Ｓｔｕｄｙｏｎｅｎｔｉｔｙａｒｃｈｉｖｅｓ’ ｕｓｅｒｂｅｈａｖｉｏｒｂａｓｅｄｏｎｃｏｎｃｅｐｔｌａｔｔｉｃｅ［Ｊ］．Ｌｉｂｒａｒｙａｎｄｉｎｆｏｒｍａｔｉｏｎｓｅｒｖｉｃｅ，２０１４，５８（１２）：１０９－１１７．［８］张晓，龙伟，卢斌．基于概念格的关联规则在排产管理的应用［Ｊ］．计算机工程与应用，２０１４，５０（９）：２６４－２７０．ｖＺＨＡＮＧＸｉａｏ，ＬＯＮＧＷｅｉ，ＬＵＢｉｎ．Ａｐｐｌｉｃａｔｉｏｎｏｆａｓｓｏｃｉａｔｉｏｎｒｕｌｅｂａｓｅｄｏｎｃｏｎｃｅｐｔｌａｔｔｉｃｅｆｏｒｓｃｈｅｄｕｌｉｎｇｍａｎ⁃ ａｇｅｍｅｎｔ［Ｊ］．Ｃｏｍｐｕｔｅｒｅｎｇｉｎｅｅｒｉｎｇａｎｄａｐｐｌｉｃａｔｉｏｎｓ，２０１４，５０（９）：２６４－２７０．［９］张涛，任宏雷．形式背景的属性拓扑表示［Ｊ］．小型微型计算机系统，２０１４，３５（３）：５９０－５９３．ＺＨＡＮＧＴａｏ，ＲＥＮＨｏｎｇｌｅｉ．Ａｔｔｒｉｂｕｔｅｔｏｐｏｌｏｇｙｏｆｆｏｒｍａｌｃｏｎｔｅｘｔ［Ｊ］．ＪｏｕｒｎａｌｏｆＣｈｉｎｅｓｅｃｏｍｐｕｔｅｒｓｙｓｔｅｍｓ，２０１４，３５（３）：５９０－５９３．［１０］ＢＥＲＲＹＡ，ＳＩＧＡＹＲＥＴＡ．Ｒｅｐｒｅｓｅｎｔｉｎｇａｃｏｎｃｅｐｔｌａｔｔｉｃｅｂｙａｇｒａｐｈ［Ｊ］．Ｄｉｓｃｒｅｔｅａｐｐｌｉｅｄｍａｔｈｅｍａｔｉｃｓ，２００４，１４４（１／２）：２７－４２．［１１］李立峰，刘三阳，罗清君．弦二部图的概念格表示［Ｊ］．电子学报，２０１３，４１（７）：１３８４－１３８８．ＬＩＬｉｆｅｎｇ，ＬＩＵＳａｎｙａｎｇ，ＬＵＯＱｉｎｇｊｕｎ．Ｒｅｐｒｅｓｅｎｔｉｎｇｃｈｏｒ⁃ ｄａｌｂｉｐａｒｔｉｔｅｇｒａｐｈｕｓｉｎｇｃｏｎｃｅｐｔｌａｔｔｉｃｅｔｈｅｏｒｙ［Ｊ］．Ａｃｔａｅｌｅｃｔｒｏｎｉｃａｓｉｎｉｃａ，２０１３，４１（７）：１３８４－１３８８．［１２］ＤＡＶＥＹＢＡ，ＰＲＩＥＳＴＬＥＹＨＡ．Ｉｎｔｒｏｄｕｃｔｉｏｎｔｏｌａｔｔｉｃｅｓａｎｄｏｒｄｅｒ［Ｍ］．２ｎｄｅｄ．ＮｅｗＹｏｒｋ：ＣａｍｂｒｉｄｇｅＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，２００２：６６－６９．［１３］王树禾．图论［Ｍ］．北京：科学出版社，２００９．［１４］ＺＨＡＮＧＴａｏ，ＲＥＮＨｏｎｇｌｅｉ，ＷＡＮＧＸｉａｏｍｉｎ．Ａｃａｌｃｕｌａ⁃ ｔｉｏｎｏｆｆｏｒｍａｌｃｏｎｃｅｐｔｂｙａｔｔｒｉｂｕｔｅｔｏｐｏｌｏｇｙ［Ｊ］．ＩＣＩＣｅｘ⁃ ｐｒｅｓｓｌｅｔｔｅｒｓｐａｒｔＢ：ａｐｐｌｉｃａｔｉｏｎｓ，２０１３，４（３）：７９３－８００．［１５］方嘉琳．集合论［Ｍ］．长春：吉林人民出版社，１９８２．作者简介：毛华，女，１９６３年生，教授，博士，主要研究方向为计算机数学及其应用、拟阵理论、离散数学。发表学术论文９０余篇，其中被ＳＣＩ、ＥＩ检索２０余篇。第４期毛华，等：基于权值最大圈的概念格构造算法 ·５２５·