基于数据立方体的维内关联规则挖掘算法

针对数据立方体的结构特点,结合联机分析处理技术,提出了两种基于数据立方体的维内关联规则挖掘算法.以合肥农河超市实际数据作为测试数据,给出了两种算法的实验结果.结果表明,两种算法在不同支持度情况下执行效率存在明显差异,分别适合在高支持度和低支持度情况下进行关联规则挖掘.

团购合买资源类别：文库，文档格式：PDF，文档页数：4，文件大小：582.4KB

D0I:10.13374/i.issm1001053x.2003.01.023 第25卷第1期北京科技大学学报 Vol.25 No.1 2003年2月 Journal of University of Science and Technology Beijing Feb.2003 基于数据立方体的维内关联规则挖掘算法杨学兵”蔡庆生” 1)安徽工业大学计算机科学系，马鞍山2430022)中国科技大学计算机科学系，合肥230027 摘要针对数据立方体的结构特点，结合联机分析处理技术，提出了两种基于数据立方体的维内关联规则挖掘算法.以合肥农河超市实际数据作为测试数据，给出了两种算法的实验结果，结果表明，两种算法在不同支持度情况下执行效率存在明显差异，分别适合在高支持度和低支持度情况下进行关联规则挖掘. 关键词知识发现；数据挖掘：关联规则：数据仓库；数据立方体；多维分析分类号TP311;TP132.3 数据库中知识发现(Knowledge Discovery in 形如：A八A2N…AA,一BAB2A…AB(4%,70%)意味 Databases,简称KDD)是目前人工智能和数据库相着目标数据中客体B,B,,B,倾向于同客体交叉的一个热门研究领域，已经受到越来越多的 A,A,…,A,一起出现.其中4%为关联规则的支持关注I.数据挖掘(Data Mining,简称DM)是KDD 度，70%为关联规则的信任度的一个十分重要的步骤，其内容涉及各种知识模 1.2 Apriori性质式的提取算法.关联规则是数据库中存在的一 Apriori算法"采用的是迭代方法，需要多遍种知识模式，其挖掘算法已得到了广泛的重视，扫描事务数据库，为了提高频繁项目集的产生效并取得了较大的进展.数据仓库技术(Data Ware- 率，可利用一个重要的Apriori性质来减少项目搜 house Techniques)、联机分析处理(Online Analy- 索空间. tical Processing,简称OLAP)和多维数据立方体定理l(Apriori性质)一个频繁项目集的所 (Muti-Dimensional Data Cube)等也是近年来涌现有非空子集必需也是频繁项目集®.这一性质是出的一些更有效地对数据进行组织、存贮：、分析由Agrawal和Srikant提出并得以证明的. 和处理的新方法川.维内关联规则是指在数据立根据这一性质，进行第k次扫描之前，可先方体中同一属性维内各项目之间存在的关联规产生候选集C.C可以分两步来产生，设前一次则，通过对传统关联规则挖掘算法进行改进，给 (第k-1次)已生成k频繁集L,则首先可以通过出基于数据立方体的多维关联规则挖掘算法.由对L,中的成员进行联接来产生候选，L-中的两于现有的OLAP技术已容许构建数据立方体，且个成员必需满足在两个成员的项目中有k一2个数据立方体内已有各项目出现次数的统计，因项目是相同的这个条件方可联接，即：此可通过读取其统计数据来确定频繁项目集，使 .L-eL-1=(40B4,BCL-1,AOBI=k-2) 挖掘过程效率大大提高. 接着再从C中删除所有包含不是频繁的 (k一1)子集的成员项目集即可 1相关概念 13数据立方体 1.1关联规则数据立方体是指含有多维属性的统计实体，关联规则概念首先由Agrawal等提出s.所谓设为n维，每维共有d,+1个值，其中d是指第i维关联规则，是指客体之间的相互关系.关联规则中互不相同的属性值，每维中再加上一个"Ay" 值，共d+1个不同值收稿日期20010104杨学兵男.35岁，副数授假设存在一个n维空间，则由每一维中各取 *国家自然科学基金项目资助(N0.60075015)和安徽省教育一个具体的属性值，则可对应一个n维空间中的厅科研经费资助(No.2002KJ046)

第卷第期年月北京科技大学学报饱。基于数据立方体的维内关联规则挖掘算法杨学兵 ” 蔡庆生，安徽工业大学计算机科学系，马鞍山中国科技大学计算机科学系，合肥摘要针对数据立方体的结构特点，结合联机分析处理技术，提出了两种基于数据立方体的维内关联规则挖掘算法以合肥农河超市实际数据作为测试数据，给出了两种算法的实验结果结果表明，两种算法在不同支持度情况下执行效率存在明显差异，分别适合在高支持度和低支持度情况下进行关联规则挖掘关键词知识发现数据挖掘关联规则数据仓库数据立方体多维分析分类号数据库中知识发现叮，简称是目前人工智能和数据库相交叉的一个热门研究领域，已经受到越来越多的关注 ‘，数据挖掘，简称是的一个十分重要的步骤，其内容涉及各种知识模式的提取算法 ’ 、关联规则是数据库中存在的一种知识模式，其挖掘算法已得到了广泛的重视，并取得了较大的进展数据仓库技术认叫、联机分析处理 · ，简称和多维数据立方体一等也是近年来涌现出的一些更有效地对数据进行组织、存贮、分析和处理的新方法 ’ 维内关联规则是指在数据立方体中同一属性维内各项目之间存在的关联规则，通过对传统关联规则挖掘算法进行改进，给出基于数据立方体的多维关联规则挖掘算法由于现有的技术已容许构建数据立方体，且数据立方体内已有各项目出现次数的统计 “ ，，因此可通过读取其统计数据来确定频繁项目集，使挖掘过程效率大大提高相关概念关联规则关联规则概念首先由等提出下所谓关联规则，是指客体之间的相互关系关联规则收稿日期一刁杨学兵男，岁，副教授国家自然科学基金项目资助和安徽省教育厅科研经费资助形如八二法一八 … ，，意味着目标数据中客体，刀，’ ，倾向于同客体】，瓜， … ，法一起出现其中为关联规则的支持度，为关联规则的信任度性质算法 ’ 采用的是迭代方法，需要多遍扫描事务数据库为了提高频繁项目集的产生效率，可利用一个重要的。汁胜质来减少项目搜索空间定理性质一个频繁项目集的所有非空子集必需也是频繁项目集〔，这一性质是由和提出并得以证明的根据这一性质，进行第次扫描之前，可先产生候选集可以分两步来产生，设前一次第一次已生成频繁集，则首先可以通过对一、中的成员进行联接来产生候选，及一，中的两个成员必需满足在两个成员的项目中有一个项目是相同的这个条件方可联接，即 · 一及一阵方及一，，冈川一 ‘ 接着再从中删除所有包含不是频繁的一子集的成员项目集即可数据立方体数据立方体是指含有多维属性的统计实体，设为维，每维共有圆个值，其中圆是指第维中互不相同的属性值，每维中再加上一个 ” ” 值，共个不同值，假设存在一个维空间，则由每一维中各取一个具体的属性值，则可对应一个维空间中的 DOI ：10．13374／j ．issn1001－053x．2003．01．023

·84 北京科技大学学报 2003年第1期点，这个点称为方格.每个方格内存贮了与其对 itemset的候选集C,及l-itemset频繁集L,k=k+l. 应的各属性的值同时出现的次数，用count表示. 步骤3，重复利用频繁Lk-,生成中k-itemset候选集三维数据立方体如图1所示. Ck,再利用C.生成k-itemsets频繁集Lk,直至L=O. (I)利用L产生候选集C的子过程. 输人：Lk Any 62 35 97 输出：C Carry Bag 30 20 50 步骤1，先置C=O.步骤2，利用Apriori性质， Any Tents 32 15 47 West 重复对L-,中的长度为k-2且有k-3个项目相同 ation Clood Poor Any South 的频繁集进行两两连接，连接结果加入Ck. Profit (2)利用候选集C产生频繁集L的子过程. 图1数据立方体示意图输入：kC Fig.1 Sketch map of the data cube 输出：L. 2算法描述步骤1，先置L=O.步骤2，重复对候选集C 中的每个候选，通过OLAP引擎取得其对应的计维内关联规则是指在一个维内存在的关联数值，检查其是否满足最小支持度.若满足，则加规则，这个维称为项目维周.项目维内的项目通过人L 另外一个维来分组，形成一个个的事务，这另外 (3)算法分析. 的一个维称为事务维.因此，维内关联规则涉及算法的第一部分通过利用Apriori性质，即对到两个维.于是可以通过OLAP引擎创建一个两每两个(k-1)-itemset频繁项目集，若其有(k-2)个维的数据立方体作为工作数据立方体，以便用来共同项目，则可对这两个项目集进行连接作为一进行数据挖掘.下面以一个例子来说明. 个k-itemset,再通过判断此k-itemset的每个子集是例：用Sales数据库中Location作为事务维，否均为频繁项目集以确定其候选身份.如果任一 Product作为项目维，则相应的二维数据立方体如子集不为频繁项目集，则此k-itemset就不能作为图2所示.根据立方体的定义，每一个格子保存候选项目集.测试子集的次数可由了从原始关系中产生的计数(count)值 2-6Ls-×k-2》 (1) Any 70 ■185 175 70 500■ 来计算，其中n是可能的最多候选项目集数量， Alert devices 20 20 40 Lk-,eLt-,是指由(k-l)-itemset产生的k-itemset的数 Carry-bags 10 100 110 220 量.因为相连接的两个(k-l)-itemset本身是频繁 Sport wea 20 60 40 的，因此在检查时，只需对除此两个之外的其他 Tents 45 (k-2)个(k-1)子集检查即可. Water purifiers 20 25 30 75 算法的第二部分主要是扫描数据立方体，扫 Tokyo Seattle Mexic Hong Kong Any 描的循环次数取决于计算每个候选的支持度时 Location 所涉及到的方格数量，具体可通过图2一个用于挖掘维内关联规则的数据立方体 Fig.2 An example of the 2-dimensional data cube (Ck-transactions) (2) 1 来计算，其中C是候选集C中候选的个数，基于这一立方体的维内关联规则挖掘的算世ransactions是数据立方体中事务的数量法过程与Apriori算法十分相似，所不同的是对每根据式(1)和(2)，此算法的时间复杂度可大一候选项目集的支持度计算是通过对数据立方略地分为两个部分：检查子集是否频繁和扫描数体的一部分进行扫描，而不是对事务数据库中的据立方体.对于一个固定的最小支持度，上面两事务表.下面给出这一算法的描述个公式中的可变部分只有三个，即忆k-日L,C 2.1由Apriori改进的维内频繁集生成算法（算法1）和n,而影响这几个值的主要因素取决于数据立输入：一个二维数据立方体Cube[transactios, 方体的事务维和项目维的大小，两者越大，耗时 items].最小支持度min_supp 越多输出：维内频繁项目L 另一个基于数据立方体的维内关联规则挖步骤1，初始化，置k=1,L=O.步骤2，生成1-

北京科技大学学报年第期点，这个点称为方格每个方格内存贮了与其对应的各属性的值同时出现的次数，用。表示三维数据立方体如图所示屡 ” “ 蒙翼翼翼薰霎刀矍介瓦不七磊一骂犷图数据立方体示意图 · 算法描述维内关联规则是指在一个维内存在的关联规则，这个维称为项目维‘川项目维内的项目通过另外一个维来分组，形成一个个的事务，这另外的一个维称为事务维因此，维内关联规则涉及到两个维于是可以通过引擎创建一个两维的数据立方体作为工作数据立方体，以便用来进行数据挖掘下面以一个例子来说明例用数据库中作为事务维，作为项目维，则相应的二维数据立方体如图所示根据立方体的定义，每一个格子保存了从原始关系中产生的计数值的候选集及卜讹频繁集乙，步骤，重复利用频繁几一生成中候选集，再利用生成频繁集，直至户必利用及一，产生候选集的子过程输人一， · 输出步骤，先置步骤，利用州性质，重复对一，中的长度为一且有一个项目相同的频繁集进行两两连接，连接结果加人利用候选集产生频繁集的子过程输入，输出步骤，先置产步骤，重复对候选集中的每个候选，通过引擎取得其对应的计数值，检查其是否满足最小支持度若满足，则加入 ‘ 算法分析算法的第一部分通过利用性质，即对每两个一频繁项目集，若其有一个共同项目，则可对这两个项目集进行连接作为一个，再通过判断此的每个子集是否均为频繁项目集以确定其候选身份如果任一子集不为频繁项目集，则此不就不能作为候选项目集测试子集的次数可由艺卜卜卜一一图一个用于挖掘维内关联规则的数据立方体一加基于这一立方体的维内关联规则挖掘的算法过程与算法十分相似，所不同的是对每一候选项目集的支持度计算是通过对数据立方体的一部分进行扫描，而不是对事务数据库中的事务表下面给出这一算法的描述由改进的维内频繁集生成算法算法输人一个二维数据立方体，最小支持度林输出维内频繁项目步骤，初始化，置，步骤，生成来计算，其中是可能的最多候选项目集数量，及一及一，是指由一卜产生的的数量因为相连接的两个一一本身是频繁的，因此在检查时，只需对除此两个之外的其他一个一子集检查即可算法的第二部分主要是扫描数据立方体，扫描的循环次数取决于计算每个候选的支持度时所涉及到的方格数量，具体可通过卜艺】卜 ’ 来计算，其中是候选集中候选的个数，是数据立方体中事务的数量根据式和，此算法的时间复杂度可大略地分为两个部分检查子集是否频繁和扫描数据立方体对于一个固定的最小支持度，上面两个公式中的可变部分只有三个，即陈一及一，和而影响这几个值的主要因素取决于数据立方体的事务维和项目维的大小，两者越大，耗时越多另一个基于数据立方体的维内关联规则挖

Vol.25 No.1 杨学兵等：基于数据立方体的维内关联规则挖掘算法 ·85· 掘算法是通过对文献[10]中提出的算法进行改进集，它不同于算法1.算法1每次扫描时只处理一得来的，算法仅需两次扫描数据立方体种长度的项目集，而算法2在一次扫描时需处理 2.2新的维内频繁集生成算法（算法2）多种长度的项目集，算法2在处理每个事务时，输人：数据立方体C(transactions,items),C中事也用到了Apriori性质，这样就避免了对所有长度务维中事务已按顺序编号，ISC=☑ 的项目进行处理，而只处理那些最有可能成为频输出：频繁项目集ISC 繁集的项目.很显然，单次扫描，其耗时是多于算步骤1，执行PHASE I;步骤2，执行PHASEⅡ；法1，但由于算法1需扫描二维立方体以处理多步骤3，输出SC 种长度的项目集，其总耗时会随着扫描次数的增其中子过程如下：加而迅速增加.算法2的第二次扫描仅仅是求精 (I)PHASE I(第一次扫描). 频繁集，因此第二次扫描耗时比第一次扫描耗时输人：数据立方体C(transactions,items),C中要少事务维各事务依次编号，总事务数为n.Min sup pot为用户给定的最低支持度，实验输出：可能频繁集1SC 步骤1，初始化.ISC-),curr trans-0;步骤2，实验在P2机器上进行，操作系统是Windows 对二维立方体中count>0(通过OLAP引擎得到)的 98,数据库采用SQL Server7.0数据库，算法用C+ 每个事务T进行以下操作 +Builder5.0来实现，被测数据是合肥市农河超市 ①增加计数.对所有属于SC的T的子集，其的实际营业数据，以购买的商品名称作为项目在ISC中的对应count+-. 维，购买序号作为事务维，具体见表1. ②插人新结点.对所有不属于ISC的T的子算法1和2对Sales挖掘结果的比较如图3所集1，若t的所有子集t均在ISC中，则将t加人ISC 示.表2为两算法执行的具体结果数据中，并置表1实验用测试数据 max missed () Table 1 Test data min {(curr_trans-1).min_support,max_missed Sales数据/个总事务数/个记录个数/个 (t )+count (f)fCt) 2000 2000 7418 5000 node.itemset=t,node.count=1,node.firstposition= 5000 16645 10000 10000 28971 curr trans. ③修剪.对ISC中的所有项目集，计算其最大可能支持度，若不满足支持度条件，则将其从SC 2500 2000 中删除.最大可能支持度通过下式得到： max prop_support()-max missed()count() 算法1 curr trans 1000 (2)PHASEⅡ（第二次扫描） 800 输入：数据立方体C,可能频繁集ISC. 600 算法2 400 输出：频繁项目集SC. 200 步骤：对于二维立方体C中的每个count>0的 0.5 0.2 0.1 0.05 事务T,进行如下操作最小支持度% 对于所有属于SC的T的子集：，若当前事务图3算法1和2对Sales挖掘执行性能的比较号小于ISC中对应的firstposition,则其ISC中相应 Fig.3 Comparison of mining efficiency between the two algorithms 的counti+,max_missed--;若当前事务号等于 ISC中对应的firstposition,则置ISC中相应的max 从图3中可以看出，在最小支持度较大时，两 missed--O,此时计算其支持度，若小于最小支持算法执行时间较为接近，相比之下，算法1执行度，则从ISC中删除t及所有以1为子集的项目集. 时间比算法2要短.这主要是由于在最小支持度 (3)算法分析较大时，产生的频繁集数目较少，k-itemset中的k 算法2在第一次扫描时，产生估计频繁项目值很小，甚至≤2.在这种情形下，它对立方体的

公杨学兵等基于数据立方体的维内关联规则挖掘算法掘算法是通过对文献【中提出的算法进行改进得来的，算法仅需两次扫描数据立方体新的维内频繁集生成算法算法输入数据立方体，，中事务维中事务已按顺序编号，输出频繁项目集步骤，执行步骤，执行步骤，输出其中子过程如下以第一次扫描输人数据立方体，，中事务维各事务依次编号，总事务数为为用户给定的最低支持度输出可能频繁集步骤，初始化， ’ 步骤，对二维立方体中。通过引擎得到的每个事务丁进行以下操作 ①增加计数对所有属于的的子集，其在中的对应 ②插入新结点对所有不属于的的子集，若的所有子集均在中，则将加人中，并置一 ’ 一 · ， ’ ‘ ，，仃 ③修剪，对中的所有项目集，计算其最大可能支持度，若不满足支持度条件，则将其从中删除最大可能支持度通过下式得到集，它不同于算法算法每次扫描时只处理一种长度的项目集，而算法在一次扫描时需处理多种长度的项目集算法在处理每个事务时，也用到了性质，这样就避免了对所有长度的项目进行处理，而只处理那些最有可能成为频繁集的项目很显然，单次扫描，其耗时是多于算法，但由于算法需扫描二维立方体以处理多种长度的项目集，其总耗时会随着扫描次数的增加而迅速增加算法的第二次扫描仅仅是求精频繁集，因此第二次扫描耗时比第一次扫描耗时要少实验实验在机器上进行，操作系统是，数据库采用数据库，算法用十来实现，被测数据是合肥市农河超市的实际营业数据，以购买的商品名称作为项目维，购买序号作为事务维，具体见表算法和对挖掘结果的比较如图所示表为两算法执行的具体结果数据表实验用测试数据尸介 ’ 数据个总事务数个记录个数个一算法夕汀第二次扫描输人数据立方体，可能频繁集输出频繁项目集步骤对于二维立方体中的每个。的事务，进行如下操作对于所有属于的的子集，若当前事务号小于中对应的，则其中相应的。，一一若当前事务号等于中对应的，则置中相应的企，此时计算其支持度，若小于最小支持度，则从中删除及所有以为子集的项目集算法分析算法在第一次扫描时，产生估计频繁项目，最小支持度图算法和对挖掘执行性能的比较 · 从图中可以看出，在最小支持度较大时，两算法执行时间较为接近，相比之下，算法执行时间比算法要短这主要是由于在最小支持度较大时，产生的频繁集数目较少，今中的值很小，甚至 ‘ 在这种情形下，它对立方体的

·86· 北京科技大学学报 2003年第1期表2实验中两算法执行情况对比表 Table 2 Mining results of the two algorithms 最小支 ARMLD Aprior 产生规持度%第一次估计集数目/个第二次精确集数目/个执行时间s扫描次数/次频繁集数目/个执行时间s则数 0.50 893 117 276 117 193 0 0.20 2266 406 370 2 406 205 0 0.10 4717 893 508 4 893 453 18 0.08 5788 I155 563 5 1155 637 108 0.05 9064 2065 807 8 2065 2619 1483 注：事务数为10000，记录数为28971 扫描次数≤2，且每次扫描立方体只检查相应的k tures,2001.369 -itemset,所以这种情况下，其执行时间必少于算 3欧阳为民，蔡庆生，发现广义序贯模式的增量式更新法2.但随着最小支持度的减小，频繁项目集数量技术.软件学报，1998,910：777 4 Gray J,Chaudhuri S,Bosworth A,et al.Data cube:a rela- 变大，k-itemset中的k值也不断变大，从而导致算 tional aggregation operator generalizing group-by,cross- 法1对立方体的扫描次数>2次，且随着k的增 tab,and sub-totals [J].Data Mining and Knowledge Dis- 大，事务的k子集数目也变得很大，因而算法执行 covery,1997,1(1:29 时间也迅速增加，这从图3中可以看出，其曲线 5 Agrawal R,Imielinski T,Swami A.Mining association 上扬的角度变大，而算法2无论最小支持度多 rules between sets of items in large databases [A].Proc 1993 ACM-SIGMOD Int Conf Management of Data [C]. 大，均需扫描数据库2次，且对每个事务需检查 Washington DC,1993.207 其所有子集，因此时间消耗较大.但随着最小支 6 Agrawal R,Srikant R.Fast algorithms for mining associ- 持度的减小，由于算法2并未因此增加对立方体 ation rules [A].Proc 1994 Int Conf very Large Data Bases 的扫描次数，仅仅是由于最小支持度减小而导致 [C].Santiago 1994.487 了频繁项目集的增加，从而增加了对每个事务的 7裴健，柴玮，唐世谓，等.联机分析处理数据立方体代数[J1.软件学报，1999,10(6：561 处理时间，而这种变化虽然影响到算法的执行时 8 Dong GZ,Han J W,Joyce M W,et al.Mining Multi-di- 间，但远不如算法1增加的迅速，因而从图形上 Mensional Constrained Gradients in Data Cubes [M].Very 看，其走势相对平缓，这正是算法2的特点所在. Large Data Base,2001:321 9 Lu H J,Feng L,Han J W.Beyond intratransaction associ- 参考文献 ation analysis:mining multidimensional intertransaction I Bischoff Joyce,.Alexander Ted著.成栋，魏立原译.数 association rules [J].Association for Computing Machin- 据仓库技术M北京：电子工业出版社，1998 ery Transactions on Office Information System,2000,18 2 Li W M.Han J W.Pei J.CMAR:Accurrate and Efficient (4):423 Classification Based on Multiple Class-association Rules I0杨学兵，高俊波，蔡庆生，可增量更新的关联规则挖 [M].The International Confederation of Drum Manufac- 掘算法[J.小型微型计算机，2000(6)：611 Algorithms for Data Cube-Based Intra-dimensional Association Rules Mining YANG Xuebing",CAl Oingsheng 1)Computer Science Department,Anhui University of Technology,Ma'an shan 243002,China 2)Computer Science Department,University of Science and Technology of China,Hefei 230027,China ABSTRACT Two algrithms for data cube-based intra-dimensional association rules mining are proposed by lu- cubrating into the structure of data cube and integrating with the technology of online analytical processing.Experi- ment results show that the two algorithms are respectively suitable for different support-constrained association ru- les mining. KEY WORDS knowledge discovery;data mining;association rule;data warehouse;data cube;multi-dimen- sional analysis

北京科技大学学报年第期表实验中两算法执行情况对比表俪最小支产生规持度第一次估计集数目个第二次精确集数目个执行时间扫描次数次频繁集数目个执行时间则数﹃川︸内‘内︸一、︶、︸、，同﹄谷内，一洲声，‘山、︸口注事务数为，记录数为扫描次数 ‘ ，且每次扫描立方体只检查相应的一，所以这种情况下，其执行时间必少于算法但随着最小支持度的减小，频繁项目集数量变大，中的值也不断变大，从而导致算法对立方体的扫描次数次，且随着的增大，事务的子集数目也变得很大，因而算法执行时间也迅速增加，这从图中可以看出，其曲线上扬的角度变大而算法无论最小支持度多大，均需扫描数据库次，且对每个事务需检查其所有子集，因此时间消耗较大但随着最小支持度的减小，由于算法并未因此增加对立方体的扫描次数，仅仅是由于最小支持度减小而导致了频繁项目集的增加，从而增加了对每个事务的处理时间，而这种变化虽然影响到算法的执行时间，但远不如算法增加的迅速，因而从图形上看，其走势相对平缓，这正是算法的特点所在参考文献作，著成栋，魏立原译数据仓库技术」北京电子工业出版社，，，一，欧阳为民，蔡庆生发现广义序贯模式的增量式更新技术软件学报，，盯，，，一，，一助，，凡，一认恤，，肠「裴健，柴玮，唐世渭，等联机分析处理数据立方体代数软件学报，，，，，一，，，一，，杨学兵，高俊波，蔡庆生可增量更新的关联规则挖掘算法小型微型计算机，一一雌，，岁心，别，，，，，，，加一 · 吃一一

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录

基于数据立方体的维内关联规则挖掘算法