数据发掘与数据库中知识发现

对数据发掘发展的研究现状及知识发现系统的研究趋势进行分析与探索,在此基础上从一般框架和特定问题的结合上提出新的构想.

团购合买资源类别：文库，文档格式：PDF，文档页数：4，文件大小：500.66KB

D0I:10.13374/i.issn1001-053x.1999.02.058 第21卷第2期北京科技大学学报 Vol.21 No.2 1999年 2月 Journal of University of Science and Technlogy Beijing Apr.1999 数据发掘与数据库中知识发现杨炳儒刘发升北京科技大学信息工程学院，北京100083 摘要对数据发掘发展的研究现状及知识发现系统的研究趋势进行分析与探索，在此基础上从一般框架和特定问题的结合上提出新的构想，关键词数据发掘；数据库；知识库；知识发现系统分类号TP18,TP391 数据发掘(Data Mining)是指对真实数据库 1数据发掘的知识种类 (具有大数据量、不完全性、不确定性、结构性、稀疏性等特征)中数据所隐藏的、先前未知的及具 1.1关联规则(association rules) 有潜在应用价值的信息进行非平凡抽取，这些信关联规则是类似于下列形式的规则：“AA… 息包括知识规则、约束和正则性等等”，通过数据 AAn→B,A…ABn”,这里A(ie{1,…,n}与B,e 发掘，感兴趣的知识、正则性或高层信息可以从 {1,“,m})是属性值的集合，这些属性值来源于数据库相关数据集中抽取出来并从不同角度进数据库中一组相关数据.例如，人们可能发现，从行研究. 一大组交易数据中，有如以下的规则：在一次交数据发掘（或KDD)已经并将继续与犹如机易中，如果一个顾客买一种品牌的牛奶，她（他）器学习、模式识别、数据库、数理统计、人工智能、通常买另一品牌的面包，股票市场也常有关联专家系统知识获取、数据可视化以及高性能计算现象的出现，等领域的交叉研究相联系.统一的目标是从大数 1.2分类规则(classif近cation rules) 据库的原始粗糙的数据中提取高级别的知识，数据发掘的一个重要应用是对巨量数据进在具体的数据发掘的研究领域，数据发掘与机器行分类.数据分类是基于一组数据的某些属性的学习及模式识别交迭在一起；数据发掘集中在寻值进行的，例如，一个汽车经销商需要按对汽车找可解释为有用或者感兴趣的知识的可理解摸的喜好对倾客进行分类以使销售人员知道接近式上.在探索性的数据分析方法中，数据发掘采谁，新型号的汽车目录可以直接邮给那些需要标用了很多统计方法；与统计学的传统方法相比，识特征的顾客以便寻求最大的商业机会山. 数据发掘更多地采用模型抽取方法2~引.数据发 l.3数据聚类(data clustering) 掘是为了面向应用领域的研究.对特定的应用领它的基本思想是，在对数据进行分析的过程域，特定的数据发掘技术将会涉及到各种不同的中，在考虑数据间的“距离”的同时，更侧重考虑领域，开拓特定的研究方法的应用，某些数据间具有类的共同内涵基本上，数据聚类近年来，随着大型专家系统与复杂巨系统研是对1组数据进行分组，这种分组基于如下的原究的深人发展，KDD(Knowledge Discovery in 理：最大的组内相似性和最小的组间相似性. Databases)的扩展性研究势在必行.为此本文提 1.4序列规则(sequence rules,sequential 出一类构建在数据库与知识库综合基上的知识 atterns) 发现系统（视为KDD的扩体）的新构想，并对其可用如下的例子描述序列规则（或称为时序应用进行研究，模式)：一个顾客租看影片“Star Wars',然后租 “Empire Strikes Back”,再租“Return of the 1998-1003收稿杨炳儒男，54岁，数授，博导 Judi”;注意到这些租借事物的发生不一定是连着 *国家基金会资助对外交流与合作项目(N0.69950120130) 的.像这样一次事件的发生会导致某些事件的相

第卷，年第期月北京科技大学学报却一数据发掘与数据库中知识发现杨炳儒刘发升北京科技大学信息工程学院，北京摘要对数据发掘发展的研究现状及知识发现系统的研究趋势进行分析与探索，在此基础上从一般框架和特定问题的结合上提出新的构想关键词数据发掘数据库知识库知识发现系统分类号，数据发掘是指对真实数据库具有大数据量、不完全性、不确定性、结构性、稀疏性等特征中数据所隐藏的、先前未知的及具有潜在应用价值的信息进行非平凡抽取，这些信息包括知识规则、约束和正则性等等川通过数据发掘，感兴趣的知识、正则性或高层信息可以从数据库相关数据集中抽取出来并从不同角度进行研究数据发掘或已经并将继续与犹如机器学习、模式识别、数据库、数理统计、人工智能、专家系统知识获取、数据可视化以及高性能计算等领域的交叉研究相联系统一的目标是从大数据库的原始粗糙的数据中提取高级别的知识在具体的数据发掘的研究领域，数据发掘与机器学习及模式识别交迭在一起数据发掘集中在寻找可解释为有用或者感兴趣的知识的可理解模式上在探索性的数据分析方法中，数据发掘采用了很多统计方法与统计学的传统方法相比，数据发掘更多地采用模型抽取方法〔卜’ 数据发掘是为了面向应用领域的研究对特定的应用领域，特定的数据发掘技术将会涉及到各种不同的领域，开拓特定的研究方法的应用近年来，随着大型专家系统与复杂巨系统研究的深人发展，肋肠卿的扩展性研究势在必行为此本文提出一类构建在数据库与知识库综合基上的知识发现系统视为的扩体的新构想，并对其应用进行研究一一收稿杨炳儒男，岁，教授，博导国家基金会资助对外交流与合作项目数据发掘的知识种类关联规胜关联规则是类似于下列形式的规则 “ ，二入凡，“ ‘ 二 “ 军，这里燕汇卜一。与乓仃‘ ， … ，是属性值的集合，这些属性值来源于数据库中一组相关数据例如，人们可能发现，从一大组交易数据中，有如以下的规则在一次交易中，如果一个顾客买一种品牌的牛奶，她他通常买另一品牌的面包川股票市场也常有关联现象的出现分类规则，，一数据发掘的一个重要应用是对巨量数据进行分类数据分类是基于一组数据的某些属性的值进行的例如，一个汽车经销商需要按对汽车的喜好对顾客进行分类以使销售人员知道接近谁，新型号的汽车目录可以直接邮给那些需要标识特征的顾客以便寻求最大的商业机会川数据聚类一它的基本思想是，在对数据进行分析的过程中，在考虑数据间的 “ 距离 ” 的同时，更侧重考虑某些数据间具有类的共同内涵基本上，数据聚类是对组数据进行分组，这种分组基于如下的原理最大的组内相似性和最小的组间相似性川序列规则一，可用如下的例子描述序列规则或称为时序模式一个顾客租看影片 “ ” ，然后租 “ ，再租 “ ” 注意到这些租借事物的发生不一定是连着的像这样一次事件的发生会导致某些事件的相 DOI ：10．13374／j ．issn1001－053x．1999．02．058

Vol.21 No.2 杨炳儒等：数据发掘与数据库中知识发现 ·203· 1.5相似(similarity)模式理非完全信息的方法，时态(temporal)或空间-时态(spatio-temporal) ④提出了一整套的知识表示、数据表示及数的数据大量存在于计算机中，这些数据库例子包据操作与知识发现的方法，括：股票价格指数的金融数据库、医疗数据库、多 ⑤在强规则的发掘及空间数据库的发掘上媒体数据库，等等.在时态或空间·时态数据库中对提出的方法进行了检验，搜索相似模式是为发现和预测风险、因果联系及 G.Shafer的证据理论、Zadeh的可信度理论关联于特定模式的趋势川和最近国内发展起来的未确知数学都是关于不根据数据发掘的不同应用对象，还有许多其完全信息的表达与处理的系统方法，本框架基于他的与特定应用领域相关的知识的发掘，但大多可信度理论可望对不完全信息的数据发掘提供数目前的研究应用，其发掘的知识的种类可以归系统的方法，基于证据理论在数据发掘中的应用纳为上述几种. 还有一些其他的研究，如文献[9]；关于不完全信息的数据发掘也有一些研究，如文献[10]. 2数据发掘方法与技术 (3)针对目前各种各样的数据发掘技术，在在数据发掘的研究与开发上已有很多进展， Wei-Ming Shen与Bing Leng提出了无监督关系许多数据发掘技术与系统已经开发出来.对数据模式学习的基于元模式（元查询）的自动发掘集发掘方法及系统可采用不同的分类准则，包括基成方法.该方法不同于工具箱式的集成方法，于研究的数据库的种类进行分类，基于发现的知他们提出的元模式(meta-pattern)的概念便于自动识的种类进行分类以及基于采用的技术的种类利用归纳、演绎及人的指导之间的相互依赖.由进行分类.对基于发现的知识的种类进行分类可于元模式具有普遍的机制，因此，可望在人指导参考文献[1,2]. 下与数据发掘开发者自己偏好的演绎及归纳技对于数据发掘算法采用的技术，主要包括机术集成，器学习、统计学、证据理论、人工神经网络、现代 (4)可视化已成为整个计算机行业的一种趋数学分析方法以及集成方法，等等，由于数据发势，也是数据发掘领域的主要研究方向之一，在掘涉及到多学科领域，不同的应用领域采用的技数据发掘领域中自动知识发现与可视化有许多术也不尽相同. 共同之处，可视化的数据发掘也有助于数据分析 2.1数据发掘方法与技术的一般性研究的解释，并且在大数据集的发掘方面也有很大的 (I)R.Agrawal等综合机器学习与数据库技潜力.G.Piatetsky-Shapiro等开发的知识发现平术，对3类数据发掘问题即分类、关联及序列作为台KDW(Knowledge Discovery Workbench)2是一个统一的蕴裁于巨量数据中的规则发现来处一个数据探测的交互式可视化数据发掘系统.该理，给出了一个统一模型和规则发现过程的几个系统集成了几种数据发掘技术如数据簇集，数据基本运算，并给出了数据发掘问题如何映射到模可视化、汇总、分类及数据变更的发现(iscovery 型和通过提出的基本运算如何解决发现问题的 of Changes).贯穿于整个系统采用了领域知识辅方法，他们提出的利用基本操作构造的分类器算助初始发现的聚焦、限制性的搜索以及揭示出的法CDP不仅能有效地发掘分类规则，而且还具有模式的评价和发现的结果的有意义呈示，在处理 D3的精度.D3是目前最好的分类器之一. 大数据库方面系统采用的是统计估计技术；统计 (2)S.Anand等提出基于证据理论方法同时还用在系统的不确定性模式的处理上. (Evidence Theory)的数据发掘一般框架EDM, 在大数据库发掘的可视化技术方面，大多都具有以下几个特点：集成了多种数据发掘技术，都可发掘多种形式的 ①固有的并行性，在此框架内开发的算法是知识规则.除了KDW外，有代表性的还有并行的，对大数据集的知识发掘有好的效率，并 Daniel A.Keim等开发的多维数据库可视化发掘且对并行的、分布的和异质的数据库都适用，系统VisDB). ②用户的先验知识与先前发现的知识可以 (5)实际发掘中发掘的知识质量如何，严重耦合到发现过程中依赖于数据库的特征表示以及现存的知识与已 ③提出了基于证据理论的、在发掘过程中处发现的知识如何协调一致；发现的知识可能不是

杨炳儒等数据发掘与数据库中知识发现相似加模式时态或空间一时态印。一的数据大量存在于计算机中，这些数据库例子包括股票价格指数的金融数据库、医疗数据库、多媒体数据库，等等在时态或空间一时态数据库中搜索相似模式是为发现和预测风险、因果联系及关联于特定模式的趋势川根据数据发掘的不同应用对象，还有许多其他的与特定应用领域相关的知识的发掘，但大多数目前的研究应用，其发掘的知识的种类可以归纳为上述几种数据发掘方法与技术在数据发掘的研究与开发上已有很多进展，许多数据发掘技术与系统已经开发出来对数据发掘方法及系统可采用不同的分类准则，包括基于研究的数据库的种类进行分类，基于发现的知识的种类进行分类以及基于采用的技术的种类进行分类对基于发现的知识的种类进行分类可参考文献【，对于数据发掘算法采用的技术，主要包括机器学习、统计学、证据理论、人工神经网络、现代数学分析方法以及集成方法，等等由于数据发掘涉及到多学科领域，不同的应用领域采用的技术也不尽相同数据发掘方法与技术的一般性研究等综合机器学习与数据库技术，对类数据发掘问题即分类、关联及序列作为一个统一的蕴藏于巨量数据中的规则发现来处理，给出了一个统一模型和规则发现过程的几个基本运算，并给出了数据发掘问题如何映射到模型和通过提出的基本运算如何解决发现问题的方法他们提出的利用基本操作构造的分类器算法不仅能有效地发掘分类规则，而且还具有的精度是目前最好的分类器之一等提出基于证据理论叮的数据发掘一般框架，具有以下几个特点 ① 固有的并行性在此框架内开发的算法是并行的，对大数据集的知识发掘有好的效率、并且对并行的、分布的和异质的数据库都适用 ② 用户的先验知识与先前发现的知识可以祸合到发现过程中 ③ 提出了基于证据理论的、在发掘过程中处理非完全信息的方法 ④ 提出了一整套的知识表示、数据表示及数据操作与知识发现的方法 ⑤ 在强规则的发掘及空间数据库的发掘上对提出的方法进行了检验的证据理论、的可信度理论和最近国内发展起来的未确知数学都是关于不完全信息的表达与处理的系统方法本框架基于可信度理论可望对不完全信息的数据发掘提供系统的方法基于证据理论在数据发掘中的应用还有一些其他的研究，如文献【关于不完全信息的数据发掘也有一些研究，如文献【针对目前各种各样的数据发掘技术，在一与提出了无监督关系模式学习的基于元模式元查询的自动发掘集成方法川该方法不同于工具箱式的集成方法，他们提出的元模式一的概念便于自动利用归纳、演绎及人的指导之间的相互依赖由于元模式具有普遍的机制，因此，可望在人指导下与数据发掘开发者自己偏好的演绎及归纳技术集成可视化已成为整个计算机行业的一种趋势，也是数据发掘领域的主要研究方向之一在数据发掘领域中自动知识发现与可视化有许多共同之处，可视化的数据发掘也有助于数据分析的解释，并且在大数据集的发掘方面也有很大的潜力幼一等开发的知识发现平台叮比 ‘，是一个数据探测的交互式可视化数据发掘系统该系统集成了几种数据发掘技术如数据簇集，数据可视化、汇总、分类及数据变更的发现贯穿于整个系统采用了领域知识辅助初始发现的聚焦、限制性的搜索以及揭示出的模式的评价和发现的结果的有意义呈示在处理大数据库方面系统采用的是统计估计技术统计方法同时还用在系统的不确定性模式的处理上在大数据库发掘的可视化技术方面，大多都集成了多种数据发掘技术，都可发掘多种形式的知识规则除了外，有代表性的还有而等开发的多维数据库可视化发掘系统 ” 实际发掘中发掘的知识质量如何，严重依赖于数据库的特征表示以及现存的知识与已发现的知识如何协调一致发现的知识可能不是

·204· 北京科技大学学报 1999年第2期用户感兴趣的或者与先前的知识有矛盾.Jong P. 量.针对兴趣度的主观度量，文献[12]将其分为 Yoon与Larry Kerschberg针对这个问题提出未期望到的(Unexpectedness)以及可操作的了一个数据库中知识发现与进化的概念.提出了 (Actionability). 利用数据库查询以发现新知识，使用正反两个方 G.Piatetsy-Shapiro2o1等对数据库发掘的应用面的例子来发现新知识以及新旧知识的协调一状况给出了全面的介绍，概括起来，这些应用主致，对数据库中例外的特征化以及随着知识与数要包括市场分析与预测，瑕疵检测、制造业、通据库的同步进化，讯、天文学、保险业、市场经营、医学、金融业、在 (6)在数据发掘中，大量的工作是关于关联线服务、商场顾客交易、证券市场与期货市场的规则、分类规则、簇集规则等某种特定规则的发客户交易、nternet上的巨量数据处理等，掘研究.由于数据库的规模巨大，数据的广泛分布，一些数据发掘算法的计算复杂性，等等都呼 4急待研究的部分专题与新构想唤高效发掘算法的研究.Cheung D W).等人对 4.1急待研究的部分专题分布式数据库的关联规则的发掘提出了一种有 (1)并行或分布的发掘算法的开发研究；效算法DMA(Distributed Mining of Association (2)在多个抽象级上，在不同知识层面上发 rules).因为需要大量的额外通讯开销，将串行算掘多种知识的有效方法；法直接用于分布式数据库的效率不高；DMA生 (3)灵活方便的数据发掘语言与接口；成一个小的候选集，且对每个候选集为支持数目 (4)在高级数据发掘系统中的知识发现技术交换仅需要O()个信息，这里n是分布式数据库及其应用系统的开发；的分布点数.因此，DMA具有很高的性能 (5)发现到的知识与专家定义的知识的集 (7)数据发掘除了集成方法或一般框架上的成；数据安全与数据保密. 研究和对某种特定规则的研究外，对特定数据库 4.2一个新构想的数据发掘也进行了大量的工作，如交易数据库突破原有的仅以数据库为基础的知识发现 (Transaction Databases)6,刃，空间数据库(Spatial 系统及其核心概念-认知自主性，形成基于数据 Databases)M、时态数据库(Temporal Databases)h 库与知识库的具有扩展性核心概念的知识发现以及面向对象数据库”、演绎数据库，等等. 系统KD(D&K).其基本结构（多层递阶，综合集 (8)Hongjun Lu等提出了利用神经网络发成)与运行机制的构想如图1所示. 掘符号分类规则的方法，与基于决策树的方法相比，他们提出的方法具有更小的分类出错率，抽用户需求控制取的规则也更简洁；不同的是，抽出规则的时间消耗比基于决策树的方法（如C4.5)来得长. 真实数据聚焦规则（知识）生成结果评价结果 2.3结果评价评价的依据主要有统计原理、认知特性、数据空间抽象、附加证据领域知识及内部反馈.一数据库协调器知识库再生般在进行综合评价时，是若干个依据并行使用以使评价保持客观性. 领域知识专家知识 3知识发现系统的核心概念及应用图1 知识发掘的新构想 KDD的核心概念是认知自主性，它规定了参考文献 KDD的基本特征，据此，要求知识发现系统在没有“教师”的引导下独立完成知识获取任务；而认 1 Chen W M.Data Mining:an Overview from An 知自主性的核心是系统在现实条件下的生成能 Database Perspective.IEEE Trans on Knowledge and 力、评价能力及两者之间的有机结合. Data Eng,1996(8):866 感兴趣度(Interestingness)是衡量发掘出来的 2 Fayyad U.Knowledge Discovery and Data Mining: 知识的质量指标，可分为主观度量与客观度 Towards a Unifying Framework.In:Proc of KDD-96. Menlo Park,CA:AAAI Press,1996.82

北京科技大学学报年第期用户感兴趣的或者与先前的知识有矛盾与咫 ‘ 针对这个问题提出了一个数据库中知识发现与进化的概念提出了利用数据库查询以发现新知识，使用正反两个方面的例子来发现新知识以及新旧知识的协调一致，对数据库中例外的特征化以及随着知识与数据库的同步进化在数据发掘中，大量的工作是关于关联规则、分类规则、簇集规则等某种特定规则的发掘研究由于数据库的规模巨大，数据的广泛分布，一些数据发掘算法的计算复杂性，等等都呼唤高效发掘算法的研究等人对分布式数据库的关联规则的发掘提出了一种有效算法因为需要大量的额外通讯开销，将串行算法直接用于分布式数据库的效率不高生成一个小的候选集，且对每个候选集为支持数目交换仅需要。个信息，这里月是分布式数据库的分布点数因此，具有很高的性能数据发掘除了集成方法或一般框架上的研究和对某种特定规则的研究外，对特定数据库的数据发掘也进行了大量的工作，如交易数据库梦，，、空间数据库，、时态数据库 “ 以及面向对象数据库 ” 、演绎数据库，等等自等 ‘，提出了利用神经网络发掘符号分类规则的方法，与基于决策树的方法相比，他们提出的方法具有更小的分类出错率，抽取的规则也更简洁不同的是，抽出规则的时间消耗比基于决策树的方法如来得长结果评价评价的依据主要有统计原理、认知特性、数据空间抽象、附加证据领域知识及内部反馈一般在进行综合评价时，是若干个依据并行使用以使评价保持客观性量针对兴趣度的主观度量，文献【将其分为未期望到的田以及可操作的一等对数据库发掘的应用状况给出了全面的介绍，概括起来，这些应用主要包括市场分析与预测，瑕疵检测、制造业、通讯、天文学、保险业、市场经营、医学、金融业、在线服务、商场顾客交易、证券市场与期货市场的客户交易、上的巨量数据处理等急待研究的部分专题与新构想急待研究的部分专题并行或分布的发掘算法的开发研究在多个抽象级上，在不同知识层面上发掘多种知识的有效方法灵活方便的数据发掘语言与接口在高级数据发掘系统中的知识发现技术及其应用系统的开发发现到的知识与专家定义的知识的集成数据安全与数据保密一个新构想突破原有的仅以数据库为基础的知识发现系统及其核心概念一认知自主性，形成基于数据库与知识库的具有扩展性核心概念的知识发现系统其基本结构多层递阶，综合集成与运行机制的构想如图所示用户需求真实数据 · 领域知识专家知识知识发现系统的核心概念及应用的核心概念是认知自主性，它规定了的基本特征据此，要求知识发现系统在没有 “ 教师 ” 的引导下独立完成知识获取任务而认知自主性的核心是系统在现实条件下的生成能力、评价能力及两者之间的有机结合感兴趣度玩是衡量发掘出来的知识的质量指标，可分为主观度量与客观度图知识发掘的新构想参考文献 · ，」一肛，

Vol.21 No.2 杨炳儒等：数据发掘与数据库中知识发现 ·205· 3 Fayyad U.Automated Analysis and Explanation of edge Discovery Systems.IEEE Trans on Knowledge Image Databases:Results,Progress,and Challenges. and Data Eng,1996(8):970 Journal of Intelligent Information Systems,1995(4):7 13 Keim D A.Visualization Techniques for Mining 4 Major J A.EFD:A Hybrid Knowledge/Statistical-Based Large Databases:A Comparison.IEEE Trans on Knowl- System for the Detection of Fraud.International Jour- edge and Data Eng,1996(8):923 nal of Intelligent Systems,1992(7):687 14 Yoon J P.A Framework for Knowledge Discovery 5 Gur-Ali O.Induction of Rules Subject to A Quality and Evolution in Databases.IEEE Trans on Knowl- Constraint:Probabilistic Inductive Learning.IEEE edge and Data Eng,1993(5):973 Trans on Knowledge and Data Eng,1993(5):979 15 Cheung O W.Efficient Mining of Association Rules 6 Agrawal R.Mining Sequential Patterns.In:Proc.11th in Distributed Databases.IEEE Trans on Knowledge Int'l Conf Data Eng.1995.3 and Data Eng,1996(8):911 7 Agrawal R.Data Mining:A Performance Perspective. 16 Kline N.Computing Temporal Aggregates.In:Proc. IEEE Trans on Knowledge and Data Eng,1993(5):IIth Int'l Conf.Data Eng.1995.222 914 17 Huang Y.An Efficient Inductive Method for Object- 8 Anand S S.EDM:A General Framework for Data riented Database Using Attribute Entropy.IEEE Trans Mining Based on Evidence Theory.Data Knowl- on Knowledge and Data Eng,1996(8):946 edge Eng,1996,18:189 18 Goh C.Knowledge Discovery in Deductive Databases 9 Bell D A.From Data Properties to Evidence.IEEE With Large Deduction Results:the First Step.IEEE Trans on Knowledge and Data Eng,1993(5):965 Trans on Knowledge and Data Eng,1996(8):952 10 Scheine R.Finding Latent Variable Models in Large 19 Lu Hongjun.Effective Data Mining Using Neural Databases.International Journal of Intelligent Systems, Networks.IEEE Trans on Knowledge and Data Eng, 1992(7):609 1996(8):957 11 Shen W A Meta-pattern Based Automated Discov- 20 Piatetsky-Shapiro G.An Overview of Issues in ery Loop for Integrated Data Mining-unsupervised Developing Industrial Data Mining and Knowledge Learning of Relational Patterns.IEEE Trans on Knowl- Discovery Applications.In:Proc of KDD-96.Menlo edge and Data Eng,1996(8):898 Park.CA:AAAl Press,1996.89 12 Silberschatz A.What Makes Interesting in Knowl- Data Mining and Knowledge Discovery in Databases Yang Bingru,Liu Fasheng Information Engineering School,UST Beijing.Beijing 100083,China ABSTRACTS Analyze and explore about the actuality of data mining and the trend of knowledge discovery system,and presents new conception on the conjion of general framework and specific problem. KEY WORDS data mining;database;knowledge database;knowledge discovery system

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录

数据发掘与数据库中知识发现