北京科技按类似于第个抽象级的各个发现环节运行，完成第

正在加载图片...

·348 北京科技大学学报 2002年第2期按类似于第1个抽象级的各个发现环节运行，基于内在机理研究，具体而论是基于“知识短完成第2个抽象级.如此往复，在认识发展与时缺”（利用有向超图）进行“定向挖掘”；而Apriori 空环境变迁的不同阶段，不断使知识丰富与升算法是基于组合论的数据库全局搜索级，不断使认识深化.由此可以看出该系统的基 (2)基本流程（或基于的模型）不同.Marad- 本特征：①具有多个抽象级、不同知识层面的多 bcm算法是一条一条短缺知识的挖掘；而Apriori 层递阶、综合集成的知识发现系统的总体框架算法是所有的规则一并挖掘. 与运行机制；②双库（即数据库与知识库）在知 (3)基础不同.Maradbcm算法是基于规则强识发现过程中具有协同机制；③综合了数据发度，它考虑了主观和客观两个方面，即考虑了用掘技术与推理机制（即使KDD与KDK统一在户的聚焦（感兴趣度），并涵盖了Apriori算法的一个过程中)，综合了KDD发掘的知识与知识支持度阈值库的知识，进而再生新知识；④强调知识发现过 (4)发现知识的量不同.Maradbcm算法考虑程中的认知自主性，即突出知识的自动发现（获了知识库，能真正发现新颖的、用户感兴趣的知取)，仅在一个发现周期（即一个抽象级）的“始识，这正是符合了KDD定义，而Apriori算法是点”与“末端”通过人机交互建立与领域专家的把满足条件的规则全部挖掘出来；另外，由于联系 Maradbcm算法中的支持度可以设置得比较小 (4)基于知识发现系统KD(D&K)的广义 (因为该算法主要是由规则强度来聚焦的)，即诊断型专家系统ESKD,详细内容可参见参考文对短缺知识的删除是比较谨慎的，因此Marad 献[7 bcm算法部分地克服了Apriori算法的一个缺陷，即遗漏重要的规则 4内在机理引发的技术方法 (S)Maradbcm算法.可融入KDD中形成新 4.1新的知识表示方法一语言场与语言值结的开放型的结构模型—KDD*,整个算法实现构表示法的运算背景是KDD*结构；而Apriori算法是原定义.C=<D,I,N,≤心，若满足下列条件：D 有的封闭系统KDD 为R上交叉闭区间的集合（基础变量论域）：N≠Φ 43因果关联规则的自动评价方法为语言值的有限集；sw为N上的全序关系；针对因果关联规则，提出了一种全新的自 I:N一D为标准值映射，满足保序性，则称C为语动评价方法，其主要特征是：言场 (1)采用全新的知识表示方法一语言场和在此基础上，给出语言值结构的定义与相语言值结构. 关的若干实现 (2)采用因果关系定性推理机制（它不必考利用语言场理论对连续属性进行离散化，虑各种数据的概率分布情况) 方法简单，计算时间短，并可以根据专家（用户） (3)将认证逻辑的分析方法应用到因果关联的意愿来划分连续属性，从而用自然语言来描规则的评价中，实现了对这种规则形式的后验述最后得到的规则，使之更易于被用户所理解，评价因此这种方法较为实用 (4)具有通用性和交互性.即此评价方法可 4.2关联规则发现的新算法一Maradbcm算法以在不同的领域中应用，因为因果关系是普遍本文作者独立提出的Maradbcm算法(min- 存在的. ing association rules algorithms based on double- 同时对于有些经常变化的数值，可以让用 bases cooperating mechanism)是基于双库协同机户随时进行补充和修改，不过当所需要的值确制的关联规则挖掘算法，体现了内在机理研究定后，推理机制和评价方法的实现都是由计算对当前KDD主流发展的重要作用机自动完成的.其中，(1)和(2)是最关键的特征， Maradbcm算法与通常公认的具权威性的也是提出该方法的基础.也只有以语言场理论挖掘关联规则的Apriori算法的主要共同，点是为基础和在因果关系定性推理机制下，才能将两者在本质上都是基于统计方法的.两者的主认证逻辑的分析方法运用到评价过程中，并使要区别（或优于Apriori算法）在于以下5个方面：其可以进行定量的分析，从而使该方法具有科 (l)基于的学术思想不同.Maradbcm算法是学性与可实现性北京科技按类似于第个抽象级的各个发现环节运行，完成第个抽象级如此往复，在认识发展与时空环境变迁的不同阶段，不断使知识丰富与升级，不断使认识深化由此可以看出该系统的基本特征 ①具有多个抽象级、不同知识层面的多层递阶、综合集成的知识发现系统的总体框架与运行机制 ②双库即数据库与知识库在知识发现过程中具有协同机制 ③综合了数据发掘技术与推理机制即使与统一在一个过程中，综合了发掘的知识与知识库的知识，进而再生新知识 ④强调知识发现过程中的认知自主性，即突出知识的自动发现获取，仅在一个发现周期即一个抽象级的 “ 始点 ” 与 “ 末端 ” 通过人机交互建立与领域专家的联系基于知识发现系统勒的广义诊断型专家系统，详细内容可参见参考文献内在机理引发的技术方法新的知识表示方法— 语言场与语言值结构表示法定义，，，丛户，若满足下列条件为上交叉闭区间的集合基础变量论域羊必为语言值的有限集 ‘ 、为上的全序关系一为标准值映射，满足保序性，则称为语言场在此基础上，给出语言值结构的定义与相关的若干实现利用语言场理论对连续属性进行离散化，方法简单，计算时间短，并可以根据专家用户的意愿来划分连续属性，从而用自然语言来描述最后得到的规则，使之更易于被用户所理解，因此这种方法较为实用关联规则发现的新算法— 算法本文作者独立提出的算法是基于双库协同机制的关联规则挖掘算法，体现了内在机理研究对当前主流发展的重要作用算法与通常公认的具权威性的挖掘关联规则的算法的主要共同点是两者在本质上都是基于统计方法的两者的主要区别或优于算法在于以下个方面基于的学术思想不同算法是大学学报年第期基于内在机理研究，具体而论是基于 “ 知识短缺，’ 利用有向超图进行 “ 定向挖掘 ” 而算法是基于组合论的数据库全局搜索基本流程或基于的模型不同算法是一条一条短缺知识的挖掘而算法是所有的规则一并挖掘基础不同算法是基于规则强度，它考虑了主观和客观两个方面，即考虑了用户的聚焦感兴趣度，并涵盖了却算法的支持度阑值发现知识的量不同算法考虑了知识库，能真正发现新颖的、用户感兴趣的知识，这正是符合了定义，而算法是把满足条件的规则全部挖掘出来另外，由于算法中的支持度可以设置得比较小因为该算法主要是由规则强度来聚焦的，即对短缺知识的删除是比较谨慎的，因此算法部分地克服了算法的一个缺陷，即遗漏重要的规则算法可融入中形成新的开放型的结构模型— ，整个算法实现的运算背景是结构而却算法是原有的封闭系统因果关联规则的自动评价方法针对因果关联规则，提出了一种全新的自动评价方法，其主要特征是采用全新的知识表示方法— 语言场和语言值结构采用因果关系定性推理机制它不必考虑各种数据的概率分布情况将认证逻辑的分析方法应用到因果关联规则的评价中，实现了对这种规则形式的后验评价仔具有通用性和交互性即此评价方法可以在不同的领域中应用，因为因果关系是普遍存在的同时对于有些经常变化的数值，可以让用户随时进行补充和修改不过当所需要的值确定后，推理机制和评价方法的实现都是由计算机自动完成的其中，和是最关键的特征，也是提出该方法的基础也只有以语言场理论为基础和在因果关系定性推理机制下，才能将认证逻辑的分析方法运用到评价过程中，并使其可以进行定量的分析，从而使该方法具有科学性与可实现性

<<向上翻页向下翻页>>

点击下载：知识发现系统内在机理