正在加载图片...
D0I:10.13374/i.issn1001053x.2003.041.022 第25卷第4期 北京科技大学学报 VoL25 No.4 2003年8月 Journal of University of Science and Technology Beijing Ag2003 基于广义归纳逻辑因果模型的 知识发现与算法实现 张德政》石阳)邓一)杨炳儒) 1)北京科技大学信息工程学院,北京1000832)鞍山科技大学计算机系,鞍山114002 摘要以语言场、广义细胞自动机和广义归纳逻辑因果模型为理论依据,分析了广义因果 联系类知识的发现机理,给出了因果联系类知识发现的实现算法,该算法为解决具有随机不 确定和模糊不确定性特征的因果联系类知识的发现提供了行之有效的方法,通过算法的运 行实例,验证和说明了算法的正确性和有效性, 关键词广义逻辑归纳因果模型;广义因果联系;数据挖掘:知识发现 分类号TP18 随着数据挖掘(Data Mining,DM)和知识发现 数据挖掘或知识发现方法进行分析. (Knowledge Discovery in Database,KDD)理论与实 广义归纳逻辑因果模型是构建在语言场与 现技术研究及应用的不断深入,已经建立了多种 语言值结构和广义细胞自动机理论基础上的完 不同类型的知识发现算法.然而,在科学与工 备归纳推理机制,通过不确定性广义归纳因果模 程领域广泛存在的、具有随机性、模糊不确定性、 型的构建,形成了包含大量随机和模糊不确定性 非线性时变性和动态特征的广义因果联系类知 特征的完备基础知识库.在知识发现的过程中, 识的发现,迄今还没有行之有效的发现理论和算 这些知识作为知识发现的元知识具有普遍性,它 法,这类知识是反映客观世界因果性和因果联系 们构成了广义因果联系类知识发现的模板,可 的深层次知识.它们对于探索客观事物间的必然 指导广义因果关联规则的发现.这样可以发现那 联系,确定其发展变化的内在机理,把握事物的 些用常规的关联规则获取方法所无法的得到 本质有重要意义,从数据库中获取这类知识,无 的低频率高强度关联规则, 论对于广泛意义下从事务数据库中获取知识还 是对于从科学数据库中发现必然性联系的规则, 1广义归纳逻辑因果模型 都是目前所亟待解决的问题. 1.1语言场与语言值结构 广义因果联系类知识是指事物之间存在的 自然语言易于被理解和接受,并且可表达十 一种潜在的因果必然性联系,是一类高关联强度 分复杂、具有抽象性和不确定性特征的知识.自 的知识.它以穆勒关于因果关系定义的普遍性原 然语言可以很好地表示有关事物状态、变态以及 理、因果共变原理和先因后果原理为特征,事物 反映因果性和因果联系的知识.利用语言场与语 的状态以及状态的变化反映出事物之间以及自 言值结构,本文建立了描述状态和变态的统一构 身属性之间所存在的广义因果联系,决定事物之 架,并提供了字符型属性值量化的模板 间必然性联系和因果性关系.这类知识蕴含在现 定义1C=<D,I,N,≤心,若满足下列条件,则 实世界的复杂联系之中,在一般情况下这类知识 称C为语言场:(I)D为R上数的集合或其上闭区 所反映的是复杂非线性关系,具有随机不确定、 间的集合,D为其对应开集:(2)W≠)为语言值的 模糊不确定和非线性时变等性质,难以用常规的 有限集:(3)≤w为N上的全序关系;(4):N一D为标 收稿日期2002-11-11张德政男,39岁,刮教授,博士 准值映射,满足保序性,即:廿n,nz∈Nn≠Ah≤w *国家自然科学基金重点项目QNo.69835001)第 卷 第 期 年 月 北 京 科 技 大 学 学 报 几 一 基于广义归纳逻辑 因果模型 的 知识发现与算法实现 张德 政 ” 石 阳 , 邓 一 ” 杨 炳 儒 ” 北京科技大学信 息 工 程学 院 , 北京 鞍 山科技大 学计 算机 系 , 鞍 山 摘 要 以语 言场 、 广义 细 胞 自动机和 广义 归纳逻辑因果模型 为理 论依据 , 分析 了广义 因 果 联 系类 知 识 的发现 机理 , 给 出 了 因 果 联 系类 知 识 发 现 的 实现算法 该 算法 为解 决具 有 随机 不 确 定和 模糊不 确 定性特征 的 因果 联系类知 识 的发现提供 了行 之有 效 的方法 通 过算法 的运 行 实例 , 验证和 说 明 了算法 的正 确性和 有 效 性 关健词 广 义 逻辑 归纳 因 果 模型 广 义 因果 联 系 数据挖 掘 知 识 发现 分类号 仔 随着数据 挖 掘 , 和 知 识 发现 五 鲍 , 理 论 与 实 现 技术研 究及 应 用 的不 断深 入 , 已经 建立 了多种 不 同类 型 的知 识 发 现 算法 【 一 然 而 , 在 科 学 与 工 程领 域广泛存在 的 、 具有 随机性 、 模 糊不确 定性 、 非 线 性 时变 性 和 动 态特 征 的广 义 因果 联 系类 知 识 的发现 , 迄今还 没 有行 之有 效 的发现 理论 和 算 法 这类 知 识 是 反 映客观 世 界 因果性和 因果 联系 的深层 次知 识 它们 对 于探 索客 观 事物 间 的必 然 联 系 , 确 定其 发展 变化 的 内在 机理 , 把握 事物 的 本质 有 重 要 意 义 从 数据 库 中获取 这 类 知 识 , 无 论 对 于 广 泛 意 义 下 从 事 务 数 据 库 中获取 知 识 还 是对 于从 科 学数据 库 中发现 必 然 性 联系 的规 则 , 都 是 目前所 鱼 待解 决 的 问题 广 义 因 果 联 系 类 知 识 是 指 事 物 之 间存 在 的 一种潜在 的 因果必 然 性联 系 , 是一类高关联 强度 的知 识 它 以穆勒 关于 因果 关系 定义 的普遍 性 原 理 、 因果 共变 原理和 先 因后 果 原理 为特 征’ 事物 的状 态 以及 状 态 的变 化 反 映 出事 物 之 间 以及 自 身属 性之 间所存在 的广义 因果联系 , 决定 事物之 间必 然 性联 系和 因果性 关系 这类 知 识 蕴 含在现 实世 界 的复 杂联 系之 中 , 在一般 情 况 下 这类 知识 所 反 映 的是 复 杂 非 线 性 关 系 , 具 有 随机 不 确 定 、 模 糊不确 定和 非线 性 时变等性质 , 难 以用 常规 的 收稿 日期 一 张德政 男 , 岁 , 副教授 , 博士 国家 自然科学基金重 点项 目困。 数据挖 掘或 知 识 发现 方 法进 行 分 析 广 义 归 纳 逻 辑 因果 模 型 是 构 建 在语 言 场 与 语 言值 结构 和 广 义 细 胞 自动 机 理 论 基 础 上 的完 备 归纳 推 理机制 通 过 不确 定性广 义 归纳 因果模 型 的构建 , 形 成 了包 含 大量 随机 和模 糊 不 确 定性 特 征 的完 备基础 知 识 库 在 知 识 发现 的过 程 中 , 这 些 知 识 作 为知 识 发现 的元 知 识 具 有 普遍 性 , 它 们 构成 了广义 因果 联系类 知 识 发现 的模板, , 可 指 导广 义 因果 关联规 则 的发现 这样可 以发现那 些 用 常规 的关联 规 则 获取 方 法 口, 所 无 法 的得 到 的低 频率 高强度 关联 规 则 广 义 归纳 逻 辑 因 果 模 型 语 言场 与语 言值 结 构 自然 语 言 易于 被 理 解 和 接 受 , 并且 可 表达 十 分 复 杂 、 具 有 抽 象 性和 不确 定性特 征 的知 识 自 然 语 言可 以很 好 地表 示 有关事物状态 、 变态 以及 反 映 因果性和 因果 联系 的知 识 利用 语 言场 与语 言值 结构 , 本文 建立 了描述状 态和 变态 的统 一构 架 , 并提 供 了字 符型属 性值 量 化 的模 板‘认 定 义 , , , ‘ 户 , 若 满足 下 列 条件 , 则 称 为语 言场 为 上 数 的集 合 或 其 上 闭 区 间 的集 合 , 为其对 应 开集 羊 为语 言值 的 有 限集 ‘ 二 为 上 的全 序 关 系 万一 为标 准值 映射 ,满 足保 序 性 , 即 ,, 任 羊 八 ,簇 , DOI :10.13374/j .issn1001-053x.2003.04.022
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有