正在加载图片...
96 北京科技大学学报 2003年第1期 引入到数据挖掘过程中,使挖掘系统具有了自主 由于现实世界的数据一般是不完整的和不 性、协同性、交互性和智能性 一致的,需要经过预处理之后才能挖掘.依据知 数据预处理Agent的任务是数据清理、数据 识库中的知识及模型库中的模型要求,数据预处 集成、数据选择及数据变换.数据挖掘Agent的任 理模块可以实现数据清理、数据集成、数据选择、 务是实现数据模式的识别,即发现诸如关联规 数据变换与数据归约.数据清洗可以消除数据中 则、分类规则、数据聚类、序贯模式、相似模式、混 的噪声或不一致数据、重复记录等.数据集成可 沌模式等知识.人-机界面Agent是连接用户与系 以把多种数据源组合在一起.数据选择是从数据 统的中间纽带,实现人一机交互功能.知识评价 库中检索与分析任务相关的数据.数据变换与数 Agent对数据挖掘Agent所给出的结果进行评价 据归约是通过选择语言变量、划分语言值、汇总 及解释.启发协调Agent的任务是通过搜索知识 或聚集等操作把真实数据变换或统一成适合挖 库中“知识节点”的不关联态,以发现“知识短 掘的形式,即形成挖掘数据库 缺”,从而启发与激活真实数据库中“数据子类”, 2.1数据挖掘Agent模型 以产生“定向发掘进程”.中断协调Agent的任务 数据挖掘Agent由感知模块、通信模块,控制 是使KDD进程适时产生“中断”,然后定向搜索 模块、数据挖掘模块、推理机、方法库、知识库及 知识库中有无生成规则的重复、冗余、从属与循 模型库等部分组成,其逻辑结构如下图3所示, 环等 启发协调 知识评价 1用 Agent Agent 2各Agent模型设计与功能实现 信 人一机界面 块 据挖掘 模型库 数据预处理 2.1数据预处理Agent模型 Agent Agent 数据预处理Agent由感知模块、通信模块、控 块 推理机 制模块、数据预处理模块、推理机、方法库、知 、外部环境 榄 识库及模型库等部分组成,其逻辑结构如下图2 方法库 知识库 所示. 图3数据挖掘Agent的逻辑结构图 数据派源 Fig.3 Logic structure of data mining agent 其他 Agent 模型库 数据挖掘 数据挖掘模块由多个子模块组成,分别用来 Agent 发掘诸如关联规则、分类规则、数据聚类、序贯模 模块 理 推理机 式、相似模式、混沌模式等知识.数据挖掘模块首 先对用户提交的挖掘任务进行分析,在与用户、 外部环境 模 块 方法库 知识库 知识库和模型库的交互过程中把任务分解,分别 送到相应的子模块进行处理 图2数据预处理Agent逻辑结构图 由于知识库要比数据库小得多,当挖掘使知 Fig.2 Logic structure of data preprocess agent 识库中有了一定的知识时,在启发协调Agent的 感知模块用于感知外部环境施加的刺激,并 作用下,数据挖掘模块通过搜索知识库中“知识 把相应的信息传递到控制模块进行处理.控制模 节点”的不关联态,以发现“知识短缺”,从而启发 块在接受到信息后先对其过滤与抽象处理,形成 与激活真实数据库中“数据子类”,以产生“定向 与外部环境中的对象相对应的有意义的符号.然 发掘进程”,从而大大加快发掘进程 后到方法库中搜索相应的决策方法进行匹配,并 2.3人-机界面Agent模型 产生相应的决策 人-机界面Agent由感知模块、通信模块、控 通信模块主要负责与其他Agent之间的联 制模块、交互处理模块、/O模块、推理机、方法 系,它既可以把其他Agent的请求/应答信号传递 库、知识库及模型库等组成,其逻辑结构如下图 给数据预处理Agent,也可以把数据预处理Agent 4所示 产生的协作/协商信息传送给其他Agent.. 人-机界面Agent.与其他Agent不同之处在于北 京 科 技 大 学 学 报 年 第 期 引入 到数据挖掘过程 中 , 使挖掘系统具有 了 自主 性 、 协 同性 、 交互 性 和智能性 数据 预 处 理 的任务是数据清理 、 数据 集成 、 数据选择及数据变换 数据挖掘 的任 务是 实现 数 据模 式 的识别 , 即发 现诸 如关联 规 则 、 分类规则 、 数据聚类 、 序贯模式 、 相 似模式 、 混 沌模式 等知识 人一机界 面 是连接用 户 与系 统 的 中间纽 带 , 实现 人一机 交互 功能 知识评价 对数据挖 掘 所 给出的结果进 行评 价 及解 释 启发 协调 的任务是‘ 通 过搜索知识 库 中 “ 知识 节点 ” 的不 关联 态 , 以发现 “ 知识短 缺 ” , 从而启发与激活 真实数据库中 “ 数据子类 ” , 以产 生 “ 定 向发 掘进 程 ” 中断协调 的任务 是使 进 程适 时产生 “ 中断 ” , 然后 定 向搜索 知识库 中有 无生 成规 则 的重 复 、 冗余 、 从属 与循 环 等 由于 现 实世 界 的数据一 般 是 不 完整 的 和 不 一 致 的 , 需 要 经 过 预 处 理 之后 才能挖 掘 依据 知 识库 中的知识及模型库 中的模型要求 , 数据 预处 理模块 可 以实现数据 清理 、 数据集成 、 数据选 择 、 数据变换与数据 归约 数据清洗可 以 消除数据 中 的 噪声或 不 一 致数据 、 重 复记 录 等 数据集成 可 以把多种 数据 源组 合在 一起 数据选 择是从数据 库 中检索与分析任务相关的数据 数据变换 与数 据归 约是 通 过选 择语 言变量 、 划 分语 言值 、 汇 总 或 聚集等操 作把 真 实 数 据 变换 或 统 一 成 适 合挖 掘 的形 式 , 即形 成挖掘 数据 库 数 据挖 掘 模 型 数据挖掘 由感知模块 、 通 信模块 、 控制 模块 、 数据挖 掘模块 、 推理机 、 方 法 库 、 知识 库及 模 型库等部分组 成 , 其逻 辑结构 如下 图 所 示 各 模型 设 计 与功能 实现 数据预 处 理 模 型 数据 预处理 由感知模块 、 通信模块 、 控 制模块 、 数据 预处 理模块 、 推理 机 、 方法库 、 知 识库及模 型 库等部分组 成 , 其逻 辑结构如下 图 所 示 数 通 据 信 挖 模型库 模 控 掘 块 制 模 模 块 块 方法库 知识库 一 一 一 一 一 一 一 一 一 一 一 一 数 据 模型库 筷 控制 预处 模块 理 感 模块 推理机 知卜 日雪 伯吃 块 方法库 知识库 图 数 据挖 掘 时 的逻 辑结 构 图 啥 一 一 一 一 一 一 图 数 据预 处 理 时 逻 辑 结构 图 · 感知模 块用 于感 知外 部环境施 加 的刺激 , 并 把相 应 的信息传递到控制模块进行处理 控制模 块在接受到信息后 先对其过滤与抽象处理 , 形 成 与外部环境 中的对象相对应 的有意义 的符号 然 后 到方法库 中搜索相 应 的决策方法 进行 匹 配 , 并 产生 相应 的决策 ‘, 通 信模 块 主 要 负责 与其他 之 间 的联 系 , 它 既 可 以 把其他 的请求 应答信号传递 给数据 预处 理 , 也 可 以把数据 预处 理 产生 的协作 协 商信息传送 给其他 数据挖 掘模块 由多个子模块组 成 , 分别用 来 发掘诸如关联规则 、 分类规则 、 数据 聚类 、 序贯模 式 、 相 似模式 、 混 沌模式等知识 数据挖 掘模块首 先对用 户 提交 的挖 掘任 务进 行 分析 , 在 与用 户 、 知识库和模 型库的交互 过程 中把任务分解 , 分别 送 到相 应 的子模块 进行 处 理 由于 知识库要 比数据 库小 得 多 , 当挖掘 使知 识 库 中有 了一 定 的知识 时 , 在启 发 协调 的 作用 下 , 数据 挖 掘模块通 过搜 索 知 识库 中 “ 知识 节 点 ” 的不关联 态 , 以发现 “ 知识短缺 ” , 从而启发 与激 活真实数据库 中 “ 数据 子类 ” , 以产生 “ 定 向 发掘进 程 ” , 从 而 大 大加快发掘进 程 人一 机 界 面 模 型 人一机 界 面 由感 知模块 、 通 信模块 、 控 制模 块 、 交互 处 理模 块 、 心 模块 、 推理机 、 方法 库 、 知识库及模型库等组 成 , 其逻 辑 结构 如 下 图 所示 人一机 界 面 与其他 不 同之处 在 于
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有