正在加载图片...
D0I:10.13374/i.issm1001053x.2003.05.050 第25卷第5期 北京科技大学学报 VoL25No.5 2003年10月 Journal of University of Science and Technology Beijing 0ct2003 基于统计空间映射的自学习模式识别方法 徐正光)瞿寿德)于连荣) 1)北京科技大学信息工程学院,北京1000832)河南省工业学校,郑州450002 摘要针对生产工况实测数据不能覆盖整个数据空间的现象,提出了一种基于统计空间 映射的自学习模式识别方法.通过实测数据的仿真实验验证了该方法的有效性。 关键词自学习,模式识别,统计空间映射 分类号TP274 1问题的提出 (2)在远离数据密集区、样本数据未达到的区 间,当生产过程异常时出现的工况数据,如图1 在文献[】中提出了基于统计映射空间的模 所示,按文献[山介绍的方法进行在线识别就会 式识别方法,通过建立产品质量空间与工况特征 带来困难。 空间的统计映射关系,在产品质量空间聚类,获 针对上述情况,本文提出了基于统计空间映 得根据质量优劣信息划分的模式类别,并将模式 射的自学习模式识别方法.通过仿真实验,获得 类别及判别准则映射回特征空间,在特征空间进 了满意的结果. 行在线分类,获得产品质量的在线推断,但在作 聚类训练时,训练数据是从现场采集的实测工况 2修正的ISODATA聚类算法 数据。相对整个数据空间来说是相当有限的. 样本空间不可能覆盖整个数据空间,存在如下 为了获得在样本数据密集区具有足够的模 问题: 式区分性能,同时划分的模式类别又能够覆盖整 (1)在数据密集区,也就是模式分类需要细分 个数据样本空间,并使其适应自学习模式识别算 的产品质量指标附近,由于样本不能完全覆盖整 法的需要.对ISODATA算法进行改进,提出如 个区域,可能有未被划分的区域,如图1所示,图 下修正的ISODATA聚类算法: 中XOY构成整个数据空间,灰色区域为数据样本 (1)给定控制参数.K为期望得到的类别数 空间,B*为远离样本空间的可能样本点,当实际 目:日为一个聚合中的标准偏差参数:I为允许的 生产工况落入这一区域时,能否识别?即使可以 最多迭代次数.给定n个混合样本,令J=1:预选 识别,对应的产品质量如何也会产生误差. c个起始聚合中心Z,j=1,2,…,c. (2)计算出每个样本与每个聚合中心的距离 Dx,Z,(U).如果 Dx,Z,)=min{Dx,Z(J0,k=1,2,…,n}, ,…, 则x∈w,j=1,2,,c,表示第i个模式类别.把全部 样本划分到c个聚合中,令n,表示各个子集X的 B率 样本数目, (3)计算新的聚合中心. X 图1样本数据示意图 Z0=片产x=12,6. Fig.1 Distribution graph of data sample (4)计算类内距离平均值. 收稿日期2002-11-22徐正光男,43岁,副教授 D,=12Dx,ZU0),j=1,2,c. 月与 *国家自然科学基金资助课题N0.96213949.1) (5)计算类内总平均距离D.第 卷 第 期 年 月 北 京 科 技 大 学 学 报 劝 么 基于统计空 间映射 的 自学习模式识别方法 徐正 光 ” 瞿寿德 ‘ ’ 于 连 荣 ” 北 京科技大学信息 工 程 学 院 , 北 京 河 南 省工 业 学校 , 郑 州 摘 要 针 对 生 产 工 况 实测 数据 不 能覆盖 整 个 数 据空 间 的现 象 , 提 出 了一 种 基 于 统 计 空 间 映射 的 自学 习 模式 识 别 方 法 通 过 实测数 据 的 仿 真实验 验证 了该 方法 的有 效性 关键 词 自学 习 , 模式识 别 , 统计 空 间 映射 分 类号 问题 的提 出 在文 献 〔 中提 出 了基 于统 计 映射 空 间 的模 式 识 别 方 法 , 通 过 建 立 产 品质 量 空 间与工 况特 征 空 间 的统 计 映射 关系 , 在产 品质 量 空 间聚 类 , 获 得 根据质 量优 劣信 息划 分 的模 式类 别 , 并将 模式 类 别及 判别准 则 映射 回特 征 空 间 , 在特征 空 间进 行 在 线 分 类 , 获得 产 品质 量 的在 线推 断 但 在 作 聚类 训 练 时 , 训 练 数据 是从现 场 采 集 的实测 工 况 数 据 相 对 整 个 数 据 空 间 来 说 是 相 当 有 限 的 样 本 空 间 不 可 能 覆 盖 整 个 数 据 空 间 , 存 在 如 下 问题 在 数 据 密 集 区 , 也就 是模式分类需要 细 分 的产 品质量 指 标 附近 , 由于样本 不 能完全 覆 盖 整 个 区 域 , 可 能有 未被 划 分 的 区 域 , 如 图 所 示 , 图 中 丫〔〕 构成 整 个 数 据 空 间 , 灰色 区域 为数 据 样本 空 间 , 为远 离 样 本 空 间的可 能样本 点 当实 际 生 产 工 况 落 入 这 一 区 域 时 , 能否 识 别 即使 可 以 识 别 , 对 应 的产 品质 量 如 何 也 会 产 生 误 差 在远 离数据密集 区 、 样本数据 未达 到 的区 间 , 当生 产 过 程 异 常 时 出现 的工 况 数 据 , 如 图 所 示 , 按 文 献 【 介 绍 的方法 进 行 在 线 识 别 就 会 带 来 困难 针 对 上述 情 况 , 本 文 提 出 了基 于 统 计 空 间映 射 的 自学 习 模 式识 别 方 法 通 过 仿 真 实验 , 获得 了满 意 的结 果 修 正 的 聚 类算法 为 了获 得 在 样 本 数 据 密 集 区 具 有 足 够 的模 式区分 性 能 , 同时划分 的模 式类 别又 能够覆盖 整 个 数据样 本 空 间 , 并使其适应 自学 习模 式 识别算 法 的需 要 对 算法 进 行 改进 , 提 出如 下修 正 的 聚 类 算法 给 定 控 制 参 数 为 期 望 得 到 的类 别 数 目 民为一 个 聚 合 中的标准偏 差参数 为允许 的 最 多迭 代 次数 给 定 个混 合 样 本 , 令 预选 个起 始聚 合 中心乙切,’ ” , , , 二 , 计 算 出每 个样 本 与每 个 聚 合 中心 的距 离 , 乌切 如 果 , 汤切 ,乌切 , 二 , ,, 二 , , 产仁 才 则瓜任助 , , , … ,。 , 表 示 第 ‘ 个模 式类 别 把 全 部 样 本 划 分 到 个 聚 合 中 , 令 表 示 各 个 子集不 的 样 本数 目 计 算新 的聚 合 中心 图 样 本数 据 示 意 图 · 汤切 一 籍 ‘ , 一 , , ,… ,。 计 算类 内距 离平 均值瓦 收稿 日期 一 空 徐 正 光 男 , 岁 , 副 教授 国家 自然科学基金 资助 课题 。 一 韶、 脚 ,少 , ,… , · 计算类 内总 平 均距 离万 DOI :10.13374/j .issn1001-053x.2003.05.050
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有