正在加载图片...
D0I:10.13374/i.issm1001053x.2002.05.023 第24卷第5期 北京科技大学学报 Vol.24 No.5 2002年10月 Journal of University of Science and Technology Beijing 0ct.2002 数据压缩技术在工业过程中的应用 王粉花董平 北京科技大学信息工程学院,北京100083 摘要针对应用模式识别技术进行数据降维过程中存在的人为性及冗余性等不足,提出一 种有效的数据压缩技术一主元分析法.研究表明,此方法具有快速、准确、一次自动完成等显 著优点,有效率达到85.18%. 关键词模式识别:数据压缩;主元分析 分类号0235 对于含有非线性、时变性和不确定性的复 特征X与X的相关系数按下式计算: 杂工业过程,实现其生产过程的自动化始终是 ∑(x4一一动 控制界的一项难题,其原因主要在于控制理论 ②-对2k- 1) 中基于状态方程的一系列控制算法难以在实际 L1 bl 中有效应用. 第二步求出R的全部特征值1,2,…2和 在进行数据采集时,由于尽可能多的采集 对应的特征向量,2,,4n;并将各特征值按照 测量数据,致使样本在模式空间的维数很大,从 从大到小的顺序排列,也就是使≥≥…≥入m:特 而导致占用内存多和所费机时大,即所谓的“维 征向量也应按照对应特征值的顺序排列. 数灾难”事实上,在高维数据坐标中,有些数 第三步按式n=2/2,求前m个主元的累 据极具相关性,有些数据可能对反映烧结矿质 计方差贡献率.当其值已经足够大(例如≥85%) 量的贡献率很微小,可见数据压缩是十分必要 时,取前m个主元作为新特征,转向第四步;否 的回.压缩模式空间维数,以便在推断烧结矿质 则m=m+1重复第三步 量过程时缩短计算时间,提高运算速度是模式 第四步 计算前m个新特征Y,Y,…Ym.计 识别技术的关键, 算公式为: 1数据压缩技术 Y 421u2z…W2n X (2) 11基本思想 … 为了提高识别的精度和效率,利用原有各 Y. 个特征构造一批新特征,而不是从原有的特征 2 实例分析 中进行选择和淘汰.每个新特征都是原有各特 征的函数,但新特征的总数少于原有特征的总 本文利用唐山钢铁公司第二炼铁厂N-90 数.这样,新特征集合既保证了原来各特征的主 计算机控制系统收集的100多个原始样本,经 要信息,又达到了降低空间维数的目的.主元分 综合分析处理后,得到了具有高质量的有效样 析法就是在这种思想指导下产生的一种很有效 本59个,根据工艺知识和专家经验,笔者用21 的数据压缩技术, 个原始特征来描述烧结矿质量,它们分别是:(1) 1.2数据压缩过程 Qco:(2)V;(3)2c;(4)T;(5)T;(6)T5;(7)T;(8)T2; 整个数据压缩的计算步骤如下: (9)T;(10)T18;(11)T9;(12)T0;(13)T1;(14)P:(15) 第一步求出原有特征的相关系数矩阵R, P2;(16)P;(17)P:(18)Pm;(19)P;(20)2ro;(21) 收稿日期200105-11王粉花女,30岁,讲师 2R.其中:Qco为氧化钙纯量,th;V为台车速度,第 2 4 卷 第 5 期 20 0 2 年 1 0 月 北 京 科 技 大 学 学 报 J o u r n a l o f U n iv e r s ity o f S c ie n e e a n d Te e h n o le gy B e ij i o g V b l . 24 N 0 . 5 O C t . 2 0 0 2 数据压缩技术在工业过程 中的应用 王粉花 董 平 北京科技大学信息工程学院 , 北京 10 0 0 8 3 摘 要 针对 应用模式识 别技术 进行数 据降 维过程 中存在 的人 为性及 冗余性等 不足 , 提出一 种 有效 的数据压缩 技术— 主元分析法 . 研究表 明 , 此方 法具有快速 、 准 确 、 一次 自动完成 等显 著优点 , 有效 率达到 85 . 1 8%. 关键词 模式识别 ; 数据压 缩 ; 主元分析 分类号 0 2 3 5 121 .耐 U二 一 鱿: 为ù蛛K … 算公式 对于含有 非线性 、 时变性和 不确定 性的 复 杂工业过程 , 实现其生产 过程的 自动化始终是 控制界 的一 项难 题 , 其原 因 主 要在于 控制理论 中基于状态方 程的一 系列 控制算 法难 以在实际 中有效应用 . 在进行数据 采集 时 , 由于尽 可 能多的 采集 测量数据 , 致使样本在模式空 间 的维数很大 , 从 而导致 占用 内存 多和所费机时大 , 即 所谓 的 “ 维 数灾难 ” 〔,〕 . 事实上 , 在 高维数据 坐标 中 , 有些 数 据极具相关性 , 有些数据可 能对 反 映烧结 矿质 量 的贡献率很微 小 , 可 见数据压缩是 十分必要 的 `2] . 压缩模 式空 间维数 , 以便在 推断烧结 矿质 量过程时缩短计算 时间 , 提 高运 算速度是模式 识别技术 的关键 . 特征怎 与不 的相关 系数按下 式计算 : 艺x( * 一系)*x(j 一耳) 卜1 「名 , 一 、 , 名 , _ 、 }乙 嶙 ik 一 ix 少 乙、为众一 xj 厂严1 L k = l 卜 I J ( l ) 第二步 求 出 R 的全部特征值义 , , 又 2 , … 沐 , 和 对应 的特征 向量 u l , 姚 , … , u , ;并将各 特征值按照 从大到小 的顺 序排列 , 也就是使又 」之 又 2沙 二 之凡; 特 征 向量也应按照 对应特 征值的顺序排列 . 第三 步 按式 叮= 艺刀艺凡求前 m 个 主 元的 累 计方差贡献率 . 当其值 已经足 够大( 例如 ) 85 % ) 时 , 取前 m 个 主元作 为新 特征 , 转 向第 四 步 ; 否 则m = m +l 重 复第 三步 . 第 四 步 计算前 m 个新 特征 艺 , K , … 乙 . 计 U二内乙,.几- ,山2 阵队巨尸风 1 数据压缩技术 L l 基本思想 为 了提高识别 的精度 和效 率 , 利用 原有各 个特征构造一批新 特征 , 而不是从原有 的特征 中进行选择和 淘 汰 . 每个新特征都是原有各特 征 的函数 , 但新 特征的总数少于原有特征 的 总 数 . 这样 , 新特征集合既保证了原来各特征的 主 要信息 , 又 达到了 降低空 间维数 的 目的 . 主元分 析法就是在这种思想指导下产生 的一种很有效 的数据压缩技术 `3,4 .] 1 . 2 数据压缩过程 整个 数据压缩 的计算步骤如下 : 第一 步 求 出原有特征 的相关系数矩阵 R , 收稿 日期 2 0 01 一5一 1 王粉 花 女 , 30 岁 , 讲 师 材 I n 封加 双, 月 ( 2 ) 2 实例分析 本文利用 唐山 钢铁公 司第二炼铁 厂 N 一 90 计算 机控制系统收集 的 or o 多个原始样本 , 经 综合分析处 理后 , 得 到了具有 高质量 的有效样 本 59 个 , 根据工艺知识 和专 家经验 , 笔者用 21 个原始特征来描述烧结矿质量 , 它们分别是 : ( l) Q e ao ; ( 2 ) V: ( 3 )cQ : ( 4 )不 : ( 5 )兀 ; ( 6 ) 5T : ( 7 ) 不 1 ; ( 8 )不 : ; ( 9 ) 不 : : ( 10 )不 : : ( 1 1 )不 9 ; ( 12 ) 兀 。 ; ( 13 )兀 1 ; ( 14 )P , ; ( 15 ) 几 ; ( 1 6)几 ; ( 1 7)只 ; ( 1 8 )P ,: : ( 19 )zP 2 ; ( 2 0 )口 F困 ; ( 2 1) Q R . 其 中 : cQ ao 为氧化 钙纯量 ,比 ; v 为台车速度 , DOI: 10. 13374 /j . issn1001 -053x. 2002. 05. 023
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有