第号第2谢sn101-03x.2001.02罪4京科技大学学报 Vol23 No.2 2001年4月 Journal of University of Science and Technology Beijing Apr.2001 基于统计空间映射的模式识别 及在线质量推断 徐正光王海涛 瞿寿德 北京科技大学信息工程学院,北京100083 摘要采用回归分析的方法,建立特征变量与产品质量之间的统计对应关系,把产品质量 表达成特征变量的回归函数,进而得到特征空间与产品质量空间在统计意义上的映射关系.在 产品质量空间进行聚类,在特征空间进行分类,而后提出了一种基于统计空间映射的在线模式 识别方法.利用唐钢烧结厂的实测数据进行了仿真,验证了本方法的正确性.从算法分析和仿 真结果看,这一算法可以有效地克服模式交叉现象的影响,并可对复杂生产过程进行在线质量 推断. 关键词 复杂生产过程;模式识别;统计空间映射 分类号 0235;TP11 复杂生产过程的生产工况与产品质量不具 其线性回归模型可表示为: 备准确单值对应的函数关系,仅仅控制复杂生 y(t)=bo+bix:(f)+b2x2(t)+..+bx(t)+8(t) 产过程的生产工况并不能保证产品质量完全合 这里b,b,,b称为回归系数. 格(或者说不能保证高品质的产品).这就给复 其回归函数为: 杂生产过程的控制带来了新的课题,如何利用 yt)=bo+bx(t)+bxx()++bx(t) (2) 检测到的生产工况信息判断产品的质量,如何 式(②)可表达为向量形式: 根据预测或检测到的产品质量信息进行复杂生 yt)=[bo,b,b][1x(t)x-(t),.xAt)]=Bx"(t) 产过程的控制.针对上述分析,以冶金烧结台床 如果得到n组关于),)}的样本,则可用最 为实际背景,提出了一种基于统计意义上的在 小二乘法估计回归系数:b,b1,,b 线质量推断方法一一基于统计空间映射的模式 B-(XXXY (3) 识别方法四.并用唐钢第一烧结厂实测的样本数 这里 据进行了仿真研究,用来验证复杂生产过程的 Y=b1)y2),…yn',X=[x(1),x(2),…x(nl 在线质量推断 x()=[1x(t0,x(0,…0]t=1,2,",n. B=[b1,b2,,b,] (4) 1 特征空间与质量指标空间的统计 在得到模型的回归参数后,为了检验模型 影射关系 是否表达了数据间的相随变动关系,必须进行 回归模型的显著性检验.·如果应变量的均值 回归分析四是分析具有相随变化的数据间 E)不随x(),x(),,x()的变化作线性变化, 统计关系的有力工具.通过均值意义上的回归 则,b=ba=…=bg=0,否则,E6)应随x(), 函数,给出数据间的统计函数关系 x(),…)的变化作线性变化.所以对回归模型 表达变量()与一组变量()之间的统计 作显著性检验就是要检验假设 关系可用如下回归模型表示: Ho:bn=bn=…=bn=0 (5) 0)=fx(tHε() (1) 记偏差平方和为SST,残差平方和为SSE, 这里,)称为因变量,)称为解释变量 回归平方和为SSR. SSR/t 收稿日期2000-06-23徐正光男,40岁,副教授博士生 定义F=SSEn-t-T (6) *国家自然科学基金资助课题No.69472023) 在假设为真时,(⑥)式应服从F分布,对给定的
第 2 3 卷 第 2 期 2 0 1 年 4 月 北 京 科 技 大 学 学 报 OJ u r n a l o f U n iv e玲iyt o f s e le n e e a n d eT c h n o fo gy B e ij in g V bL 23 AP .r N 0 . 2 20 1 基于统计空间映射的模式识别 及在线质量推断 徐正光 王 海涛 瞿寿德 北京科技大学信息工程学院 , 北京 1 0 0 0 83 摘 要 采用 回归分析的 方法 , 建立特征变量 与产 品质 量之间 的统计对 应关系 , 把产品质量 表达成 特征变 量的 回归 函数 , 进而得到特征 空 间与产品质量空 间在 统计意 义上 的映射关系 . 在 产品质 量空 间进行聚类 , 在特征空 间进行分类 , 而后提出 了一种基于统计空 间映射的在线模式 识别方法 . 利用唐钢烧结厂 的实测数据进行 了仿真 , 验证了本方法的 正确性 . 从算法分析和仿 真结果看 , 这 一算法 可以 有效地克服模式交叉现象的影响 ,并可对复杂生 产过程进行在线质量 推断 . 关键词 复杂 生产过程 ; 模式识别 ; 统计空 间 映射 分类 号 0 2 35 : PT 1 1 复杂生产过程的生产工况 与产品质量不具 备准确单值对应 的 函数关系 , 仅仅控制复杂生 产过程的生产工况并不能保证产品质量完全合 格 ( 或者说不能保证 高品质 的产品 ) . 这就 给复 杂生产过程 的控制带来 了新 的课题 , 如何利用 检测到 的生产 工况信息判断产 品 的质量 , 如何 根据预测或检测到 的产品质量信息进行 复杂生 产过程的控制 . 针对上述分析 , 以冶金烧结 台床 为实际背景 , 提 出了一种基 于统 计意义上 的在 线质量推 断方法— 基 于统计 空间映射 的模式 识别方法 1] . 并用唐钢第一烧结厂实测的样本数 据进行 了仿真研究 , 用来验证复杂生产过程 的 在线质量推断 . 1 特征空 间与质量指标空 间的统计 影射关系 回 归分析 `2 ,是分析 具有相随变化 的数 据间 统计关 系的有力工具 . 通过均值 意义上 的 回归 函数 , 给出数 据间 的统计 函数关系 . 表 达变量 只t) 与一组 变量 ’x( 乃之间 的统 计 关 系可用如下 回归模 型表示 : y (t) 二 户禹(月)斌t) ( l) 这里 , 只t) 称 为因变量 , xj( t) 称为解 释变量 . , 收 稿日期 2 0 0刁卜2 3 徐正光 男 , 40 岁 , 副教授 , 博士生 * 国家 自然科学基金 资助课题伽.0 6 94 7 2 0 2 3) 其线性 回归模 型 可表示为 : 只)t = b0 + b l xl ()t + b Z为()t + … 十bj x,{ )t + 找)t 这里 b0, 阮 , … , bj 称 为 回归系数 . 其 回归 函数 为: 只乃= 云 。钻lx (t) + 吞式2 (t) +. ~ 十帆(t) (2 ) 式(2 )可表 达为 向量形式 : 只t) = 「bo, b l , b,] 【1丙 ()t 丙 ()t , … 以t)] T只a 尸(t) 如果得 到 n 组关于 扭t) , x,( )}t 的样本 , 则可用最 小二 乘法估计回归 系数 : b0 , 阮 , … , ’b. 刀= 伏丫田 , Y ( 3 ) 这里 Y = 区l )抓2 ) , …武 n )] T , X “ 【了( 1 )了 (2 ) , …了 ( n )〕 , 城t) = 汇1丙 (t) 丙(t) , … 丙(t) 〕 t = 1 , 2 , … , .n =B b[, ,bz ’, .,bj l (4) 在得 到模 型 的 回归参数后 , 为 了检验模型 是否表 达了 数据间 的相 随变 动关系 , 必须进行 回 归模 型 的显著 性检 验 一 如 果应 变量 的均值 石州功 不随 xl (t) 丙 (t) , … , 以力的变化作线性变化 , 则禹 , = b 。 = 一 b 。 = O , 否 则声伽(t) 应 随 xl (t) , xz( t) , … 以t) 的变化作线性变化 . 所以对 回归模型 作显著性检验 就是要检验假设 0H : 氏 , = b 。 = 一氏= 0 ` · ( 5 ) 记偏 差平方 和为 S S T , 残差平方 和 为 S SE , 回归平方和为 S S .R 定义 F S SR/ t 一 S S (E/ n 一 t 一 l ) 在假设为真时 , (6 )式应服从 F 分 布 , ( 6 ) 对 给定 的 DOI: 10. 13374 /j . issn1001 -053x. 2001. 02. 024
·182· 北京科技大学学报 2001年第2期 显著性水平假设检验的拒绝域为: (3)对每次聚类过程中,没有样本划入的类 F>F1-a(t,n-t-1) (7) 别,保持其聚类中心不变,而只对有样本划人的 如果(⑦)式成立,则假设不成立,即(②)式成 类别,计算新的聚类中心. 立,E(y)》随x(),x(0,",x)的变化作线性变化. 这样一方面保持了模式类别覆盖数据的分 根据回归分析方法还应作参数的显著性检 布区间,另一方面利用ISODATA聚类算法的类 验,以确定每个回归参数对应变量的影响程度. 别分裂功能,在数据密集区进行了足够的类别 这里考虑到最终的应用只是确定2个空间的类 细分,保证了在工作点附近的类别区分性能. 别及判别函数之间的映射,参数对应变量的影 对ISODATA聚类算法的几个初始参数作 响程度并不重要,因此在本文没有作参数的显 如下考虑:为了获取足够多的关于烧结矿质量 著性检验. 区别的信息及为下一步作烧结工况的预测模 回归函数(2)式表示了产品质量空间与特征 型作准备,根据唐钢烧结厂实际工况参数的数 空间的统计映射关系,通过公式(2),在均值意义 据结构,取:(1)期望得到的聚合数目K,本文中 上,产品质量表达为特征变量的回归函数.产品 K=40;(2)一个聚合中的标准偏差参数日.,初始 质量作为因变量,用y(),i=1,2,3分别表示氧化 标准偏差参数0,=0.2;(3)其余的初始参数则考 亚铁、转鼓指数、碱度.特征变量作为解释变量, 虑在仿真时不断调整. 用x(),1,2,3,…,9表示.其线性回归模型可以 通过聚类我们在质量指标空间得到了根据 表示为: 质量指标差异划分的类别:类别中心Z();每个 y(t)=bo+bx(t)+bx(t)+…+bx(t)+elt0),=l,2,3(8) 样本与每个聚合中心的距离Dy,Z();判别准 则Dk,ZD》=min{Dyk,Z(U). 2质量空间的模式聚类 3特征空间的分类 在描述复杂生产过程工况的特征变量与产 品质量之间也只存在一种相随变化的统计关 通过在产品质量空间的聚类分析,得到了 系.为了用模式识别的方法来推断复杂生产过 关于产品质量差异划分的类别,以及关于产品 程的产品质量,有必要在产品质量空间直接进 质量空间的类别中心、距离函数及判别准则. 行模式类别的划分.本文应用了动态模式识别 在烧结生产的实际操作中,烧结台床的工 方法中的ISODATA聚类算法3,并根据工艺生 况的检测是可以实时进行的,其检测参数的采 产的实际情况在产品质量空间进行模式聚类, 样时间也是较短的,而烧结矿的质量检验一般 得到了关于产品质量的模式类别及判别函数. 时间间隔比较长.以唐钢烧结厂为例,烧结台床 这样在划分后的模式类别之间存在着产品质量 工况的检测,1h记录1次工况参数,而烧结矿 上的差异,为操作及控制生产工况提供了依据. 产品质量的检验是4h给出1次产品质量的检 ISODATA聚类算法的讨论. 验结果,因此为获得烧结矿的在线质量推断,有 根据唐钢烧结厂提供的烧结工况的检测数 必要在描述烧结机生产工况的特征空间进行模 据及对产品质量的要求,考虑到在产品质量空 式类的划分.具体算法如下: 间划分类别的目的是要提供烧结矿质量优劣的 (1)通过回归分析方法,获得每个产品质量 信息,为了保证足够多的区分产品质量优劣的 与特征变量之间的回归函数. 类别,达到类别的分布既可以覆盖产品质量分 ·(2)将产品质量与特征变量之间的回归函数 布的主要区间,同时又能在正常状态(工作点) 代入: 附近具有足够的区分性能,我们选择了ISODA- 类别中心ZU,), TA聚类算法,并作如下改进: 每个样本与每个聚合中心的距离D, (1)首先根据采集到的样本数据的分布,确 ZJ)》, 定初始类别中心,使初始类别中心均匀分布并 判别准则Dy,ZJ,)=min{Dy,ZW)》; 覆盖整个样本数据的分布区间. 得到关于特征空间的类别中心Z(W), (2)取消了ISODATA聚类算法中减少类别 每个样本与每个聚合中心的距离Dxk, 和类别合并的功能 ZU))
一 1 8 2 . 北 京 科 技 大 学 学 报 0 01年2 第 期 2 显著性水平假设检 验的拒绝域为 : 兀F > 一 a ( ,t n 一 t一 1) ( 7 ) 如果 (7 )式成立 , 则假设不 成立 , 即 (2 )式成 立 声伽(t) 随尤 t (t) 丙 (t) , … , 以t) 的变化作线性变化 . 根据 回归分析方法还应作参数 的显著性检 验 , 以确定每个 回归参数对应变量 的影响程度 . 这里考虑到最终的应用只 是确定 2 个空 间的类 别及判别 函数 之间的映射 , 参数 对应变量 的影 响程度并不重 要 , 因此在本 文没有作参数 的显 著性检验 . 回归 函数(2) 式表示 了产 品质量空间与特征 空 间的统计映射关系 , 通过公式 (2) , 在均值 意义 上 , 产品质量表达为特征变 量的回归 函数 . 产 品 质量作为因变量 , 用 iy (t), i = 1 , 2 , 3 分别表示 氧化 亚铁 、 转鼓指数 、 碱度 . 特征变量作 为解释变量 , 用xj (t) ’=,j 1 , 2 , 3 , … , 9 表示 . 其线性 回归模 型可 以 表示 为 : 另(t) = b砂b `, x l (t) + b ,燕()t + … + b丙()t 忱 I ( )t , 卜 l , 2 , 3 ( 8 ) (3 ) 对每次 聚类 过程 中 , 没有样本划人 的类 别 , 保持其聚类 中心不变 , 而只对有样本 划人 的 类别 , 计算 新的聚类 中心 . 这样一方面保持 了模式类别覆盖数 据的分 布 区 间 , 另一方面利用 sI O D A I A 聚类算法 的类 别分 裂功能 , 在 数据密集区进行 了 足够 的类别 细分 , 保证 了在工作点 附近的类别 区 分性能 . 对 sI 0 D A I人 聚类算法 的几个 初始参数作 如 下考 虑 : 为 了获取足够 多的关于烧结矿质 量 区 别 的信 息及 为下 一 步作烧 结 工况 的预测模 型作 准备 , 根据 唐钢烧结厂实 际工况参数 的数 据结 构 , 取 : ( 1) 期望得 到的聚合数 目K, 本文 中 =K 4;0 (2 )一个 聚合 中的标准偏 差参数 s0 , 初 始 标 准偏差参数 氏闭 . 2 ; (3 )其余 的初始参数则 考 虑在仿真时不断调整 . 通过 聚类我们在质量指标 空间得 到了根 据 质量指标差异划分 的类别 : 类别 中心 各切 ; 每个 样本 与每个聚合 中心的距离 D 伙 , 乌切;) 判别准 则 刀伽 , 乙切) = m l n {D认 , 各切) . 2 质量空间的模式聚类 、 在描述复杂生产过程工况的特征变量与产 品质 量之 间也 只 存在 一 种相 随变化 的统 计关 系 . 为 了用模式识别 的方法来推 断复杂生产过 程的产品质量 , 有必 要在产品质量空 间直接进 行模式类别 的划分 . 本文应用 了动态模式识 别 方法 中的 sI O D 八T A 聚类算 法1[,3 ,4] 并根据 工艺生 产 的实 际情况 在产 品质 量空间进行模式 聚类 , 得到 了关 于产品质量 的模 式类别及判别 函 数 . 这样在划分后 的模式类别之间存在着产 品质量 上的差异 , 为操作及控制生产工况提供 了依据 . sI O D A I A 聚类算法 的讨论 . 根据唐钢烧结 厂提供 的烧结工况 的检测数 据及对产 品质量 的要求 , 考虑 到在产品质量空 间划分类别 的 目的是要提供烧 结矿质量优劣 的 信息 , 为了保证足够多 的区分 产品质量优劣 的 类别 , 达到类别 的分布既 可以覆 盖产品质量分 布 的主要 区 间 , 同时又 能在正 常状态 (工作点 ) 附近具有足够的区 分性能 , 我们选择 了 sI o D A - TA 聚类算法 , 并作如下改进 : ( 1) 首先根 据采集到的样本数据 的分 布 , 确 定初始类别 中心 , 使初始类别 中心均匀分布并 覆盖整个样本数 据的分布 区 间 . (2 ) 取消 了 sI 0 D IA 陈 聚类 算法 中减少类别 和类别合 并的功能 . 3 特征空 间的分类 通过在产 品质量空 间的聚类分 析 , 得到 了 关于产 品质量差异划 分的类别 , 以及关于产 品 质量空 间的类别 中心 、 距 离 函数及 判别准则 . 在烧结生产 的实际操作 中 , 烧结 台床的工 况 的检测是可 以 实时进行 的 , 其检测参 数的采 样时 间也是较 短的 , 而烧 结矿 的质量检 验一般 时间间隔 比较长 . 以唐钢烧结厂为例 , 烧结 台床 工况 的检测 , l h 记 录 1 次工 况参数 , 而烧结矿 产 品质量 的检 验是 4 h 给 出 1 次产 品质 量的检 验结果 . 因此为获得烧结矿的在线质量 推断 , 有 必要在描述烧结机 生产 工况 的特征空 间进行模 式类 的划 分 . 具体算 法如下 : (l) 通过 回归分析方法 , 获得 每个产品质量 与特征 变量之间的 回归 函数 . (2 )将产品质量与特征变量之间的 回归函数 代人 : 类别 中心 乌认) , 每 个 样 本 与 每 个 聚 合 中心 的 距 离刀伙 , 汤怀 ) , 判别 准则刀伽 滋 , 乌y(J D , in {D伙 , 易(J, ) ; 得 到关 于特征空 间的类 别 中心各x(J ) , 每 个 样 本 与 每 个 聚 合 中 心 的距 离 D 伙 七 , 汤x(J )
VoL23 No.2 徐正光等:基于统计空间映射的模式识别及在线质量推断 ·183 判别准则D,ZJ)=minD(x,ZU) 使用44组样本中的前35个样本在产品质 (3)将在特征空间获取的特征变量样本代入 量空间进行聚类,初始聚类中心设为20个,经 判别函数,完成特征空间的样本分类 聚类得到25个关于产品质量空间的类别及相 应的类别中心.将产品质量空间的聚类结果映 4仿真研究 射回特征空间,在特征空间使用44组样本中剩 实验在唐钢烧结厂提取了9个烧结机参数 余的9个样本进行分类,其中8个分类正确,1 作为反映烧结机生产工况的特征变量,构成特 个分类错误,识别率达到89%. 征空间.同时记录了与其相对应时刻的烧结矿 的3个产品质量:氧化亚铁FeO含量;转鼓指 5 结论 数SO,碱度R,用来构成产品质量空间. 复杂生产过程控制的根本目的是为了保证 将3个产品质量作为因变量,表示为y,, 产品的质量,从这一新概念出发,论证了复杂生 y,9个特征变量作为解释变量,表示为x,,x, 产过程的工况与产品质量之间存在着的一种相 x,x,x,,x,,分别来考虑9个解释变量对每 随变化的统计关系,但不能用数学模型来描述. 个因变量的影响关系.应用回归分析方法,得到 在这一基础上提出了基于统计空间映射的模式 关于产品质量与特征变量的3个回归模型为: 识别方法,通过仿真验证了该方法的正确性.该 FeO含量 方法同时也是一种复杂生产过程的在线质量推 y=0.000616x1-0.001755x+0.002748x3- 断方法.我们下一步将给出动态模式识别的新 0.000193x4-2.063111x5-0.000082x6+ 的定义,并完成基于动态模式识别的模式类预 0.000511x-0.000245x+0.012093x (9) 测模型. ISO 参考文献 y=-0.002633x+0.022193x2+0.004074x+ 1李金宗,模式识别导论.北京:高等教育出版社,1994 0.002931x4-7.220137x+0.008138x6- 2周纪芗.回归分析.上海:华东师范大学出版社,1993 0.002841x,+0.004316xg+0.102647x (10) 3任若恩,王惠文,多元统计分析一理论、方法、实 R 例.北京:国防工业出版社,1997 4盟寿德.智能自动化的模式识别方法.北京科技大学 y=-0.007545x1-0.002984x2-0.001086x+ 学报,1998,22(2):385 0.005735x4+9.032436x+0.001972x6+ 0.005535x7-0.006256xg-0.162582x (11) A Pattern Recognition Method based on Statistical Mapping Space XU Zhengguang, WANG Haitao, OU Shoude Information Engineering School,UST Beijing,Beijing 100083,China ABSTRACT The statistical relationship between feature vector and quality index is built by regress analysis and then the quality index is expressed to the regress function of feature vector.By this means,a statistical ma- pping relation between in feature space and quality index space is built and a online pattern recognition method based on the statistical mapping space is provided through the clustering in quality space and classification in feature space.The validity of the method is verified by the simulation results of the data from Sinter factory of Tangshan Steel Corporation.From the algorithm analysis and simulation results,this method can effectively overcome the pattern intercross and can be used for complex production process quality online prediction. KEY WORDS complex production process;pattern recognition;statistical space mapping
V七L 2 3 N o . 2 徐 正光等 : 基于 统计 空 间映射 的模式识 别及 在线 质量 推断 . 18 3 - 判 别准则 D 伪 , 写x(J ) =nI i nD xk( , 乙x(J .) (3 )将在特征空间获取的特征变量样本代人 判别 函数 , 完成特征空 间的样 本分类 . 4 仿真研究 实验在唐钢烧结厂提取 了 9 个烧结机参数 作为反映烧结 机生产工况 的特征变量 , 构成特 征空 间 . 同时记录 了与其相对应 时刻的烧结矿 的 3 个产 品质量 : 氧化亚铁 eF o 含量 ; 转鼓指 数 15 0 , 碱度 R , 用来 构成产 品质 量空间 . 将 3 个产 品质量作 为因变量 ,表示 为 yl ,儿 , 乃 , 9 个 特征变量作 为解 释变量 , 表示 为x l , 丸 , xs, 为 , 凡 , 石 ,为 , 石 , 两 , 分别来 考虑 9 个解释变量对每 个 因变量的影响关 系 . 应用回 归分析方法 , 得到 关 于产 品质量与特征变量 的 3 个 回 归模型 为 : F e o 含 量 y l = 0 . 0 0 0 6 1 x6 , 一 0 . 0 0 1 7 5 5 x 2+ 0 . 0 0 2 7 4阮一 0 . 0 0 0 1 9 3X4 一 2 . 0 6 3 l l l x s 一 0 . 0 0 0 0 8 2 x ` + 0 . 0 0 0 5 1 1为一 0 . 0 0 0 2 4 xs5 + 0 . 0 12 0 9 3两 (9 ) 15 0 y 厂一 0 . 0 0 2 6 3 3 x ,+ 0 . 0 2 2 19 3丸+ 0 . 0 0 4 0 7 xs4 + 0 . 0 0 2 9 3 1为一 7 . 2 2 0 1 3 7 x ,+ 0 . 0 0 8 13歇 6 一 0 . 0 0 2 8 4 1 x , + 0 · 0 0 4 3 1 xs6 + 0 . 10 2 64 x79 ( 10 ) R y3 = 一 0 . 0 0 7 5 4 5 x , 一 0 . 0 0 2 9 8x4 2一 0 . 0 0 1 0 8 x6 ,+ 0 . 0 0 5 7 3 5 x 4+ 9 . 0 3 2 4 3 x6 5+ 0 . 0 0 1 9 7 x2 `+ 0 . 0 0 5 5 3 5 x ,一 0 . 0 0 6 2 5 6 x . 一 0 . 16 2 5 8 2x , ( 1 1) 使用 4 组样本 中的前 35 个样本 在产 品质 量空 间进行 聚类 , 初始 聚类 中心设为 20 个 , 经 聚类得 到 25 个 关于产 品质量空 间的类别及相 应 的类别 中心 . 将产品质量空 间的聚类结果映 射 回特征空 间 , 在特征空间使用 科 组样本 中剩 余 的 9 个样本进 行分类 , 其中 8 个分 类正确 , 1 个分类错误 , 识 别率达到 89 % 5 结论 复杂生产过程控制 的根本 目的是为 了保证 产 品的质量 , 从这一新概念 出发 , 论证 了 复杂生 产过程 的工况与产品质量之间存在着 的一种相 随变化 的统计关 系 , 但不能用数学模 型来描述 . 在这一基础上提出了基 于统计空 间映射 的模式 识别方法 , 通过仿 真验证了该方法的正确性 . 该 方法 同时也是一种复杂生产过程 的在线质量推 断方 法 . 我们下一 步将 给 出动态模式 识别 的新 的定 义 , 并完成基 于动态模式识别 的模式类预 测模 型 . 参 考 文 献 1 李金 宗 . 模式识别导 论 . 北京: 高等教育出版社 , 19 94 2 周纪 萝 . 回归分析 . 上海:华东师范大学出版社 , 19 93 3 任 若恩 , 王 惠文 . 多元统计分析— 理论 、 方法 、 实 例 . 北京 : 国防工 业出版社 , 1 9 7 4 霍寿德 . 智能自动化的模式识别方 法 . 北京科技大学 学报 , 19 98 , 2 2 ( 2) : 38 5 A P at e nr R e e o g n it i o n M e ht o d b a s e d on S t at i s ti c a 1M ap P in g S P a e e 了U hZ 环月刃G 月乞iat o , QU hS o u de I n fo n u iat o n E n g l n e . r in g S c b o l , U S T B e ij ign , B e ij ign 10 0 0 83 , C h in a A B S T R A C T Th e s at i ist c al er lat i o n s h iP b e wt e en fe a t 珍e ve c otr an d q u a 】iyt in de x 1 5 加ilt by r e gr e s s an aly s i s a n d ht e n het q u a l iyt in d e x 1 5 e x Per s s e d t o het er g6r s s 丘nI e it o n o f fe a it ir e v e e ot r’ B y 而s m e an s , a s at i s it e al ma - P Pign r e liat o n b e t w e e n in fe a t ur e sP ac e an d q u a 1 iyt in d e x sP a c e i s b u iit an d a o ul ien Pat em er e o gn it 1on m e ht o d b as e d on ht e s at i ist e a l m aP Pi n g sP ac e 1 5 P r o v ide d htr o u hg het e in s t e r in g in q u a l iyt sP ac e an d e l a s s iif c iat on in fe a t u r e sP a e e . T h e v al id iyt o f ht e m het od 1 5 ve ir if e d by ht e s lm u liat on er s u lst o f het d at a fr o m S int er fa c t o yr o f T a n g s h an S et e l C o rp or at ion . F r o m ht e a l g o ir t hln an a 】y s i s an d s 加u l iat on er s u lt s , ht i s m e ht o d e an e fe e t i v e ly O V e r c om e ht e Pa t e m iin ecr or s s an d c an b e u s e d for c o m Plex Pr o du c it on P r o e e s s q ua l iyt Oul i n e Pr e id e it on . K E Y W O R D S e o m P lex rP o d u c t ion Por e e s s : Pa t e m er e o gn it i o n : s枉吐ist i e a l s P a e e m a P Pi n g