D0I:10.13374/.issn1001-053x.2012.04.008 第34卷第4期 北京科技大学学报 Vol.34 No.4 2012年4月 Journal of University of Science and Technology Beijing Apr.2012 基于核主成分分析的热轧带钢头部拉窄分析 何飞”四徐金梧2》阳建宏》黎敏2) 1)北京科技大学国家板带生产先进装备工程技术研究中心,北京1000832)北京科技大学机械工程学院,北京100083 ☒通信作者,E-mail:hefei@usth.edu.cn 摘要将核主成分分析方法引入热轧生产过程的监控与诊断中,根据平方预测误差统计量进行生产过程监控,然后利用数 据重构和优化的邻域选取策略相结合的方法求出各工艺参数对平方预测误差统计量的作用,分析引起过程异常的主要工艺 参数,最后利用仿真和热轧带钢实际生产数据进行实验.结果表明:基于核主成分分析的平方预测误差统计量能较准确诊断 过程的异常,并可以找出引起异常的原因,为调整生产过程提供方法支撑,防止次品的出现, 关键词热轧:带钢;产品质量:主成分分析:数据分析 分类号TG335.1:TP391.5 Cause analysis of the head width narrowing of hot rolled strips based on the ker- nel principal component analysis HE Fei☒,XU Jin-wu2,,YANG Jian-hong》,I Min?》 1)National Engineering Research Center of Flat Rolling Equipment,University of Science and Technology Beijing.Beijing 100083,China 2)School of Mechanical Engineering,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:hefei@ustb.edu.cn ABSTRACT A method of production quality monitoring and diagnosis based on the kernel principal component analysis was intro- duced in the hot rolled strip process.The squared prediction error(SPE)statistic was used in process monitoring.The diagnosis crite- rion could express the influential importance to SPE,which was computed by the data construction method and the optimal neighbor se- lection strategy.Finally,simulation data and actual production data were used for model validation.The result shows that the SPE sta- tistic based on the kemel principal component analysis can detect the abnormality and track the causes of faults effectively for adjusting the production process to prevent from substandard products. KEY WORDS hot rolling;strips:product quality:principal component analysis:data analysis 热轧带钢的宽度精度是热轧成品质量的重要指 用数据分析方法进行生产过程的诊断是一个新的 标口,精确的宽度控制不仅可提高产品的成材率, 课题-习 而且将给热轧用户及后部工序创造好的生产条件. 实际生产过程各工艺参数间存在着非线性关 热轧带钢的头部拉窄是指带钢头部的宽度实际值小 系,主成分分析(principal component analysis, 于目标值.某条热轧带钢生产线改造后出现大量的 PCA)、偏最小二乘法作为线性方法,难以有效 头部拉窄现象.由于热轧生产工艺参数众多,各工 提取非线性关系.目前解决非线性过程监控的神经 艺参数与质量指标之间存在复杂的内在关系,难以 网络方法是建立在经验风险最小化的基础上,泛化 建立机理模型分析头部拉窄的原因.现代化的生产 能力较差,另外模型结构也较难确定,需要解决复杂 线中记录了大量生产数据,如何充分利用这些数 的非线性优化问题:而核函数方法是通过核函数将 据对生产过程进行监控,出现质量异常时,如何利 原始空间的非线性问题转化为高维特征空间的线性 收稿日期:201102-21 基金项目:国家自然科学基金资助项目(51004013):国家高技术研究发展计划资助项目(2009AA04Z136):高等学校博士学科点专项科研基金 资助项目(20110006110027):国家“十二五”科技支撑计划资助项目(2012BAF04B02):中国博士后基金资助项目(20110490294)
第 34 卷 第 4 期 2012 年 4 月 北京科技大学学报 Journal of University of Science and Technology Beijing Vol. 34 No. 4 Apr. 2012 基于核主成分分析的热轧带钢头部拉窄分析 何 飞1) 徐金梧1,2) 阳建宏2) 黎 敏2) 1) 北京科技大学国家板带生产先进装备工程技术研究中心,北京 100083 2) 北京科技大学机械工程学院,北京 100083 通信作者,E-mail: hefei@ ustb. edu. cn 摘 要 将核主成分分析方法引入热轧生产过程的监控与诊断中,根据平方预测误差统计量进行生产过程监控,然后利用数 据重构和优化的邻域选取策略相结合的方法求出各工艺参数对平方预测误差统计量的作用,分析引起过程异常的主要工艺 参数,最后利用仿真和热轧带钢实际生产数据进行实验. 结果表明: 基于核主成分分析的平方预测误差统计量能较准确诊断 过程的异常,并可以找出引起异常的原因,为调整生产过程提供方法支撑,防止次品的出现. 关键词 热轧; 带钢; 产品质量; 主成分分析; 数据分析 分类号 TG335. 1; TP391. 5 Cause analysis of the head width narrowing of hot rolled strips based on the kernel principal component analysis HE Fei 1) ,XU Jin-wu1,2) ,YANG Jian-hong2) ,LI Min2) 1) National Engineering Research Center of Flat Rolling Equipment,University of Science and Technology Beijing,Beijing 100083,China 2) School of Mechanical Engineering,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail: hefei@ ustb. edu. cn ABSTRACT A method of production quality monitoring and diagnosis based on the kernel principal component analysis was introduced in the hot rolled strip process. The squared prediction error ( SPE) statistic was used in process monitoring. The diagnosis criterion could express the influential importance to SPE,which was computed by the data construction method and the optimal neighbor selection strategy. Finally,simulation data and actual production data were used for model validation. The result shows that the SPE statistic based on the kernel principal component analysis can detect the abnormality and track the causes of faults effectively for adjusting the production process to prevent from substandard products. KEY WORDS hot rolling; strips; product quality; principal component analysis; data analysis 收稿日期: 2011--02--21 基金项目: 国家自然科学基金资助项目( 51004013) ; 国家高技术研究发展计划资助项目( 2009AA04Z136) ; 高等学校博士学科点专项科研基金 资助项目( 20110006110027) ; 国家“十二五”科技支撑计划资助项目( 2012BAF04B02) ; 中国博士后基金资助项目( 20110490294) 热轧带钢的宽度精度是热轧成品质量的重要指 标[1],精确的宽度控制不仅可提高产品的成材率, 而且将给热轧用户及后部工序创造好的生产条件. 热轧带钢的头部拉窄是指带钢头部的宽度实际值小 于目标值. 某条热轧带钢生产线改造后出现大量的 头部拉窄现象. 由于热轧生产工艺参数众多,各工 艺参数与质量指标之间存在复杂的内在关系,难以 建立机理模型分析头部拉窄的原因. 现代化的生产 线中记录了大量生产数据,如何充分利用这些数 据对生产过程进行监控,出现质量异常时,如何利 用数据分析方法进行生产过程的诊断是一个新的 课题[2--3]. 实际生产过程各工艺参数间存在着非线性关 系,主 成 分 分 析 ( principal component analysis, PCA) 、偏最小二乘法作为线性方法[4--5],难以有效 提取非线性关系. 目前解决非线性过程监控的神经 网络方法是建立在经验风险最小化的基础上,泛化 能力较差,另外模型结构也较难确定,需要解决复杂 的非线性优化问题; 而核函数方法是通过核函数将 原始空间的非线性问题转化为高维特征空间的线性 DOI:10.13374/j.issn1001-053x.2012.04.008
·438 北京科技大学学报 第34卷 问题,且核函数方法是建立在结构风险最小化的基 如果P足够大,等于所有非零特征值的个数,则上式 础上,较好地解决了模型泛化能力问题,运算较简 可写为(x)=p(x).但是,通常为了消除噪声和 单6-).核主成分分析(kernel principal component 降低维数,选取的主成分的个数p一般都要小于非 analysis,.KPCA)即是其中一种.核主成分分析应用 零特征值的个数.前p个特征值的和除以所有特征 于产品质量监控中已有一些研究),但出现过程 值的和,被定义为主成分累计解释率,表示前p个主 异常后的质量诊断成为难点,Cho等o将核函数 成分所解释的数据信息占全部数据信息的比例.主 梯度法引入到质量诊断中,但计算复杂,难以工业应 成分个数通常利用主成分累计解释率大于一定比例 用.本文提出了一种新的质量诊断方法,将核主成 来选取. 分分析的数据重构方法和优化的邻域选取策略算法 在故障诊断中需要计算原始数据空间中的变量 相结合引入到故障诊断中,能更准确地发现引起过 对生产过程的影响,才能诊断出引起故障的工艺参 程异常的工艺参数.利用仿真数据和带钢热轧生产 数.为了得到在原始输入空间x的重构值,通常计 过程数据验证了该方法的有效性 算一个向量z,使之满足条件p(z)=P(x),即要求 1核主成分分析 向量z是原始输入空间中向量x的一个较好的近似 值.但是,由于核变换的逆变换难以求得,通常可以 核主成分分析的基本思想是将数据从输入空间 最小化下式来求出向量z): 映射到高维特征空间,然后在特征空间利用线性主 p(z)=‖p(z)-p(x)I2 (7) 成分分析方法计算主成分1-回.给定N个样本 可以将上式写成 {x1,x2,…,xv}∈R",由非线性函数p()将输入数 p(z)=1p(z)‖2-2(p(z)·p(x))+‖p(x)I2. 据从原始空间映射到高维特征空间F.p(x:)的协 (8) 方差阵C为C=↓) p(x:)p(x)T,计算其特 其中‖p(x)I2为与z无关的量.式中的内积形式 N台 可以用核函数表示,将式(2)、式(5)和式(6)代入式 征值和特征向量 (8),可以得到如下的表达式: AV=CV=∑ 「N (p(x)·V)p(x:). (1) pl日=ke,-224.k(x)+ 式中:入为F空间中C的特征值;V为F空间中C Ip(x)‖2. (9) 的特征向量,可认为是F空间中样本的线性组 如果采用常用的高斯核函数k(x,y)=exp(- 合,即 Ix-y‖2/c),则k(z,z)为常数1.可将上式的最小 V=∑a,p(x,). (2) 化问题转化为求解下式的最大化: 式(1)两边左乘p(x)得 (2)=∑B,k(2x). (10) = A(p(x)·V)=p(x)·CV (3) 定义N×N的核矩阵K=K(x,x)=p(x), 式中,B= 名d P(x)).将K代入式(3),具体推导过程详见文献 z的求解己转化为一个求极值问题,可采用梯 02],可得 度下降法求解.令式(10)对z的梯度为零,可得 Nλ=K, (4) 式中=a1,2,…,a]',则样本在F空间中第k p日=p(-l-W(-20k- 个主成分t为 x:)=0,从而可得z的表达式 4=p(x)=∑aK(x,x,). (5) Bep (e)x.B. 2 核主成分分析的数据重构 exp(-‖z-x,l2/c) (11) 由上式可以得到求解z的迭代式 为了通过特征空间中的p个主成分1:重构 P(x),可以在F空间进行线性主成分分析,可得重 乙+1= B.exp (--./e)xB. 构值) exp (-z-x;ll2/c) (12) (6) 式中,z1=x为迭代初值.通过迭代使向量z成为原 始输入数据空间中x的一个较好的近似值
北 京 科 技 大 学 学 报 第 34 卷 问题,且核函数方法是建立在结构风险最小化的基 础上,较好地解决了模型泛化能力问题,运算较简 单[6--7]. 核 主 成 分 分 析( kernel principal component analysis,KPCA) 即是其中一种. 核主成分分析应用 于产品质量监控中已有一些研究[7--8],但出现过程 异常后的质量诊断成为难点[9],Cho 等[10]将核函数 梯度法引入到质量诊断中,但计算复杂,难以工业应 用. 本文提出了一种新的质量诊断方法,将核主成 分分析的数据重构方法和优化的邻域选取策略算法 相结合引入到故障诊断中,能更准确地发现引起过 程异常的工艺参数. 利用仿真数据和带钢热轧生产 过程数据验证了该方法的有效性. 1 核主成分分析 核主成分分析的基本思想是将数据从输入空间 映射到高维特征空间,然后在特征空间利用线性主 成分分析方法 计 算 主 成 分[11--12]. 给 定 N 个 样 本 { x1,x2,…,xN} ∈Rm,由非线性函数 φ(·) 将输入数 据从原始空间映射到高维特征空间 F. φ( xi ) 的协 方差阵 CF 为 CF = 1 N ∑ N i = 1 φ( xi ) φ ( xi ) T ,计算其特 征值和特征向量 λV = CF V = 1 N ∑ N i = 1 ( φ( xi )·V) φ( xi ) . ( 1) 式中: λ 为 F 空间中 CF 的特征值; V 为 F 空间中 CF 的特 征 向 量,可 认 为 是 F 空 间 中 样 本 的 线 性 组 合,即 V = ∑ N i = 1 αiφ( xi ) . ( 2) 式( 1) 两边左乘 φ( xj ) 得 λ( φ( xj )·V) = φ( xj )·CF V. ( 3) 定义 N × N 的核矩阵 Kij = K ( xi,xj ) =〈φ ( xi ) , φ( xj ) 〉. 将 K 代入式( 3) ,具体推导过程详见文献 [12],可得 Nλα = Kα, ( 4) 式中 α =[α1,α2,…,αN]T ,则样本在 F 空间中第 k 个主成分 tk 为 tk = Vk ·φ( x) = ∑ N i = 1 αk i K( x,xi ) . ( 5) 2 核主成分分析的数据重构 为了通过特征空间中的 p 个 主 成 分 tk 重 构 φ( x) ,可以在 F 空间进行线性主成分分析,可得重 构值[13] φ^( x) = ∑ p k = 1 tkVk . ( 6) 如果 p 足够大,等于所有非零特征值的个数,则上式 可写为 φ^( x) = φ( x) . 但是,通常为了消除噪声和 降低维数,选取的主成分的个数 p 一般都要小于非 零特征值的个数. 前 p 个特征值的和除以所有特征 值的和,被定义为主成分累计解释率,表示前 p 个主 成分所解释的数据信息占全部数据信息的比例. 主 成分个数通常利用主成分累计解释率大于一定比例 来选取. 在故障诊断中需要计算原始数据空间中的变量 对生产过程的影响,才能诊断出引起故障的工艺参 数. 为了得到在原始输入空间 x 的重构值,通常计 算一个向量 z,使之满足条件 φ( z) = φ^ ( x) ,即要求 向量 z 是原始输入空间中向量 x 的一个较好的近似 值. 但是,由于核变换的逆变换难以求得,通常可以 最小化下式来求出向量 z [13]: ρ( z) = ‖φ( z) - φ^( x) ‖2 . ( 7) 可以将上式写成 ρ( z) = ‖φ( z) ‖2 - 2( φ( z)·φ^( x) ) + ‖φ^( x) ‖2 . ( 8) 其中‖φ^( x) ‖2 为与 z 无关的量. 式中的内积形式 可以用核函数表示,将式( 2) 、式( 5) 和式( 6) 代入式 ( 8) ,可以得到如下的表达式: ρ( z) = k( z,z) - 2 ∑ p k = 1 tk ∑ N i = 1 αk i k( z,xi ) + ‖φ^( x) ‖2 . ( 9) 如果采用常用的高斯核函数 k( x,y) = exp ( - ‖x - y‖2 /c) ,则 k( z,z) 为常数 1. 可将上式的最小 化问题转化为求解下式的最大化: ρ 槇( z) = ∑ N i = 1 βik( z,xi ) . ( 10) 式中,βi = ∑ p k = 1 tkαk i . z 的求解已转化为一个求极值问题,可采用梯 度下降法求解. 令式( 10) 对 z 的梯度为零,可得 Δ zρ( z) = ∑ N i = 1 βiexp ( - ‖z - xi‖2 /c) ( - 2 /c) ( z - xi ) = 0,从而可得 z 的表达式 z = ∑ N i = 1 βiexp ( - ‖z - xi‖2 /c) xi ∑ N i = 1 βi · exp( - ‖z - xi‖2 /c) . ( 11) 由上式可以得到求解 z 的迭代式 zt + 1 = ∑ N i = 1 βiexp ( - ‖zt - xi‖2 /c) xi ∑ N i = 1 βi · exp ( - ‖zt - xi‖2 /c) . ( 12) 式中,z1 = x 为迭代初值. 通过迭代使向量 z 成为原 始输入数据空间中 x 的一个较好的近似值. ·438·
第4期 何飞等:基于核主成分分析的热轧带钢头部拉窄分析 ·439 本x用正常生产过程中的样本来替换,即可以将当 3 过程监控与诊断 前样本用正常样本中与其近邻的k个样本的加权线 3.1过程监控 性表示,即 核主成分模型在i时刻的平方预测误差SPE常 被用来进行生产过程的监控,可以写为下式: =∑0 (16) SPE- 式中,心为当前样本与其近邻样本x的权值, (13) 式中,x为真实数据,z为重构数据,m为变量个数. %=1. 平方预测误差统计量度量了一个数据点偏离核主成 传统的K近邻方法仅用欧氏距离为度量基准, 分分析模型的程度.当其过大时,则说明过程中出 只取与当前样本最近的k个样本作为近邻.此时所 现了不正常情况.可以证明平方预测误差统计量的 求的k个样本表示当前样本时可能会出现信息的冗 控制限可以按下式计算B.o: 余.信息的冗余会产生不必要的重复信息,而且还 Q.=0,[C。√202h6/B1+1+02ho(ho-1)/G]1o 阻碍了其他样本被选为近邻节点,从而导致近邻节 点不能有效表达当前节点.为了避免这种冗余,本 (14) 文提出如下的优化邻域选取策略. 式中,0.=∑A(i=1,2,3),h=1-281036,Ca 首先,给出空间中两个样本x:和x的相似性度 j=p+l 为正态分布在检验水平为α下的临界值.当样本的 量公式 平方预测误差统计量超出控制限,则认为生产过程 5g=exp(-E). (17) 出现异常 式中,e=川x:-x川2.当6=0时,取到最大值 3.2过程诊断 1,表示两个样本完全重合,相关性最大:当6,→∞ 当生产过程出现异常,需要进行过程诊断,即检 时,取值趋向于0,表示两个样本完全不相关.专 验当前样本x中的第i个变量是否为引起过程异常 是ε的递减函数,两样本的距离越远,相关性越小. 的工艺参数.本文提出的过程诊断的核心思想是在 利用欧氏距离选择与当前样本x最近的样本x: 历史的正常数据中寻求与当前样本x相近的样本来 作为一个邻近点,记相似性为专.,然后计算除样 替换其第i个变量.替换方法采用优化的邻域选取 本x:外与当前样本最近的样本x,记相似性为 方法,在正常的数据中寻求与当前样本x近邻的k 专.m,样本x,与样本x:的相似性记为专时为了避免 个样本,然后用这k个样本的第i个变量的加权平 样本x,和样本x:表达当前样本的信息冗余,对样本 均值来代替当前样本x中的第i个变量的取值.然 x作如下的判断来决定其是否作为当前样本x的近 邻:如果样本x与样本x:的相似性小于与当前样本 后再利用替换后的数据代入建立的核主成分分 x的相似性的一定比例,即 析模型中,计算其估计值.特定义故障指数 专动≤T吃.w’ (18) n=l2-I2/lz-x‖2. (15) 式中r为常数,则认为样本x为当前样本x的近邻; 式中,为除第i个变量与x中的不同而被替换外, 否则认为样本x与样本x:较相似,表达当前样本存 其他变量取值均与x相同.如果第i个变量是引起 在冗余信息,不会将样本x作为当前样本的近邻, 过程异常的原因,则平方预测误差‖之-产‖2与 然后继续寻找近邻直到找到当前样本x的k个近 ‖z-x‖2相比会减小,故障指数)较小.故障指数 邻.如图1所示,样本x:是与当前样本x距离最近 η最小的值则认为是引起过程异常的主要原因. 的样本,其次为x和x,x虽然与当前样本的距离 现将最为关键的步骤即优化的邻域选取方法介 小于x与当前样本的距离,但因为x与x:距离较 绍如下. 近即相似性较强,不会将其作为当前样本的近邻,而 r○ K近邻方法由于其简单易于实现而被广泛使 用,算法假设所有的样本对应于m维空间中的点, 一个样本的近邻是根据标准的欧氏距离定义的, 两个样本x:和x的距离定义为d=‖x:-xI2= 9 图1优化近邻选取的示意图 (x。-x)2.在过程诊断中,需要将当前样 Fig.I Optimization selection sketch of neighbors
第 4 期 何 飞等: 基于核主成分分析的热轧带钢头部拉窄分析 3 过程监控与诊断 3. 1 过程监控 核主成分模型在 i 时刻的平方预测误差 SPE 常 被用来进行生产过程的监控,可以写为下式: SPE = ∑ m j = 1 ( zij - xij ) 2 . ( 13) 式中,x 为真实数据,z 为重构数据,m 为变量个数. 平方预测误差统计量度量了一个数据点偏离核主成 分分析模型的程度. 当其过大时,则说明过程中出 现了不正常情况. 可以证明平方预测误差统计量的 控制限可以按下式计算[3,10]: Qα = θ1[Cα 槡2θ2 h2 0 /θ1 + 1 + θ2 h0 ( h0 - 1) /θ 2 1]1 /h0 . ( 14) 式中,θi = ∑ N j = p+1 λi j( i = 1,2,3) ,h0 = 1 - 2θ1 θ3 /3θ 2 2,Cα 为正态分布在检验水平为 α 下的临界值. 当样本的 平方预测误差统计量超出控制限,则认为生产过程 出现异常. 3. 2 过程诊断 当生产过程出现异常,需要进行过程诊断,即检 验当前样本 x 中的第 i 个变量是否为引起过程异常 的工艺参数. 本文提出的过程诊断的核心思想是在 历史的正常数据中寻求与当前样本 x 相近的样本来 替换其第 i 个变量. 替换方法采用优化的邻域选取 方法,在正常的数据中寻求与当前样本 x 近邻的 k 个样本,然后用这 k 个样本的第 i 个变量的加权平 均值来代替当前样本 x 中的第 i 个变量的取值. 然 后再利用替换后的数据 x槇i 代入建立的核主成分分 析模型中,计算其估计值 z槇i . 特定义故障指数 η = ‖z槇i - x槇i ‖2 /‖z - x‖2 . ( 15) 式中,x槇i 为除第 i 个变量与 x 中的不同而被替换外, 其他变量取值均与 x 相同. 如果第 i 个变量是引起 过程异常的原因,则平方预测误差‖z槇i - x槇i ‖2 与 ‖z - x‖2 相比会减小,故障指数 η 较小. 故障指数 η 最小的值则认为是引起过程异常的主要原因. 现将最为关键的步骤即优化的邻域选取方法介 绍如下. K 近邻方法由于其简单易于实现而被广泛使 用,算法假设所有的样本对应于 m 维空间中的点, 一个样本的近邻是根据标准的欧氏距离定义的[14], 两个样本 xi 和 xj 的距离定义为 d = ‖xi - xj‖2 = ∑ m q = 1 ( xiq - xjq ) 槡 2 . 在过程诊断中,需要将当前样 本 x 用正常生产过程中的样本来替换,即可以将当 前样本用正常样本中与其近邻的 k 个样本的加权线 性表示,即 x槇 = ∑ k j = 1 wj xj . ( 16) 式中,wj 为当前样本与其近邻样本 xj 的 权 值, ∑ k j = 1 wj = 1. 传统的 K 近邻方法仅用欧氏距离为度量基准, 只取与当前样本最近的 k 个样本作为近邻. 此时所 求的 k 个样本表示当前样本时可能会出现信息的冗 余. 信息的冗余会产生不必要的重复信息,而且还 阻碍了其他样本被选为近邻节点,从而导致近邻节 点不能有效表达当前节点. 为了避免这种冗余,本 文提出如下的优化邻域选取策略. 首先,给出空间中两个样本 xi 和 xj 的相似性度 量公式[14] ξij = exp ( - εij ) . ( 17) 式中,εij = ‖xi - xj‖2 . 当 εij = 0 时,ξij取到最大值 1,表示两个样本完全重合,相关性最大; 当 εij→∞ 时,ξij取值趋向于 0,表示两个样本完全不相关. ξij 是 εij的递减函数,两样本的距离越远,相关性越小. 利用欧氏距离选择与当前样本 x 最近的样本 xi 作为一个邻近点,记相似性为 ξi,now,然后计算除样 本 xi 外与当前样本最近的样本 xj ,记 相 似 性 为 ξj,now,样本 xj 与样本 xi 的相似性记为 ξi,j . 为了避免 样本 xi 和样本 xj 表达当前样本的信息冗余,对样本 xj 作如下的判断来决定其是否作为当前样本 x 的近 邻: 如果样本 xj 与样本 xi 的相似性小于与当前样本 x 的相似性的一定比例,即 ξi,j≤rξj,now, ( 18) 图 1 优化近邻选取的示意图 Fig. 1 Optimization selection sketch of neighbors 式中 r 为常数,则认为样本 xj 为当前样本 x 的近邻; 否则认为样本 xj 与样本 xi 较相似,表达当前样本存 在冗余信息,不会将样本 xj 作为当前样本的近邻, 然后继续寻找近邻直到找到当前样本 x 的 k 个近 邻. 如图 1 所示,样本 xi 是与当前样本 x 距离最近 的样本,其次为 xj 和 xk,xj 虽然与当前样本的距离 小于 xk 与当前样本的距离,但因为 xj 与 xi 距离较 近即相似性较强,不会将其作为当前样本的近邻,而 ·439·
·440· 北京科技大学学报 第34卷 把x.作为近邻 (x =t+e, 确定k个近邻后,利用式(16)计算当前样本x x2=2-31-0.6+e2,e1,e2,e3~N(0,0.12). 的替换值,如果没有k个样本可以作为近邻则仅选 x3=-t3+31+e3 择满足条件的样本作为近邻即可.当前样本x与其 当t在区间D.01,2]上等间隔取正常数据100个样 近邻样本x:的权值可以先利用式(17)计算,即取为 本作为训练数据:取正常数据50个,扰动后数据 专,w,然后通过变换使所有权值的和为1,从而得到 150个,共200个样本作为测试数据.利用训练样本 所需的0· 分别建立主成分分析和核主成分分析模型,然后利 4过程监控与诊断步骤 用测试样本检验模型的有效性. 在核主成分分析模型中选取高斯函数作为核函 基于核主成分分析的过程监控与诊断的具体步 数,根据交叉验证法选取核参数c=2,根据主成分 骤如下 累计解释率大于95%的准则,选取五个主成分.在 (1)数据预处理.对数据进行标准化处理以消 主成分分析中,同样根据主成分累计解释率大于 除量纲的影响,减去均值除以标准差,使各变量的均 95%的原则,选取两个主成分.图2给出了核主成 值为0,方差为1. 分分析模型和主成分分析模型中的平方预测误差统 (2)利用正常生产过程数据建立核主成分分析 计量控制图.从图2(a)可以明显地看到后150个 模型,根据交叉验证法选取核参数c.根据主成分累 样本的平方预测误差统计量绝大多数超出了控制 计解释率大于95%的准则,选取主成分个数. 限,认为此时过程出现了故障;而主成分分析模型的 (3)分别利用式(13)和(14)计算用于生产过程 异常捕捉能力明显要差于核主成分分析模型.在过 监控的平方预测误差统计量和控制限. 程诊断中,通过实验选取近邻的个数k=5,式(18) (4)利用式(13)计算待监控生产数据的平方预 中的常数r=0.1.图3给出了核主成分分析模型中 测误差统计量,当其超出控制限时则认为生产过程 各变量对平方预测误差作用的故障指数.从图3中 异常,否则认为生产过程处于统计稳态 可以看到后200个样本点的第二个变量对平方预测 (5)若过程异常则利用式(15)计算故障指数 误差的故障指数最小,可以认为第二个变量的变化 ,分析各工艺变量对平方预测误差统计量的作用, 偏离了正常分布状态,是引起生产过程异常的主要 从而判断引起异常的原因.最小的故障指数对应的 原因,这与实际所加扰动相符合 工艺变量认为是引起过程异常的主要原因 5.2热轧头部拉窄分析 5实验及结果分析 由于热轧生产过程中数据庞大而复杂,依据热 轧工艺知识,从600余个监测变量中选择62个直接 5.1仿真实验 或间接影响头部宽度质量的变量,从中找出影响头 为了验证方法的有效性,利用仿真数据进行实 部拉窄的主要因素,具体的变量如表1所示 验o.正常情况和扰动后的数据分别来源于 核主成分分析中,将每块钢板作为一个样本点, x=t+el, 选取各变量对应的头部拉窄部分的平均值作为分析 x2=2-31+e2, e1e2,e3~N(0,0.12) 用变量.由于头部拉窄部分占整块钢板的比例的平 x3=-t3+31+e3 均值约为5%,所以在头部宽度正常的样本中,选取 和 头部5%的数据的平均值作为正常样本的变量值. 0.5 0.15 (a) (b) 一SPE统计量 0.10 0.3 一--…90%控制限 …95%控制限 0.2 =·99%控制限 501 50 100 150 200 250 300 0 50 100 150 200 250 30 样本编号 样本编号 图2核主成分分析(a)和主成分分析(b)中平方预测误差统计量控制图 Fig.2 SPE statistic control charts based on KPCA (a)and PCA (b)
北 京 科 技 大 学 学 报 第 34 卷 把 xk 作为近邻. 确定 k 个近邻后,利用式( 16) 计算当前样本 x 的替换值,如果没有 k 个样本可以作为近邻则仅选 择满足条件的样本作为近邻即可. 当前样本 x 与其 近邻样本 xk 的权值可以先利用式( 17) 计算,即取为 ξk,now,然后通过变换使所有权值的和为 1,从而得到 所需的 wk . 4 过程监控与诊断步骤 基于核主成分分析的过程监控与诊断的具体步 骤如下. ( 1) 数据预处理. 对数据进行标准化处理以消 除量纲的影响,减去均值除以标准差,使各变量的均 值为 0,方差为 1. ( 2) 利用正常生产过程数据建立核主成分分析 模型,根据交叉验证法选取核参数 c. 根据主成分累 计解释率大于 95% 的准则,选取主成分个数. ( 3) 分别利用式( 13) 和( 14) 计算用于生产过程 监控的平方预测误差统计量和控制限. ( 4) 利用式( 13) 计算待监控生产数据的平方预 测误差统计量,当其超出控制限时则认为生产过程 异常,否则认为生产过程处于统计稳态. ( 5) 若过程异常则利用式( 15) 计算故障指数 η,分析各工艺变量对平方预测误差统计量的作用, 从而判断引起异常的原因. 最小的故障指数对应的 工艺变量认为是引起过程异常的主要原因. 图 2 核主成分分析( a) 和主成分分析( b) 中平方预测误差统计量控制图 Fig. 2 SPE statistic control charts based on KPCA ( a) and PCA ( b) 5 实验及结果分析 5. 1 仿真实验 为了验证方法的有效性,利用仿真数据进行实 验[10]. 正常情况和扰动后的数据分别来源于 xnorm = x1 = t + e1, x2 = t 2 - 3t + e2, x3 = - t 3 + 3t + e3 { . e1,e2,e3 ~ N( 0,0. 12 ) 和 xfault = x1 = t + e1, x2 = t 2 - 3t - 0. 6 + e2, x3 = - t 3 + 3t + e3 { . e1,e2,e3 ~ N( 0,0. 12 ) . 当 t 在区间[0. 01,2]上等间隔取正常数据 100 个样 本作为训练数据; 取正常数据 50 个,扰动后数据 150 个,共 200 个样本作为测试数据. 利用训练样本 分别建立主成分分析和核主成分分析模型,然后利 用测试样本检验模型的有效性. 在核主成分分析模型中选取高斯函数作为核函 数,根据交叉验证法选取核参数 c = 2,根据主成分 累计解释率大于 95% 的准则,选取五个主成分. 在 主成分分析中,同样根据主成分累计解释率大于 95% 的原则,选取两个主成分. 图 2 给出了核主成 分分析模型和主成分分析模型中的平方预测误差统 计量控制图. 从图 2( a) 可以明显地看到后 150 个 样本的平方预测误差统计量绝大多数超出了控制 限,认为此时过程出现了故障; 而主成分分析模型的 异常捕捉能力明显要差于核主成分分析模型. 在过 程诊断中,通过实验选取近邻的个数 k = 5,式( 18) 中的常数 r = 0. 1. 图 3 给出了核主成分分析模型中 各变量对平方预测误差作用的故障指数. 从图 3 中 可以看到后 200 个样本点的第二个变量对平方预测 误差的故障指数最小,可以认为第二个变量的变化 偏离了正常分布状态,是引起生产过程异常的主要 原因,这与实际所加扰动相符合. 5. 2 热轧头部拉窄分析 由于热轧生产过程中数据庞大而复杂,依据热 轧工艺知识,从 600 余个监测变量中选择 62 个直接 或间接影响头部宽度质量的变量,从中找出影响头 部拉窄的主要因素,具体的变量如表 1 所示. 核主成分分析中,将每块钢板作为一个样本点, 选取各变量对应的头部拉窄部分的平均值作为分析 用变量. 由于头部拉窄部分占整块钢板的比例的平 均值约为 5% ,所以在头部宽度正常的样本中,选取 头部 5% 的数据的平均值作为正常样本的变量值. ·440·
第4期 何飞等:基于核主成分分析的热轧带钢头部拉窄分析 441· 为了消除带钢力学性能和厚度对结果的影响,选择 变量 写2.0 -变量2 了同一钢种厚度为3.0mm的数据作为研究对象. 1.s *…变量3 1.0 在现场实际生产数据中,选择头部宽度正常的样本 0 h人人 数据150个,利用核主成分分析建模,然后利用50 80 120 160 200 样本编号 个正常数据,110个拉窄数据进行生产过程的监控 训练和测试共310个样本的基于核主成分分析的监 图3核主成分分析中各变量的故障指数图 Fig.3 Fault index plots based on KPCA 控图如图4所示,图中给出了95%置信度下的控制 表1头部拉窄数据分析变量表 Table 1 Variable table of head width narrowing data analysis 类别 变量 具体变量名称 编号 个数 温度 精轧入口温度、精轧出口温度 1~2 2 设定速度 精轧机F1~F7设定速度 3-9 > 实测速度 精轧机F1~F7实测速度 10~16 7 套量 活套1~6套量 17~22 6 工艺参数 ①精轧机F1~F7双侧轧制力设定值 轧制力 ②精轧机F1~F7工作侧轧制力实测值 23~43 21 ③精轧机F1~7传动侧轧制力实测值 辊缝 精轧机F1~7辊缝值 44~50 7 速度差 前机架计算前滑后的速度与后机架计算后滑后的速度的差值 51~56 6 活套高度 活套1~6高度值 57~62 6 质量指标 宽度误差 限.从图4中可以看到:训练样本(样本编号1~ 图5(a)中可以看到引起样本265头部拉窄的主要 150)的统计量均在控制限下;测试样本(样本编号 原因是第19、22个变量(活套3和6的套量):(2) 151~310)中前50个正常数据的统计量虽然与训练 从图5(b)中可以看到引起样本212头部拉窄的主 样本相比有所增加,但绝大多数在控制限下,有部分 要原因是第2个变量(精轧出口温度):(3)从图5 稍超过了控制限;测试样本中的拉窄数据绝大多数 (c)中可以看到引起样本289头部拉窄的主要原因 远远超出控制限.由此可见,核主成分分析可以有 是第55个变量(五、六机架的速度差):(4)从图5 效地监控出生产状态的异常 (d)中可以看到引起样本216头部拉窄的主要原因 60 是第2、55个变量(精轧出口温度,五、六机架的速 一统计量 238 :5641 度差);(5)从图5(e)中可以看到引起样本243头 50- ---95%控制限 X:289 X:216 53.85 期 部拉窄的主要原因是第1个变量(精轧入口温度). 40- 从以上分析可以看到,精轧入口温度、精轧出口 30 温度、活套3和6的套量以及五、六机架的速度差是 20 引起头部拉窄的主要原因,在后续的精确分析中应 对上述参数做重点研究. 经过现场的分析发现了如下的问题:(1)由于 0 50 100 150200 250 300 50 温度传感器在改造过程中并没有更换,长时间使用 样本编号 没有及时进行校正,导致了精轧入口温度、精轧出口 图4核主成分分析中头部拉窄的平方预测误差统计量 温度测量值精度不高,给后续的控制带来影响:(2) Fig.4 SPE statistic of the head width narrowing based on KPCA 由于前三机架驱动电机有减速器,而后四机架没有 为了分析引起异常的原因,分别给出图4中异 减速器,从而导致前三机架和后四机架的电机控制 常比较严重的样本点265、212、289、216和243的故 特性不同,即电机的速度精度和速度响应有一定的 障诊断图,如图5所示 差异,而在电机控制中没有充分认识到减速器给控 从故障诊断图中分析出现故障的原因:(1)从 制带来的影响,出现了活套3控制的不协调:(3)因
第 4 期 何 飞等: 基于核主成分分析的热轧带钢头部拉窄分析 图 3 核主成分分析中各变量的故障指数图 Fig. 3 Fault index plots based on KPCA 为了消除带钢力学性能和厚度对结果的影响,选择 了同一钢种厚度为 3. 0 mm 的数据作为研究对象. 在现场实际生产数据中,选择头部宽度正常的样本 数据 150 个,利用核主成分分析建模,然后利用 50 个正常数据,110 个拉窄数据进行生产过程的监控. 训练和测试共 310 个样本的基于核主成分分析的监 控图如图 4 所示,图中给出了 95% 置信度下的控制 表 1 头部拉窄数据分析变量表 Table 1 Variable table of head width narrowing data analysis 类别 变量 具体变量名称 编号 个数 温度 精轧入口温度、精轧出口温度 1 ~ 2 2 设定速度 精轧机 F1 ~ F7 设定速度 3 ~ 9 7 实测速度 精轧机 F1 ~ F7 实测速度 10 ~ 16 7 套量 活套 1 ~ 6 套量 17 ~ 22 6 工艺参数 ①精轧机 F1 ~ F7 双侧轧制力设定值 轧制力 ②精轧机 F1 ~ F7 工作侧轧制力实测值 23 ~ 43 21 ③精轧机 F1 ~ F7 传动侧轧制力实测值 辊缝 精轧机 F1 ~ F7 辊缝值 44 ~ 50 7 速度差 前机架计算前滑后的速度与后机架计算后滑后的速度的差值 51 ~ 56 6 活套高度 活套 1 ~ 6 高度值 57 ~ 62 6 质量指标 — 宽度误差 — 1 限. 从图 4 中可以看到: 训练样本( 样本编号 1 ~ 150) 的统计量均在控制限下; 测试样本( 样本编号 151 ~ 310) 中前 50 个正常数据的统计量虽然与训练 样本相比有所增加,但绝大多数在控制限下,有部分 稍超过了控制限; 测试样本中的拉窄数据绝大多数 远远超出控制限. 由此可见,核主成分分析可以有 效地监控出生产状态的异常. 图 4 核主成分分析中头部拉窄的平方预测误差统计量 Fig. 4 SPE statistic of the head width narrowing based on KPCA 为了分析引起异常的原因,分别给出图 4 中异 常比较严重的样本点 265、212、289、216 和 243 的故 障诊断图,如图 5 所示. 从故障诊断图中分析出现故障的原因: ( 1) 从 图 5( a) 中可以看到引起样本 265 头部拉窄的主要 原因是第 19、22 个变量( 活套 3 和 6 的套量) ; ( 2) 从图 5( b) 中可以看到引起样本 212 头部拉窄的主 要原因是第 2 个变量( 精轧出口温度) ; ( 3) 从图 5 ( c) 中可以看到引起样本 289 头部拉窄的主要原因 是第 55 个变量( 五、六机架的速度差) ; ( 4) 从图 5 ( d) 中可以看到引起样本 216 头部拉窄的主要原因 是第 2、55 个变量( 精轧出口温度,五、六机架的速 度差) ; ( 5) 从图 5( e) 中可以看到引起样本 243 头 部拉窄的主要原因是第 1 个变量( 精轧入口温度) . 从以上分析可以看到,精轧入口温度、精轧出口 温度、活套 3 和 6 的套量以及五、六机架的速度差是 引起头部拉窄的主要原因,在后续的精确分析中应 对上述参数做重点研究. 经过现场的分析发现了如下的问题: ( 1) 由于 温度传感器在改造过程中并没有更换,长时间使用 没有及时进行校正,导致了精轧入口温度、精轧出口 温度测量值精度不高,给后续的控制带来影响; ( 2) 由于前三机架驱动电机有减速器,而后四机架没有 减速器,从而导致前三机架和后四机架的电机控制 特性不同,即电机的速度精度和速度响应有一定的 差异,而在电机控制中没有充分认识到减速器给控 制带来的影响,出现了活套 3 控制的不协调; ( 3) 因 ·441·
·442 北京科技大学学报 第34卷 13 (a) 1.2 (b) 1.0- 1.1 0.9 X:22 艳0.8 :0.8387 0.7 0.7 X:19 0.6X:2 :0.6086 :0.5496 20 3040 50 60 0.56 10 203040 5060 变量编号 变量编号 1.04 1.10 1.02 1.05 1.00 0.98 *WI 0.96 0.90 X:55 0.94 X:55 X:2 :0.927 Y:0.9316 Y:0.8751 0920 10 2030405060 0.850 10 203040 50 变量箱号 变量编号 1.05 (e) 1.00 0.95 0.90 毫0.80 0.75 0.70:1 0.65上0.6563 0 102030405060 变量编号 图5头部拉窄典型样本的基于核主成分分析的故障诊断.(a)样本点265:(b)样本点212:(c)样本点289:(d)样本点216;(e)样本点 243 Fig.5 Fault diagnosis of the head width narrowing based on KPCA for the representative samples:(a)sample No.265;(b)sample No.212:(c) sample No.289:(d)sample No.216;(e)sample No.243 为设定模型的不合理,导致后三个机架间速度差的 据分析的正确性,从而为生产的正常进行和保证产 不匹配,出现了最后两个活套和机架间的速度差的 品质量提供技术支持 不协调.这些问题最终均会导致头部控制的不准 确,出现拉窄现象 参考文献 [Sun Y K.Model and Control of Hot Strip Rolling.Beijing:Metal- 6结论 lurgical Industry Press,2007 本文利用核主成分分析的平方预测误差统计量 (孙一康.带钢热连轧的模型与控制.北京:治金工业出版社, 2007) 进行生产过程的监控,通过故障指数来衡量各工艺 [2] Chiang L.H.Fault Detection and Diagnosis in Industrial Systems. 参数对统计量的作用.利用仿真数据对方法的有效 Duan J M,Translated.Beijing:China Machine Press,2003 性进行验证,与线性主成分分析方法相比,核主成分 (蒋浩天.工业系统的故障检测与诊断.段建民,译.北京:机 分析的平方预测误差统计量可以更加准确有效地捕 械工业出版社,2003) 捉到过程的异常,而且利用故障指数图可以给出引 B] Zhang J,Yang X H.Multirariate Statistical Process Control.Bei- jing:Chemical Industry Press,2000 起异常的原因.应用到热轧带钢头部拉窄分析中, (张杰,阳宪惠.多变量统计过程控制.北京:化学工业出版 可以有效查找出引起拉窄异常的主要原因,通过现 社,2000) 场的实际分析和改进后的实际生产情况,验证了数 4]Zhao X,Yan WW,Shao HH.The product quality control based
北 京 科 技 大 学 学 报 第 34 卷 图 5 头部拉窄典型样本的基于核主成分分析的故障诊断 . ( a) 样本点 265; ( b) 样本点 212; ( c) 样本点 289; ( d) 样本点 216; ( e) 样本点 243 Fig. 5 Fault diagnosis of the head width narrowing based on KPCA for the representative samples: ( a) sample No. 265; ( b) sample No. 212; ( c) sample No. 289; ( d) sample No. 216; ( e) sample No. 243 为设定模型的不合理,导致后三个机架间速度差的 不匹配,出现了最后两个活套和机架间的速度差的 不协调. 这些问题最终均会导致头部控制的不准 确,出现拉窄现象. 6 结论 本文利用核主成分分析的平方预测误差统计量 进行生产过程的监控,通过故障指数来衡量各工艺 参数对统计量的作用. 利用仿真数据对方法的有效 性进行验证,与线性主成分分析方法相比,核主成分 分析的平方预测误差统计量可以更加准确有效地捕 捉到过程的异常,而且利用故障指数图可以给出引 起异常的原因. 应用到热轧带钢头部拉窄分析中, 可以有效查找出引起拉窄异常的主要原因,通过现 场的实际分析和改进后的实际生产情况,验证了数 据分析的正确性,从而为生产的正常进行和保证产 品质量提供技术支持. 参 考 文 献 [1] Sun Y K. Model and Control of Hot Strip Rolling. Beijing: Metallurgical Industry Press,2007 ( 孙一康. 带钢热连轧的模型与控制. 北京: 冶金工业出版社, 2007) [2] Chiang L H. Fault Detection and Diagnosis in Industrial Systems. Duan J M,Translated. Beijing: China Machine Press,2003 ( 蒋浩天. 工业系统的故障检测与诊断. 段建民,译. 北京: 机 械工业出版社,2003) [3] Zhang J,Yang X H. Multivariate Statistical Process Control. Beijing: Chemical Industry Press,2000 ( 张杰,阳宪惠. 多变量统计过程控制. 北京: 化学工业出版 社,2000) [4] Zhao X,Yan W W,Shao H H. The product quality control based ·442·
第4期 何飞等:基于核主成分分析的热轧带钢头部拉窄分析 ·443· on multivariable statistical methods.J Shanghai Jiaotong Unir, (黄宴委,彭铁根.基于核主元分析的非线性动态故障诊断 2007,41(1):126 系统仿真学报,2005,17(9):2291) (赵旭,阁威武,邵惠鹤.基于多变量统计方法的产品质量控 ] Venkatasubramanian V,Rengaswamy R,Kavuri SN,et al.A re- 制.上海交通大学学报,2007,41(1):126) view of process fault detection and diagnosis:Part II.Process his- 5]Yao L,Yang J H,Xu J W,et al.Quality monitoring method of tory based methods.Comput Chem Eng,2003,27(3):327 strip hot-ip galvanizing based on partial least squares regression. [10]Cho J H,Lee J M,Choi S W,et al.Fault identification for J Univ Sci Technol Beijing,2007,29(6):627 process monitoring using kemnel principal component analysis. (姚林,阳建宏,徐金梧,等.基于偏最小二乘回归模型的带钢 Chem Eng Sci,2005,60(1):279 热镀锌质量监控方法.北京科技大学学报,2007,29(6): [11]Twining CJ,Taylor C J.The use of kernel principal component 627) analysis to model data distributions.Pattern Recognit,2003,36 6]Jia F,Martin E B,Morris A J.Non-inear principal components (1):217 analysis with application to process fault detection.Int Syst Sci, [12]Scholkopf B,Smola A,Muller K R.Nonlinear component analy- 2000,31(11):1473 sis as a kernel eigenvalue problem.Neural Comput,1998,10 Xie L,Wang S Q.Recursive kemel PCA and its application in (5):1299 adaptive monitoring of nonlinear processes.J Chem Ind Eng Chi- [13]Mika S,Schlkopf B,Smola A,et al.Kemel PCA and De-noi- na,2007,58(7):1776 sing in feature spaces /Kearns M S,Solla S A,Cohn D A, (谢磊,王树青.递归核P℃A及其在非线性过程自适应监控中 Eds.Adrances in Neural Information Processing Systems ll.Cam- 的应用.化工学报,2007,58(7):1776) bridge:MIT Press,1999:536 [8]Huang Y W,PengTG.Fault diagnosis for nonlinear dynamic sys- [14]Ge SS,Guan F,Pan Y,et al.Neighborhood linear embedding tem using kernel principal component analysis.I Syst Simul, for intrinsic structure discovery.Mach Vision Appl,2010,21 2005,17(9):2291 (3):391
第 4 期 何 飞等: 基于核主成分分析的热轧带钢头部拉窄分析 on multivariable statistical methods. J Shanghai Jiaotong Univ, 2007,41( 1) : 126 ( 赵旭,阎威武,邵惠鹤. 基于多变量统计方法的产品质量控 制. 上海交通大学学报,2007,41( 1) : 126) [5] Yao L,Yang J H,Xu J W,et al. Quality monitoring method of strip hot-dip galvanizing based on partial least squares regression. J Univ Sci Technol Beijing,2007,29( 6) : 627 ( 姚林,阳建宏,徐金梧,等. 基于偏最小二乘回归模型的带钢 热镀锌质量监控方法. 北京科技大学 学 报,2007,29 ( 6 ) : 627) [6] Jia F,Martin E B,Morris A J. Non-linear principal components analysis with application to process fault detection. Int J Syst Sci, 2000,31( 11) : 1473 [7] Xie L,Wang S Q. Recursive kernel PCA and its application in adaptive monitoring of nonlinear processes. J Chem Ind Eng China,2007,58( 7) : 1776 ( 谢磊,王树青. 递归核 PCA 及其在非线性过程自适应监控中 的应用. 化工学报,2007,58( 7) : 1776) [8] Huang Y W,Peng T G. Fault diagnosis for nonlinear dynamic system using kernel principal component analysis. J Syst Simul, 2005,17( 9) : 2291 ( 黄宴委,彭铁根. 基于核主元分析的非线性动态故障诊断. 系统仿真学报,2005,17( 9) : 2291) [9] Venkatasubramanian V,Rengaswamy R,Kavuri S N,et al. A review of process fault detection and diagnosis: Part Ⅲ. Process history based methods. Comput Chem Eng,2003,27( 3) : 327 [10] Cho J H,Lee J M,Choi S W,et al. Fault identification for process monitoring using kernel principal component analysis. Chem Eng Sci,2005,60( 1) : 279 [11] Twining C J,Taylor C J. The use of kernel principal component analysis to model data distributions. Pattern Recognit,2003,36 ( 1) : 217 [12] Schlkopf B,Smola A,Müller K R. Nonlinear component analysis as a kernel eigenvalue problem. Neural Comput,1998,10 ( 5) : 1299 [13] Mika S,Schlkopf B,Smola A,et al. Kernel PCA and De-noising in feature spaces / / Kearns M S,Solla S A,Cohn D A, Eds. Advances in Neural Information Processing Systems II. Cambridge: MIT Press,1999: 536 [14] Ge S S,Guan F,Pan Y,et al. Neighborhood linear embedding for intrinsic structure discovery. Mach Vision Appl,2010,21 ( 3) : 391 ·443·