正在加载图片...
第4期 何飞等:基于核主成分分析的热轧带钢头部拉窄分析 ·439 本x用正常生产过程中的样本来替换,即可以将当 3 过程监控与诊断 前样本用正常样本中与其近邻的k个样本的加权线 3.1过程监控 性表示,即 核主成分模型在i时刻的平方预测误差SPE常 被用来进行生产过程的监控,可以写为下式: =∑0 (16) SPE- 式中,心为当前样本与其近邻样本x的权值, (13) 式中,x为真实数据,z为重构数据,m为变量个数. %=1. 平方预测误差统计量度量了一个数据点偏离核主成 传统的K近邻方法仅用欧氏距离为度量基准, 分分析模型的程度.当其过大时,则说明过程中出 只取与当前样本最近的k个样本作为近邻.此时所 现了不正常情况.可以证明平方预测误差统计量的 求的k个样本表示当前样本时可能会出现信息的冗 控制限可以按下式计算B.o: 余.信息的冗余会产生不必要的重复信息,而且还 Q.=0,[C。√202h6/B1+1+02ho(ho-1)/G]1o 阻碍了其他样本被选为近邻节点,从而导致近邻节 点不能有效表达当前节点.为了避免这种冗余,本 (14) 文提出如下的优化邻域选取策略. 式中,0.=∑A(i=1,2,3),h=1-281036,Ca 首先,给出空间中两个样本x:和x的相似性度 j=p+l 为正态分布在检验水平为α下的临界值.当样本的 量公式 平方预测误差统计量超出控制限,则认为生产过程 5g=exp(-E). (17) 出现异常 式中,e=川x:-x川2.当6=0时,取到最大值 3.2过程诊断 1,表示两个样本完全重合,相关性最大:当6,→∞ 当生产过程出现异常,需要进行过程诊断,即检 时,取值趋向于0,表示两个样本完全不相关.专 验当前样本x中的第i个变量是否为引起过程异常 是ε的递减函数,两样本的距离越远,相关性越小. 的工艺参数.本文提出的过程诊断的核心思想是在 利用欧氏距离选择与当前样本x最近的样本x: 历史的正常数据中寻求与当前样本x相近的样本来 作为一个邻近点,记相似性为专.,然后计算除样 替换其第i个变量.替换方法采用优化的邻域选取 本x:外与当前样本最近的样本x,记相似性为 方法,在正常的数据中寻求与当前样本x近邻的k 专.m,样本x,与样本x:的相似性记为专时为了避免 个样本,然后用这k个样本的第i个变量的加权平 样本x,和样本x:表达当前样本的信息冗余,对样本 均值来代替当前样本x中的第i个变量的取值.然 x作如下的判断来决定其是否作为当前样本x的近 邻:如果样本x与样本x:的相似性小于与当前样本 后再利用替换后的数据代入建立的核主成分分 x的相似性的一定比例,即 析模型中,计算其估计值.特定义故障指数 专动≤T吃.w’ (18) n=l2-I2/lz-x‖2. (15) 式中r为常数,则认为样本x为当前样本x的近邻; 式中,为除第i个变量与x中的不同而被替换外, 否则认为样本x与样本x:较相似,表达当前样本存 其他变量取值均与x相同.如果第i个变量是引起 在冗余信息,不会将样本x作为当前样本的近邻, 过程异常的原因,则平方预测误差‖之-产‖2与 然后继续寻找近邻直到找到当前样本x的k个近 ‖z-x‖2相比会减小,故障指数)较小.故障指数 邻.如图1所示,样本x:是与当前样本x距离最近 η最小的值则认为是引起过程异常的主要原因. 的样本,其次为x和x,x虽然与当前样本的距离 现将最为关键的步骤即优化的邻域选取方法介 小于x与当前样本的距离,但因为x与x:距离较 绍如下. 近即相似性较强,不会将其作为当前样本的近邻,而 r○ K近邻方法由于其简单易于实现而被广泛使 用,算法假设所有的样本对应于m维空间中的点, 一个样本的近邻是根据标准的欧氏距离定义的, 两个样本x:和x的距离定义为d=‖x:-xI2= 9 图1优化近邻选取的示意图 (x。-x)2.在过程诊断中,需要将当前样 Fig.I Optimization selection sketch of neighbors第 4 期 何 飞等: 基于核主成分分析的热轧带钢头部拉窄分析 3 过程监控与诊断 3. 1 过程监控 核主成分模型在 i 时刻的平方预测误差 SPE 常 被用来进行生产过程的监控,可以写为下式: SPE = ∑ m j = 1 ( zij - xij ) 2 . ( 13) 式中,x 为真实数据,z 为重构数据,m 为变量个数. 平方预测误差统计量度量了一个数据点偏离核主成 分分析模型的程度. 当其过大时,则说明过程中出 现了不正常情况. 可以证明平方预测误差统计量的 控制限可以按下式计算[3,10]: Qα = θ1[Cα 槡2θ2 h2 0 /θ1 + 1 + θ2 h0 ( h0 - 1) /θ 2 1]1 /h0 . ( 14) 式中,θi = ∑ N j = p+1 λi j( i = 1,2,3) ,h0 = 1 - 2θ1 θ3 /3θ 2 2,Cα 为正态分布在检验水平为 α 下的临界值. 当样本的 平方预测误差统计量超出控制限,则认为生产过程 出现异常. 3. 2 过程诊断 当生产过程出现异常,需要进行过程诊断,即检 验当前样本 x 中的第 i 个变量是否为引起过程异常 的工艺参数. 本文提出的过程诊断的核心思想是在 历史的正常数据中寻求与当前样本 x 相近的样本来 替换其第 i 个变量. 替换方法采用优化的邻域选取 方法,在正常的数据中寻求与当前样本 x 近邻的 k 个样本,然后用这 k 个样本的第 i 个变量的加权平 均值来代替当前样本 x 中的第 i 个变量的取值. 然 后再利用替换后的数据 x槇i 代入建立的核主成分分 析模型中,计算其估计值 z槇i . 特定义故障指数 η = ‖z槇i - x槇i ‖2 /‖z - x‖2 . ( 15) 式中,x槇i 为除第 i 个变量与 x 中的不同而被替换外, 其他变量取值均与 x 相同. 如果第 i 个变量是引起 过程异常的原因,则平方预测误差‖z槇i - x槇i ‖2 与 ‖z - x‖2 相比会减小,故障指数 η 较小. 故障指数 η 最小的值则认为是引起过程异常的主要原因. 现将最为关键的步骤即优化的邻域选取方法介 绍如下. K 近邻方法由于其简单易于实现而被广泛使 用,算法假设所有的样本对应于 m 维空间中的点, 一个样本的近邻是根据标准的欧氏距离定义的[14], 两个样本 xi 和 xj 的距离定义为 d = ‖xi - xj‖2 = ∑ m q = 1 ( xiq - xjq ) 槡 2 . 在过程诊断中,需要将当前样 本 x 用正常生产过程中的样本来替换,即可以将当 前样本用正常样本中与其近邻的 k 个样本的加权线 性表示,即 x槇 = ∑ k j = 1 wj xj . ( 16) 式中,wj 为当前样本与其近邻样本 xj 的 权 值, ∑ k j = 1 wj = 1. 传统的 K 近邻方法仅用欧氏距离为度量基准, 只取与当前样本最近的 k 个样本作为近邻. 此时所 求的 k 个样本表示当前样本时可能会出现信息的冗 余. 信息的冗余会产生不必要的重复信息,而且还 阻碍了其他样本被选为近邻节点,从而导致近邻节 点不能有效表达当前节点. 为了避免这种冗余,本 文提出如下的优化邻域选取策略. 首先,给出空间中两个样本 xi 和 xj 的相似性度 量公式[14] ξij = exp ( - εij ) . ( 17) 式中,εij = ‖xi - xj‖2 . 当 εij = 0 时,ξij取到最大值 1,表示两个样本完全重合,相关性最大; 当 εij→∞ 时,ξij取值趋向于 0,表示两个样本完全不相关. ξij 是 εij的递减函数,两样本的距离越远,相关性越小. 利用欧氏距离选择与当前样本 x 最近的样本 xi 作为一个邻近点,记相似性为 ξi,now,然后计算除样 本 xi 外与当前样本最近的样本 xj ,记 相 似 性 为 ξj,now,样本 xj 与样本 xi 的相似性记为 ξi,j . 为了避免 样本 xi 和样本 xj 表达当前样本的信息冗余,对样本 xj 作如下的判断来决定其是否作为当前样本 x 的近 邻: 如果样本 xj 与样本 xi 的相似性小于与当前样本 x 的相似性的一定比例,即 ξi,j≤rξj,now, ( 18) 图 1 优化近邻选取的示意图 Fig. 1 Optimization selection sketch of neighbors 式中 r 为常数,则认为样本 xj 为当前样本 x 的近邻; 否则认为样本 xj 与样本 xi 较相似,表达当前样本存 在冗余信息,不会将样本 xj 作为当前样本的近邻, 然后继续寻找近邻直到找到当前样本 x 的 k 个近 邻. 如图 1 所示,样本 xi 是与当前样本 x 距离最近 的样本,其次为 xj 和 xk,xj 虽然与当前样本的距离 小于 xk 与当前样本的距离,但因为 xj 与 xi 距离较 近即相似性较强,不会将其作为当前样本的近邻,而 ·439·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有