正在加载图片...
赵启东等:基于支持向量数据描述方法的生产过程监控、诊断与优化 ·1793· 0 0 n (7) 0 0 0 0 0 其中,n为训练样本的总数,n,为支持向量的个数.由 Ψx:2 于在利用SVDD方法建立监控模型的过程中,只有正 0 0 0 常样本参与建模,而位于超球体外和超球体面上的支 0 持向量x与球心o的距离是大于等于半径R的,即 (12) D(x)≥R.由前面的分析可知,可以作为支持向量 结合式(11)和式(12)可以看出,贡献矩阵C,是 的样本其自身是正常样本,但根据监控准则被判为异 一个p×n的矩阵,只有其中的第j行是有数值的,它 常样本,由此可以用支持向量的个数n来计算虚 警率。 代表的是异常样本点x的第j个变量分别与每个正 常样本的第j个变量之间的相互关系.设有n个正常 为对参数)和核参数进行优化,首先需要给定 样本,那么就将C,中n个非零元素进行加和,可以得 显著性水平a:然后分别确定参数v和核参数σ的取 到异常样本点的第j个变量的能量值E, 值范围,并划分网格,计算每个参数组合下的虚警率, 对n个正常样本求平均值,得到一个新的样本x。, 选出7≈α时的参数u:在确定参数v之后,画出)-0 按照上述计算过程,可以相应获得新样本点的第j个 曲线图,选择η达到稳定时的σ值作为模型中核参数 变量的能量值E。,以此作为后续比较分析的基准值. 值.所提出的参数优化方法的好处在于,完全是根据 定义异常样本点x的第j变量的贡献值为 数据内在的结构特征来确定支持向量的个数,进而获 (13) 得虚警率,并以此作为收敛条件来确定核参数,无需引 6=lg(E:/E). 入其他复杂的优化算法,使得计算过程效率高,易于实 式中:E为异常样本点的第j个变量的能量值:E为正 常样本点的第广个变量的能量值:δ表示异常样本的 现在线监控 第个变量与正常样本的第个变量之间的偏离程度, 1.2基于贡献图的异常点诊断 δ值越大,则说明第j个变量导致样本异常的可能性 利用建立好的监控模型可以对测试样本进行监 控.在核参数σ确定的情况下,式(6)中第三部分 就越大 假设共有p个变量,依次对这p个变量计算出贡 会会aK)主要是由训练集x决定的,但 献值6j=1,2,…,P,便可画出所有变量对异常的贡献 要对新来的测试样本x进行实时监控,主要是取决 图,如图1所示,横坐标代表各个变量,纵坐标则表示 贡献值.贡献值越大所对应的变量,则越有可能引起 于式(6)的第二部分∑a,K(xx,),即 生产过程的异常 ga)=名a业ge (8) 由上式可知,若Ix-x:‖2越大,式(8)的值就 越小,则D(x)就越大.由此可知,式(6)中测试样 本点到球心的距离主要取决于下式: 含。I=宫a医 (9) 式中,x:=xew-x 变量1 变量2 变量即 假设新来的测试样本x超过了R控制限,被判 图1贡献图的示意图 为异常样本.为了实现对异常样本点的诊断,需要将 Fig.1 Schematic diagram of the contribution plot 式(9)中:和a:结合生成一个新矩阵X 1.3基于邻近点替换的工艺参数优化 X,x=[Wa√瓜…Va…√a].((10) 在诊断出由哪些变量引起生产过程的异常后,需 式中,p表示样本的变量个数 要对这些异常样本点进行优化控制,使生产过程及时 在此基础上定义第j个变量的贡献矩阵C,为 调整回到受控状态.基本思路如下所述, C=业X= 在核函数映射的高维特征空间中,设山(y)为异常 [aΨ√aΨ2…aΨ…√a乎] 样本,中(z)为正常样本,见图2.定义异常样本到超球 (11) 体球心的距离为D,正常样本到超球体球心的距离 其中,矩阵业仅有a为1,其余元素全为0,如下式: 为Do赵启东等: 基于支持向量数据描述方法的生产过程监控、诊断与优化 η = nsv n . ( 7) 其中,n 为训练样本的总数,nsv为支持向量的个数. 由 于在利用 SVDD 方法建立监控模型的过程中,只有正 常样本参与建模,而位于超球体外和超球体面上的支 持向量 xsv与球心 o 的距离是大于等于半径 R 的,即 D2 ( xsv ) ≥R2 . 由前面的分析可知,可以作为支持向量 的样本其自身是正常样本,但根据监控准则被判为异 常样本,由 此 可 以 用 支 持 向 量 的 个 数 nsv 来 计 算 虚 警率. 为对参数 υ 和核参数 σ 进行优化,首先需要给定 显著性水平 α; 然后分别确定参数 υ 和核参数 σ 的取 值范围,并划分网格,计算每个参数组合下的虚警率, 选出 η≈α 时的参数 υ; 在确定参数 υ 之后,画出 η - σ 曲线图,选择 η 达到稳定时的 σ 值作为模型中核参数 值. 所提出的参数优化方法的好处在于,完全是根据 数据内在的结构特征来确定支持向量的个数,进而获 得虚警率,并以此作为收敛条件来确定核参数,无需引 入其他复杂的优化算法,使得计算过程效率高,易于实 现在线监控. 1. 2 基于贡献图的异常点诊断 利用建立好的监控模型可以对测试样本进行监 控. 在核参 数 σ 确 定 的 情 况 下,式( 6 ) 中 第 三 部 分 ∑ n i = 1 ∑ n j = 1 αiαj K( xi,xj ) 主要是由训练集{ xi} 决定的,但 要对新来的测试样本 xnew进行实时监控,主要是取决 于式( 6) 的第二部分 ∑ n i = 1 αiK( xnew,xi ) ,即 ∑ n i = 1 αiK( xnew,xi ) = ∑ n i = 1 αie - ‖xnew - xi‖2 σ2 . ( 8) 由上式可知,若‖xnew - xi‖2 越大,式( 8) 的值就 越小,则 D2 ( xnew ) 就越大. 由此可知,式( 6) 中测试样 本点到球心的距离主要取决于下式: ∑ n i = 1 αi‖xnew - xi‖2 = ∑ n i = 1 αi‖x^ i‖2 . ( 9) 式中,x^ i = xnew - xi . 假设新来的测试样本 xnew超过了 R2 控制限,被判 为异常样本. 为了实现对异常样本点的诊断,需要将 式( 9) 中 x^ i 和 αi 结合生成一个新矩阵 ^ X ^ Xp × n =[槡α1 x^ 1 槡α2 x^ 2… 槡αix^ i… 槡αn x^ n ]. ( 10) 式中,p 表示样本的变量个数. 在此基础上定义第 j 个变量的贡献矩阵 Cj 为 Cj = Ψj ^ X = [槡α1Ψj x^ 1 槡α2Ψj x^ 2…槡αiΨj x^ i…槡αnΨj x^ n ]. ( 11) 其中,矩阵 Ψj 仅有 ajj为 1,其余元素全为 0,如下式: Ψj x^ i = 0 0 … 0 0 0   0 0   ajj   0 0   0 0 0 …              0 0  x^ 1i  x^ ji  x^               pi = 0 0 ajj x^ ji               0  . ( 12) 结合式( 11) 和式( 12) 可以看出,贡献矩阵 Cj 是 一个 p × n 的矩阵,只有其中的第 j 行是有数值的,它 代表的是异常样本点 xnew的第 j 个变量分别与每个正 常样本的第 j 个变量之间的相互关系. 设有 n 个正常 样本,那么就将 Cj 中 n 个非零元素进行加和,可以得 到异常样本点的第 j 个变量的能量值 Ej . 对 n 个正常样本求平均值,得到一个新的样本 x0, 按照上述计算过程,可以相应获得新样本点的第 j 个 变量的能量值 Ej0,以此作为后续比较分析的基准值. 定义异常样本点 xnew的第 j 变量的贡献值为 δj = lg( E2 j /E2 j0 ) . ( 13) 式中: Ej 为异常样本点的第 j 个变量的能量值; Ej0为正 常样本点的第 j 个变量的能量值; δj 表示异常样本的 第 j 个变量与正常样本的第 j 个变量之间的偏离程度, δj 值越大,则说明第 j 个变量导致样本异常的可能性 就越大. 假设共有 p 个变量,依次对这 p 个变量计算出贡 献值 δj ,j = 1,2,…,p,便可画出所有变量对异常的贡献 图,如图 1 所示,横坐标代表各个变量,纵坐标则表示 贡献值. 贡献值越大所对应的变量,则越有可能引起 生产过程的异常. 图 1 贡献图的示意图 Fig. 1 Schematic diagram of the contribution plot 1. 3 基于邻近点替换的工艺参数优化 在诊断出由哪些变量引起生产过程的异常后,需 要对这些异常样本点进行优化控制,使生产过程及时 调整回到受控状态. 基本思路如下所述. 在核函数映射的高维特征空间中,设 ( y) 为异常 样本,( z) 为正常样本,见图 2. 定义异常样本到超球 体球心的距离为 Dyo,正常样本到超球体球心的距离 为 Dzo . ·1793·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有