正在加载图片...
何飞等:信息熵特征选择方法定位热轧带钢头部拉窄原因 ·47 薄,在不同工序停留的时间长度也不同.使用数据统 将通过该格点的路径延伸(,),即: 计方法进行过程监控与诊断要求:各生产变量间,生产 y(i,j》=d(xy)+ 变量与质量变量间要对应钢板的同一位置,即每一个 min(y(x-y),y(y-i),y(x-y-i)).(4) 样本点都是由对应钢板相同位置的工艺参数和质量参 其中,y(i,》为累加距离,由当前计算点的距离和相邻 数组成. 点的累加DTW距离计算得到. 动态时间弯曲算法是基于动态规划思想的一种模 式匹配算法,具备时间和幅度上的伸缩能力.DTW算 3信息熵特征选择方法 法的实质是运用动态规划的思想,将一个复杂的全局 因不同的生产过程变量均对产品质量产生影响, 最优化问题转化为许多局部最优化问题.利用局部最 为了在众多影响因素中比较各生产过程变量对产品质 优化自动寻找一条路径,沿着这条路径,两个特征矢量 量的影响程度,在热轧带钢头部拉窄分析中找出引起 之间的累积距离和最小,这条路径上的点构成新的变 宽度异常的关键工艺参数,本文拟采用特征选择的方 量从而实现变量长度相等 法进行关键变量的筛选.特征选择方法常用于分类或 DTW算法的原理是”-:假设有两个长度分别为 回归中变量或者特征的选择,其基本原理是分析待选 m和n的信号序列X={xx2…,xm}和Y={y2, 择变量或者特征与分类信息或者预测变量间的相关程 …,y},按照编号顺序,构造序列X和Y之间点与点对 度,选择相关程度较大的变量或特征.而在质量异常 应关系的m×n矩阵M: 分析中,可以认为与质量变量相关程度较大的变量是 [Ma d(x,y) d(x') 引起质量异常的主要原因.本文拟采用最大相关度一 M= 最小冗余度(max-relevance and min-redundancy)的信 d(x'y) d(xmyn) 息熵特征选择方法@进行热轧带钢头部拉窄原因 (1) 分析. 其中,元素M表示序列点x:和y之间的欧式距离d 信息熵作为系统状态不确定性的定量评价指标, xy). 对于系统内在信息具有较强的刻画能力.互信息用于 弯曲路径W是矩阵中邻近元素的集合: 测量两个随机变量间的统计相关性.互信息的表达式 W={w,e2,…,w},max(m,n)≤k≤m+n-1. 如下-四: (2) I(X,)=H(X)+H()-H(X,)= 其中,w:(i=1,2,…,k)为距离矩阵中的弯曲路径点. H(X)-H(XIY)=H(Y)-H(YIX). (5) 动态时间弯曲路径要满足下列条件: 式中,H()和H()分别为X和Y的熵.H(X,)为两 (1)边界条件:弯曲路径起始于矩阵的左上角 者的联合嫡,H(XIY)和H(YIX)分别为各自的条 01=(1,1),结束于矩阵的右下角w。=(m,n): 件熵 (2)连续性:弯曲路径上的任意两个相连点,它们 H(X)=-p,(x,)logp,(x), (6) 在矩阵中对应元素是相邻的.设计算点为(i,j),它的 前一点只能是(i-1),(i,j-1)或(i-1,j-1): H(XI=-∑P,(xly)logP(xly),(7) (3)单调性:弯曲路径上的元素点是向前发展的 H(X,Y)=->p (logp (,y).(8) w=(a,b),0g-1=(a,b),必须满足:a-a≥0,b- 式中P,(xly)为给定Y时X的条件概率,熵H(X) b≥0. 为X的不确定性度量,随机变量的随机性越大,熵值 从时间起始点(1,1)到终点(m,n),满足上述条 则越大:H(X)则为给定Y时X的不确定的度量,条 件的路径有很多.计算每条达到点(m,n)的路径的总 件熵和联合熵反映两个随机变量可预测性的相关性, 累积距离,具有最小累积距离的路径即为所寻找最小 log为对数,底数取为2. 弯曲代价的路径,即: 最简单直接的方法是选择因变量与自变量互信息 DTW (X,Y)=min 0,W=01,2,…, 最大的变量,其评价函数如式(5)所示.在衡量相关性 的基础上引入惩罚项,同时考虑变量间的相关性和冗 (3) 余性,评价函数如下式所示,参数B来控制冗余项的惩 搜索最小弯曲代价路径可以通过递归计算起始点 罚程度: (1,1)到终点(m,n)之间的局部最优解获得.具体方 法是:设计算点为(i,》,由于它的前一点只能是(i- R=I(x,)-B∑I(x,x,) (9) 1,),(i,j-1)或(i-1,j-1),那么点(i,)一定选择这 式中,S为已选特征子集,x,为已选特征. 三个距离中最小者所对应的格点作为其前续格点,并 避免参数B的选择问题,Kassidas等提出了最大何 飞等; 信息熵特征选择方法定位热轧带钢头部拉窄原因 薄,在不同工序停留的时间长度也不同. 使用数据统 计方法进行过程监控与诊断要求: 各生产变量间,生产 变量与质量变量间要对应钢板的同一位置,即每一个 样本点都是由对应钢板相同位置的工艺参数和质量参 数组成. 动态时间弯曲算法是基于动态规划思想的一种模 式匹配算法,具备时间和幅度上的伸缩能力. DTW 算 法的实质是运用动态规划的思想,将一个复杂的全局 最优化问题转化为许多局部最优化问题. 利用局部最 优化自动寻找一条路径,沿着这条路径,两个特征矢量 之间的累积距离和最小,这条路径上的点构成新的变 量从而实现变量长度相等. DTW 算法的原理是[7 - 8]: 假设有两个长度分别为 m 和 n 的信号序列 X = { x1,x2,…,xm } 和 Y = { y1,y2, …,yn } ,按照编号顺序,构造序列 X 和 Y 之间点与点对 应关系的 m × n 矩阵 M: M = M11 … Mm1    M1n … M        mn  = d( x1,y1 ) … d( xm,y1 )    d( x1,yn ) … d( xm,yn        )  . ( 1) 其中,元素 Mij表示序列点 xi 和 yj 之间的欧式距离 d ( xi,yj ) . 弯曲路径 W 是矩阵中邻近元素的集合: W = { w1,w2,…,wk } ,max ( m,n) ≤k≤m + n - 1. ( 2) 其中,wi ( i = 1,2,…,k) 为距离矩阵中的弯曲路径点. 动态时间弯曲路径要满足下列条件: ( 1) 边界 条 件: 弯曲路径起始于矩阵的左上角 w1 = ( 1,1) ,结束于矩阵的右下角 wk = ( m,n) ; ( 2) 连续性: 弯曲路径上的任意两个相连点,它们 在矩阵中对应元素是相邻的. 设计算点为( i,j) ,它的 前一点只能是( i - 1,j) ,( i,j - 1) 或( i - 1,j - 1) ; ( 3) 单调性: 弯曲路径上的元素点是向前发展的. wk = ( a,b) ,wk - 1 = ( a',b') ,必须满足: a - a'≥0,b - b'≥0. 从时间起始点( 1,1) 到终点( m,n) ,满足上述条 件的路径有很多. 计算每条达到点( m,n) 的路径的总 累积距离,具有最小累积距离的路径即为所寻找最小 弯曲代价的路径,即: DTW( X,Y) = m W in { ∑ k i = 1 wi,W =〈w1,w2,…,wk〉} . ( 3) 搜索最小弯曲代价路径可以通过递归计算起始点 ( 1,1) 到终点( m,n) 之间的局部最优解获得. 具体方 法是: 设计算点为( i,j) ,由于它的前一点只能是( i - 1,j) ,( i,j - 1) 或( i - 1,j - 1) ,那么点( i,j) 一定选择这 三个距离中最小者所对应的格点作为其前续格点,并 将通过该格点的路径延伸( i,j) ,即: γ( i,j) = d( xi,yj ) + min ( γ( xi - 1,yj ) ,γ( xi,yj - 1 ) ,γ( xi - 1,yj - 1 ) ) . ( 4) 其中,γ( i,j) 为累加距离,由当前计算点的距离和相邻 点的累加 DTW 距离计算得到. 3 信息熵特征选择方法 因不同的生产过程变量均对产品质量产生影响, 为了在众多影响因素中比较各生产过程变量对产品质 量的影响程度,在热轧带钢头部拉窄分析中找出引起 宽度异常的关键工艺参数,本文拟采用特征选择的方 法进行关键变量的筛选. 特征选择方法常用于分类或 回归中变量或者特征的选择,其基本原理是分析待选 择变量或者特征与分类信息或者预测变量间的相关程 度,选择相关程度较大的变量或特征. 而在质量异常 分析中,可以认为与质量变量相关程度较大的变量是 引起质量异常的主要原因. 本文拟采用最大相关度— 最小冗余度( max-relevance and min-redundancy) 的 信 息熵特征选择方法[9 - 10]进行热轧带钢头部拉窄原因 分析. 信息熵作为系统状态不确定性的定量评价指标, 对于系统内在信息具有较强的刻画能力. 互信息用于 测量两个随机变量间的统计相关性. 互信息的表达式 如下[11 - 12]: I( X,Y) = H( X) + H( Y) - H( X,Y) = H( X) - H( X| Y) = H( Y) - H( Y | X) . ( 5) 式中,H( X) 和 H( Y) 分别为 X 和 Y 的熵. H( X,Y) 为两 者的联合 熵,H( X | Y) 和 H( Y | X) 分 别 为 各 自 的 条 件熵. H( X) = - ∑i px ( xi ) logpx ( xi ) , ( 6) H( X| Y) = - ∑i px | y ( xi | yi ) logpx | y ( xi | yi ) , ( 7) H( X,Y) = - ∑i pxy ( xi,yi ) logpxy ( xi,yi ) . ( 8) 式中: px | y ( xi | yi ) 为给定 Y 时 X 的条件概率,熵 H( X) 为 X 的不确定性度量,随机变量的随机性越大,熵值 则越大; H( X| Y) 则为给定 Y 时 X 的不确定的度量,条 件熵和联合熵反映两个随机变量可预测性的相关性, log 为对数,底数取为 2. 最简单直接的方法是选择因变量与自变量互信息 最大的变量,其评价函数如式( 5) 所示. 在衡量相关性 的基础上引入惩罚项,同时考虑变量间的相关性和冗 余性,评价函数如下式所示,参数 β 来控制冗余项的惩 罚程度: R = I( xi,Y) - β ∑xsS I( xi,xs ) . ( 9) 式中,S 为已选特征子集,xs 为已选特征. 避免参数 β 的选择问题,Kassidas 等提出了最大 ·47·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有