工程科学学报,第37卷,增刊1:4550,2015年5月 Chinese Journal of Engineering,Vol.37,Suppl.1:45-50,May 2015 DOI:10.13374/j.issn2095-9389.2015.s1.008:http://journals.ustb.edu.cn 信息熵特征选择方法定位热轧带钢头部拉窄原因 何飞四,肖会芳 北京科技大学国家板带生产先进装备工程技术研究中心,北京100083 区通信作者,E-mail:hefei(@ustb.edu.cn 摘要针对某热轧带钢生产线时常会出现头部拉窄现象,本文从实际生产数据出发,首先采用动态弯曲时间算法将长度不 同的各变量转换为相同长度,然后采用信息熵特征选择算法分析各生产过程变量对产品质量的影响程度,找出对头部拉窄影 响最大的前若干个过程变量,初步定位热轧带钢头部拉窄原因.结果表明:信息熵特征选择方法可以有效初选热轧带钢头部 拉窄原因,为生产调整提供方法支撑,将来还可推广到其他质量异常定位,甚至其他工序或者其他应用领域 关键词信息嫡:特征选择;热轧:头部拉窄;故障诊断 分类号TG335.5 Cause analysis of head width narrow of hot rolled strip based on feature selection of in- formation entropy HE Fei,XIAO Huifang National Engineering Research Center of Flat Rolling Equipment,University of Science and Technology Beijing.Beijing 100083,China Corresponding author,E-mail:hefei@ustb.edu.cn ABSTRACT The quality problem of head width narrow appears on one hot rolled strip line sometime.In order to using the real da- ta,in this paper the dynamic time warping was firstly utilized to transfer the different length data to the same length,and then the fea- ture selection method based on information entropy was applied to analyze the order of important about process parameters that effect on the quality.The first several process parameters were selected as the causes of head width narrow of hot rolled strip.The results show that the feature selection method based on information entropy can track the causes of the head width narrow of hot rolled strip effec- tively to adjust the process.In the future,the methods can be applied in other quality diagnosis,other processes or other application fields. KEY WORDS information entropy:feature selection:hot rolling head width narrow:fault diagnosis 热轧带钢产品是工业材料和钢铁生产过程的重要 和各机架速度相关,轧制力的设定和带钢温度相关等: 产品,不仅可以直接使用,而且是连铸和冷轧生产过程 (3)数据类型繁杂,如温度、轧制力是连续性数值,而 的中间环节,起着承前启后的作用,其产品质量会影响 表面质量只能使用符号性描述,有无缺陷等.当发现 后续加工.随着机理模型和控制技术的深入研究,发 产品质量发生异常时,质量诊断成为生产过程的关键 展了轧制力模型、温度模型等0,使得热轧带钢的产品 问题,如何快速有效地定位异常原因是确保后续质量 质量有了很大的提高.但因热连轧生产过程复杂,主 的首要问题四.当前生产过程中,更多依赖有经验的 要体现在:(1)生产过程变量众多,如各机架轧制力、 专家和现有的机理模型,分析各生产过程间的影响关 温度、速度等:(2)变量间强耦合,如机架间的活套量 系,改进生产四.随着计算机控制技术、传感技术和数 收稿日期:2015-0105 基金项目:国家自然科学基金资助项目(51204018);国家“十二五”科技支撑计划项目(2015BA30B00):北京高等学校青年英才计划 (YET0422):中央高校基本科研业务费资助项目(FRF-TP-14一124A2)
工程科学学报,第 37 卷,增刊 1: 45--50,2015 年 5 月 Chinese Journal of Engineering,Vol. 37,Suppl. 1: 45--50,May 2015 DOI: 10. 13374 /j. issn2095--9389. 2015. s1. 008; http: / /journals. ustb. edu. cn 信息熵特征选择方法定位热轧带钢头部拉窄原因 何 飞,肖会芳 北京科技大学国家板带生产先进装备工程技术研究中心,北京 100083 通信作者,E-mail: hefei@ ustb. edu. cn 摘 要 针对某热轧带钢生产线时常会出现头部拉窄现象,本文从实际生产数据出发,首先采用动态弯曲时间算法将长度不 同的各变量转换为相同长度,然后采用信息熵特征选择算法分析各生产过程变量对产品质量的影响程度,找出对头部拉窄影 响最大的前若干个过程变量,初步定位热轧带钢头部拉窄原因. 结果表明: 信息熵特征选择方法可以有效初选热轧带钢头部 拉窄原因,为生产调整提供方法支撑,将来还可推广到其他质量异常定位,甚至其他工序或者其他应用领域. 关键词 信息熵; 特征选择; 热轧; 头部拉窄; 故障诊断 分类号 TG335. 5 Cause analysis of head width narrow of hot rolled strip based on feature selection of information entropy HE Fei ,XIAO Hui-fang National Engineering Research Center of Flat Rolling Equipment,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail: hefei@ ustb. edu. cn ABSTRACT The quality problem of head width narrow appears on one hot rolled strip line sometime. In order to using the real data,in this paper the dynamic time warping was firstly utilized to transfer the different length data to the same length,and then the feature selection method based on information entropy was applied to analyze the order of important about process parameters that effect on the quality. The first several process parameters were selected as the causes of head width narrow of hot rolled strip. The results show that the feature selection method based on information entropy can track the causes of the head width narrow of hot rolled strip effectively to adjust the process. In the future,the methods can be applied in other quality diagnosis,other processes or other application fields. KEY WORDS information entropy; feature selection; hot rolling ; head width narrow; fault diagnosis 收稿日期: 2015--01--05 基金项目: 国家自然科学基金资助项目( 51204018) ; 国家“十二五”科技支撑计划项目( 2015BAF30B00) ; 北京高等学校青年英才计划 ( YETP0422) ; 中央高校基本科研业务费资助项目( FRF--TP--14--124A2) 热轧带钢产品是工业材料和钢铁生产过程的重要 产品,不仅可以直接使用,而且是连铸和冷轧生产过程 的中间环节,起着承前启后的作用,其产品质量会影响 后续加工. 随着机理模型和控制技术的深入研究,发 展了轧制力模型、温度模型等[1],使得热轧带钢的产品 质量有了很大的提高. 但因热连轧生产过程复杂,主 要体现在: ( 1) 生产过程变量众多,如各机架轧制力、 温度、速度等; ( 2) 变量间强耦合,如机架间的活套量 和各机架速度相关,轧制力的设定和带钢温度相关等; ( 3) 数据类型繁杂,如温度、轧制力是连续性数值,而 表面质量只能使用符号性描述,有无缺陷等. 当发现 产品质量发生异常时,质量诊断成为生产过程的关键 问题,如何快速有效地定位异常原因是确保后续质量 的首要问题[2]. 当前生产过程中,更多依赖有经验的 专家和现有的机理模型,分析各生产过程间的影响关 系,改进生产[3]. 随着计算机控制技术、传感技术和数
·46* 工程科学学报,第37卷,增刊1 据库技术的发展,在热轧带钢生产过程中,各控制模型 选变量与因变量间的相关程度来对可能引起质量异常 的计算、设定数据,在线仪表的实测数据等被大量记 的各过程变量进行排序分析,初步定位异常原因,文中 录,为生产过程和质量的分析提供了真实有效的数据 采用了信息熵分析方法选择最有可能引起本块带钢异 来源.如Hog等利用相关分析来确定活套控制参数, 常的过程变量,最后利用现场连续出现头部拉窄现象 提升带钢宽度质量四 的多块带钢对异常变量进行综合判断,给出当前生产 本文从实际生产数据入手,希望通过数据分析方 过程的薄弱环节,为现场质量诊断提供技术支撑 法帮助现场工程师初步定位质量异常原因5,然后 1 热轧带钢生产 开展有针对性的研究,分析了热轧带钢生产中出现头 部拉窄的原因.因热轧生产过程是依次通过各单体设 1.1热轧带钢生产简介 备,而且带钢是变薄变长的过程,因而在不同生产部位 热连轧生产常以连铸板坯为原料,将钢材加工为 现场数据采集的时间和长度不同,首先判断各变量的 厚度约为2~6mm的板带产品.常用的带钢热连轧生 初始和结束记录时刻,然后采用动态时间弯曲方法 产线一般包括:加热炉区、粗轧区、粗精轧之间的中间 (dynamic time warping,DTW)将各采集变量同步化为 辊道及飞剪、精轧区、热输出辊道及层流冷却装置、卷 相同长度@.其次,采用特征选择的思路即计算各备 取区等,如图1所示 】8?侮阳888用 加热 粗轧区 中间辊道及飞剪精轧区 热输出辊道及层流冷却 卷取区 图1热连轧生产过程的布置图 Fig.1 Layout drawing of hot rolling process 带钢热连轧生产过程需要保证成品带钢的如下质 定数据、在线仪表的实测数据等被大量记录,为生产过 量.(1)尺寸形状质量:厚度精度,宽度精度,凸度及 程和质量的分析提供了真实的数据来源.但由于热轧 平直度等;(2)力学性能质量:屈服强度,抗拉强度,延 生产工艺参数众多,规格品种繁多,生产节奏较快,而 伸率和硬度等;(3)表面质量:划痕,裂纹等.宽度精 且各工艺参数与质量指标之间存在复杂的内在关系, 度是热轧带钢产品重要的产品质量. 如何充分利用这些数据对生产过程进行监控,出现质 1.2热轧带钢头部拉窄 量异常时,如何利用数据分析方法进行生产过程的诊 头部拉窄是指带钢头部的实际宽度小于目标宽 断是一个难题. 度,造成产品质量不合格,给企业带来重大的经济损 由于热轧生产过程数据庞大而复杂,依据热轧工 失.某热轧厂在生产过程中时常会出现头部拉窄问 艺知识,从600余个监测变量中选择55个直接或间接 题.随着计算机控制技术、传感技术和数据库技术的 影响头部宽度质量的变量,试图从中找出影响头部拉 发展,在热轧带钢生产过程中,各控制模型的计算及设 窄的主要因素,具体的变量见表1所示 表1热轧带钢头部拉窄数据分析变量表 Table 1 Variables table of head width narrow of hot rolled strip 变量 类别 具体变量名称 编号 个数 温度 精轧入口温度、精轧出口温度 1-2 实测速度 精轧机F1~F7实测速度 3-9 1 套量 活套1~6套量 10~15 6 ①精轧机F1~F7双侧轧制力设定值 工艺参数 轧制力 ②精轧机F1~F7工作侧轧制力实测值 16~36 ③精轧机F1~F7传动侧轧制力实测值 辊缝 精轧机FI~F7辊缝值 37~43 7 速度差 前机架计算前滑后的速度与后机架计算后滑后的速度的差值 44~49 活套高度 活套1~6高度值 50-55 6 质量指标 宽度误差 1 置,热轧生产过程中,钢板依次进入各轧机,造成各变 2 动态时间弯曲算法 量开始测量和结束测量的时间不同,同一时刻各变量 由于各变量采集点分布在热轧生产线的不同位 采集的数据所对应的钢板位置不同,而且钢板由厚变
工程科学学报,第 37 卷,增刊 1 据库技术的发展,在热轧带钢生产过程中,各控制模型 的计算、设定数据,在线仪表的实测数据等被大量记 录,为生产过程和质量的分析提供了真实有效的数据 来源. 如 Hong 等利用相关分析来确定活套控制参数, 提升带钢宽度质量[4]. 本文从实际生产数据入手,希望通过数据分析方 法帮助现场工程师初步定位质量异常原因[5 - 6],然后 开展有针对性的研究,分析了热轧带钢生产中出现头 部拉窄的原因. 因热轧生产过程是依次通过各单体设 备,而且带钢是变薄变长的过程,因而在不同生产部位 现场数据采集的时间和长度不同,首先判断各变量的 初始和结束记录时刻,然后采用动态时间弯曲方法 ( dynamic time warping,DTW) 将各采集变量同步化为 相同长度[6]. 其次,采用特征选择的思路即计算各备 选变量与因变量间的相关程度来对可能引起质量异常 的各过程变量进行排序分析,初步定位异常原因,文中 采用了信息熵分析方法选择最有可能引起本块带钢异 常的过程变量,最后利用现场连续出现头部拉窄现象 的多块带钢对异常变量进行综合判断,给出当前生产 过程的薄弱环节,为现场质量诊断提供技术支撑. 1 热轧带钢生产 1. 1 热轧带钢生产简介 热连轧生产常以连铸板坯为原料,将钢材加工为 厚度约为 2 ~ 6 mm 的板带产品. 常用的带钢热连轧生 产线一般包括: 加热炉区、粗轧区、粗精轧之间的中间 辊道及飞剪、精轧区、热输出辊道及层流冷却装置、卷 取区等,如图 1 所示. 图 1 热连轧生产过程的布置图 Fig. 1 Layout drawing of hot rolling process 带钢热连轧生产过程需要保证成品带钢的如下质 量. ( 1) 尺寸形状质量: 厚度精度,宽度精度,凸度及 平直度等; ( 2) 力学性能质量: 屈服强度,抗拉强度,延 伸率和硬度等; ( 3) 表面质量: 划痕,裂纹等. 宽度精 度是热轧带钢产品重要的产品质量. 1. 2 热轧带钢头部拉窄 头部拉窄是指带钢头部的实际宽度小于目标宽 度,造成产品质量不合格,给企业带来重大的经济损 失. 某热轧厂在生产过程中时常会出现头部拉窄问 题. 随着计算机控制技术、传感技术和数据库技术的 发展,在热轧带钢生产过程中,各控制模型的计算及设 定数据、在线仪表的实测数据等被大量记录,为生产过 程和质量的分析提供了真实的数据来源. 但由于热轧 生产工艺参数众多,规格品种繁多,生产节奏较快,而 且各工艺参数与质量指标之间存在复杂的内在关系, 如何充分利用这些数据对生产过程进行监控,出现质 量异常时,如何利用数据分析方法进行生产过程的诊 断是一个难题. 由于热轧生产过程数据庞大而复杂,依据热轧工 艺知识,从 600 余个监测变量中选择 55 个直接或间接 影响头部宽度质量的变量,试图从中找出影响头部拉 窄的主要因素,具体的变量见表 1 所示. 表 1 热轧带钢头部拉窄数据分析变量表 Table 1 Variables table of head width narrow of hot rolled strip 变量 类别 具体变量名称 编号 个数 温度 精轧入口温度、精轧出口温度 1 ~ 2 2 实测速度 精轧机 F1 ~ F7 实测速度 3 ~ 9 7 套量 活套 1 ~ 6 套量 10 ~ 15 6 工艺参数 轧制力 ①精轧机 F1 ~ F7 双侧轧制力设定值 ②精轧机 F1 ~ F7 工作侧轧制力实测值 ③精轧机 F1 ~ F7 传动侧轧制力实测值 16 ~ 36 21 辊缝 精轧机 F1 ~ F7 辊缝值 37 ~ 43 7 速度差 前机架计算前滑后的速度与后机架计算后滑后的速度的差值 44 ~ 49 6 活套高度 活套 1 ~ 6 高度值 50 ~ 55 6 质量指标 宽度误差 1 2 动态时间弯曲算法 由于各变量采集点分布在热轧生产线的不同位 置,热轧生产过程中,钢板依次进入各轧机,造成各变 量开始测量和结束测量的时间不同,同一时刻各变量 采集的数据所对应的钢板位置不同,而且钢板由厚变 ·46·
何飞等:信息熵特征选择方法定位热轧带钢头部拉窄原因 ·47 薄,在不同工序停留的时间长度也不同.使用数据统 将通过该格点的路径延伸(,),即: 计方法进行过程监控与诊断要求:各生产变量间,生产 y(i,j》=d(xy)+ 变量与质量变量间要对应钢板的同一位置,即每一个 min(y(x-y),y(y-i),y(x-y-i)).(4) 样本点都是由对应钢板相同位置的工艺参数和质量参 其中,y(i,》为累加距离,由当前计算点的距离和相邻 数组成. 点的累加DTW距离计算得到. 动态时间弯曲算法是基于动态规划思想的一种模 式匹配算法,具备时间和幅度上的伸缩能力.DTW算 3信息熵特征选择方法 法的实质是运用动态规划的思想,将一个复杂的全局 因不同的生产过程变量均对产品质量产生影响, 最优化问题转化为许多局部最优化问题.利用局部最 为了在众多影响因素中比较各生产过程变量对产品质 优化自动寻找一条路径,沿着这条路径,两个特征矢量 量的影响程度,在热轧带钢头部拉窄分析中找出引起 之间的累积距离和最小,这条路径上的点构成新的变 宽度异常的关键工艺参数,本文拟采用特征选择的方 量从而实现变量长度相等 法进行关键变量的筛选.特征选择方法常用于分类或 DTW算法的原理是”-:假设有两个长度分别为 回归中变量或者特征的选择,其基本原理是分析待选 m和n的信号序列X={xx2…,xm}和Y={y2, 择变量或者特征与分类信息或者预测变量间的相关程 …,y},按照编号顺序,构造序列X和Y之间点与点对 度,选择相关程度较大的变量或特征.而在质量异常 应关系的m×n矩阵M: 分析中,可以认为与质量变量相关程度较大的变量是 [Ma d(x,y) d(x') 引起质量异常的主要原因.本文拟采用最大相关度一 M= 最小冗余度(max-relevance and min-redundancy)的信 d(x'y) d(xmyn) 息熵特征选择方法@进行热轧带钢头部拉窄原因 (1) 分析. 其中,元素M表示序列点x:和y之间的欧式距离d 信息熵作为系统状态不确定性的定量评价指标, xy). 对于系统内在信息具有较强的刻画能力.互信息用于 弯曲路径W是矩阵中邻近元素的集合: 测量两个随机变量间的统计相关性.互信息的表达式 W={w,e2,…,w},max(m,n)≤k≤m+n-1. 如下-四: (2) I(X,)=H(X)+H()-H(X,)= 其中,w:(i=1,2,…,k)为距离矩阵中的弯曲路径点. H(X)-H(XIY)=H(Y)-H(YIX). (5) 动态时间弯曲路径要满足下列条件: 式中,H()和H()分别为X和Y的熵.H(X,)为两 (1)边界条件:弯曲路径起始于矩阵的左上角 者的联合嫡,H(XIY)和H(YIX)分别为各自的条 01=(1,1),结束于矩阵的右下角w。=(m,n): 件熵 (2)连续性:弯曲路径上的任意两个相连点,它们 H(X)=-p,(x,)logp,(x), (6) 在矩阵中对应元素是相邻的.设计算点为(i,j),它的 前一点只能是(i-1),(i,j-1)或(i-1,j-1): H(XI=-∑P,(xly)logP(xly),(7) (3)单调性:弯曲路径上的元素点是向前发展的 H(X,Y)=->p (logp (,y).(8) w=(a,b),0g-1=(a,b),必须满足:a-a≥0,b- 式中P,(xly)为给定Y时X的条件概率,熵H(X) b≥0. 为X的不确定性度量,随机变量的随机性越大,熵值 从时间起始点(1,1)到终点(m,n),满足上述条 则越大:H(X)则为给定Y时X的不确定的度量,条 件的路径有很多.计算每条达到点(m,n)的路径的总 件熵和联合熵反映两个随机变量可预测性的相关性, 累积距离,具有最小累积距离的路径即为所寻找最小 log为对数,底数取为2. 弯曲代价的路径,即: 最简单直接的方法是选择因变量与自变量互信息 DTW (X,Y)=min 0,W=01,2,…, 最大的变量,其评价函数如式(5)所示.在衡量相关性 的基础上引入惩罚项,同时考虑变量间的相关性和冗 (3) 余性,评价函数如下式所示,参数B来控制冗余项的惩 搜索最小弯曲代价路径可以通过递归计算起始点 罚程度: (1,1)到终点(m,n)之间的局部最优解获得.具体方 法是:设计算点为(i,》,由于它的前一点只能是(i- R=I(x,)-B∑I(x,x,) (9) 1,),(i,j-1)或(i-1,j-1),那么点(i,)一定选择这 式中,S为已选特征子集,x,为已选特征. 三个距离中最小者所对应的格点作为其前续格点,并 避免参数B的选择问题,Kassidas等提出了最大
何 飞等; 信息熵特征选择方法定位热轧带钢头部拉窄原因 薄,在不同工序停留的时间长度也不同. 使用数据统 计方法进行过程监控与诊断要求: 各生产变量间,生产 变量与质量变量间要对应钢板的同一位置,即每一个 样本点都是由对应钢板相同位置的工艺参数和质量参 数组成. 动态时间弯曲算法是基于动态规划思想的一种模 式匹配算法,具备时间和幅度上的伸缩能力. DTW 算 法的实质是运用动态规划的思想,将一个复杂的全局 最优化问题转化为许多局部最优化问题. 利用局部最 优化自动寻找一条路径,沿着这条路径,两个特征矢量 之间的累积距离和最小,这条路径上的点构成新的变 量从而实现变量长度相等. DTW 算法的原理是[7 - 8]: 假设有两个长度分别为 m 和 n 的信号序列 X = { x1,x2,…,xm } 和 Y = { y1,y2, …,yn } ,按照编号顺序,构造序列 X 和 Y 之间点与点对 应关系的 m × n 矩阵 M: M = M11 … Mm1 M1n … M mn = d( x1,y1 ) … d( xm,y1 ) d( x1,yn ) … d( xm,yn ) . ( 1) 其中,元素 Mij表示序列点 xi 和 yj 之间的欧式距离 d ( xi,yj ) . 弯曲路径 W 是矩阵中邻近元素的集合: W = { w1,w2,…,wk } ,max ( m,n) ≤k≤m + n - 1. ( 2) 其中,wi ( i = 1,2,…,k) 为距离矩阵中的弯曲路径点. 动态时间弯曲路径要满足下列条件: ( 1) 边界 条 件: 弯曲路径起始于矩阵的左上角 w1 = ( 1,1) ,结束于矩阵的右下角 wk = ( m,n) ; ( 2) 连续性: 弯曲路径上的任意两个相连点,它们 在矩阵中对应元素是相邻的. 设计算点为( i,j) ,它的 前一点只能是( i - 1,j) ,( i,j - 1) 或( i - 1,j - 1) ; ( 3) 单调性: 弯曲路径上的元素点是向前发展的. wk = ( a,b) ,wk - 1 = ( a',b') ,必须满足: a - a'≥0,b - b'≥0. 从时间起始点( 1,1) 到终点( m,n) ,满足上述条 件的路径有很多. 计算每条达到点( m,n) 的路径的总 累积距离,具有最小累积距离的路径即为所寻找最小 弯曲代价的路径,即: DTW( X,Y) = m W in { ∑ k i = 1 wi,W =〈w1,w2,…,wk〉} . ( 3) 搜索最小弯曲代价路径可以通过递归计算起始点 ( 1,1) 到终点( m,n) 之间的局部最优解获得. 具体方 法是: 设计算点为( i,j) ,由于它的前一点只能是( i - 1,j) ,( i,j - 1) 或( i - 1,j - 1) ,那么点( i,j) 一定选择这 三个距离中最小者所对应的格点作为其前续格点,并 将通过该格点的路径延伸( i,j) ,即: γ( i,j) = d( xi,yj ) + min ( γ( xi - 1,yj ) ,γ( xi,yj - 1 ) ,γ( xi - 1,yj - 1 ) ) . ( 4) 其中,γ( i,j) 为累加距离,由当前计算点的距离和相邻 点的累加 DTW 距离计算得到. 3 信息熵特征选择方法 因不同的生产过程变量均对产品质量产生影响, 为了在众多影响因素中比较各生产过程变量对产品质 量的影响程度,在热轧带钢头部拉窄分析中找出引起 宽度异常的关键工艺参数,本文拟采用特征选择的方 法进行关键变量的筛选. 特征选择方法常用于分类或 回归中变量或者特征的选择,其基本原理是分析待选 择变量或者特征与分类信息或者预测变量间的相关程 度,选择相关程度较大的变量或特征. 而在质量异常 分析中,可以认为与质量变量相关程度较大的变量是 引起质量异常的主要原因. 本文拟采用最大相关度— 最小冗余度( max-relevance and min-redundancy) 的 信 息熵特征选择方法[9 - 10]进行热轧带钢头部拉窄原因 分析. 信息熵作为系统状态不确定性的定量评价指标, 对于系统内在信息具有较强的刻画能力. 互信息用于 测量两个随机变量间的统计相关性. 互信息的表达式 如下[11 - 12]: I( X,Y) = H( X) + H( Y) - H( X,Y) = H( X) - H( X| Y) = H( Y) - H( Y | X) . ( 5) 式中,H( X) 和 H( Y) 分别为 X 和 Y 的熵. H( X,Y) 为两 者的联合 熵,H( X | Y) 和 H( Y | X) 分 别 为 各 自 的 条 件熵. H( X) = - ∑i px ( xi ) logpx ( xi ) , ( 6) H( X| Y) = - ∑i px | y ( xi | yi ) logpx | y ( xi | yi ) , ( 7) H( X,Y) = - ∑i pxy ( xi,yi ) logpxy ( xi,yi ) . ( 8) 式中: px | y ( xi | yi ) 为给定 Y 时 X 的条件概率,熵 H( X) 为 X 的不确定性度量,随机变量的随机性越大,熵值 则越大; H( X| Y) 则为给定 Y 时 X 的不确定的度量,条 件熵和联合熵反映两个随机变量可预测性的相关性, log 为对数,底数取为 2. 最简单直接的方法是选择因变量与自变量互信息 最大的变量,其评价函数如式( 5) 所示. 在衡量相关性 的基础上引入惩罚项,同时考虑变量间的相关性和冗 余性,评价函数如下式所示,参数 β 来控制冗余项的惩 罚程度: R = I( xi,Y) - β ∑xsS I( xi,xs ) . ( 9) 式中,S 为已选特征子集,xs 为已选特征. 避免参数 β 的选择问题,Kassidas 等提出了最大 ·47·
·48… 工程科学学报,第37卷,增刊1 相关最小冗余算法刀,将样本规模与参数B建立联系, 变化较小,厚度变薄导致长度变长,宽度信息是在精轧 即用互信息的均值作为冗余评价指标,其评价函数 结束后第7机架出口处测量的.因而各轧机所测量的 如下: 生产过程变量长度不同,为了分析生产过程中各测量 1 R=”-三). (10) 变量对宽度质量的影响关系,首先需要实现各过程变 量与宽度信息一一对应,本文采用动态时间弯曲算法, 式中,IS1为已选特征子集S中特征的个数. 以宽度信息为基准,将所有其他变量信息映射到宽度 4热轧带钢头部拉窄分析 时间变量坐标.因变量众多,图2(a)选择部分变量信 息作为典型代表,给出了各变量信息在原始坐标空间 4.1动态时间弯曲数据预处理 中标准化后的数据,所谓标准化即对原始数据减去均 因热连轧生产过程中,带钢需要分别经过各轧机, 值除以标准差.图2(b)则使用动态时间弯曲算法将 最终达到带钢厚度变薄的目的,相关体积情况下,宽度 各变量转换到宽度时间变量坐标后标准化后的数据· 1.0 (a) 0.5 6 -0.5 一宽度误差 -宽度误差 -8 一精轧人入口温度 1.0 精轧入口温度 -10 -精轧出口温度 --…精轧出口温度 12 -1. -14 0 10 20 30 40 50 10152025 30 时间/s 时间/s 图2动态时间弯曲实现长度同步化()原始空间变量:(b)时间同步化空间变量 Fig.2 Synchronization of length using dynamic time warping:(a)variables in the original space:(b)variables in the time synchronization space 4.2信息熵特征选择分析 量信息数据,发现连续3块带钢均出现了头部拉窄现 在实际生产中,实时采集相关生产过程数据和质 象,头部宽度质量信息如图3所示 (b) 500 1000 50M0 500 1000 时间/103 时间/103 时间/10>等 图3头部拉窄质量信息.(a)带钢1:(b)带钢2:()带钢3 Fig.3 Width values with head width narrow of hot rolled strip:(a)Strip 1;(b)Strip 2:(c)Strip 3 首先采用动态时间弯曲算法实现各带钢长度同步 的相关性,而且考虑了过程参数间的冗余性,因此更有 化,然后采用信息熵算法分析各生产过程变量对宽度 利于发掘异常原因.因此后续分析中采用最大相关性 信息的影响程度,选取前5个影响程度最大的生产过 最小冗余方法作为特征选取方法进行影响程度的排序 程变量.因为连续发现3块带钢均出现头部拉窄现 和分析. 象,分别利用互信息和最大相关性最小冗余方法对3 为综合各样本分析中重要生产过程变量的排序结 块带钢进行分析,获得了如表2~5所示结果,从表中 果,采用加权评分分析方法对各过程变量进行重要性 可以看到,以表2为例利用互信息获得的前5个重要 的综合排序,因为生产过程变量排序越靠前,其重要程 信息均为机架间的速度差,因为连轧生产中各机架间 度越大,因此给与更高的加权分数,随着排序的推移, 的速度差高度相关,均选中对异常的定位不利.而最 权重值则越小.变量处于排序1~5位置处分别赋予 大相关性最小冗余方法不仅考虑了过程参数与质量间 权重值5~1分,进而计算各变量的综合分值来确定
工程科学学报,第 37 卷,增刊 1 相关最小冗余算法[7],将样本规模与参数 β 建立联系, 即用互信息的均值作为冗余评价指标,其评价函数 如下: R = I( xi,Y) - 1 | S | ∑xsS I( xi,xs ) . ( 10) 式中,| S | 为已选特征子集 S 中特征的个数. 4 热轧带钢头部拉窄分析 4. 1 动态时间弯曲数据预处理 因热连轧生产过程中,带钢需要分别经过各轧机, 最终达到带钢厚度变薄的目的,相关体积情况下,宽度 变化较小,厚度变薄导致长度变长,宽度信息是在精轧 结束后第 7 机架出口处测量的. 因而各轧机所测量的 生产过程变量长度不同,为了分析生产过程中各测量 变量对宽度质量的影响关系,首先需要实现各过程变 量与宽度信息一一对应,本文采用动态时间弯曲算法, 以宽度信息为基准,将所有其他变量信息映射到宽度 时间变量坐标. 因变量众多,图 2( a) 选择部分变量信 息作为典型代表,给出了各变量信息在原始坐标空间 中标准化后的数据,所谓标准化即对原始数据减去均 值除以标准差. 图 2( b) 则使用动态时间弯曲算法将 各变量转换到宽度时间变量坐标后标准化后的数据. 图 2 动态时间弯曲实现长度同步化. ( a) 原始空间变量; ( b) 时间同步化空间变量 Fig. 2 Synchronization of length using dynamic time warping: ( a) variables in the original space; ( b) variables in the time synchronization space 4. 2 信息熵特征选择分析 在实际生产中,实时采集相关生产过程数据和质 量信息数据,发现连续 3 块带钢均出现了头部拉窄现 象,头部宽度质量信息如图 3 所示. 图 3 头部拉窄质量信息. ( a) 带钢 1; ( b) 带钢 2; ( c) 带钢 3 Fig. 3 Width values with head width narrow of hot rolled strip: ( a) Strip 1; ( b) Strip 2; ( c) Strip 3 首先采用动态时间弯曲算法实现各带钢长度同步 化,然后采用信息熵算法分析各生产过程变量对宽度 信息的影响程度,选取前 5 个影响程度最大的生产过 程变量. 因为连续发现 3 块带钢均出现头部拉窄现 象,分别利用互信息和最大相关性最小冗余方法对 3 块带钢进行分析,获得了如表 2 ~ 5 所示结果,从表中 可以看到,以表 2 为例利用互信息获得的前 5 个重要 信息均为机架间的速度差,因为连轧生产中各机架间 的速度差高度相关,均选中对异常的定位不利. 而最 大相关性最小冗余方法不仅考虑了过程参数与质量间 的相关性,而且考虑了过程参数间的冗余性,因此更有 利于发掘异常原因. 因此后续分析中采用最大相关性 最小冗余方法作为特征选取方法进行影响程度的排序 和分析. 为综合各样本分析中重要生产过程变量的排序结 果,采用加权评分分析方法对各过程变量进行重要性 的综合排序,因为生产过程变量排序越靠前,其重要程 度越大,因此给与更高的加权分数,随着排序的推移, 权重值则越小. 变量处于排序 1 ~ 5 位置处分别赋予 权重值 5 ~ 1 分,进而计算各变量的综合分值来确定 ·48·
何飞等:信息熵特征选择方法定位热轧带钢头部拉窄原因 ·49 表2重要过程参数影响程度排序(带钢1) Table 2 Order of importance about process parameters (Strip 1) 重要变量排序 算法 1 2 3 4 5 第三四机架速 第四五机架速 第五六机架速 第二三机架速 第六七机架速 互信息 度差(46) 度差(47) 度差(48) 度差(45) 度差(49) 第三四机架速 精轧出口温度 第四五机架速 第三机架实测 第六机架实测 最大相关性最小冗余 度差46 (2) 度差(47) 速度(5) 速度(8) 注:括号里的数字代表了表1中各变量的序号,下同 表3重要过程参数影响程度排序(带钢2) Table 3 Order of importance about process parameters (Strip 2) 重要变量排序 算法 1 3 4 5 第二三机架间的活 第二三机架间的活 第三四机架速度差 第六七机架速度差 第四机架的辊缝值 互信息 套高度(51) 套量(11) (46) (49) (40) 第二三机架间的活 第五六机架速度差 第三四机架速度差 第一机架实测速度 最大相关性最小冗余 精轧出口温度(2) 套高度51 (48) (46) (3) 表4重要过程参数影响程度排序(带钢3) Table 4 Order of importance about process parameters (Strip 3) 重要变量排序 算法 5 第三四机架速 第五六机架速 第二三机架速 第六七机架速 互信息 第四五机架速 度差(46) 度差(48) 度差(45) 度差(47) 度差(49) 第三四机架速 精轧出口温度 第六七机架速 第四五机架速 第一二机架速 最大相关性最小冗余 度差(46) (2) 度差(49) 度差(47) 度差(45) 表5重要过程参数综合影响程度排序 Table 5 Order of importance about process parameters (All) 5结论 排序 变量名称 综合得分 (1)采用动态时间弯曲算法可以实现将不同长度 精轧出口温度(2) 12 的生产过程数据的长度同步化. 2 第三四机架速度差(46) 12 (2)选择与热轧带钢头部拉窄相关的过程变量, 3 第四五机架速度差(47) 5 通过信息熵特征选择方法对各生产过程变量进行重要 4 第二三机架间的活套高度(51) 5 性排序分析,初步定位异常原因,为后续分析异常原因 5 第五六机架速度差(48) 3 提供了技术支撑. (3)采集现场实际生产数据,采用数据分析方法 6 第六七机架速度差(49) 3 进行生产过程的监控与诊断是机理模型分析的有效补 其综合重要程度 充,为实现生产过程的智能诊断提供可能。 对宽度影响最大的前6个重要过程参数见表5所 示.从表中可以看到精轧出口温度和第三四机架速度 考文献 差是影响宽度最重要的2个参数,从而作为最重要的 故障诊断的分析对象,经过现场分析发现由于温度传 [1]Sun Y K.Model and Control of Hot Strip Rolling.Beijing:Metal- 感器测量精轧出口温度精度不高,给后续控制带来了 lurgical Industry Press,2007 (孙一康.带钢热连轧的模型与控制.北京:治金工业出版社, 影响,由于前三机架驱动电机有减速器,而后四个机架 2007) 没有减速器,从而导致了前三个机架和后四个机架的 2]Manabu K,Yoshiaki N.Data-based process monitoring,process 电机控制特性不同,出现了第三四机架间已经前后相 control,and quality improvement:Recent developments and ap- 关联机架的速度差、活套高度控制等不协调. plications in steel industry.Comput Chem Eng,2008,32(1/2):
何 飞等; 信息熵特征选择方法定位热轧带钢头部拉窄原因 表 2 重要过程参数影响程度排序( 带钢 1) Table 2 Order of importance about process parameters ( Strip 1) 算法 重要变量排序 1 2 3 4 5 互信息 第三四机架速 度差( 46) 第四五机架速 度差( 47) 第五六机架速 度差( 48) 第二三机架速 度差( 45) 第六七机架速 度差( 49) 最大相关性最小冗余 第三四机架速 度差 46 精轧出口温度 ( 2) 第四五机架速 度差( 47) 第三机架实测 速度( 5) 第六机架实测 速度( 8) 注: 括号里的数字代表了表 1 中各变量的序号,下同. 表 3 重要过程参数影响程度排序( 带钢 2) Table 3 Order of importance about process parameters ( Strip 2) 算法 重要变量排序 1 2 3 4 5 互信息 第二三机架间的活 套高度( 51) 第二三机架间的活 套量( 11) 第三四机架速度差 ( 46) 第六七机架速度差 ( 49) 第四机架的辊缝值 ( 40) 最大相关性最小冗余 第二三机架间的活 套高度 51 精轧出口温度( 2) 第五六机架速度差 ( 48) 第三四机架速度差 ( 46) 第一机架实测速度 ( 3) 表 4 重要过程参数影响程度排序( 带钢 3) Table 4 Order of importance about process parameters ( Strip 3) 算法 重要变量排序 1 2 3 4 5 互信息 第三四机架速 度差( 46) 第五六机架速 度差( 48) 第二三机架速 度差( 45) 第四五机架速 度差( 47) 第六七机架速 度差( 49) 最大相关性最小冗余 第三四机架速 度差( 46) 精轧出口温度 ( 2) 第六七机架速 度差( 49) 第四五机架速 度差( 47) 第一二机架速 度差( 45) 表 5 重要过程参数综合影响程度排序 Table 5 Order of importance about process parameters ( All) 排序 变量名称 综合得分 1 精轧出口温度( 2) 12 2 第三四机架速度差( 46) 12 3 第四五机架速度差( 47) 5 4 第二三机架间的活套高度( 51) 5 5 第五六机架速度差( 48) 3 6 第六七机架速度差( 49) 3 其综合重要程度. 对宽度影响最大的前 6 个重要过程参数见表 5 所 示. 从表中可以看到精轧出口温度和第三四机架速度 差是影响宽度最重要的 2 个参数,从而作为最重要的 故障诊断的分析对象,经过现场分析发现由于温度传 感器测量精轧出口温度精度不高,给后续控制带来了 影响,由于前三机架驱动电机有减速器,而后四个机架 没有减速器,从而导致了前三个机架和后四个机架的 电机控制特性不同,出现了第三四机架间已经前后相 关联机架的速度差、活套高度控制等不协调. 5 结论 ( 1) 采用动态时间弯曲算法可以实现将不同长度 的生产过程数据的长度同步化. ( 2) 选择与热轧带钢头部拉窄相关的过程变量, 通过信息熵特征选择方法对各生产过程变量进行重要 性排序分析,初步定位异常原因,为后续分析异常原因 提供了技术支撑. ( 3) 采集现场实际生产数据,采用数据分析方法 进行生产过程的监控与诊断是机理模型分析的有效补 充,为实现生产过程的智能诊断提供可能. 参 考 文 献 [1] Sun Y K. Model and Control of Hot Strip Rolling. Beijing: Metallurgical Industry Press,2007 ( 孙一康. 带钢热连轧的模型与控制. 北京: 冶金工业出版社, 2007) [2] Manabu K,Yoshiaki N. Data-based process monitoring,process control,and quality improvement: Recent developments and applications in steel industry. Comput Chem Eng,2008,32( 1 /2) : ·49·
·50· 工程科学学报,第37卷,增刊1 12 ping.Mechanical Systems and Signal Processing,2013,34(1/2): B]Yuan M.Width control of strip head and tail in 1780mm hot strip 191 mill.Metallurgical Industry Automation,2007(1):39 ]Peng HC.Long F H,Ding C.Feature selection based on mutual (袁敏.1780热连轧机带钢头尾宽度控制.治金自动化,2007 information:criteria of max-dependency,max-relevance,and (1):39) min-tedundancy.IEEE Trans Pattern Anal Mach Intell,2005,27 4]Hong W K,Kim P H,Moon Y H,et al.Hot strip width control (8):1226 method by using looper tension measuring system in finishing mill. [10]Tang Y B,Gui W H,Peng T,et al.Prediction method for dis- Journal of Materials Processing Technology,2001,111(13):74 solved gas concentration in transformer oil based on variable se- [5]Chiang L.H,Russell E L,Braatz R D.Fault Detection and Diag- lection of mutual information.Chinese Journal of Scientific Instru- nosis in Industrial Systems.Springer,2001 met,2013,34(7):1492 Braha D.Data Mining for Design and Manufacturing:Methods (唐勇波,桂卫华,彭涛,等.基于互信息变量选择的变压器 and Applications.London:Kluwer Academic Publishers,2001 油中溶解气体浓度预测.仪器仪表学报,2013,34(7): Kassidas A,Macgregor J F,Taylor PA.Synchronization of batch 1492) trajectories using dynamic time warping.A/ChE J,1998,44(4): 1]Principe ]C.Information Theoretic Learning:Renyis Entropy 864 and Kernel Perspectires.German:Springer-Verlag,2010 [8]Zhen D,Wang T,Gu F,et al.Fault diagnosis of motor drives [12]Huang D,Chow T W S.Effective feature selection scheme using using stator current signal analysis based on dynamic time war- mutual information.Neurocomputing,2005,63:325
工程科学学报,第 37 卷,增刊 1 12 [3] Yuan M. Width control of strip head and tail in 1780 mm hot strip mill. Metallurgical Industry Automation,2007( 1) : 39 ( 袁敏. 1780 热连轧机带钢头尾宽度控制. 冶金自动化,2007 ( 1) : 39) [4] Hong W K,Kim P H,Moon Y H,et al. Hot strip width control method by using looper tension measuring system in finishing mill. Journal of Materials Processing Technology,2001,111( 1-3) : 74 [5] Chiang L H,Russell E L,Braatz R D. Fault Detection and Diagnosis in Industrial Systems. Springer,2001 [6] Braha D. Data Mining for Design and Manufacturing: Methods and Applications. London: Kluwer Academic Publishers,2001 [7] Kassidas A,Macgregor J F,Taylor P A. Synchronization of batch trajectories using dynamic time warping. AIChE J,1998,44( 4) : 864 [8] Zhen D,Wang T,Gu F,et al. Fault diagnosis of motor drives using stator current signal analysis based on dynamic time warping. Mechanical Systems and Signal Processing,2013,34( 1 /2) : 191 [9] Peng H C,Long F H,Ding C. Feature selection based on mutual information: criteria of max-dependency, max-relevance, and min-redundancy. IEEE Trans Pattern Anal Mach Intell,2005,27 ( 8) : 1226 [10] Tang Y B,Gui W H,Peng T,et al. Prediction method for dissolved gas concentration in transformer oil based on variable selection of mutual information. Chinese Journal of Scientific Instrument,2013,34( 7) : 1492 ( 唐勇波,桂卫华,彭涛,等. 基于互信息变量选择的变压器 油中溶解 气 体 浓 度 预 测. 仪 器 仪 表 学 报,2013,34 ( 7 ) : 1492) [11] Principe J C. Information Theoretic Learning: Renyi's Entropy and Kernel Perspectives. German: Springer-Verlag,2010 [12] Huang D,Chow T W S. Effective feature selection scheme using mutual information. Neurocomputing,2005,63: 325 ·50·