基于减法聚类的带钢厚度数据驱动建模

针对轧钢生产中大批过程数据没有被用于提高厚度质量的现象,提出了一种基于减法聚类的带钢厚度数据驱动在线建模方法.首先通过减法聚类将输入空间划分为一些小的局部空间,在每个局部空间中用最小二乘支持向量机建立子模型,子模型加权输出作为带钢厚度的离线模型;然后当在线数据不断增加时,通过在线减法聚类算法实时调整局部空间,子模型的参数采用最小二乘支持向量机的递推算法进行相应的在线辨识,子模型的预测输出作为模型的最后输出.实验结果表明,该方法具有良好的预测精度和较强的在线学习能力.

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：878.12KB

D0L:10.13374/.issn1001-053x.2012.11.010 第34卷第11期北京科技大学学报 Vol.34 No.11 2012年11月 Journal of University of Science and Technology Beijing Now.2012 基于减法聚类的带钢厚度数据驱动建模梁辉12)四童朝南2) 1)北京科技大学自动化学院，北京1000832)北京科技大学钢铁流程先进控制教有部重点实验室，北京100083 ☒通信作者，E-mail:lianghuio430@sohu.com 摘要针对轧钢生产中大批过程数据没有被用于提高厚度质量的现象，提出了一种基于减法聚类的带钢厚度数据驱动在线建模方法.首先通过减法聚类将输入空间划分为一些小的局部空间，在每个局部空间中用最小二乘支持向量机建立子模型，子模型加权输出作为带钢厚度的离线模型：然后当在线数据不断增加时，通过在线减法聚类算法实时调整局部空间，子模型的参数采用最小二乘支持向量机的递推算法进行相应的在线辨识，子模型的预测输出作为模型的最后输出.实验结果表明，该方法具有良好的预测精度和较强的在线学习能力. 关键词热轧：厚度控制；数据驱动：聚类算法：最小二乘法：支持向量机分类号TP2731 Online data-driven modeling for strip thickness based on subtractive clustering LIANG Hui.2☒，TONG Chao-nan'2 1)School of Automation and Electrical Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)Key Laboratory of the Ministry of Education for Advanced Control of Iron and Steel Process,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:lianghui0430@sohu.com ABSTRACT In hot rolling,actual production data were not used to improve the thickness quality of products.For this phenomenon, an online data-driven modeling algorithm was proposed for strip thickness control based on subtractive clustering.Firstly,the input space is divided into several clusters by subtractive clustering,in each cluster a sub-model is built by a least square support vector ma- chine (LS-SVM),and an offline model is obtained by weighting the outputs of these sub-models.Then,when the online data constant- ly increase,the clustering subsets are adjusted on-ine by a subtractive clustering algorithm,and the parameters of the sub-models are determined using the recursive algorithm of the least squares support vector machine.The predictive outputs of the sub-models are the final outputs.Experimental results demonstrate that the method has good prediction accuracy and online learning ability. KEY WORDS hot rolling:thickness control;data-driven approach:clustering algorithms:least squares approximations:support vector machines 近年来，随着网络技术的快速发展以及基础自究，取得了较好的跟踪效果；Aif等因在高速运动机动化水平的大幅提升，数据驱动建模技术正在被广械手中将基于数据驱动的控制方法融入迭代学习控泛的研究，以实现对生产过程的实时模拟和控制，仿真结果表明该方法具有较高的控制精度和较制-.数据驱动建模技术是以描述样本数据的特快的收敛速度征作为建模的主要准则，在“数据为自身说话”的信随着生产信息化的发展，在热轧生产过程中产念下分析系统变量间的相互关系，其实质是一种生并积累了大量丰富详实的在线和离线测量数据， “黑箱”建模技术可.例如Rhodes等采用基于数如轧制力、辊缝和轧辊速度，这为实现轧制过程数据据驱动的方法对Lorenz模型和实际的电路进行研驱动建模提供了可能，因此数据驱动建模开始应用收稿日期：2011-10-19 基金项目：北京市教委重点学科资助项目(XK100080537)

第 34 卷第 11 期 2012 年 11 月北京科技大学学报 Journal of University of Science and Technology Beijing Vol． 34 No． 11 Nov． 2012 基于减法聚类的带钢厚度数据驱动建模梁辉1，2) 童朝南1，2) 1) 北京科技大学自动化学院，北京 100083 2) 北京科技大学钢铁流程先进控制教育部重点实验室，北京 100083 通信作者，E-mail: lianghui0430@ sohu． com 摘要针对轧钢生产中大批过程数据没有被用于提高厚度质量的现象，提出了一种基于减法聚类的带钢厚度数据驱动在线建模方法．首先通过减法聚类将输入空间划分为一些小的局部空间，在每个局部空间中用最小二乘支持向量机建立子模型，子模型加权输出作为带钢厚度的离线模型; 然后当在线数据不断增加时，通过在线减法聚类算法实时调整局部空间，子模型的参数采用最小二乘支持向量机的递推算法进行相应的在线辨识，子模型的预测输出作为模型的最后输出．实验结果表明，该方法具有良好的预测精度和较强的在线学习能力．关键词热轧; 厚度控制; 数据驱动; 聚类算法; 最小二乘法; 支持向量机分类号 TP273 + 1 Online data-driven modeling for strip thickness based on subtractive clustering LIANG Hui 1，2) ，TONG Chao-nan1，2) 1) School of Automation and Electrical Engineering，University of Science and Technology Beijing，Beijing 100083，China 2) Key Laboratory of the Ministry of Education for Advanced Control of Iron and Steel Process，University of Science and Technology Beijing，Beijing 100083，China Corresponding author，E-mail: lianghui0430@ sohu． com ABSTRACT In hot rolling，actual production data were not used to improve the thickness quality of products． For this phenomenon， an online data-driven modeling algorithm was proposed for strip thickness control based on subtractive clustering． Firstly，the input space is divided into several clusters by subtractive clustering，in each cluster a sub-model is built by a least square support vector machine ( LS-SVM) ，and an offline model is obtained by weighting the outputs of these sub-models． Then，when the online data constantly increase，the clustering subsets are adjusted on-line by a subtractive clustering algorithm，and the parameters of the sub-models are determined using the recursive algorithm of the least squares support vector machine． The predictive outputs of the sub-models are the final outputs． Experimental results demonstrate that the method has good prediction accuracy and online learning ability． KEY WORDS hot rolling; thickness control; data-driven approach; clustering algorithms; least squares approximations; support vector machines 收稿日期: 2011--10--19 基金项目: 北京市教委重点学科资助项目( XK100080537) 近年来，随着网络技术的快速发展以及基础自动化水平的大幅提升，数据驱动建模技术正在被广泛的研究，以实现对生产过程的实时模拟和控制［1--2］．数据驱动建模技术是以描述样本数据的特征作为建模的主要准则，在“数据为自身说话”的信念下分析系统变量间的相互关系，其实质是一种 “黑箱”建模技术［3］．例如 Rhodes 等［4］采用基于数据驱动的方法对 Lorenz 模型和实际的电路进行研究，取得了较好的跟踪效果; Arif 等［5］在高速运动机械手中将基于数据驱动的控制方法融入迭代学习控制，仿真结果表明该方法具有较高的控制精度和较快的收敛速度．随着生产信息化的发展，在热轧生产过程中产生并积累了大量丰富详实的在线和离线测量数据，如轧制力、辊缝和轧辊速度，这为实现轧制过程数据驱动建模提供了可能，因此数据驱动建模开始应用 DOI:10.13374/j.issn1001-053x.2012.11.010

第11期梁辉等：基于减法聚类的带钢厚度数据驱动建模 ·1339· 于板带钢轧制领域.国内主要在科研方面进行了探 SVM 1 索，如罗永军等提出了基于遗传算法的热连轧负荷再分配模型，彭开香等采用贝叶斯神经网络预测带钢轧制过程机架出口厚度，洪悦等图基于数据驱动的冷连轧过程轧制力设定.国外Son等回采用 SVMn 神经网络建立热轧轧制力的在线模型，模型通过短图1传统多支持向量机模型结构期学习和长期学习获得精确的轧制力预报；Jeong Fig.1 Structure of a traditional multiple support vector machine model 等0提出了一种在线RBF神经网络控制热轧带钢卷取温度，取代了传统的基于规则的查找表：德国西在实际应用中该方法效果住往不理想，其问题门子公司则从1995开始将近20种神经网络模型应主要有以下两方面阿：一是采用的是离线聚类算用于轧制力预报及带钢温度预报等方面)，法，在线训练时每增加一个样本都需要重新聚类并支持向量机(support vector machine,SVM)是近进行子模型建模，从而导致模型的实时性差和学习年来在统计学习理论基础上提出的一种新型机器学率低：二是多模型加权输出是在全局模型为子模型习方法，非线性逼近能力和学习能力强网.由于支的线性组合的假设上，而实际上对于热连轧这样的持向量机更好地执行了统计学习理论的结构风险最复杂对象，该假设是不成立，因此加权后模型的整体小化准则，可以有效地解决神经网络的过学习问题，预测精度会下降具有强大的学习和泛化能力，因此支持向量机在时为了解决上述问题，本文采用离线准备和在线间序列的预测研究、非线性建模与预测和优化控应用两阶段相结合的思想.准备阶段采用传统方法制4-切等方面得到了广泛的应用. 建立带钢厚度模型：应用阶段时对输入空间数据进另一方面，由于热连轧轧制过程具有多变量、强行在线聚类划分，以及子模型参数自学习.在标准耦合、强非线性、大时延和动态特性随工况变化等综减法聚类算法基础上进行改进，提出了在线减法聚合复杂特性，所以传统的利用输入输出数据建立的类算法，子模型建模通过递推的最小二乘支持向量系统单一模型仅是对系统的近似，易出现模型“过机实现，模型输出采用预测样本所在子模型的预测拟合”或泛化性很差等问题.多模型通过一定方式结果作为输出，不再采用加权算法将单个模型连接，使得不同的单个模型之间互相弥 1.1标准减法聚类算法补不足，从而构成对象的整个输入空间模型，增强了减法聚类与其他聚类方法相比，不需要预先确模型的预测精度和鲁棒性.因此，本文根据多模型定聚类数，仅根据样本数据密度即可快速确定聚类的这种思想并结合支持向量机在模型训练及泛化能中心的位置和聚类数：而它把每一个数据点作为一力方面的优势，建立了基于多支持向量机(multiple 个潜在的聚类中心的特性，则克服了山峰聚类法计 support vector machine,MSVM)的带钢厚度预测模算量随着问题的维数按指数增长的不足，使得聚类型.首先是利用大量现场数据为在线建模做准备工的结果与问题的维数无关四.因此，减法聚类算法作，对输入空间数据进行聚类分析，在不同空间分别是一种适合基于数据建模的规则自动提取方法建立子模型：然后在线运行过程中根据实际工况进设定m维空间中的N个数据点(X,X2,, 行在线聚类，并调整相应的子模型参数；最后以某钢 Xw),每个数据点X=比.1x2,,xm]都是聚类厂1700mm热连轧带钢厚度控制系统为对象，采用中心的候选者，i=1,2,,N,数据点X,的密度函数上述建模方法进行仿真研究.研究结果表明了本文定义为算法的有效性 Ix:-X (1) (./2)2 1在线聚类算法式中，半径r,是一个正数.一般按下式设定：目前多支持向量机建模方法结构如图1所示 '.=2 mint max（lx:-Xl}. (2) 常用的输入空间划分方法有K均值聚类法、模糊C 均值聚类、山峰聚类和减法聚类法图.首先对每个 T.定义了该点的一个影响邻域，半径以外的数据点聚类建立子模型，然后根据几个子模型的输出进行对该点的密度指标贡献非常小，一般忽略不计加权，最后得到预测样本的输出，以此提高模型精度计算每一点X的密度值，选择具有最高密度指和鲁棒性标D的数据点作为第一个聚类中心X。:然后修正

第 11 期梁辉等: 基于减法聚类的带钢厚度数据驱动建模于板带钢轧制领域．国内主要在科研方面进行了探索，如罗永军等［6］提出了基于遗传算法的热连轧负荷再分配模型，彭开香等［7］采用贝叶斯神经网络预测带钢轧制过程机架出口厚度，洪悦等［8］基于数据驱动的冷连轧过程轧制力设定．国外 Son 等［9］采用神经网络建立热轧轧制力的在线模型，模型通过短期学习和长期学习获得精确的轧制力预报; Jeong 等［10］提出了一种在线 RBF 神经网络控制热轧带钢卷取温度，取代了传统的基于规则的查找表; 德国西门子公司则从 1995 开始将近 20 种神经网络模型应用于轧制力预报及带钢温度预报等方面［11］．支持向量机( support vector machine，SVM) 是近年来在统计学习理论基础上提出的一种新型机器学习方法，非线性逼近能力和学习能力强［12］．由于支持向量机更好地执行了统计学习理论的结构风险最小化准则，可以有效地解决神经网络的过学习问题，具有强大的学习和泛化能力，因此支持向量机在时间序列的预测研究［13］、非线性建模与预测和优化控制［14--17］等方面得到了广泛的应用．另一方面，由于热连轧轧制过程具有多变量、强耦合、强非线性、大时延和动态特性随工况变化等综合复杂特性，所以传统的利用输入输出数据建立的系统单一模型仅是对系统的近似，易出现模型“过拟合”或泛化性很差等问题．多模型通过一定方式将单个模型连接，使得不同的单个模型之间互相弥补不足，从而构成对象的整个输入空间模型，增强了模型的预测精度和鲁棒性．因此，本文根据多模型的这种思想并结合支持向量机在模型训练及泛化能力方面的优势，建立了基于多支持向量机( multiple support vector machine，MSVM) 的带钢厚度预测模型．首先是利用大量现场数据为在线建模做准备工作，对输入空间数据进行聚类分析，在不同空间分别建立子模型; 然后在线运行过程中根据实际工况进行在线聚类，并调整相应的子模型参数; 最后以某钢厂 1 700 mm 热连轧带钢厚度控制系统为对象，采用上述建模方法进行仿真研究．研究结果表明了本文算法的有效性． 1 在线聚类算法目前多支持向量机建模方法结构如图 1 所示．常用的输入空间划分方法有 K 均值聚类法、模糊 C 均值聚类、山峰聚类和减法聚类法［18］．首先对每个聚类建立子模型，然后根据几个子模型的输出进行加权，最后得到预测样本的输出，以此提高模型精度和鲁棒性．图 1 传统多支持向量机模型结构 Fig． 1 Structure of a traditional multiple support vector machine model 在实际应用中该方法效果往往不理想，其问题主要有以下两方面［19］: 一是采用的是离线聚类算法，在线训练时每增加一个样本都需要重新聚类并进行子模型建模，从而导致模型的实时性差和学习率低; 二是多模型加权输出是在全局模型为子模型的线性组合的假设上，而实际上对于热连轧这样的复杂对象，该假设是不成立，因此加权后模型的整体预测精度会下降．为了解决上述问题，本文采用离线准备和在线应用两阶段相结合的思想．准备阶段采用传统方法建立带钢厚度模型; 应用阶段时对输入空间数据进行在线聚类划分，以及子模型参数自学习．在标准减法聚类算法基础上进行改进，提出了在线减法聚类算法，子模型建模通过递推的最小二乘支持向量机实现，模型输出采用预测样本所在子模型的预测结果作为输出，不再采用加权算法． 1. 1 标准减法聚类算法减法聚类与其他聚类方法相比，不需要预先确定聚类数，仅根据样本数据密度即可快速确定聚类中心的位置和聚类数; 而它把每一个数据点作为一个潜在的聚类中心的特性，则克服了山峰聚类法计算量随着问题的维数按指数增长的不足，使得聚类的结果与问题的维数无关［20］．因此，减法聚类算法是一种适合基于数据建模的规则自动提取方法．设定 m 维空间中的 N 个数据点( X1，X2，…， XN) ，每个数据点 Xi =［xi，1，xi，2，…，xi，m］都是聚类中心的候选者，i = 1，2，…，N，数据点 Xi 的密度函数定义为 Di = ∑ N j = 1 [ exp － ‖Xi － Xj‖2 ( ra /2) 2 ] ． ( 1) 式中，半径 ra 是一个正数．一般按下式设定 ra : ra = 1 2 min k { max 1≤i≤N， 1≤k≤N， k≠N { ‖Xi － Xk‖} } ． ( 2) ra 定义了该点的一个影响邻域，半径以外的数据点对该点的密度指标贡献非常小，一般忽略不计．计算每一点 Xi 的密度值，选择具有最高密度指标 Dc1的数据点作为第一个聚类中心 Xc1 ; 然后修正 ·1339·

·1340· 北京科技大学学报第34卷密度值，消除前面己有聚类中心的影响.按下式修步骤6计算聚类中心：与(i≠j,i,j=1,2, 正密度值： …,c)之间的距离.如果min‖vi-vj‖≤ra,且 D.-D.-Daep(-Ix-xi (3) D(y>D(v),其中ra=(0.5-0.7)r,则说明聚类 (rh/2)2 子集：与可以合并为一个聚类，该聚类中心为其中，D。是初始聚类中心对应的最高密度值.修正否则保持聚类结果不变半径，的设定是为了避免第二个聚类中心点离前一个中心点太近，一般设定为=r,1.25≤7≤ 2基于最小二乘支持向量机的数据驱动建 1.5. 模修正每个数据点的密度指标后，当D4与D1满 2.1最小二乘支持向量机回归建模足下式时，该密度指标对应的聚类中心即为第k个标准支持向量机算法复杂度不依赖于输入空间聚类中心.不断重复这个过程，直到新的聚类中心的维数，依赖于样本数据的个数，样本数据越大，求 X4的相应的密度指标D4与D。满足下式时终止解相应的二次规划(quadratic programming,QP)问聚类：题越复杂，计算速度越慢.最小二乘支持向量机 D4/Da0;p(x)为非线性变换映 c个聚类中心并存储，(i=1,2,…c)及其对应的密射函数，将输入样本数据从原空间映射到高维特征度值D(v). 空间：b为偏置量. 步骤3当新增的在线数据集中的第k个数据引入Lagrange函数进行求解得：到来时，计算x4(k=1,2,…,M)到i个聚类中心 L(w,b,er,ag)= :(i=1,2,,c)的距离dh=‖xk-y:‖.若d> J(w,e）- awg)+b+e-小.(6) r,转到步骤4；若d≤r.,转到步骤5. 式中，ak为Lagrange乘子.根据KTT最优条件可步骤4由式(3)计算xk的密度值D(x),并得到：且Dx)>8,6=0.5,mD(),则说明数据x aL 不属于任何一个已有的聚类，则新创建一个聚类，输 a10 =0→w=∑a4p(x), 入空间的聚类个数c=c+1,返回步骤3. aL 步骤5根据最小距离准则确定数据点x4属 ab =0→∑&=0， (7) 于最近的聚类子集，进一步比较新数据x:的密度值 aL 与聚类中心的密度值.如果D(x)>D(:),则数据 ek =0ag=yex' x:更靠近其最近的聚类中心，xk取代原聚类中心作为该子集的新聚类中心：如果D(x)≤D(":), aL=0→wpx,)+b+e-=0. 00k 则保持聚类结果不改变.判断新增数据组是否结对于k=1,2,…,N,消去w和e,得到如下线性方束.如果结束，则转到步骤6；否则，返回步骤3 程组：

北京科技大学学报第 34 卷密度值，消除前面已有聚类中心的影响．按下式修正密度值: Di = Di － Dc1 [ exp － ‖Xi － Xc1‖2 ( rb /2) 2 ] ． ( 3) 其中，Dc1是初始聚类中心对应的最高密度值．修正半径 rb 的设定是为了避免第二个聚类中心点离前一个中心点太近，一般设定为 rb = ηra，1. 25≤η≤ 1. 5．修正每个数据点的密度指标后，当 Dck与 Dc1满足下式时，该密度指标对应的聚类中心即为第 k 个聚类中心．不断重复这个过程，直到新的聚类中心 Xck的相应的密度指标 Dck 与 Dc1 满足下式时终止聚类: Dck /Dc1 ＜ δ． ( 4) 式中，δ 是根据实际情况提前设定的阈值． 1. 2 减法聚类的在线算法传统聚类方法均是基于离线数据缺乏数据更新，聚类指标缺乏灵活性，进而影响了子集模型的精确性; 本文提出的在线聚类方法则克服了此缺点．基本思想如下: 如果一个点到一个组的中心的距离小于聚类半径 ra，那么该点属于此组; 当获得新的数据时，组和组的中心做相应的变化．随着输入空间数据的不断增加，本文算法通过实时动态的调整聚类中心与聚类个数获得更好的输入空间划分，步骤如下．步骤 1 数据归一化处理，输入数据各维聚类半径 ra 及阈值 δ 等设定．步骤 2 由历史训练数据集进行减法聚类得到 c 个聚类中心并存储 vi ( i = 1，2，…，c) 及其对应的密度值 D( vi ) ．步骤 3 当新增的在线数据集中的第 k 个数据到来时，计算 xk ( k = 1，2，…，M) 到 i 个聚类中心 vi ( i = 1，2，…，c) 的距离 dki = ‖xk － vi‖．若 dki ＞ ra，转到步骤 4; 若 dki≤ra，转到步骤 5. 步骤 4 由式( 3) 计算 xk 的密度值 D( xk ) ，并且 D( xk ) ＞ ε，ε = 0. 5 max i = 1，2，…，c D( vi ) ，则说明数据 xk 不属于任何一个已有的聚类，则新创建一个聚类，输入空间的聚类个数 c = c + 1，返回步骤 3. 步骤 5 根据最小距离准则确定数据点 xk 属于最近的聚类子集，进一步比较新数据 xk 的密度值与聚类中心的密度值．如果 D( xk ) ＞ D( vi ) ，则数据 xk 更靠近其最近的聚类中心，xk 取代原聚类中心作为该子集的新聚类中心 v' i ; 如果 D( xk ) ≤D( vi ) ，则保持聚类结果不改变．判断新增数据组是否结束．如果结束，则转到步骤 6; 否则，返回步骤 3. 步骤 6 计算聚类中心 v' i 与 v' j( i≠j，i，j = 1，2， …，c) 之间的距离．如果 min‖v' i － v' j ‖≤rd，且 D( v' j ) ＞ D( v' i ) ，其中 rd = ( 0. 5 － 0. 7) ra，则说明聚类子集 v' i 与 v' j 可以合并为一个聚类，该聚类中心为 v' j ; 否则保持聚类结果不变． 2 基于最小二乘支持向量机的数据驱动建模 2. 1 最小二乘支持向量机回归建模标准支持向量机算法复杂度不依赖于输入空间的维数，依赖于样本数据的个数，样本数据越大，求解相应的二次规划( quadratic programming，QP) 问题越复杂，计算速度越慢．最小二乘支持向量机 ( least squares support vector machine，LS--SVM) 用等式约束代替不等式约束，变成了求解一组等式方程，避免了求解耗时的二次规划问题，求解速度相对加快［21］．最小二乘支持向量机不需要指定逼近精度，而是利用 SRM 准则构造下面的最小化目标函数，可描述为: min J( w，ek ) = 1 2 wT w + 1 2 γ∑ N k = 1 e 2 k， s． t． yk = wT φ( xk ) + b + ek，k = 1，2，…， { N． ( 5) 式中: xk ( k = 1，2，…，N) 为子模型的输入; yk 是与 xk 对应的输出; w 代表模型的复杂度; ek 表示经验误差; 常数 c 为惩罚系数; γ ＞ 0; φ( x) 为非线性变换映射函数，将输入样本数据从原空间映射到高维特征空间; b 为偏置量．引入 Lagrange 函数进行求解得: L( w，b，ek，αk ) = J( w，e) － ∑ N k = 1 αk ［wT φ( xk ) + b + ek － yk ］． ( 6) 式中，αk 为 Lagrange 乘子．根据 KTT 最优条件可得到:  L  w = 0w = ∑ N k = 1 αkφ( xk ) ，  L  b = 0∑ N k = 1 αk = 0，  L  ek = 0αk = γek，  L  αk = 0wT φ( xk ) + b + ek － yk = 0． ( 7) 对于 k = 1，2，…，N，消去 w 和 e，得到如下线性方程组: ·1340·

第11期梁辉等：基于减法聚类的带钢厚度数据驱动建模 ·1341· 日zya-9 (8) 分别如下： K= 式中，q=0,1,…,1]Ixw,Z=[p(x）T,p(x2)T,…, 「k(xx) k(x1,x2) k(x1xx） p(x)]T,Y=y1,y2,…,yx]T,a=[a1'a2,, a]',I为单位矩阵 k(xxx)k(x飞，x2)…k(xxxx）用最小二乘求出和b,得到支持向量输出： HN, y(x)=>ao(x)'o(x)+b. (9) k(1x,)+ k(x1x2） k(x1,xx）为了找到非线性映射函数p(x),引进核函数代替非线性映射，即用K(x,x)=p(x)'p(x)代替 p(x),则支持向量机模型预测输出为 k(xxx) k(xx)…k(x)+ y y(x）=∑aK(x,x)+b. (11) (10) 将线性方程组(8)写为如下表达式：式中，核函数K(x,x:)为满足Mercer条件的任意对 Axav =YN, (12) 称函数，取不同的核函数就生成不同的支持向量基. 0 91 「b1 目前常用的核函数主要有多项式核函数K(x,x)= (13) x,x)+1]、径向基核函数K（x,x）= 即{和s核画数K红，) 式中，9=0,1，…，1]1xY=y2…y%],a= [a1,2,…,ay]T,I为单位矩阵. 当新数据加入到原数据集时，首先采用减法聚 tanh(x,x)+c]等. 2.2最小二乘支持向量机在线模型参数自学习类的在线算法更新多模型结构参数n,聚类中心c:, 判断新增数据属于哪一个子集，或者是新增加的子对于历史离线数据进行输入空间数据划分，得到不同工况下的c个子集，对各子集数据建立起最集.由于聚类结果发生变化，则需对各相应的新子集模型参数(b,α)进行在线调整，没有发生变化的小二乘支持向量机回归模型.假设第i个子集(i= 子集模型，则直接采用离线子模型进行训练 1,2,…,c)由N,对输入输出数据构成的训练集 {x(k),y(k)},组成，其中x4∈R,yk∈R,此时支假定第k次采集到的新数据{xx,+1yx+1}属于子集i,其中i=1,2,…,c,则其支持向量机的核函数持向量机的核函数矩阵Kx,为一个维数为N,×N KM+变成一个(N1+1)×(N,+1)的方阵：的方阵，令HN=KN+yI,则Kx和Hy的表达式 k(x,x) k(x1,x2) k(x1,xx,） k(x1,xN+i） KN1+1= (14) k(xxx） k(xx2） …k(x,xx） k() k(x+1x)k(x+12)…k(xN+1xX）k(xw+1x+i) 同理可得H,+1=K1+yL,这里I为单位矩阵，其维数为(N,+1)维，则当前N+1组数据的 (17) 最小二乘支持向量机模型系数Ax+1表达式为式中，中=y+K(x+1,xx+）,a=1,K(x AN,+1= q Hx (15) )K()]. 由分块矩阵运算定理及矩阵A为非奇异，可通过比较矩阵AM+1和Ax,则当前新的最小二以推导出Aw,+1的逆矩阵如下所示：乘支持向量机模型与原模型之间的关系可以为 A+1= Ax1+1+1=YN1+1: (16) Ax.-6aa"]--As'a [-a'Ay'a]- AN a] -aAx[6-a Av a]- [6-aAv a]- bJ +1= +1 (18)

第 11 期梁辉等: 基于减法聚类的带钢厚度数据驱动建模 0 qT q ZZT + γ [ ] － 1 I b [ ] α = 0 [ ] Y ． ( 8) 式中，q =［1，1，…，1］T 1 × N，Z =［φ( x1 ) T ，φ( x2 ) T ，…， φ( xN) T ］T ，Y = ［y1，y2，…，yN］T ，α = ［α1，α2，…， αN］T ，I 为单位矩阵．用最小二乘求出 α 和 b，得到支持向量输出: y( x) = ∑ N k = 1 αkφ( x) T φ( xk ) + b． ( 9) 为了找到非线性映射函数 φ( x) ，引进核函数代替非线性映射，即用 K( x，xk ) = φ( x) T φ( xk ) 代替 φ( x) ，则支持向量机模型预测输出为 y( x) = ∑ N k = 1 αkK( x，xk ) + b． ( 10) 式中，核函数 K( x，xk ) 为满足 Mercer 条件的任意对称函数，取不同的核函数就生成不同的支持向量基．目前常用的核函数主要有多项式核函数 K( x，xk ) = ［( x，xk ) + 1］q 、径向基核函数 K ( x，xk ) = exp { － ‖x － xk‖2 2σ2 } 和 Sigmod 核函数 K( x，xk ) = tanh［v( x，xk ) + c］等． 2. 2 最小二乘支持向量机在线模型参数自学习对于历史离线数据进行输入空间数据划分，得到不同工况下的 c 个子集，对各子集数据建立起最小二乘支持向量机回归模型．假设第 i 个子集( i = 1，2，…，c) 由 N1 对输入输出数据构成的训练集 { x( k) ，y( k) } N1 k = 1组成，其中 xk∈Rn1，yk∈R，此时支持向量机的核函数矩阵 KN1 为一个维数为 N1 × N1 的方阵，令 HN1 = KN1 + γ － 1 I，则 KN1和 HN1的表达式分别如下: KN1 = k( x1，x1 ) k( x1，x2 ) … k( x1，xN1 )     k( xN1 ，x1 ) k( xN1 ，x2 ) … k( xN1 ，xN1           ) ， HN1 = k( x1，x1 ) + 1 γ k( x1，x2 ) … k( x1，xN1 )     k( xN1 ，x1 ) k( xN1 ，x2 ) … k( xN1 ，xN1 ) + 1              γ  ． ( 11) 将线性方程组( 8) 写为如下表达式: AN1α' N1 = YN1 ， ( 12) AN1 = 0 qT q HN [ ] 1 ，α' N1 = b [ ] α ，YN1 = 0 [ ] Y ． ( 13) 式中，q =［1，1，…，1］T 1 × N1 ，Y =［y1，y2，…，yN1 ］T ，α = ［α1，α2，…，αN1 ］T ，I 为单位矩阵．当新数据加入到原数据集时，首先采用减法聚类的在线算法更新多模型结构参数 n，聚类中心 ci，判断新增数据属于哪一个子集，或者是新增加的子集．由于聚类结果发生变化，则需对各相应的新子集模型参数( b，α) 进行在线调整，没有发生变化的子集模型，则直接采用离线子模型进行训练．假定第 k 次采集到的新数据{ xN1 + 1，yN1 + 1 } 属于子集 i，其中 i = 1，2，…，c，则其支持向量机的核函数 KN1 + 1变成一个( N1 + 1) × ( N1 + 1) 的方阵: KN1 + 1 = k( x1，x1 ) k( x1，x2 ) … k( x1，xN1 ) k( x1，xN1 + 1 )      k( xN1 ，x1 ) k( xN1 ，x2 ) … k( xN1 ，xN1 ) k( xN1 ，xN1 + 1 ) k( xN1 + 1，x1 ) k( xN1 + 1，x2 ) … k( xN1 + 1，xN1 ) k( xN1 + 1，xN1 + 1               ) ． ( 14) 同理可得 HN1 + 1 = KN1 + 1 + γ － 1 I，这里 I 为单位矩阵，其维数为( N1 + 1) 维，则当前 N1 + 1 组数据的最小二乘支持向量机模型系数 AN1 + 1表达式为 AN1 + 1 = 0 qT q HN1 [ ] + 1 ． ( 15) 通过比较矩阵 AN1 + 1和 AN1 ，则当前新的最小二乘支持向量机模型与原模型之间的关系可以为 AN1 + 1α' N1 + 1 = YN1 + 1 ; ( 16) AN1 + 1 = AN1 a a [ ] T  ，α' N1 + 1 = α' N1 αN1 [ ] + 1 ， YN1 + 1 = YN1 yN1 [ ] + 1 ． ( 17) 式中， = γ － 1 + K ( xN1 + 1，xN1 + 1 ) ，a = ［1，K ( x1， xN1 + 1 ) ，…，K( xN1 ，xN1 + 1) ］T ．由分块矩阵运算定理及矩阵 AN1 为非奇异，可以推导出 AN1 + 1的逆矩阵如下所示: A－1 N1 +1 = ［AN1 － －1 aaT ］－1 － A－1 N1 a［ － aT A－1 N1 a］－1 － aT A－1 N1 ［ － aT A－1 N1 a］－1 ［ － aT A－1 N1 [ ] a］－1 ． ( 18) ·1341·

·1342· 北京科技大学学报第34卷假定矩阵A∈RxN,C∈R“x均为非奇异，矩阵胀问题，这里引入数据遗忘机制，保持训练数据集的 B∈RNx",D∈RMxN,则矩阵(A+BCD)具有逆大小不变，利用支持向量机中己经计算得到的矩阵： Lagrange乘子，训练数据对建模的重要程度可通过 (A+BCD)-1= Lagrange乘子绝对值Ia:l反映出来，la:|越小，表明 A-1-A-B(DA-B+C-1)-DA-1.(19) 数据对训练越无关紧要四，根据以上的矩阵求逆引理，则可以推导出：假设Lagrange乘子绝对值Ia|最小的数据集为 [Ay-中aa门-1= {xmym}(m=1,2,…,N1+1),把其从数据集中去 A+As a [-aASa]-aAs.(20) 除时，可根据下式计算更新的A: 把式(20)代入式(18)中得出A见式(21)，只需 A=A(i,》- 利用前八，组数据集的最小二乘支持向量机模型系 A(m,m]-A(i,m)A+:(m,). 数A,就可以递推计算出，而不需要对全部数据重 (22) 新计算. 式中，i,j=0,2,m,m+2,…,W1+2]. A1= 40'1+ 每次迭代过程中首先对N1+1组数据集的 Lagrange乘子进行排序，寻找最小的Ia,l,Ia:l是新 [-1-a'Aa]- AN a 模型的参数，不需再单独计算，然后把最小Iα，I对应 -1] 1-1 的数据样本删除，则即考虑了历史数据的影响，又突 (21) 出了新数据的作用. 式中，0=D,0…,0]1xw,+)是零向量基于最小二乘支持向量机的带钢厚度数据驱动为了避免随着训练数据的增加而导致的计算膨在线算法流程如图2所示. 厂准备工作离线数据{伍，y六预处理及参数设置新数据化，y}增加，计算x到的距离d 进行减法聚类得到C个子集并存储聚类中心y,(位=1,2，…，c)及相应数据集 x,片}属于第聚类子集>N c=c+1 Y 各聚类子集数据进行LS-SVM训练. 更新第类的A,并存行储增加新的聚类子集，并存存储各子集相对应的A、计算聚类中心y1 对排序，去除最小的口的数据样本进行LS-SvM训练行储新的A、对新样本重新进行LS-SVM训练，更新A√ 输出建模结果立 N 新增数据是杏结束 T 终止计算图2带钢厚度数据驱动在线算法流程图 Fig.2 Flow chart of the online algorithm for strip thickness 数字轧机系统产生的数据在Matlab仿真平台上进 3实验分析行带钢厚度质量预测.轧制规程如下所示，钢种为 3.1数字轧机仿真实验 Q235,宽带B=1200mm,轧辊半径R=380mm,F1 为验证本文所提方法的有效性，以带钢热连轧机架入口厚度H=32mm,出口厚度h=16.65mm

北京科技大学学报第 34 卷假定矩阵 A∈RN × N，C∈RM × M 均为非奇异，矩阵 B∈RN × M，D∈ RM × N，则矩阵 ( A + BCD) 具有逆矩阵［22］: ( A + BCD) － 1 = A － 1 － A － 1 B( DA － 1 B + C － 1 ) － 1 DA － 1 ． ( 19) 根据以上的矩阵求逆引理，则可以推导出: ［AN1 －  － 1 aaT ］－ 1 = A － 1 N1 + A － 1 N1 a［ － aT A － 1 N1 a］－ 1 aT A － 1 N1 ． ( 20) 把式( 20) 代入式( 18) 中得出 A － 1 N1 + 1，见式( 21) ，只需利用前 N1 组数据集的最小二乘支持向量机模型系数 A － 1 N1 ，就可以递推计算出，而不需要对全部数据重新计算． A － 1 N1 + 1 = A － 1 N1 0T 0 [ ] 0 + ［ － 1 － aT A － 1 N1 a］－ 1 A － 1 N1 a [ ] － 1 ［aT A － 1 N1 － 1］． ( 21) 式中，0 =［0，0…，0］1 × ( N1 + 1) 是零向量．为了避免随着训练数据的增加而导致的计算膨胀问题，这里引入数据遗忘机制，保持训练数据集的大小不变，利用支持向量机中已经计算得到的 Lagrange乘子，训练数据对建模的重要程度可通过 Lagrange乘子绝对值 | αi | 反映出来，| αi | 越小，表明数据对训练越无关紧要［23］．假设 Lagrange 乘子绝对值| αi |最小的数据集为 { xm，ym } ( m = 1，2，…，N1 + 1) ，把其从数据集中去除时，可根据下式计算更新的 A' N1 － 1［24］: A' N1 － 1 = A － 1 N1 + 1 ( i，j) －［A － 1 N1 + 1 ( m，m) ］－ 1 A － 1 N1 + 1 ( i，m) A － 1 N1 + 1 ( m，j) ． ( 22) 式中，i，j =［1，2，…m，m + 2，…，N1 + 2］．每次迭代过程中首先对 N1 + 1 组数据集的 Lagrange乘子进行排序，寻找最小的 | αi |，| αi | 是新模型的参数，不需再单独计算，然后把最小| αi | 对应的数据样本删除，则即考虑了历史数据的影响，又突出了新数据的作用．基于最小二乘支持向量机的带钢厚度数据驱动在线算法流程如图 2 所示．图 2 带钢厚度数据驱动在线算法流程图 Fig． 2 Flow chart of the online algorithm for strip thickness 3 实验分析 3. 1 数字轧机仿真实验为验证本文所提方法的有效性，以带钢热连轧数字轧机系统产生的数据在 Matlab 仿真平台上进行带钢厚度质量预测．轧制规程如下所示，钢种为 Q235，宽带 B = 1 200 mm，轧辊半径 R = 380 mm，F1 机架入口厚度 H = 32 mm，出口厚度 h = 16. 65 mm， ·1342·

第11期梁辉等：基于减法聚类的带钢厚度数据驱动建模 ·1343· 精轧入口温度1020℃等.这里不考虑原始化学成 17.0 分对带钢成品的影响，仅从热轧生产工艺参数方面 16.9 对带钢出口厚度的影响上，选取某机架轧制力P、辊 16.8 Wwwhwwwlhpm 缝设定值S、入口厚度H、轧制速度：和来料温度T 作为厚度预测模型的输入变量，出口厚度作为预测 1660 0 30405060708090 100 模型的输出变量，输入量序列如图3所示样本个数 2 34 (b) 是3 wwbhr 30 50 100 150 200 250300 S155 wHnloawthiyyh/-phpbrutntwwnmm 2 15L 0 10 2030405060 708090100 50 100 150200 250300 样本个数 1000 图4采用本文方法的厚度预测(a)和误差曲线(b) 960 50 100 150 200 250 300 Fig.4 Thickness prediction (a)and error curve (b)by the method proposed in this paper 》 100 150 200250 300 121 法有较高的预测精度 17.0 50 100150200 250 300 样本个数 16.9 16.8 图3输入变量序列 16.7 Fig.3 Serial of input variables 16.6 0 20 30 405060 708090100 对训练样本进行离线建模，支持向量机核函数样本个数 0.02 取为高斯径向基，训练样本集个数为200，测试样本 0.01 集个数100.首先，对数据进行归一化处理，然后采 0 用减法聚类算法对训练样本集进行空间划分，在减 -0.01 法聚类算法中聚类半径对聚类个数有较大的影响， 0.02 0 10 20 30 405060 7080 90100 聚类半径通常的取值范围为0.2~0.5，通过实验对样本个数比分析后，得到三个聚类子集S,、S,和S3,样本个数图5采用传统多支持向量机的厚度预测(a)和误差曲线(b) 分别为91、68和41，各子集分别采用最小二乘支持 Fig.5 Thickness prediction (a)and error curve (b)by the tradi- 向量机方法建立子模型，带钢厚度最小二乘支持向 tional multiple SVM model 量机回归模型为为了进一步比较本文方法和其他方法的优劣， Y=0.4779Y+0.3009Y2+0.2212Y3(23) 采用标准误差RMSE、平均相对预报误差MAPE和采用本文算法对系统进行在线建模，在线聚类模型跟踪性能指标TP(tracking precision)来衡量发生变化，新增加一个聚类子集，在原聚类的结果上模型性能.其中σ为模型计算值与实际值之间偏新增加一个聚类子集S4,子模型的参数随着A、的变化而进行更新，测试样本以所属子模型的预测结差的方差，o为实际输出值的方差.TP指标反映模型输出对真实输出值的跟踪效果，TP值小于0 果作为输出，而不需要再采用加权算法，带钢出口厚表明模型精度较差，TP值越接近1则表明模型跟踪度预测和误差曲线如图4所示，厚度偏差范围为精度越强 -0.002~0.002mm. 离线多支持向量机模型建立后，当测试数据增 RMSE= 1：-方12， 24) 加时，分别采用传统多支持向量机和本文算法两种方法对系统进行在线建模.传统多支持向量机建模 (25) 过程中，聚类结果不会随着测试数据的变化而变化，因此其模型预测结果精度较差，误差为-0.02~ 0.02mm,如图5所示.从图4和图5可以看出，本 TP=l-drm (26) 文数据驱动在线建模方法比传统多模型离线建模方表1列出了几种模型的性能数据对比，即在线

第 11 期梁辉等: 基于减法聚类的带钢厚度数据驱动建模精轧入口温度 1 020 ℃ 等．这里不考虑原始化学成分对带钢成品的影响，仅从热轧生产工艺参数方面对带钢出口厚度的影响上，选取某机架轧制力 P、辊缝设定值 S、入口厚度 H、轧制速度 v 和来料温度 T 作为厚度预测模型的输入变量，出口厚度作为预测模型的输出变量，输入量序列如图 3 所示．图 3 输入变量序列 Fig． 3 Serial of input variables 对训练样本进行离线建模，支持向量机核函数取为高斯径向基，训练样本集个数为 200，测试样本集个数 100．首先，对数据进行归一化处理，然后采用减法聚类算法对训练样本集进行空间划分，在减法聚类算法中聚类半径对聚类个数有较大的影响，聚类半径通常的取值范围为 0. 2 ～ 0. 5，通过实验对比分析后，得到三个聚类子集 S1、S2 和 S3，样本个数分别为 91、68 和 41，各子集分别采用最小二乘支持向量机方法建立子模型，带钢厚度最小二乘支持向量机回归模型为 Y = 0. 477 9Y1 + 0. 300 9Y2 + 0. 221 2Y3 ． ( 23) 采用本文算法对系统进行在线建模，在线聚类发生变化，新增加一个聚类子集，在原聚类的结果上新增加一个聚类子集 S4，子模型的参数随着 A － 1 N 的变化而进行更新，测试样本以所属子模型的预测结果作为输出，而不需要再采用加权算法，带钢出口厚度预测和误差曲线如图 4 所示，厚度偏差范围为－ 0. 002 ～ 0. 002 mm．离线多支持向量机模型建立后，当测试数据增加时，分别采用传统多支持向量机和本文算法两种方法对系统进行在线建模．传统多支持向量机建模过程中，聚类结果不会随着测试数据的变化而变化，因此其模型预测结果精度较差，误差为－ 0. 02 ～ 0. 02 mm，如图 5 所示．从图 4 和图 5 可以看出，本文数据驱动在线建模方法比传统多模型离线建模方图 4 采用本文方法的厚度预测( a) 和误差曲线( b) Fig． 4 Thickness prediction ( a) and error curve ( b) by the method proposed in this paper 法有较高的预测精度．图 5 采用传统多支持向量机的厚度预测( a) 和误差曲线( b) Fig． 5 Thickness prediction ( a) and error curve ( b) by the traditional multiple SVM model 为了进一步比较本文方法和其他方法的优劣，采用标准误差 RMSE、平均相对预报误差 MAPE 和模型跟踪性能指标 TP ［19］( tracking precision) 来衡量模型性能．其中 σ2 eror为模型计算值与实际值之间偏差的方差，σ2 property为实际输出值的方差． TP 指标反映模型输出对真实输出值的跟踪效果，TP 值小于 0 表明模型精度较差，TP 值越接近 1 则表明模型跟踪精度越强． RMSE = 1 N∑ N i = 1 | yi － y^ i | 槡 2 ， ( 24) MAPE = 1 N ∑ N i = 1 yi － y^ i yi ， ( 25) TP = 1 － σ2 eror σ2 property ． ( 26) 表 1 列出了几种模型的性能数据对比，即在线 ·1343·

·1344· 北京科技大学学报第34卷多支持向量机建模方法、传统多支持向量机建模及 12.65 支持向量机的全局模型、BP神经网络建模以及偏最 (a) 实际值 12.60 一预测值小二乘统计模型(PLS).从表1的统计数据可见，与 12.55 多模型的两种建模方法相比，本文算法比传统的多 12.50 模型算法，标准误差精度和平均相对误差精度都提 124560 50 1000 1500 样本个数高了一个数量级，模型跟踪能力提高了3.6%.在全 0.01 局模型中，偏最小二乘统计模型的性能是最优的，本文算法相比最优的全局模型其标准误差RMSE提高 45.3%,MAPE提高43.2%，TP提高1.3% 0.0 表1几种带钢厚度模型性能数据比较 -0.02 500 1000 00 Table 1 Comparison of performance data among different methods 样本个数方法 RMSE MAPE p 图7采用本文方法的厚度预测()和厚差曲线(b) 在线MSVM 7.1×10-4 3.5073x10-5 0.9893 Fig.7 Thickness prediction (a)and error curve (b)by the online data-driven algorithm MSVM 2.5×10-3 9.9855×10-5 0.9546 SVM 4.2×10-3 1.5029×10-4 0.9231 自动厚度控制算法后，F4机架的厚度偏差曲线，该 BP神经网络 8.8×10-3 4.1844×10-4 0.9010 数据是从现场PDA中导出的，其偏差范围在 PLS 1.3×103 6.1799×10-5 0.9758 -0.08~0mm;图8(b)是采用传统的多支持向量机 3.2现场数据实验分析建模方法建立带钢厚度预测模型，由于其建立的厚为了进一步说明本文提出的算法在工业现场的度模型为离线模型，其不随工况的变化而实时调整，应用效果，下面从某钢厂六机架热连轧1700mm生故其厚度预测值与实际值偏差较大.相比较目前工产现场PDA记录的实际数据中，随机抽取F4机架业现场各机架采用基于弹跳方程的厚度机理建模方某卷带钢作为样本，如图6所示.将数据从PDA中法，采用基于数据驱动在线算法建立的带钢厚度预导出，PDA采样周期为10ms,取500组作为训练样测模型，预测精度非常高，厚度偏差范围在-0.02~ 本，1500组作为测试样本，对样本数据进行归一化 0.01mm之内，厚度模型的高精度预测，为后续的自处理，然后采用本文所提出的算法建立带钢厚度预动厚度控制算法提供了有力保障测模型，带钢厚度预测结果见图7 0.02 0.04 0.06 -F4 SPD 0.08 500 1000 50 样本个数 0.15 (b) 0.10 FI EIT THCKO 0.05 0 015 500 1000 1500 035的0经340创5010的000057的样本个数图6PDA导出数据图8 采用机理模型(a)和采用多支持向量机(b)模型的厚差 Fig.6 Data from PDA of production process 曲线 Fig.8 Thickness error curve by the mechanism model (a)and the 厚度精度作为热轧带钢质量的主要衡量指标之 traditional MSVM (b) 一，直接关系到产品质量和经济效益，现代热连轧精轧机组都装备有自动厚度控制系统.它的理论基础 4 结论是弹跳方程，将各种影响厚度控制精度的因素通过参数补偿的方式，代入到弹跳方程中，然后调节压下 (1)提出了一种基于减法聚类的带钢厚度数据进行控制.图8(a)为现场使用的机理模型在采取驱动建模算法，将离线模型和在线学习结合起来，即

北京科技大学学报第 34 卷多支持向量机建模方法、传统多支持向量机建模及支持向量机的全局模型、BP 神经网络建模以及偏最小二乘统计模型( PLS) ．从表1 的统计数据可见，与多模型的两种建模方法相比，本文算法比传统的多模型算法，标准误差精度和平均相对误差精度都提高了一个数量级，模型跟踪能力提高了 3. 6% ．在全局模型中，偏最小二乘统计模型的性能是最优的，本文算法相比最优的全局模型其标准误差 RMSE 提高 45. 3% ，MAPE 提高 43. 2% ，TP 提高 1. 3% ．表 1 几种带钢厚度模型性能数据比较 Table 1 Comparison of performance data among different methods 方法 RMSE MAPE TP 在线 MSVM 7. 1 × 10 － 4 3. 507 3 × 10 － 5 0. 989 3 MSVM 2. 5 × 10 － 3 9. 985 5 × 10 － 5 0. 954 6 SVM 4. 2 × 10 － 3 1. 502 9 × 10 － 4 0. 923 1 BP 神经网络 8. 8 × 10 － 3 4. 184 4 × 10 － 4 0. 901 0 PLS 1. 3 × 10 － 3 6. 179 9 × 10 － 5 0. 975 8 3. 2 现场数据实验分析为了进一步说明本文提出的算法在工业现场的应用效果，下面从某钢厂六机架热连轧 1 700 mm 生产现场 PDA 记录的实际数据中，随机抽取 F4 机架某卷带钢作为样本，如图 6 所示．将数据从 PDA 中导出，PDA 采样周期为 10 ms，取 500 组作为训练样本，1 500 组作为测试样本，对样本数据进行归一化处理，然后采用本文所提出的算法建立带钢厚度预测模型，带钢厚度预测结果见图 7. 图 6 PDA 导出数据 Fig． 6 Data from PDA of production process 厚度精度作为热轧带钢质量的主要衡量指标之一，直接关系到产品质量和经济效益，现代热连轧精轧机组都装备有自动厚度控制系统．它的理论基础是弹跳方程，将各种影响厚度控制精度的因素通过参数补偿的方式，代入到弹跳方程中，然后调节压下进行控制．图 8( a) 为现场使用的机理模型在采取图 7 采用本文方法的厚度预测( a) 和厚差曲线( b) Fig． 7 Thickness prediction ( a) and error curve ( b) by the online data-driven algorithm 自动厚度控制算法后，F4 机架的厚度偏差曲线，该数据是从现场 PDA 中导出的，其偏差范围在－ 0. 08 ～ 0 mm; 图 8( b) 是采用传统的多支持向量机建模方法建立带钢厚度预测模型，由于其建立的厚度模型为离线模型，其不随工况的变化而实时调整，故其厚度预测值与实际值偏差较大．相比较目前工业现场各机架采用基于弹跳方程的厚度机理建模方法，采用基于数据驱动在线算法建立的带钢厚度预测模型，预测精度非常高，厚度偏差范围在－ 0. 02 ～ 0. 01 mm 之内，厚度模型的高精度预测，为后续的自动厚度控制算法提供了有力保障．图 8 采用机理模型( a) 和采用多支持向量机( b) 模型的厚差曲线 Fig． 8 Thickness error curve by the mechanism model ( a) and the traditional MSVM ( b) 4 结论 ( 1) 提出了一种基于减法聚类的带钢厚度数据驱动建模算法，将离线模型和在线学习结合起来，即 ·1344·

第11期梁辉等：基于减法聚类的带钢厚度数据驱动建模 ·1345· 充分利用了生产过程中的大量历史数据，又可以根 neural network for prediction for rolling force in hot-rolling mill. 据工况变化在线调整模型的结构和参数. Mater Process Technol,2005,164/165:1612 (2)通过数字轧机仿真实验中几种模型的性能 [10]Jeong S Y,Lee M,Lee S Y,et al.Improving lookup table con- trol of a hot coil strip process with online retrainable RBF net- 对比可以看出，在线多支持向量机厚度模型比最优 work.IEEE Trans Ind Electron,2000,47(3):679 的偏最小二乘统计模型的RMSE提高45.3%， 01] Portmann N F,Lindhoff D.Sorgel G,et al.Application of neu- MAPE提高43.2%，TP提高1.3%.工业现场数据 ral networks in rolling mill automation.Iron Steel Eng,1995,72 仿真分析表明了本文算法具有较高的预测精度，能 (2):33 满足工业在线应用要求. [12]Ma J S,Theiler J,Perkins S.Accurate on-ine support vector re- gression.Neural Comput,2003,15(11)2683 (3)通过基于数据驱动的热轧带钢厚度预测模 13] Mukherjee S.Osuna E,Girosi F.Nonlinear prediction of chaotic 型探索性研究，在忽略精轧机组间的相互影响以及 time series using a support vector machine//Proceedings of1997 厚度与板形、宽带的耦合影响因素的前提下，建立了 IEEE Workshop.New York,1997:511 单机架厚度相关因素模型. ū4] Suykens J A K.Non-inear modelling and support vector ma- chines /Proceedings of IEEE Instrumentation and Measurement Technology Conference.Budapest,2001:287 参考文献 [15]Li W,Yang Y P,Wang N.Multi-model LSSVM regression mod- eling based on kernel fuzzy clustering.Control Decis,2008,23 [1]Hou Z S,Xu J X.On data-driven control theory:the state of the (5):560 art and perspective.Acta Autom Sin,2009,35(6):650 (李卫，杨煜普，王娜.基于核模糊聚类的多模型LSSVM回 (侯忠生，许建新.数据驱动控制理论及方法的回顾和展望归建模.控制与决策，2008,23(5)：560) 自动化学报，2009,35(6)：650) [16]Yu Z H,Fu X,Li Y L.Online support vector regression for sys- Gui W H,Yang C H,Li Y G,et al.Data-driven operational-pat- tem identification.Lect Notes Comput Sci,2005,3611:627 tem optimization for copper flash smelting process.Acta Auom 17] Nemmour H,Chibani Y.Multiple support vector machines for Sin,2009,35(6):717 land cover change detection:an application for mapping urban (桂卫华，阳春华，李勇刚，等。基于数据驱动的铜闪速熔炼 extensions.ISPRS J Photogramm Remote Sens,2006,61(2): 过程操作模式优化及应用.自动化学报，2009,35(6)：717) 125 B]Gao C H,Jian L,Chen J M,et al.Data-driven modeling and pre- 08] Chiu S L.Fuzzy model identification based on cluster estimation dictive algorithm for complex blast fumace ironmaking process.Ac- J Intell Fuzzy Syst,1994,2(3):267 ta Autom Sin,2009,35(6):725 [19]Li X L,Su H Y,Chu J.Multiple models soft-ensing technique (郜传厚，渐令，陈积明，等.复杂高炉炼铁过程的数据驱动 based on online clustering arithmetic.J Chem Ind Eng China, 建模及预测算法.自动化学报，2009,35(6)：725) 2007,58(11):2834 4]Rhodes C,Morari M,Tsimring LS.Data-based control trajectory (李修亮，苏宏业，褚键.基于在线聚类的多模型软测量建 planning for nonlinear systems.Phys Rev E,1997,56(3):2398 模方法.化工学报，2007,58(11)：2834) 5]Arif M,Ishihara T.Inooka H.Incorporation of experience in iter- [20]Xiong S W.Niu XX,Liu H B.Support vector machines based ative learning controllers using locally weighted learning.Automat- on subtractive clustering /Proceeding of the Fourth International ica,2001,37(6):881 Conference on Machine Learning and Cybernetics.Guangzhou, [6]Luo Y J,Li Z F,Cao J M,et al.Application of GA to rolling 2005:4345 forces re-distribution in hot strip mills.J Uni Sci Technol Beijing, 1]Tang H S,Xue S T,Chen R,et al.Sequential LS-SVM for 2004,26(4):420 structural systems identification.J Vib Eng,2006,19(3):382 (罗永军，李忠富，曹军民，等。基于遗传算法的热连轧机负 (唐和生，薛松涛，陈镕，等。序贯最小二乘支持向量机的结荷再分配.北京科技大学学报，2004,26(4)：420) 构系统识别.振动工程学报，2006,19(3)：382) Peng K X,Yu SZ.Prediction and control of strip thickness based 22]Li LJ,Su H Y,Chu J.Generalized predictive control with online on Bayesianneural networks.J Unir Sci Technol Beijing,2010,32 least squares support vector machines.Acta Autom Sin,2007,33 (2):256 (11):1182 (彭开香，余尚志.基于贝叶斯神经网络的带钢厚度预测与控 [23]Suykens J A K,Lukas L,Vandewalle J.Sparse approximation 制.北京科技大学学报，2010,32(2)：256) using least squares support vector machines//Proceeding of IEEE 8]Hong Y,Tang L X.Data-driven rolling force calculation for cold International Symposium on Circuits and Systems.Geneva,2000: rolling mill.Control Eng China,2009,16(Suppl 3):146 757 (洪悦，唐立新.基于数据驱动的冷连轧过程轧制力设定方 24]Cauwenberghs G,Poggio T.Incremental and decremental support 法.控制工程，2009,16（增刊3）：146) vector machine learning.Adr Neural Inf Process Syst,2001,13: [9]Son J S,Lee D M.Kilm I S,et al.A study on on-ine learning 409

第 11 期梁辉等: 基于减法聚类的带钢厚度数据驱动建模充分利用了生产过程中的大量历史数据，又可以根据工况变化在线调整模型的结构和参数． ( 2) 通过数字轧机仿真实验中几种模型的性能对比可以看出，在线多支持向量机厚度模型比最优的偏最小二乘统计模型的 RMSE 提高 45. 3% ， MAPE 提高 43. 2% ，TP 提高 1. 3% ．工业现场数据仿真分析表明了本文算法具有较高的预测精度，能满足工业在线应用要求． ( 3) 通过基于数据驱动的热轧带钢厚度预测模型探索性研究，在忽略精轧机组间的相互影响以及厚度与板形、宽带的耦合影响因素的前提下，建立了单机架厚度相关因素模型．参考文献［1］ Hou Z S，Xu J X． On data-driven control theory: the state of the art and perspective． Acta Autom Sin，2009，35( 6) : 650 ( 侯忠生，许建新．数据驱动控制理论及方法的回顾和展望．自动化学报，2009，35( 6) : 650) ［2］ Gui W H，Yang C H，Li Y G，et al． Data-driven operational-pattern optimization for copper flash smelting process． Acta Autom Sin，2009，35( 6) : 717 ( 桂卫华，阳春华，李勇刚，等．基于数据驱动的铜闪速熔炼过程操作模式优化及应用．自动化学报，2009，35( 6) : 717) ［3］ Gao C H，Jian L，Chen J M，et al． Data-driven modeling and predictive algorithm for complex blast furnace ironmaking process． Acta Autom Sin，2009，35( 6) : 725 ( 郜传厚，渐令，陈积明，等．复杂高炉炼铁过程的数据驱动建模及预测算法．自动化学报，2009，35( 6) : 725) ［4］ Rhodes C，Morari M，Tsimring L S． Data-based control trajectory planning for nonlinear systems． Phys Rev E，1997，56( 3) : 2398 ［5］ Arif M，Ishihara T，Inooka H． Incorporation of experience in iterative learning controllers using locally weighted learning． Automatica，2001，37( 6) : 881 ［6］ Luo Y J，Li Z F，Cao J M，et al． Application of GA to rolling forces re-distribution in hot strip mills． J Univ Sci Technol Beijing， 2004，26( 4) : 420 ( 罗永军，李忠富，曹军民，等．基于遗传算法的热连轧机负荷再分配．北京科技大学学报，2004，26( 4) : 420) ［7］ Peng K X，Yu S Z． Prediction and control of strip thickness based on Bayesianneural networks． J Univ Sci Technol Beijing，2010，32 ( 2) : 256 ( 彭开香，余尚志．基于贝叶斯神经网络的带钢厚度预测与控制．北京科技大学学报，2010，32( 2) : 256) ［8］ Hong Y，Tang L X． Data-driven rolling force calculation for cold rolling mill． Control Eng China，2009，16( Suppl 3) : 146 ( 洪悦，唐立新．基于数据驱动的冷连轧过程轧制力设定方法．控制工程，2009，16( 增刊 3) : 146) ［9］ Son J S，Lee D M，Kilm I S，et al． A study on on-line learning neural network for prediction for rolling force in hot-rolling mill． J Mater Process Technol，2005，164 /165: 1612 ［10］ Jeong S Y，Lee M，Lee S Y，et al． Improving lookup table control of a hot coil strip process with online retrainable RBF network． IEEE Trans Ind Electron，2000，47( 3) : 679 ［11］ Portmann N F，Lindhoff D，Sorgel G，et al． Application of neural networks in rolling mill automation． Iron Steel Eng，1995，72 ( 2) : 33 ［12］ Ma J S，Theiler J，Perkins S． Accurate on-line support vector regression． Neural Comput，2003，15( 11) : 2683 ［13］ Mukherjee S，Osuna E，Girosi F． Nonlinear prediction of chaotic time series using a support vector machine / / Proceedings of 1997 IEEE Workshop． New York，1997: 511 ［14］ Suykens J A K． Non-linear modelling and support vector machines / / Proceedings of IEEE Instrumentation and Measurement Technology Conference． Budapest，2001: 287 ［15］ Li W，Yang Y P，Wang N． Multi-model LSSVM regression modeling based on kernel fuzzy clustering． Control Decis，2008，23 ( 5) : 560 ( 李卫，杨煜普，王娜．基于核模糊聚类的多模型 LSSVM 回归建模．控制与决策，2008，23( 5) : 560) ［16］ Yu Z H，Fu X，Li Y L． Online support vector regression for system identification． Lect Notes Comput Sci，2005，3611: 627 ［17］ Nemmour H，Chibani Y． Multiple support vector machines for land cover change detection: an application for mapping urban extensions． ISPRS J Photogramm Remote Sens，2006，61 ( 2) : 125 ［18］ Chiu S L． Fuzzy model identification based on cluster estimation． J Intell Fuzzy Syst，1994，2( 3) : 267 ［19］ Li X L，Su H Y，Chu J． Multiple models soft-sensing technique based on online clustering arithmetic． J Chem Ind Eng China， 2007，58( 11) : 2834 ( 李修亮，苏宏业，褚键．基于在线聚类的多模型软测量建模方法．化工学报，2007，58( 11) : 2834) ［20］ Xiong S W，Niu X X，Liu H B． Support vector machines based on subtractive clustering / / Proceeding of the Fourth International Conference on Machine Learning and Cybernetics． Guangzhou， 2005: 4345 ［21］ Tang H S，Xue S T，Chen R，et al． Sequential LS-SVM for structural systems identification． J Vib Eng，2006，19( 3) : 382 ( 唐和生，薛松涛，陈镕，等．序贯最小二乘支持向量机的结构系统识别．振动工程学报，2006，19( 3) : 382) ［22］ Li L J，Su H Y，Chu J． Generalized predictive control with online least squares support vector machines． Acta Autom Sin，2007，33 ( 11) : 1182 ［23］ Suykens J A K，Lukas L，Vandewalle J． Sparse approximation using least squares support vector machines / /Proceeding of IEEE International Symposium on Circuits and Systems． Geneva，2000: 757 ［24］ Cauwenberghs G，Poggio T． Incremental and decremental support vector machine learning． Adv Neural Inf Process Syst，2001，13: 409 ·1345·

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录

基于减法聚类的带钢厚度数据驱动建模