D0I:10.13374/1.issnl00103.2007.06.040 第29卷第6期 北京科技大学学报 Vol.29 No.6 2007年6月 Journal of University of Science and Technology Beijing Jun.2007 基于偏最小二乘回归模型的带钢热镀锌质量监控方法 姚林12)阳建宏徐金梧)王植) 1)北京科技大学机械工程学院,北京1000832)鞍山钢铁集团公司,鞍山114021 3)鞍钢股份有限公司冷轧厂,鞍山114030 摘要提出了基于偏最小二乘回归模型的带钢热镀锌质量监控方法:以带钢热镀锌生产中带钢力学性能和锌层质量的质 量监控为研究对象,用偏最小二乘方法建立了生产过程参数与质量结果之间的回归模型,对生产过程控制能力进行了分析, 并给出了产品质量的预测方法:用鞍钢股份有限公司带钢热镀锌的实际生产数据进行验证·结果表明,偏最小二乘法比传统 的多元线性回归方法具有更好的预测精度,基于偏最小二乘回归的锌层质量预测模型,其相对预测误差可达到5.93%. 关键词带钢热镀锌:偏最小二乘法;质量监控:预测方法 分类号TG335.22:0213.1 随着国民经济的发展,对热镀锌钢板的质量要 因变量的数据表X=[x1,,xp]m×p和Y=[y1, 求也越来越高、由于工艺流程复杂,生产过程对产 ,yg]×g偏最小二乘回归建模方法的主要思路 品质量的影响常常是多因素的,例如原板的化学成 是:在X和Y中分别提取出成分t1和,t1是x1, 分、带钢的退火温度、光整延伸率等都会对钢板的力 …,x2的线性组合,是y1,…,yg的线性组合,并 学性能造成影响).建立工艺过程参数与产品质 且满足:①1和应尽可能大地携带各自数据表 量之间的回归模型,可以为生产过程监控和质量管 中的变异信息,即t1和1尽可能好地代表数据表 理提供有力的数据支持和分析手段,多元线性回归 X和Y;②t1和之间的相关程度达到最大,即自 (multiple linear regression,MLR)是常用的回归方 变量的成分t1对因变量的成分1具有最强的解释 法,但在变量间多重相关性问题上存在一定的局限 能力 性,而神经网络等方法虽在回归精度上有些优势, 利用偏最小二乘法的简化算法,不需要提取因 却在模型对应关系的解释上不够明确 变量的成分,算法具体计算步骤如下: 偏最小二乘法(partial least square,PLS)是由 (1)将原始数据表X和Y标准化后分别得到 Wold和Albano等提出的多因变量对多自变量的回 自变量矩阵Eo和因变量矩阵F,· 归建模方法,通过对系统数据进行有效的分解和筛 (②)计算矩阵E0FoF6Eo最大特征值对应的正 选,提取对因变量解释性最强的综合变量一辨识 则化特征向量w1,得第一成分t1=E0w1,其中E0 系统中的信息与噪声,从而较好地克服了变量多重 和F6分别是E0和Fo的转置, 相关在系统建模中的不良影响3], (3)分别求Eo和F对t1的回归方程E0= 本文将偏最小二乘法引入到带钢热镀锌生产的 tp1十E和Fo=t1r1十F1,其中, 质量监控中,提出了基于偏最小二乘法的带钢热镀 Eot1 锌工艺过程参数与产品质量的回归建模方法及产品 pm=1下 (1) 质量的预测模型,并结合鞍钢股份有限公司带钢热 Fot 镀锌实际生产对建模方法的有效性进行了验证, =TaN2 (2) 1偏最小二乘回归建模方法 E和F分别是Eo和Fo的残差矩阵 (4)检验收敛性,利用交叉有效性判断是否满 对p个自变量x1,,x}和g个因变量y1, 足精度要求,若不满足则Eo=E,F0=F1,然后重 ,yg获取n个观测样本,可以获得关于自变量和 复步骤(2)和(3),计算下一个成分,直至满足要求; 收稿日期:2006-10-31修回日期:2007-01-25 若有h个成分计算终止,则: 基金项目:北京市自然科学基金资助项目(N。,3062012) Fo=t1ri十t2r2十+thrh (3) 作者简介:姚林(1965一),男,教授级高级工程师,博士研究生: 徐金梧(1949一),男,教授,博士生导师 (5)建立Eo和Fo的回归方程Fo=EoB十
基于偏最小二乘回归模型的带钢热镀锌质量监控方法 姚 林12) 阳建宏1) 徐金梧1) 王 植3) 1) 北京科技大学机械工程学院北京100083 2) 鞍山钢铁集团公司鞍山114021 3) 鞍钢股份有限公司冷轧厂鞍山114030 摘 要 提出了基于偏最小二乘回归模型的带钢热镀锌质量监控方法.以带钢热镀锌生产中带钢力学性能和锌层质量的质 量监控为研究对象用偏最小二乘方法建立了生产过程参数与质量结果之间的回归模型对生产过程控制能力进行了分析 并给出了产品质量的预测方法.用鞍钢股份有限公司带钢热镀锌的实际生产数据进行验证.结果表明偏最小二乘法比传统 的多元线性回归方法具有更好的预测精度基于偏最小二乘回归的锌层质量预测模型其相对预测误差可达到5∙93%. 关键词 带钢热镀锌;偏最小二乘法;质量监控;预测方法 分类号 TG335∙22;O213∙1 收稿日期:2006-10-31 修回日期:2007-01-25 基金项目:北京市自然科学基金资助项目(No.3062012) 作者简介:姚 林(1965-)男教授级高级工程师博士研究生; 徐金梧(1949-)男教授博士生导师 随着国民经济的发展对热镀锌钢板的质量要 求也越来越高.由于工艺流程复杂生产过程对产 品质量的影响常常是多因素的例如原板的化学成 分、带钢的退火温度、光整延伸率等都会对钢板的力 学性能造成影响[1-2].建立工艺过程参数与产品质 量之间的回归模型可以为生产过程监控和质量管 理提供有力的数据支持和分析手段.多元线性回归 (multiple linear regressionMLR)是常用的回归方 法但在变量间多重相关性问题上存在一定的局限 性.而神经网络等方法虽在回归精度上有些优势 却在模型对应关系的解释上不够明确. 偏最小二乘法(partial least squarePLS)是由 Wold 和 Albano 等提出的多因变量对多自变量的回 归建模方法通过对系统数据进行有效的分解和筛 选提取对因变量解释性最强的综合变量———辨识 系统中的信息与噪声从而较好地克服了变量多重 相关在系统建模中的不良影响[3-5]. 本文将偏最小二乘法引入到带钢热镀锌生产的 质量监控中提出了基于偏最小二乘法的带钢热镀 锌工艺过程参数与产品质量的回归建模方法及产品 质量的预测模型并结合鞍钢股份有限公司带钢热 镀锌实际生产对建模方法的有效性进行了验证. 1 偏最小二乘回归建模方法 对 p 个自变量{x1…xp}和 q 个因变量{y1 …yq}获取 n 个观测样本可以获得关于自变量和 因变量的数据表 X= [ x1…xp ] n×p 和 Y = [ y1 …yq ] n×q.偏最小二乘回归建模方法的主要思路 是:在 X 和 Y 中分别提取出成分 t1 和 u1t1 是 x1 …xp 的线性组合u1 是 y1…yq 的线性组合并 且满足:① t1 和 u1 应尽可能大地携带各自数据表 中的变异信息即 t1 和 u1 尽可能好地代表数据表 X 和 Y;② t1 和 u1 之间的相关程度达到最大即自 变量的成分 t1 对因变量的成分 u1 具有最强的解释 能力. 利用偏最小二乘法的简化算法不需要提取因 变量的成分[3]算法具体计算步骤如下: (1) 将原始数据表 X 和 Y 标准化后分别得到 自变量矩阵 E0 和因变量矩阵 F0. (2) 计算矩阵 E′0F0F′0E0 最大特征值对应的正 则化特征向量 w1得第一成分 t1= E0w1其中 E′0 和 F′0 分别是 E0 和 F0 的转置. (3) 分别求 E0 和 F0 对 t1 的回归方程 E0= t1p′1+ E1 和 F0=t1r′1+F1其中 p1= E′0t1 ‖t1‖2 (1) r1= F′0t1 ‖t1‖2 (2) E1 和 F1 分别是 E0 和 F0 的残差矩阵. (4) 检验收敛性.利用交叉有效性判断是否满 足精度要求若不满足则 E0= E1F0= F1然后重 复步骤(2)和(3)计算下一个成分直至满足要求; 若有 h 个成分计算终止则: F0=t1r′1+t2r′2+…+thr′h (3) (5) 建立 E0 和 F0 的回归方程 F0= E0B+ 第29卷 第6期 2007年 6月 北 京 科 技 大 学 学 报 Journal of University of Science and Technology Beijing Vol.29No.6 Jun.2007 DOI:10.13374/j.issn1001-053x.2007.06.040
.628 北京科技大学学报 第29卷 FA,其中, 其主要思想是:(I)先取出s个样本点,将原始的n B= (-wpi)]ri 个样本点分成两部分,即用于回归建模的数据(n一 s个样本点)和用于预测校验的数据(s个样本点) I为单位向量,FA为残差矩阵 (②)用n一s个样本点根据给定的PLS成分数目, (6)通过对E0和o进行反标准化,建立原始 建立回归模型,计算出s个样本的预测值,并求出预 自变量X和因变量Y之间的回归方程: 测误差.(3)用抽样测试的方法重复上述两步,得 Y=XB,十C (5) 出总的平均预测误差:如果新增了成分数目并没有 其中, 明显减少总的平均预测误差,则应舍弃最后新增的 B=D:BD, (6) 成分 C=my一mxBg (7) PLS成分数目确定后,即可根据偏最小二乘的 D,和D,分别是矩阵X和Y各列方差组成的对角 算法步骤求出式(5)中的B,和C,得到回归模型. 矩阵,mz和m,分别是矩阵X和Y各列均值组成的 2.1.4基于回归模型的产品质量预测 行向量 建立工艺参数与产品质量回归模型后,即可根 据式(5),利用工艺过程参数的回归系数对产品质量 2基于PLS的质量监控模型 进行预测 在过程参数与产品质量的回归模型中,回归系 2.1.5对模型的精度评价 数可以定性或定量地描述各生产过程参数对产品质 评价回归建模方法的常用指标是复相关系数, 量性能的影响程度和影响方式,因此,结合生产工 它是反映一个因变量和多个自变量之间相关程度的 艺原理,根据过程参数对质量性能的影响关系分析 指标,取值在0到1之间.复相关系数越接近1表 实际生产过程中对各个工艺参数的控制情况,从而 明该因变量和多个自变量之间相关程度越显著,回 达到质量监控的目的.此外,也可以根据回归模型, 归模型越适用 利用监测到的生产过程参数对产品质量性能进行预 R=J0/U (8) 测,为实际生产中工艺改进和生产质量控制提供必 要的决策支持和分析手段-] 式中,R表示复相关系数,Q= 空(列 2.1建立质量监控模型的步骤 2.1.1质量监控回归模型的输入和输出 归平方和,U=空(0:一为总偏差平方和,元 在生产质量监控的回归模型中,自变量通常对 表示预测值,y:表示真值,y表示真值的平均值,n 应于过程参数,因变量通常对应于质量指标.建立 表示预测样本数. 模型时,必须结合实际生产工艺和已有的工艺参数 此外,评价回归模型预测精度的常用指标是预 收集手段,对模型的输入量(自变量)和输出量(因变 测误差平方和(prediction error sum of squares, 量)进行仔细筛选,使模型既能反映主要工艺流程, PESS): 又需保证模型数据在采样间隔上的一致性 2.1.2样本数据的预处理 PEs8=是(W (9) (1)异常数据的筛除,为保证建模的准确性, 预测误差平方和越小,表明该模型具有越高的 由于异常原因而产生的、不满足带钢热镀锌生产技 预测精度 术规程的过程参数或质量数据,在建模前要加以 2.2热镀锌带钢力学性能的质量监控 筛除. 本文以鞍钢股份有限公司某带钢热镀锌生产线 (2)数据的标准化处理,在对生产数据进行回 的实际生产数据作为数据样本空间,以某结构钢为 归建模之前,必须要对数据进行标准化处理,即对 研究对象,共收集到490个样本,每个样本包括一卷 样本数据进行零均值化后再除以数据的标准差,保 带钢的原板化学成分(如碳、硅、锰、磷、硫、钛等化学 证处理后的每一个变量的数据均值为0,方差为1, 元素的含量)、带钢退火温度(实验中所取数据为带 以消除过程参数及质量指标间量纲不一致对数据分 钢在退火炉区均热段出口平均温度,即影响晶粒回 析造成的影响, 复和再结晶的决定性温度)、光整延伸率、光整轧制 2.1.3PLS成分数目的确定与回归建模 力以及镀锌板成品的力学性能数据(如屈服强度、抗 确定PLS成分数目的常用方法是交叉验证法, 拉强度、断裂延伸率、塑性应变比和应变硬化指数
FA其中 B= ∑ h j=1 ∏ j—1 i=1 ( I-wip′i)wj r′j (4) I 为单位向量FA 为残差矩阵. (6) 通过对 E0 和 F0 进行反标准化建立原始 自变量 X 和因变量 Y 之间的回归方程: Y=XBg+C (5) 其中 Bg= D -1 x BDy (6) C=my-mxBg (7) Dx 和 Dy 分别是矩阵 X 和 Y 各列方差组成的对角 矩阵mx 和 my 分别是矩阵 X 和 Y 各列均值组成的 行向量. 2 基于 PLS 的质量监控模型 在过程参数与产品质量的回归模型中回归系 数可以定性或定量地描述各生产过程参数对产品质 量性能的影响程度和影响方式.因此结合生产工 艺原理根据过程参数对质量性能的影响关系分析 实际生产过程中对各个工艺参数的控制情况从而 达到质量监控的目的.此外也可以根据回归模型 利用监测到的生产过程参数对产品质量性能进行预 测为实际生产中工艺改进和生产质量控制提供必 要的决策支持和分析手段[6-7]. 2∙1 建立质量监控模型的步骤 2∙1∙1 质量监控回归模型的输入和输出 在生产质量监控的回归模型中自变量通常对 应于过程参数因变量通常对应于质量指标.建立 模型时必须结合实际生产工艺和已有的工艺参数 收集手段对模型的输入量(自变量)和输出量(因变 量)进行仔细筛选使模型既能反映主要工艺流程 又需保证模型数据在采样间隔上的一致性. 2∙1∙2 样本数据的预处理 (1) 异常数据的筛除.为保证建模的准确性 由于异常原因而产生的、不满足带钢热镀锌生产技 术规程的过程参数或质量数据在建模前要加以 筛除. (2) 数据的标准化处理.在对生产数据进行回 归建模之前必须要对数据进行标准化处理.即对 样本数据进行零均值化后再除以数据的标准差保 证处理后的每一个变量的数据均值为0方差为1 以消除过程参数及质量指标间量纲不一致对数据分 析造成的影响. 2∙1∙3 PLS 成分数目的确定与回归建模 确定 PLS 成分数目的常用方法是交叉验证法 其主要思想是:(1) 先取出 s 个样本点将原始的 n 个样本点分成两部分即用于回归建模的数据( n- s 个样本点)和用于预测校验的数据( s 个样本点). (2) 用 n- s 个样本点根据给定的 PLS 成分数目 建立回归模型计算出 s 个样本的预测值并求出预 测误差.(3) 用抽样测试的方法重复上述两步得 出总的平均预测误差;如果新增了成分数目并没有 明显减少总的平均预测误差则应舍弃最后新增的 成分. PLS 成分数目确定后即可根据偏最小二乘的 算法步骤求出式(5)中的 Bg 和 C得到回归模型. 2∙1∙4 基于回归模型的产品质量预测 建立工艺参数与产品质量回归模型后即可根 据式(5)利用工艺过程参数的回归系数对产品质量 进行预测. 2∙1∙5 对模型的精度评价 评价回归建模方法的常用指标是复相关系数 它是反映一个因变量和多个自变量之间相关程度的 指标取值在0到1之间.复相关系数越接近1表 明该因变量和多个自变量之间相关程度越显著回 归模型越适用. R= Q/U (8) 式中R 表示复相关系数Q= ∑ n i=1 (^yi- y) 2 为回 归平方和U = ∑ n i=1 ( yi- y) 2 为总偏差平方和^yi 表示预测值yi 表示真值y 表示真值的平均值n 表示预测样本数. 此外评价回归模型预测精度的常用指标是预 测误 差 平 方 和 (prediction error sum of squares PESS): PESS= ∑ n i=1 (^yi-yi) 2 (9) 预测误差平方和越小表明该模型具有越高的 预测精度. 2∙2 热镀锌带钢力学性能的质量监控 本文以鞍钢股份有限公司某带钢热镀锌生产线 的实际生产数据作为数据样本空间以某结构钢为 研究对象共收集到490个样本每个样本包括一卷 带钢的原板化学成分(如碳、硅、锰、磷、硫、钛等化学 元素的含量)、带钢退火温度(实验中所取数据为带 钢在退火炉区均热段出口平均温度即影响晶粒回 复和再结晶的决定性温度)、光整延伸率、光整轧制 力以及镀锌板成品的力学性能数据(如屈服强度、抗 拉强度、断裂延伸率、塑性应变比和应变硬化指数 ·628· 北 京 科 技 大 学 学 报 第29卷
第6期 姚林等:基于偏最小二乘回归模型的带钢热镀锌质量监控方法 .629 等)89] 质量指标的复相关系数分别为:屈服强度95,92%, 数据样本的统计结果如表1所示,根据交叉验 抗拉强度93.75%,断裂延伸率85.85%,塑性应变 证法,取PLS成分的数目为5,运用偏最小二乘回归 比74.04%,应变硬化指数84.89%.从复相关系数 建模得到的回归系数如表2所示。回归模型中对各 可以看出,回归模型具有较好的建模精度, 表1样本数据统计结果 Table 1 Statistical results of sample data 项目 变量 最大值 最小值 平均值 标准差 C质量分数/% 0.0640 0.0010 0.0258 0.0136 Si质量分数/% 0.0450 0.0100 0.0134 0.0061 Mn质量分数/% 0.2800 0.1000 0.2151 0.0513 P质量分数/% 0.0210 0.0060 0.0098 0.0023 输入量 s质量分数/% 0.0080 0.0030 0.0051 0.0010 Ti质量分数/% 0.0720 0.0010 0.0160 0.0254 退火温度/℃ 816.0000 729.0000 754.2082 14.2813 光整轧制力/N 7070000.0 560000.0 2635388.0 10163.94 光整延伸率/ 14.0000 1.0000 9.3510 1.7582 屈服强度/MPa 316.0000 154.0000 245.2959 42.7339 抗拉强度/MPa 380.0000 249.0000 337.9694 26.5613 输出量 断裂延伸率/% 49.3400 31.6900 41.0304 2.8946 塑性应变比 6.3880 1.0940 1,7139 0.5410 应变硬化指数 0.2420 0.2020 0.2194 0.0091 表2带钢力学性能的质量监控模型回归系数 Table 2 Regression coefficients of the quality monitoring model of strip's mechanical properties 输出量 C质量分数Si质量分数M质量分数P质量分数S质量分数Ti质量分数 退火温度 光整轧制力光整延伸率 屈服强度 0.3040 -0.0096 0.2302 0.0632 0.0186 -0.3362 0.0137 0.2045 -0.0272 抗拉强度 0.3197 0.0193 0.2252 0.0763 -0.0241 -0.3516 0.0039 0.2071 -0.0169 断裂延伸率 -0.2097 -0.0935 -0.1283 -0.1484 0.0298 0.2885 -0.0150 -0.4155 0.0523 塑性应变比 -0.1677 0.0582 -0.1687 -0.0366 -0.1323 0.1983 -0.0353 -0.1367 0.1427 应变硬化指数一0.3600 -0.0917 -0.2209 -0.0473 -0.0085 0.3971 -0.0248 -0.0769 -0.2003 借助回归系数可以定性和定量地分析工艺参数 很难改变,因此原板化学成分的回归系数所反映的 对产品质量的影响程度及影响方式,回归系数绝对 主要是上游工序对热镀锌带钢力学性能的影响.因 值越大,表示影响程度越大:反之,回归系数的绝对 为样本数据来自于相对稳定的实际生产过程,带钢 值越小,则表示影响程度越小,回归系数的符号为 退火温度的波动都是在热镀锌带钢退火工艺规定的 正,表示过程参数对质量指标的影响为正相关,即质 范围之内,所以,带钢退火温度的回归系数较小,其 量指标随着过程参数的变大而变大;反之,回归系数 含义是在工艺规程范围内带钢退火温度的波动对带 的符号为负,表示过程参数对质量指标的影响为负 钢力学性能的影响比较小,也说明在生产过程中对 相关,即质量指标随着过程参数的变大而变小.如 带钢退火温度的控制能力较好,这与实际的生产情 果回归系数绝对值较小,即影响程度很小时,其符号 况是相吻合的.而光整轧制力的回归系数较大,说 的正负容易随数据的波动而变化, 明在样本数据所对应的实际生产过程中,光整轧制 从回归系数上看,碳、硅、锰、磷、硫、钛等化学元 力的波动对带钢力学性能的波动影响较大,也说明 素的含量对带钢力学性能的影响与金属学工艺原理 在生产过程中对光整轧制力的控制能力较差,应该 和实际生产经验基本吻合,原板的化学成分在上游 在人员、设备、工艺、原料、环境等各种生产要素中找 工序中就已确定,在带钢热镀锌的生产工艺中己经 出薄弱环节,加以改善,以提高对光整轧制力的生产
等) [8-9]. 数据样本的统计结果如表1所示.根据交叉验 证法取 PLS 成分的数目为5运用偏最小二乘回归 建模得到的回归系数如表2所示.回归模型中对各 质量指标的复相关系数分别为:屈服强度95∙92% 抗拉强度93∙75%断裂延伸率85∙85%塑性应变 比74∙04%应变硬化指数84∙89%.从复相关系数 可以看出回归模型具有较好的建模精度. 表1 样本数据统计结果 Table1 Statistical results of sample data 项目 变量 最大值 最小值 平均值 标准差 C 质量分数/% 0∙0640 0∙0010 0∙0258 0∙0136 Si 质量分数/% 0∙0450 0∙0100 0∙0134 0∙0061 Mn 质量分数/% 0∙2800 0∙1000 0∙2151 0∙0513 P 质量分数/% 0∙0210 0∙0060 0∙0098 0∙0023 输入量 S 质量分数/% 0∙0080 0∙0030 0∙0051 0∙0010 Ti 质量分数/% 0∙0720 0∙0010 0∙0160 0∙0254 退火温度/℃ 816∙0000 729∙0000 754∙2082 14∙2813 光整轧制力/N 7070000∙0 560000∙0 2635388∙0 10163∙94 光整延伸率/‰ 14∙0000 1∙0000 9∙3510 1∙7582 屈服强度/MPa 316∙0000 154∙0000 245∙2959 42∙7339 抗拉强度/MPa 380∙0000 249∙0000 337∙9694 26∙5613 输出量 断裂延伸率/% 49∙3400 31∙6900 41∙0304 2∙8946 塑性应变比 6∙3880 1∙0940 1∙7139 0∙5410 应变硬化指数 0∙2420 0∙2020 0∙2194 0∙0091 表2 带钢力学性能的质量监控模型回归系数 Table2 Regression coefficients of the quality monitoring model of strip’s mechanical properties 输出量 C 质量分数 Si 质量分数 Mn 质量分数 P 质量分数 S 质量分数 Ti 质量分数 退火温度 光整轧制力 光整延伸率 屈服强度 0∙3040 -0∙0096 0∙2302 0∙0632 0∙0186 -0∙3362 0∙0137 0∙2045 -0∙0272 抗拉强度 0∙3197 0∙0193 0∙2252 0∙0763 -0∙0241 -0∙3516 0∙0039 0∙2071 -0∙0169 断裂延伸率 -0∙2097 -0∙0935 -0∙1283 -0∙1484 0∙0298 0∙2885 -0∙0150 -0∙4155 0∙0523 塑性应变比 -0∙1677 0∙0582 -0∙1687 -0∙0366 -0∙1323 0∙1983 -0∙0353 -0∙1367 0∙1427 应变硬化指数 -0∙3600 -0∙0917 -0∙2209 -0∙0473 -0∙0085 0∙3971 -0∙0248 -0∙0769 -0∙2003 借助回归系数可以定性和定量地分析工艺参数 对产品质量的影响程度及影响方式.回归系数绝对 值越大表示影响程度越大;反之回归系数的绝对 值越小则表示影响程度越小.回归系数的符号为 正表示过程参数对质量指标的影响为正相关即质 量指标随着过程参数的变大而变大;反之回归系数 的符号为负表示过程参数对质量指标的影响为负 相关即质量指标随着过程参数的变大而变小.如 果回归系数绝对值较小即影响程度很小时其符号 的正负容易随数据的波动而变化. 从回归系数上看碳、硅、锰、磷、硫、钛等化学元 素的含量对带钢力学性能的影响与金属学工艺原理 和实际生产经验基本吻合.原板的化学成分在上游 工序中就已确定在带钢热镀锌的生产工艺中已经 很难改变因此原板化学成分的回归系数所反映的 主要是上游工序对热镀锌带钢力学性能的影响.因 为样本数据来自于相对稳定的实际生产过程带钢 退火温度的波动都是在热镀锌带钢退火工艺规定的 范围之内.所以带钢退火温度的回归系数较小其 含义是在工艺规程范围内带钢退火温度的波动对带 钢力学性能的影响比较小也说明在生产过程中对 带钢退火温度的控制能力较好这与实际的生产情 况是相吻合的.而光整轧制力的回归系数较大说 明在样本数据所对应的实际生产过程中光整轧制 力的波动对带钢力学性能的波动影响较大也说明 在生产过程中对光整轧制力的控制能力较差应该 在人员、设备、工艺、原料、环境等各种生产要素中找 出薄弱环节加以改善以提高对光整轧制力的生产 第6期 姚 林等: 基于偏最小二乘回归模型的带钢热镀锌质量监控方法 ·629·
.630 北京科技大学学报 第29卷 过程控制能力,进而提高产品质量的控制能力 预测实验,每次选其中的6组作为回归数据集,剩下 模型的回归精度代表了对学习样本的拟合程 的1组作为检验数据集,最终可以得到所有数据总 度,预测精度代表了模型的泛化能力·为分析回归 的预测误差平方和PESS,结果如表3所示,从表3 模型的预测精度,采用分批交叉验证方法,将490个 中可以看出,偏最小二乘回归模型的预测误差平方 样本平均分成7组,每组70个样本,分别用偏最小 和小于多元线性回归模型,说明偏最小二乘回归方 二乘回归方法和多元线性回归方法建模,进行7次 法在泛化能力上具有更好的预测精度 表3PLS与MLR回归模型的预测误差平方和 Table 3 Comparison of the prediction error sum of squares between partial least square regression and multiple linear regression 模型 屈服强度 抗拉强度 断裂延伸率 塑性应变比 应变硬化指数 PLS 48.9794 80.8288 162.5832 417.4569 165.3340 MLR 57.5691 83.8987 162.6599 436.7384 178.4313 2.3热镀锌带钢锌层质量的预测模型 式(5)一(7),求得锌层质量的预测模型如下: 热镀锌生产中,锌层质量是一个重要的用户质 f(w)= 量指标,气刀的喷气压力、气刀喷嘴到带钢的距离、 -0.200P+5.464d+0.394s-16.784h+31.575 机组运行速度和带钢厚度等是影响锌层质量的几个 (11) 主要因素[山,本文以鞍钢股份有限公司某带钢热镀 预测模型的精度用相对预测误差来表示,其计算公 锌生产线的实际生产数据作为数据样本空间,以每 式如式(12)所示: 一卷带钢为取样点,收集气刀参数、机组运行速度、 带钢厚度等工艺参数和带钢表面锌层质量的数据样 RPE= (12) 本,运用偏最小二乘法进行回归建模并对带钢表面 锌层质量进行预测,从现场的实际生产记录中取得 空1 1400个数据样本,取前1200个样本用于回归建模, 用式(11)表示的预测模型所得到的预测结果如 剩下的200个样本用于预测模型的校验,在回归建 图1所示,相对预测误差为5.93%,用多元线性回 模过程中,应用交叉验证法确定PLS成分的数目为 归预测模型得到的相对预测误差为6.51%,从图1 2,得到各过程参数对锌层质量影响的回归系数,建 中可以看出,基于偏最小二乘回归的预测模型从总 立标准化后数据的回归模型: 体上较有效地反映了各工艺过程参数对锌层质量的 f(0*)= 影响关系,在预测精度上要优于多元线性回归方法 -0.716p*+0.813d*+0.439s*-0.309h* 目20 …目标值 (10) 9150 100 式中,心为标准化锌层质量,P*为标准化气刀压 50 力,d*为标准化气刀到带钢的距离,s为标准化机 0020406080100120140160180200 组运行速度,h为标准化带钢厚度. 样本数 从回归系数中可以看出:一方面,从影响的性质 图1锌层质量的预测结果 上说,气刀压力、带钢厚度与锌层质量呈负相关,即 Fig.I Prediction results of zinc coating mass 气刀压力越大、带钢厚度越大,锌层质量就越小;气 刀到带钢的距离、机组速度与锌层质量呈正相关,即 3 讨论 气刀到带钢的距离越大、机组速度越大,锌层质量就 越大,另一方面,从影响的大小上说,气刀压力、气 采用偏最小二乘回归方法建立带钢热镀锌产品 刀到带钢的距离对锌层质量的影响较大,带钢厚度、 质量监控模型是比较有效的一种方法,但在实际应 机组速度相对而言影响较小,这与现场的实际生产 用中仍会存在一些问题: 情况也是相吻合的, (1)实际生产中很多工艺过程参数都会对产品 式(10)是标准化处理之后数据的回归方程,如 质量造成影响10),但由于取样条件的限制,通常 果要建立锌层质量的预测模型,还需要将式(10)中 用于产品质量监控建模的工艺过程参数都是有限 的结果转化成原始过程参数的回归系数,根据 的,因此通过受控的工艺过程参数对产品质量进行
过程控制能力进而提高产品质量的控制能力. 模型的回归精度代表了对学习样本的拟合程 度预测精度代表了模型的泛化能力.为分析回归 模型的预测精度采用分批交叉验证方法将490个 样本平均分成7组每组70个样本分别用偏最小 二乘回归方法和多元线性回归方法建模进行7次 预测实验每次选其中的6组作为回归数据集剩下 的1组作为检验数据集最终可以得到所有数据总 的预测误差平方和 PESS结果如表3所示.从表3 中可以看出偏最小二乘回归模型的预测误差平方 和小于多元线性回归模型说明偏最小二乘回归方 法在泛化能力上具有更好的预测精度. 表3 PLS 与 MLR 回归模型的预测误差平方和 Table3 Comparison of the prediction error sum of squares between partial least square regression and multiple linear regression 模型 屈服强度 抗拉强度 断裂延伸率 塑性应变比 应变硬化指数 PLS 48∙9794 80∙8288 162∙5832 417∙4569 165∙3340 MLR 57∙5691 83∙8987 162∙6599 436∙7384 178∙4313 2∙3 热镀锌带钢锌层质量的预测模型 热镀锌生产中锌层质量是一个重要的用户质 量指标.气刀的喷气压力、气刀喷嘴到带钢的距离、 机组运行速度和带钢厚度等是影响锌层质量的几个 主要因素[1].本文以鞍钢股份有限公司某带钢热镀 锌生产线的实际生产数据作为数据样本空间以每 一卷带钢为取样点收集气刀参数、机组运行速度、 带钢厚度等工艺参数和带钢表面锌层质量的数据样 本运用偏最小二乘法进行回归建模并对带钢表面 锌层质量进行预测.从现场的实际生产记录中取得 1400个数据样本取前1200个样本用于回归建模 剩下的200个样本用于预测模型的校验.在回归建 模过程中应用交叉验证法确定 PLS 成分的数目为 2得到各过程参数对锌层质量影响的回归系数建 立标准化后数据的回归模型: f ( w ∗)= -0∙716P ∗+0∙813d ∗+0∙439s ∗-0∙309h ∗ (10) 式中w ∗ 为标准化锌层质量P ∗ 为标准化气刀压 力d ∗为标准化气刀到带钢的距离s ∗为标准化机 组运行速度h ∗为标准化带钢厚度. 从回归系数中可以看出:一方面从影响的性质 上说气刀压力、带钢厚度与锌层质量呈负相关即 气刀压力越大、带钢厚度越大锌层质量就越小;气 刀到带钢的距离、机组速度与锌层质量呈正相关即 气刀到带钢的距离越大、机组速度越大锌层质量就 越大.另一方面从影响的大小上说气刀压力、气 刀到带钢的距离对锌层质量的影响较大带钢厚度、 机组速度相对而言影响较小.这与现场的实际生产 情况也是相吻合的. 式(10)是标准化处理之后数据的回归方程.如 果要建立锌层质量的预测模型还需要将式(10)中 的结果转化成原始过程参数的回归系数.根据 式(5)~(7)求得锌层质量的预测模型如下: f ( w)= -0∙200P+5∙464d+0∙394s-16∙784h+31∙575 (11) 预测模型的精度用相对预测误差来表示其计算公 式如式(12)所示: RPE= ∑ n i=1 |^yi — yi| ∑ n i=1 |yi| (12) 用式(11)表示的预测模型所得到的预测结果如 图1所示相对预测误差为5∙93%用多元线性回 归预测模型得到的相对预测误差为6∙51%.从图1 中可以看出基于偏最小二乘回归的预测模型从总 体上较有效地反映了各工艺过程参数对锌层质量的 影响关系在预测精度上要优于多元线性回归方法. 图1 锌层质量的预测结果 Fig.1 Prediction results of zinc coating mass 3 讨论 采用偏最小二乘回归方法建立带钢热镀锌产品 质量监控模型是比较有效的一种方法但在实际应 用中仍会存在一些问题: (1) 实际生产中很多工艺过程参数都会对产品 质量造成影响[10-11]但由于取样条件的限制通常 用于产品质量监控建模的工艺过程参数都是有限 的因此通过受控的工艺过程参数对产品质量进行 ·630· 北 京 科 技 大 学 学 报 第29卷
第6期 姚林等:基于偏最小二乘回归模型的带钢热镀锌质量监控方法 .631 监控的能力也是有限的,解决这个问题的关键在于 供了有效的统计分析手段 生产工艺流程设计时,需要考虑哪些工艺参数必须 受控且易于取样,这样有利于建立分析模型,对实际 参考文献 生产提供决策支持, [1]李九岭.带钢连续热镀锌.2版:北京:冶金工业出版社, 2001.275 (2)与神经网络、支持向量机等方法相比,偏最 [2]余宗森,袁泽喜,李定秀,等.鞍钢钢材成分与其力学性能的 小二乘回归建模方法简单、有效,其回归系数在质量 定量关系.北京科技大学学报,1997,15(9):510 监控中有非常明确的物理意义,与传统的多元线性 [3]王惠文.偏最小二乘法回归及其应用,北京:国防工业出版 回归建模方法相比,虽然从回归精度上说二者较接 社,1999:2 近,但由于偏最小二乘回归方法通过提取对因变量 [4]de Jong S.SIMPLS:an alternative approach to partial least 解释性最强的综合成分进行回归建模,因而具有较 squares regression.Chemometr Intell Lab Syst.1993.18:251 [5]Svante W,MichaelS,Lennart E.PLS-regression:a basic tool of 好的模型鲁棒性和模型预测精度. chemometrics.Chemometr Intell Lab Syst,2001.58:109 4 结论 []苟淑云·生产工艺对低碳铝镇静钢热镀锌钢板性能的影响 钢铁,2006,41(2):34 本文提出了基于偏最小二乘回归模型的带钢热 [7]程国平,袁明生,张红。连续热镀锌工艺对F钢力学性能的 镀锌产品质量监控方法,以热镀锌带钢的力学性能 影响.宝钢技术,2001(2):9 [8]余宗森.钢的成分,残留元素及其性能的定量关系,北京:冶 和锌层质量为实例,给出了在工艺过程参数与产品 金工业出版社,2001:8 质量之间建立回归模型的方法,并运用回归模型对 [9]王景川·热镀锌工艺对超深冲板性能的影响.四川冶金,2003 锌层质量建立了产品质量预测模型,现场数据的实 (5):15 验结果表明,基于偏最小二乘回归方法建立的带钢 [10]初元璋,祁鹏,张娅.宝钢F钢大生产产品性能预测。北京科 热镀锌产品质量监控模型与实际生产经验和工艺特 技大学学报,2001,23(1):48 [11]王丹民,李华德,周建龙,热轧带钢力学性能预测模型及其应 性相吻合,为新工艺的生产调试和产品质量控制提 用.北京科技大学学报,2006,28(7):687 Quality monitoring method of strip hot dip galvanizing based on partial least squares regression YAO Lin).YANG Jianhong),XU Jinwu).WANG Zhi) 1)Mechanical Engineering School.University of Science and Technology Beijing,Beijing 100083,China 2)Anshan Iron and Steel Group Corporation.Anshan 114021.China 3)Cold Rolling Plant.Angang Steel Company Limited.Anshan 114030.China ABSTRACI A quality monitoring method for strip hot-dip galvanizing based on partial least square regression was proposed.Taking the quality monitoring of mechanical properties and zinc coating mass in strip hot-dip gal- vanizing as the investigated subject,a regression model between process parameters and quality results was con- structed through partial least square method.With the regression model,the capability of production process control was analyzed and a production quality prediction method was presented.Real field data from strip hot-dip galvanizing production in Angang Steel Company Limited were used for validation.The results show that partial least square regression has a better predicting precision than traditional multiple linear regression,and that the zinc coating mass prediction model based on partial least square regression has a relative prediction error of 5.93%. KEY WORDS strip hot-dip galvanizing:partial least square;quality monitoring:prediction method
监控的能力也是有限的.解决这个问题的关键在于 生产工艺流程设计时需要考虑哪些工艺参数必须 受控且易于取样这样有利于建立分析模型对实际 生产提供决策支持. (2) 与神经网络、支持向量机等方法相比偏最 小二乘回归建模方法简单、有效其回归系数在质量 监控中有非常明确的物理意义.与传统的多元线性 回归建模方法相比虽然从回归精度上说二者较接 近但由于偏最小二乘回归方法通过提取对因变量 解释性最强的综合成分进行回归建模因而具有较 好的模型鲁棒性和模型预测精度. 4 结论 本文提出了基于偏最小二乘回归模型的带钢热 镀锌产品质量监控方法以热镀锌带钢的力学性能 和锌层质量为实例给出了在工艺过程参数与产品 质量之间建立回归模型的方法并运用回归模型对 锌层质量建立了产品质量预测模型.现场数据的实 验结果表明基于偏最小二乘回归方法建立的带钢 热镀锌产品质量监控模型与实际生产经验和工艺特 性相吻合为新工艺的生产调试和产品质量控制提 供了有效的统计分析手段. 参 考 文 献 [1] 李九岭.带钢连续热镀锌.2版.北京:冶金工业出版社 2001:275 [2] 余宗森袁泽喜李定秀等.鞍钢钢材成分与其力学性能的 定量关系.北京科技大学学报199715(9):510 [3] 王惠文.偏最小二乘法回归及其应用.北京:国防工业出版 社1999:2 [4] de Jong S.SIMPLS:an alternative approach to partial least squares regression.Chemometr Intell Lab Syst199318:251 [5] Svante WMichael SLennart E.PLS-regression:a basic tool of chemometrics.Chemometr Intell Lab Syst200158:109 [6] 苟淑云.生产工艺对低碳铝镇静钢热镀锌钢板性能的影响. 钢铁200641(2):34 [7] 程国平袁明生张红.连续热镀锌工艺对 IF 钢力学性能的 影响.宝钢技术2001(2):9 [8] 余宗森.钢的成分、残留元素及其性能的定量关系.北京:冶 金工业出版社2001:8 [9] 王景川.热镀锌工艺对超深冲板性能的影响.四川冶金2003 (5):15 [10] 初元璋祁鹏张娅.宝钢 IF 钢大生产产品性能预测.北京科 技大学学报200123(1):48 [11] 王丹民李华德周建龙.热轧带钢力学性能预测模型及其应 用.北京科技大学学报200628(7):687 Quality monitoring method of strip hot-dip galvanizing based on partial least squares regression Y AO L in 12)Y A NG Jianhong 1)XU Jinw u 1)WA NG Zhi 3) 1) Mechanical Engineering SchoolUniversity of Science and Technology BeijingBeijing100083China 2) Anshan Iron and Steel Group CorporationAnshan114021China 3) Cold Rolling PlantAngang Steel Company LimitedAnshan114030China ABSTRACT A quality monitoring method for strip hot-dip galvanizing based on partial least square regression was proposed.Taking the quality monitoring of mechanical properties and zinc coating mass in strip hot-dip galvanizing as the investigated subjecta regression model between process parameters and quality results was constructed through partial least square method.With the regression modelthe capability of production process control was analyzed and a production quality prediction method was presented.Real field data from strip hot-dip galvanizing production in Angang Steel Company Limited were used for validation.The results show that partial least square regression has a better predicting precision than traditional multiple linear regressionand that the zinc coating mass prediction model based on partial least square regression has a relative prediction error of 5∙93%. KEY WORDS strip hot-dip galvanizing;partial least square;quality monitoring;prediction method 第6期 姚 林等: 基于偏最小二乘回归模型的带钢热镀锌质量监控方法 ·631·