D0I:10.13374/.issn1001-053x.2012.10.011 第34卷第10期 北京科技大学学报 Vol.34 No.10 2012年10月 Journal of University of Science and Technology Beijing 0ct.2012 COREX冷煤气成分预测的二步建模方法 赵晨熙”张群》徐金梧)四 黎 敏” 1)北京科技大学机械工程学院,北京1000832)宝钢股份研究院,上海201900 ☒通信作者,E-mail:jwxu@usth.cd加.cn 摘要针对熔融气化炉冷煤气成分含量,提出了基于痛权模糊C均值聚类和偏最小二乘的COREX冷煤气成分预测方法 建模过程中首先根据料单中各种原料的单耗量,利用熵权模糊C均值聚类的方法将料单聚类成若干种料单类别,然后针对不 同的料单类别,利用偏最小二乘法分别建立冷煤气成分预测模型.对宝钢COREX一1“炉实际生产数据验证结果表明:该方法 可以有效地建立COREX冷煤气成分预测模型,具有较好的预测精度. 关键词熔炼:铁矿石还原:煤气:预测:模糊聚类:偏最小二乘法 分类号T℉557:0212.4 Two-stage modeling method for predicting COREX cold gas content ZHA0 Chen-xi,ZHANG Qun2》,XU Jin-回,Mim) 1)School of Mechanical Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)Research Institute,Baoshan Iron Steel Co.Ltd.Shanghai 201900,China Corresponding author E-mail:jwxu@ustb.edu.cn ABSTRACT A method for predicting cold gas content in a melter-gasifier was proposed based on entropy-weighted fuzzy C-means clustering and partial least squares (PLS).In the modeling process,an entropy-weighted fuzzy C-means clustering algorithm is used to get the clustering result of burden calculation reports according to the consumption of raw materials at first.Then,different prediction models are built based on a PLS algorithm for various cluster types.The real field data of cold gas content from Baosteel COREX were used for verification.It is shown that the method can build the prediction model of COREX cold gas content effectively,and has an advantage in prediction accuracy. KEY WORDS smelting:iron ore reduction:gases:prediction:fuzzy clustering:partial least squares COREX熔融还原炼铁技术是一种直接采用块 理,在一些合理的假设条件下,确定变量之间的数学 矿、球团矿和非炼焦煤,附加部分焦炭来生产热铁水 关系,分析其因果关系和演化过程,从而建立系统的 的新工艺,是一项已实现工业生产的熔融还原炼铁 数学模型同.Xu等0利用基于物料平衡和热量平 技术O.COREX工艺污染少、生产的铁水质量能与 衡的分析方法分析了影响COREX燃料消耗的因 高炉铁水相媲美回.2007年11月和2011年3月, 素;Prachethan等的开发了一套基于物料平衡和热 年产150万吨铁水的C0REX-3000-1"炉和2"炉分 量平衡的COREX生产过程分析模型:Barman等 别在宝钢建成出铁. 建立了回旋区的数学模型,并分析了回旋区参数对 近几年,国内外研究工作者对COREX炉生产 COREX过程的影响.然而由于COREX涉及的反应 过程进行了一些研究.常用的建模方法主要有两 过程十分复杂,在实际应用中很难对其机理做出定 种:机理分析法;统计与人工智能分析法.机理建模 性或定量描述.统计与人工智能分析法是指对建模 方法是通过分析和运用一些已知的定律、定理和原 系统采集的大量观测数据,建立某些变量与另一些 理,如物料平衡方程、能量平衡方程和传热传质原 变量间统计相依关系的规律或数学表达式,即建立 收稿日期:201201-13 基金项目:国家自然科学基金资助项目(50934007:51004013):中央高校基本科研业务费专项(FRF-MP-09-009B:FRF-AS-09-008B)
第 34 卷 第 10 期 2012 年 10 月 北京科技大学学报 Journal of University of Science and Technology Beijing Vol. 34 No. 10 Oct. 2012 COREX 冷煤气成分预测的二步建模方法 赵晨熙1) 张 群2) 徐金梧1) ! 黎 敏1) 1) 北京科技大学机械工程学院,北京 100083 2) 宝钢股份研究院,上海 201900 !通信作者,E-mail: jwxu@ ustb. edu. cn 摘 要 针对熔融气化炉冷煤气成分含量,提出了基于熵权模糊 C 均值聚类和偏最小二乘的 COREX 冷煤气成分预测方法. 建模过程中首先根据料单中各种原料的单耗量,利用熵权模糊 C 均值聚类的方法将料单聚类成若干种料单类别,然后针对不 同的料单类别,利用偏最小二乘法分别建立冷煤气成分预测模型. 对宝钢 COREX--1# 炉实际生产数据验证结果表明: 该方法 可以有效地建立 COREX 冷煤气成分预测模型,具有较好的预测精度. 关键词 熔炼; 铁矿石还原; 煤气; 预测; 模糊聚类; 偏最小二乘法 分类号 TF557; O212. 4 Two-stage modeling method for predicting COREX cold gas content ZHAO Chen-xi 1) ,ZHANG Qun2) ,XU Jin-wu1) !,LI Min1) 1) School of Mechanical Engineering,University of Science and Technology Beijing,Beijing 100083,China 2) Research Institute,Baoshan Iron & Steel Co. Ltd. ,Shanghai 201900,China !Corresponding author E-mail: jwxu@ ustb. edu. cn ABSTRACT A method for predicting cold gas content in a melter-gasifier was proposed based on entropy-weighted fuzzy C-means clustering and partial least squares ( PLS) . In the modeling process,an entropy-weighted fuzzy C-means clustering algorithm is used to get the clustering result of burden calculation reports according to the consumption of raw materials at first. Then,different prediction models are built based on a PLS algorithm for various cluster types. The real field data of cold gas content from Baosteel COREX-1# were used for verification. It is shown that the method can build the prediction model of COREX cold gas content effectively,and has an advantage in prediction accuracy. KEY WORDS smelting; iron ore reduction; gases; prediction; fuzzy clustering; partial least squares 收稿日期: 2012--01--13 基金项目: 国家自然科学基金资助项目( 50934007; 51004013) ; 中央高校基本科研业务费专项( FRF--MP--09--009B; FRF--AS--09--008B) COREX 熔融还原炼铁技术是一种直接采用块 矿、球团矿和非炼焦煤,附加部分焦炭来生产热铁水 的新工艺,是一项已实现工业生产的熔融还原炼铁 技术[1]. COREX 工艺污染少、生产的铁水质量能与 高炉铁水相媲美[2]. 2007 年 11 月和 2011 年 3 月, 年产 150 万吨铁水的 COREX--3000--1# 炉和 2# 炉分 别在宝钢建成出铁. 近几年,国内外研究工作者对 COREX 炉生产 过程进行了一些研究. 常用的建模方法主要有两 种: 机理分析法; 统计与人工智能分析法. 机理建模 方法是通过分析和运用一些已知的定律、定理和原 理,如物料平衡方程、能量平衡方程和传热传质原 理,在一些合理的假设条件下,确定变量之间的数学 关系,分析其因果关系和演化过程,从而建立系统的 数学模型[3]. Xu 等[4]利用基于物料平衡和热量平 衡的分析方法分析了影响 COREX 燃料消耗的因 素; Prachethan 等[5]开发了一套基于物料平衡和热 量平衡的 COREX 生产过程分析模型; Barman 等[6] 建立了回旋区的数学模型,并分析了回旋区参数对 COREX 过程的影响. 然而由于 COREX 涉及的反应 过程十分复杂,在实际应用中很难对其机理做出定 性或定量描述. 统计与人工智能分析法是指对建模 系统采集的大量观测数据,建立某些变量与另一些 变量间统计相依关系的规律或数学表达式,即建立 DOI:10.13374/j.issn1001-053x.2012.10.011
第10期 赵晨熙等:COREX冷煤气成分预测的二步建模方法 ·1185· 描述这些变量关系的统计数学模型.Prachethan 等团利用回归分析的方法预测COREX铁水中Si 其中,P= xg'k=1/nn,若P=0,则 含量 Pilnpi=0. 熔融气化炉是一个气一固一液三相高温复杂反 定义第j个属性的权重为 应的容器,在COREX熔融还原炼铁工艺过程中起 0=8 gj=1,2,…,m (2) 着非常重要的作用,主要完成燃煤造气和海绵铁熔 化,熔剂分解、熔化,生铁脱硫、渗碳,造渣和渣铁分 其中,g=1-er 离等反应网.在熔融气化炉中形成的煤气自炉顶排 由式(2)得到各属性的权重,W={0102,…, 出后兑入冷煤气通入热旋风除尘器进行粗除尘.粗 0m}.对于给定的j,x的差异越小,则g越小,说明 除尘后的半净煤气分为两路:一路作为还原气送往 该属性在聚类中提供区分的有用信息少;x:的差异 还原竖炉:另一路经进一步清洗形成冷煤气.还原 越大,则g:越大,说明该属性在聚类中提供区分的 气进入竖炉后向上流动,对矿石进行还原,然后自竖 有用信息多,应重点考察该属性 炉炉顶排出 为消除不同属性间量纲不一致的影响,对原始 熔融气化炉的冷煤气中主要含有C0、C0,和H2 数据X进行标准化处理,即对原始数据减去均值后 等,影响冷煤气成分含量的因素众多,除煤和焦炭的 再除以数据的标准差,保证处理后的每一个变量的 组成外还有吹入熔融气化炉的氧气量、氧气压力、拱 数据均值为0,方差为1.对标准化后的数据X进 顶温度和海绵铁的金属化率等,它们对冷煤气成分 行加权,得到加权后的数据矩阵Z=WX. 含量的影响是一个多因素的复杂过程.找出这些参 1.2模糊C均值聚类方法 数与冷煤气成分含量之间的关系,对生产过程有重 不同料单的原料使用种类、使用量不同,导致产 要的指导价值. 生不同的炉况,而在不同炉况下各参数对冷煤气成 从我们前期的研究发现:原料配比情况是影响 分含量的影响关系是波动变化的.在确定各种原料 炉况的重要因素之一,不同比例的原料配比会产生 权重的基础上,本文采用模糊C均值聚类方法对料 不同的炉况,而不同炉况下各参数对冷煤气成分含 单进行聚类,将其聚成若干种料单类别. 量的影响关系是波动变化的.本文将熵权模糊C均 模糊C均值(fuz四C-mean,FCM)算法是由 值(weighted fuzzy C-means,WFCM)的方法用于对 Bezdek提出的,它是基于模糊集合理论,并把聚 料单的聚类,为每个料单样本赋予一个属于某种料 类归结成一个带约束的非线性规划问题,通过迭代 单类别的隶属度,之后对不同类别的料单,利用偏最 优化求解获得数据集的模糊划分和聚类结果 小二乘(partial least square,PLS)方法分别建立冷 对于加权后的数据集Z={a122,…,zn}∈R, 煤气成分预测模型. 令ut表示第k个样本属于第i类的隶属度,以表示 每个给定样本属于各个类的程度.“的取值范围为 1基于熵权模糊C均值的聚类方法 D,1],并且一个样本的隶属度之和为1.模糊C均 1.1熵值法确定属性的权重 值算法在迭代寻优过程中,不断更新各类的中心和 由于料单中不同属性对聚类的重要性不同,因 隶属度矩阵各元素的值,其目标函数为 此需要采用各个属性权重的选取方法.本文采用熵 J(U,C1,c2,…,c)= uad 权法来确定料单中各种属性的权重. 信息熵是从平均意义上表征信源总体信息测度 (3) 的一个量,同时又是信源输出信息的不确定性和事 其中:c为聚类数目;d4=川:-4‖为第i个聚类中 件发生随机性的量度0,其对于系统内在信息具有 心与第k个样本点间的欧氏距离,V={,2,…,} 较强的刻画能力,所以可以用信息熵来衡量携带信 表示每个类的聚类中心;m是加权指数,通常选取m 息量的多少 为2.聚类准则为求J(U,C)的极小值. 对于给定的数据集X={x1,x2,,xn}∈R",m 2 COREX冷煤气成分含量预测 为属性个数,n为观测样本个数,则第j项属性的熵 值为 冷煤气成分含量是COREX炉反应性、稳定性 的重要指标,其对于正常生产有很大的影响,是现场 g=-k∑ 1 工程师监测炉况是否正常的重要指标之一.C02成
第 10 期 赵晨熙等: COREX 冷煤气成分预测的二步建模方法 描述这 些 变 量 关 系 的 统 计 数 学 模 型. Prachethan 等[7]利用回归分析的方法预测 COREX 铁水中 Si 含量. 熔融气化炉是一个气--固--液三相高温复杂反 应的容器,在 COREX 熔融还原炼铁工艺过程中起 着非常重要的作用,主要完成燃煤造气和海绵铁熔 化,熔剂分解、熔化,生铁脱硫、渗碳,造渣和渣铁分 离等反应[8]. 在熔融气化炉中形成的煤气自炉顶排 出后兑入冷煤气通入热旋风除尘器进行粗除尘. 粗 除尘后的半净煤气分为两路: 一路作为还原气送往 还原竖炉; 另一路经进一步清洗形成冷煤气. 还原 气进入竖炉后向上流动,对矿石进行还原,然后自竖 炉炉顶排出[9]. 熔融气化炉的冷煤气中主要含有 CO、CO2和 H2 等,影响冷煤气成分含量的因素众多,除煤和焦炭的 组成外还有吹入熔融气化炉的氧气量、氧气压力、拱 顶温度和海绵铁的金属化率等,它们对冷煤气成分 含量的影响是一个多因素的复杂过程. 找出这些参 数与冷煤气成分含量之间的关系,对生产过程有重 要的指导价值. 从我们前期的研究发现: 原料配比情况是影响 炉况的重要因素之一,不同比例的原料配比会产生 不同的炉况,而不同炉况下各参数对冷煤气成分含 量的影响关系是波动变化的. 本文将熵权模糊 C 均 值( weighted fuzzy C-means,WFCM) 的方法用于对 料单的聚类,为每个料单样本赋予一个属于某种料 单类别的隶属度,之后对不同类别的料单,利用偏最 小二乘( partial least square,PLS) 方法分别建立冷 煤气成分预测模型. 1 基于熵权模糊 C 均值的聚类方法 1. 1 熵值法确定属性的权重 由于料单中不同属性对聚类的重要性不同,因 此需要采用各个属性权重的选取方法. 本文采用熵 权法来确定料单中各种属性的权重. 信息熵是从平均意义上表征信源总体信息测度 的一个量,同时又是信源输出信息的不确定性和事 件发生随机性的量度[10],其对于系统内在信息具有 较强的刻画能力,所以可以用信息熵来衡量携带信 息量的多少. 对于给定的数据集 X = { x1,x2,…,xn } ∈Rm,m 为属性个数,n 为观测样本个数,则第 j 项属性的熵 值为 ej = - k ∑ n i = 1 pij lnpij . ( 1) 其 中,pij = xij ∑ n i = 1 xij ,k = 1 /lnn,若 pij = 0,则 pij lnpij = 0. 定义第 j 个属性的权重为 wj = gj ∑ m i = 1 gi,j = 1,2,…,m. ( 2) 其中,gj = 1 - ej . 由式( 2) 得到各属性的权重,W = { w1,w2,…, wm } . 对于给定的 j,xij的差异越小,则 gj 越小,说明 该属性在聚类中提供区分的有用信息少; xij的差异 越大,则 gj 越大,说明该属性在聚类中提供区分的 有用信息多,应重点考察该属性. 为消除不同属性间量纲不一致的影响,对原始 数据 X 进行标准化处理,即对原始数据减去均值后 再除以数据的标准差,保证处理后的每一个变量的 数据均值为 0,方差为 1. 对标准化后的数据 X* 进 行加权,得到加权后的数据矩阵 Z = WX* . 1. 2 模糊 C 均值聚类方法 不同料单的原料使用种类、使用量不同,导致产 生不同的炉况,而在不同炉况下各参数对冷煤气成 分含量的影响关系是波动变化的. 在确定各种原料 权重的基础上,本文采用模糊 C 均值聚类方法对料 单进行聚类,将其聚成若干种料单类别. 模糊 C 均 值 ( fuzzy C-mean,FCM) 算 法 是 由 Bezdek [11]提出的,它是基于模糊集合理论,并把聚 类归结成一个带约束的非线性规划问题,通过迭代 优化求解获得数据集的模糊划分和聚类结果. 对于加权后的数据集 Z = { z1,z2,…,zn } ∈Rm, 令 uik表示第 k 个样本属于第 i 类的隶属度,以表示 每个给定样本属于各个类的程度. uik的取值范围为 [0,1],并且一个样本的隶属度之和为 1. 模糊 C 均 值算法在迭代寻优过程中,不断更新各类的中心和 隶属度矩阵各元素的值,其目标函数为 J( U,c1,c2,…,cc) = ∑ c i = 1 Ji = ∑ c i = 1 ∑ n k = 1 um ikd2 ik . ( 3) 其中: c 为聚类数目; dik = ‖vi - zk‖为第 i 个聚类中 心与第 k 个样本点间的欧氏距离,V = { v1,v2,…,vc} 表示每个类的聚类中心; m 是加权指数,通常选取 m 为 2. 聚类准则为求 J( U,C) 的极小值. 2 COREX 冷煤气成分含量预测 冷煤气成分含量是 COREX 炉反应性、稳定性 的重要指标,其对于正常生产有很大的影响,是现场 工程师监测炉况是否正常的重要指标之一. CO2成 ·1185·
·1186 北京科技大学学报 第34卷 分含量过高,表明冷煤气中C0和H,等还原性气体 为了研究p个自变量X={x1,x2,…,x},q个因变 含量偏低,还原铁矿石的能力过低;CO,成分含量过 量Y={y1y2,…,y,}之间的统计关系,观测了n个 低,易发生碳素溶解反应的逆反应.该反应是一个 样本点.偏最小二乘建模方法的主要思路是:在X 放热反应,易使直接还原铁(direct reduction iron, 和Y中分别提取出主元t1和山1,其中t1和山1分别 DRI)的下降管发生粘接.通过预测冷煤气CO2成分 是名1,为2,…,x。和y1,y2,,y。的线性组合,并且满 含量来预测生产状态,一旦出现异常,可以通过改变 足①,和山1应尽可能多地携带各自数据表中的变 控制参数来调整炉况 异信息,②t1对山1具有最强的解释能力间 影响冷煤气C0,成分含量的因素主要分为原料 分别实施X和Y对1的回归.若回归方程已满 配比情况、控制参数、物料及气化炉状态参数.原料 足精度要求,则算法终止:否则,利用X和Y被11解 配比是现场工程师根据炉况进行计算调整的,调整 释后的残余信息进行第二轮主元提取.如此反复, 后产生效果的时间较长.控制参数主要包括风口氧 直到达到满意精度为止.然后建立X和Y对提取的 气压力、风口氧气单耗、氧气烧嘴单耗和粉尘烧嘴单 m个主元t,t2,…,tm的回归方程,最后还原为Y关 耗等,这些参数可实时调整.物料及气化炉状态参 于X的回归方程 数主要包括直接还原铁的金属化率和拱顶温度等, 确定偏最小二乘主元的常用方法是交叉验证 这些变量通过实时监测得到.因此建立冷煤气CO2 法,其主要思想是:①将原始的个样本点分成两部 成分含量的预测模型,首先需根据料单中各种原料 分,即用于回归建模的数据(n-s个样本点)和用于 的单耗量,利用熵权模糊C均值方法将料单聚类成 预测校验的数据(s个样本点):②用n-s个样本点 若干种料单类别,然后针对不同的料单类别,利用偏 根据给定的偏最小二乘主元数目,建立回归模型,计 最小二乘法分别建立控制参数和气化炉状态参数对 算出s个样本的预测值,并求出预测误差:③用抽样 冷煤气CO,成分含量的预测模型 测试的方法重复上述两步,得出总的平均预测误差 2.1建立预测模型的步骤 将取得最小平均预测误差情况下的主元数确定为建 (1)样本聚类数的选择.通过熵值法得到料单 立模型的主元数 中各种属性的权重,利用模糊C均值法进行聚类, 2.2料单的聚类 挑选同一类料单下的实际生产数据样本进行建模. 本文采用聚类有效性指标一Silhouette指 料单是现场工程师依据COREX炉生产计划和 标四分析聚类结果,确定最佳聚类数.设b()为样 实际运行情况等制定的原料使用单,上面记录着各 本i到其他每个类中样本平均距离的最小值,D(i) 种原料的单耗量和配比情况.不同的料单会对炉况 为样本i与类内所有其他样本的平均距离,则 造成不同的影响,所以对料单进行聚类,可以间接地 Silhouette指标定义为 将炉况聚类成若干种炉况类别. Sl()=b()-D() 挑选COREX-1"炉某两个月生产过程中使用的 max(b(i),D(i)) (4) 282个料单,选择加入竖炉原料(龙腾球团矿、萨马 Silhouette指标反映了聚类结构的类内紧密性 科球团矿、锡兴矿、山西焦和宝钢焦)和加入熔融气 和类间分离性,可用于评价聚类质量,其值在[-1, 化炉原料(平朔煤、兴隆庄煤、大同煤、型煤、山西焦 1]范围内变动,所有样本的平均Silhouette指标值越 和宝钢焦)的单耗值作为聚类的属性,构成了本文 大表示聚类质量越好,其最大值对应的聚类数为最 1.1节中提到的数据集X={x1,2,…,xn}∈R",其 佳聚类数 中m=11,n=282.利用公式(1)、公式(2)计算得 (2)偏最小二乘回归方法与模型主元的确定 到11种原料的权重,如表1所示. 表1各属性熵值法权重结果 Table 1 Weight values of attributes by utilizing the entropy-weighted method 龙腾球团 萨马科球团 锡兴矿 山西焦 宝钢焦 竖炉原料 0.010 0.002 0.007 0.143 0.098 平朔煤 兴隆庄煤 大同煤 型煤 山西焦 宝钢焦 气化炉原料 0.187 0.002 0.126 0.012 0.044 0.368
北 京 科 技 大 学 学 报 第 34 卷 分含量过高,表明冷煤气中 CO 和 H2等还原性气体 含量偏低,还原铁矿石的能力过低; CO2成分含量过 低,易发生碳素溶解反应的逆反应. 该反应是一个 放热反应,易使直接还原铁( direct reduction iron, DRI) 的下降管发生粘接. 通过预测冷煤气 CO2成分 含量来预测生产状态,一旦出现异常,可以通过改变 控制参数来调整炉况. 影响冷煤气 CO2成分含量的因素主要分为原料 配比情况、控制参数、物料及气化炉状态参数. 原料 配比是现场工程师根据炉况进行计算调整的,调整 后产生效果的时间较长. 控制参数主要包括风口氧 气压力、风口氧气单耗、氧气烧嘴单耗和粉尘烧嘴单 耗等,这些参数可实时调整. 物料及气化炉状态参 数主要包括直接还原铁的金属化率和拱顶温度等, 这些变量通过实时监测得到. 因此建立冷煤气 CO2 成分含量的预测模型,首先需根据料单中各种原料 的单耗量,利用熵权模糊 C 均值方法将料单聚类成 若干种料单类别,然后针对不同的料单类别,利用偏 最小二乘法分别建立控制参数和气化炉状态参数对 冷煤气 CO2成分含量的预测模型. 2. 1 建立预测模型的步骤 ( 1) 样本聚类数的选择. 通过熵值法得到料单 中各种属性的权重,利用模糊 C 均值法进行聚类, 挑选同一类料单下的实际生产数据样本进行建模. 本文采用聚类有效性指标———Silhouette 指 标[12]分析聚类结果,确定最佳聚类数. 设 b( i) 为样 本 i 到其他每个类中样本平均距离的最小值,D( i) 为样 本 i 与类内所有其他样本的平均距离,则 Silhouette指标定义为 Sil( i) = b( i) - D( i) max( b( i) ,D( i) ) . ( 4) Silhouette 指标反映了聚类结构的类内紧密性 和类间分离性,可用于评价聚类质量,其值在[- 1, 1]范围内变动,所有样本的平均 Silhouette 指标值越 大表示聚类质量越好,其最大值对应的聚类数为最 佳聚类数. ( 2) 偏最小二乘回归方法与模型主元的确定. 为了研究 p 个自变量 X = { x1,x2,…,xp } ,q 个因变 量 Y = { y1,y2,…,yq } 之间的统计关系,观测了 n 个 样本点. 偏最小二乘建模方法的主要思路是: 在 X 和 Y 中分别提取出主元 t1 和 u1,其中 t1 和 u1 分别 是 x1,x2,…,xp 和 y1,y2,…,yq 的线性组合,并且满 足①t1 和 u1 应尽可能多地携带各自数据表中的变 异信息,②t1 对 u1 具有最强的解释能力[13]. 分别实施 X 和 Y 对 t1 的回归. 若回归方程已满 足精度要求,则算法终止; 否则,利用 X 和 Y 被 t1 解 释后的残余信息进行第二轮主元提取. 如此反复, 直到达到满意精度为止. 然后建立 X 和 Y 对提取的 m 个主元 t1,t2,…,tm 的回归方程,最后还原为 Y 关 于 X 的回归方程[14]. 确定偏最小二乘主元的常用方法是交叉验证 法,其主要思想是: ①将原始的 n 个样本点分成两部 分,即用于回归建模的数据( n - s 个样本点) 和用于 预测校验的数据( s 个样本点) ; ②用 n - s 个样本点 根据给定的偏最小二乘主元数目,建立回归模型,计 算出 s 个样本的预测值,并求出预测误差; ③用抽样 测试的方法重复上述两步,得出总的平均预测误差. 将取得最小平均预测误差情况下的主元数确定为建 立模型的主元数. 2. 2 料单的聚类 料单是现场工程师依据 COREX 炉生产计划和 实际运行情况等制定的原料使用单,上面记录着各 种原料的单耗量和配比情况. 不同的料单会对炉况 造成不同的影响,所以对料单进行聚类,可以间接地 将炉况聚类成若干种炉况类别. 挑选 COREX--1# 炉某两个月生产过程中使用的 282 个料单,选择加入竖炉原料( 龙腾球团矿、萨马 科球团矿、锡兴矿、山西焦和宝钢焦) 和加入熔融气 化炉原料( 平朔煤、兴隆庄煤、大同煤、型煤、山西焦 和宝钢焦) 的单耗值作为聚类的属性,构成了本文 1. 1 节中提到的数据集 X = { x1,x2,…,xn } ∈Rm,其 中 m = 11,n = 282. 利用公式( 1) 、公式( 2) 计算得 到 11 种原料的权重,如表 1 所示. 表 1 各属性熵值法权重结果 Table 1 Weight values of attributes by utilizing the entropy-weighted method 竖炉原料 龙腾球团 萨马科球团 锡兴矿 山西焦 宝钢焦 0. 010 0. 002 0. 007 0. 143 0. 098 气化炉原料 平朔煤 兴隆庄煤 大同煤 型煤 山西焦 宝钢焦 0. 187 0. 002 0. 126 0. 012 0. 044 0. 368 ·1186·
第10期 赵晨熙等:COREX冷煤气成分预测的二步建模方法 ·1187· 利用模糊C均值对282个料单进行聚类,过程 2.3冷煤气成分含量的预测模型 中利用Silhouette指标选取合适的聚类数,如图1所 本文以宝钢COREX-1"炉实际生产数据作为数 示.聚类数选为3时的聚类结果如图2所示 据样本空间,以冷煤气C0,成分含量为预测对象. 0.80 由于从发出料单更改指令到炉内完全使用的是 0.75 该料单的原料需要较长时间,在此期间炉内的原料 0.70 种类是多料单混合的.为了建模的准确性,只考虑 0.65 炉内使用单一料单时刻的生产数据进行建模.由于 0.60 类别A中部分料单使用时间较短,用于建模的生产 0.55 数据不多,因此剔除这部分料单 0.50 根据上述料单聚类的结果,选择C类的某些料 0.45 单下的生产实际数据,数据的采样间隔为l0min,共 聚类数 有215个样本,建立冷煤气成分回归模型 根据实际生产工艺,选择风口氧气压力、风口氧 图1不同聚类数的Silhouette指标 Fig.1 Silhouette indices at different cluster numbers 气单耗、氧气烧嘴单耗、粉尘烧嘴单耗、直接还原铁 的金属化率和拱顶温度作为模型的输入变量;选择 冷煤气C0,含量作为模型的输出变量.从工艺和机 1.0 理角度分析认为,不同金属化率的直接还原铁对于 ◆类别A 08 +类别B 熔融气化炉内的反应会产生很大的影响,但实际生 0.6 o类别C 产中直接还原铁的金属化率无法通过化验实时得 到,本文采用的方法是综合其他变量的信息,用“竖 炉上下煤气中还原性气体成分差”间接地反映直接 0.5 类别B隶属度 101.0080.6a402 还原铁的金属化率. 类别A隶属度 数据样本的统计结果如表2所示 图2料单的聚类结果 根据交叉验证法,取偏最小二乘的主元的数目 Fig.2 Clustering result of burden reports 为3,运用偏最小二乘回归建模得到的回归系数,建 表2样本数据统计结果 Table 2 Statistical results of sample data 输入量 输出量 数据统计 风口氧气 风口氧气 氧气烧嘴 粉尘烧嘴 竖炉上下煤气中还原性 拱顶 冷煤气C02 压力kPa 单耗/m3 单耗/m3 单耗/m3 气体体积分数差/% 温度/℃ 体积分数/% 最大值 619.84 414.02 146.54 92.09 31.02 1096.39 14.90 最小值 566.80 358.50 104.61 0.08 27.35 1029.69 4.96 平均值 583.00 379.36 129.20 23.21 29.30 1063.86 9.42 标准差 10.79 9.82 7.93 19.35 0.93 13.98 2.06 立C类料单下的冷煤气C02含量标准化后数据的回 所示 归模型为 借助回归系数可以分析输入量对输出量的影响 f(c)=0.094P-0.252C+0.262C+ 程度及影响方式。回归系数绝对值越大,表示影响 0.485C.-0.247D-0.314T. (5) 程度越大:反之,回归系数的绝对值越小,则表示影 式中,c为标准化冷煤气CO,含量,P为标准化风 响程度越小) 口氧气压力,C。为标准化风口氧气单耗,C为标准 从回归系数上看:风口氧气压力、氧气烧嘴单耗 化氧气烧嘴单耗,C为标准化粉尘烧嘴单耗,D为 和粉尘烧嘴单耗与冷煤气C02含量呈正相关:风口 标准化还原性气体成分差,T为标准化拱顶温度. 氧气单耗、竖炉上下煤气中还原性气体成分差和拱 回归模型中的复相关系数为0.653,平均相对误差 顶温度与冷煤气C02含量呈负相关.粉尘烧嘴单耗 为11.23%.冷煤气C02含量回归结果图如图3 和拱顶温度对冷煤气C0,含量的影响最大.通过与
第 10 期 赵晨熙等: COREX 冷煤气成分预测的二步建模方法 利用模糊 C 均值对 282 个料单进行聚类,过程 中利用 Silhouette 指标选取合适的聚类数,如图 1 所 示. 聚类数选为 3 时的聚类结果如图 2 所示. 图 1 不同聚类数的 Silhouette 指标 Fig. 1 Silhouette indices at different cluster numbers 图 2 料单的聚类结果 Fig. 2 Clustering result of burden reports 2. 3 冷煤气成分含量的预测模型 本文以宝钢 COREX--1# 炉实际生产数据作为数 据样本空间,以冷煤气 CO2成分含量为预测对象. 由于从发出料单更改指令到炉内完全使用的是 该料单的原料需要较长时间,在此期间炉内的原料 种类是多料单混合的. 为了建模的准确性,只考虑 炉内使用单一料单时刻的生产数据进行建模. 由于 类别 A 中部分料单使用时间较短,用于建模的生产 数据不多,因此剔除这部分料单. 根据上述料单聚类的结果,选择 C 类的某些料 单下的生产实际数据,数据的采样间隔为 10 min,共 有 215 个样本,建立冷煤气成分回归模型. 根据实际生产工艺,选择风口氧气压力、风口氧 气单耗、氧气烧嘴单耗、粉尘烧嘴单耗、直接还原铁 的金属化率和拱顶温度作为模型的输入变量; 选择 冷煤气 CO2含量作为模型的输出变量. 从工艺和机 理角度分析认为,不同金属化率的直接还原铁对于 熔融气化炉内的反应会产生很大的影响,但实际生 产中直接还原铁的金属化率无法通过化验实时得 到,本文采用的方法是综合其他变量的信息,用“竖 炉上下煤气中还原性气体成分差”间接地反映直接 还原铁的金属化率. 数据样本的统计结果如表 2 所示. 根据交叉验证法,取偏最小二乘的主元的数目 为 3,运用偏最小二乘回归建模得到的回归系数,建 表 2 样本数据统计结果 Table 2 Statistical results of sample data 数据统计 输入量 输出量 风口氧气 压力/kPa 风口氧气 单耗/m3 氧气烧嘴 单耗/m3 粉尘烧嘴 单耗/m3 竖炉上下煤气中还原性 气体体积分数差/ % 拱顶 温度/ ℃ 冷煤气 CO2 体积分数/ % 最大值 619. 84 414. 02 146. 54 92. 09 31. 02 1 096. 39 14. 90 最小值 566. 80 358. 50 104. 61 0. 08 27. 35 1 029. 69 4. 96 平均值 583. 00 379. 36 129. 20 23. 21 29. 30 1 063. 86 9. 42 标准差 10. 79 9. 82 7. 93 19. 35 0. 93 13. 98 2. 06 立 C 类料单下的冷煤气 CO2含量标准化后数据的回 归模型为 f( c * ) = 0. 094P* ot - 0. 252C* ot + 0. 262C* ob + 0. 485C* db - 0. 247D* - 0. 314T* . ( 5) 式中,c * 为标准化冷煤气 CO2含量,P* ot 为标准化风 口氧气压力,C* ot 为标准化风口氧气单耗,C* ob为标准 化氧气烧嘴单耗,C* db为标准化粉尘烧嘴单耗,D* 为 标准化还原性气体成分差,T* 为标准化拱顶温度. 回归模型中的复相关系数为 0. 653,平均相对误差 为 11. 23% . 冷 煤 气 CO2 含量回归结果图如图 3 所示. 借助回归系数可以分析输入量对输出量的影响 程度及影响方式. 回归系数绝对值越大,表示影响 程度越大; 反之,回归系数的绝对值越小,则表示影 响程度越小[13]. 从回归系数上看: 风口氧气压力、氧气烧嘴单耗 和粉尘烧嘴单耗与冷煤气 CO2含量呈正相关; 风口 氧气单耗、竖炉上下煤气中还原性气体成分差和拱 顶温度与冷煤气 CO2含量呈负相关. 粉尘烧嘴单耗 和拱顶温度对冷煤气 CO2含量的影响最大. 通过与 ·1187·
·1188 北京科技大学学报 第34卷 利用本文中熵权模糊C均值的方法,对料单进 一训练样本真实值 14 一训练样本预值 行聚类,得到三种料单类别.由于A类料单类别对 应可用于建模的生产数据没有,剔除该类料单类别. 利用其他两类料单类别进行对比实验.样本空间的 选择方式为:①选择B类料单类别数据作为样本空 间:②选择C类料单类别数据作为样本空间:③选 择两类料单类别的全部数据作为样本空间.利用上 述三种样本空间分别建模,模型的精度比较如表3 100 150 200 250 所示. 样本编号 表3使用不同样本建立模型的精度比较 图3冷煤气C02含量回归结果 Table 3 Comparison of precision between models built by different sam- Fig.3 Regression results of CO,content in the cold gas ples 现场工程师交流,现场工程师认为结果符合实际生 训练复 训练相对 训练均方 模型 测定系数 误差/% 根误差 产规律 B类料单模型 0.698 12.20 1.206 为了验证模型的预测能力,进行如下实验:从 215个样本中,随机选取其中70%(150个)的样本 C类料单模型 0.653 11.23 1.229 作为训练样本建立模型,用剩余30%(65个)的样 未分类料单模型 0.587 13.22 1.404 本作为测试样本. 从表3中可以看出,相比料单未分类情况下,对 训练模型和预测模型的平均相对误差分别为 同一类料单下的生产数据进行建模,其复测定系数 11.02%和11.36%.冷煤气C02含量训练模型和预 高,训练相对误差和训练均方根误差均较小. 测模型的结果图分别如图4和图5所示.从图5中 为了进一步验证对料单聚类的必要性,针对生 可以看出,样本的预测值和真实值之间匹配度很好, 产过程中新产生的料单及对应的生产数据,进行不 因此可以说明该模型具有较好预测精度 同预测方式的对比实验.实验步骤如下 16 训练样本真实值 ◆一训练样本预测值 (1)针对一个新的料单,利用距离法判断其的 类别. minDist (i)min l ze-v2. (6) 其中,z为经过加权后的新料单的各种原料单耗 40 60 80100 120 140 160 值,:为第i类的类中心.计算z其与所有类中心 样本编号 的距离,认为该料单属于距离最近的料单类别 图4冷煤气C02含量调练结果 (2)利用前文提到的三种模型分别预测,比较 Fig.4 Training results of CO,content in the cold gas 其预测精度. 通过式(6)计算出新料单属于料单类别B,对该 16 预测样本真实值 14 预测样本预测值 料单使用时对应的42个生产过程数据,分别计算三 个模型的预测结果见表4和图6.从中可以看出:利 0020 用同一类料单类别下的生产数据建立的模型进行预 测的精度高,分别比用不同类料单类别及所有类别 20 40 表4 WFCMPLS与PLS回归模型的预测精度比较 样本编号 Table 4 Comparison of prediction precision between WFCM-PLS and 图5冷煤气C0含量预测结果 PLS Fig.5 Prediction results of CO2 content in the cold gas 模型 预测相对误差/% 预测均方根误差 B类料单 10.39 1.046 2.4料单聚类的效果分析 C类料单模型 50.35 4.184 为了验证对料单聚类的必要性,进行料单聚类 未分类料单模型 12.27 1.246 与否对模型精度影响的对比实验
北 京 科 技 大 学 学 报 第 34 卷 图 3 冷煤气 CO2含量回归结果 Fig. 3 Regression results of CO2 content in the cold gas 现场工程师交流,现场工程师认为结果符合实际生 产规律. 为了验证模型的预测能力,进行如下实验: 从 215 个样本中,随机选取其中 70% ( 150 个) 的样本 作为训练样本建立模型,用剩余 30% ( 65 个) 的样 本作为测试样本. 训练模型和预测模型的平均相对误差分别为 11. 02% 和 11. 36% . 冷煤气 CO2含量训练模型和预 测模型的结果图分别如图 4 和图 5 所示. 从图 5 中 可以看出,样本的预测值和真实值之间匹配度很好, 因此可以说明该模型具有较好预测精度. 图 4 冷煤气 CO2含量训练结果 Fig. 4 Training results of CO2 content in the cold gas 图 5 冷煤气 CO2含量预测结果 Fig. 5 Prediction results of CO2 content in the cold gas 2. 4 料单聚类的效果分析 为了验证对料单聚类的必要性,进行料单聚类 与否对模型精度影响的对比实验. 利用本文中熵权模糊 C 均值的方法,对料单进 行聚类,得到三种料单类别. 由于 A 类料单类别对 应可用于建模的生产数据没有,剔除该类料单类别. 利用其他两类料单类别进行对比实验. 样本空间的 选择方式为: ①选择 B 类料单类别数据作为样本空 间; ②选择 C 类料单类别数据作为样本空间; ③选 择两类料单类别的全部数据作为样本空间. 利用上 述三种样本空间分别建模,模型的精度比较如表 3 所示. 表 3 使用不同样本建立模型的精度比较 Table 3 Comparison of precision between models built by different samples 模型 训练复 测定系数 训练相对 误差/% 训练均方 根误差 B 类料单模型 0. 698 12. 20 1. 206 C 类料单模型 0. 653 11. 23 1. 229 未分类料单模型 0. 587 13. 22 1. 404 从表 3 中可以看出,相比料单未分类情况下,对 同一类料单下的生产数据进行建模,其复测定系数 高,训练相对误差和训练均方根误差均较小. 为了进一步验证对料单聚类的必要性,针对生 产过程中新产生的料单及对应的生产数据,进行不 同预测方式的对比实验. 实验步骤如下. ( 1) 针对一个新的料单,利用距离法判断其的 类别. min i Dist( i) = min i ‖znew - vi‖2 . ( 6) 其中,znew为经过加权后的新料单的各种原料单耗 值,vi 为第 i 类的类中心. 计算 znew其与所有类中心 的距离,认为该料单属于距离最近的料单类别. ( 2) 利用前文提到的三种模型分别预测,比较 其预测精度. 通过式( 6) 计算出新料单属于料单类别 B,对该 料单使用时对应的 42 个生产过程数据,分别计算三 个模型的预测结果见表 4 和图 6. 从中可以看出: 利 用同一类料单类别下的生产数据建立的模型进行预 测的精度高,分别比用不同类料单类别及所有类别 表 4 WFCM-PLS 与 PLS 回归模型的预测精度比较 Table 4 Comparison of prediction precision between WFCM-PLS and PLS 模型 预测相对误差/% 预测均方根误差 B 类料单 10. 39 1. 046 C 类料单模型 50. 35 4. 184 未分类料单模型 12. 27 1. 246 ·1188·
第10期 赵晨熙等:COREX冷煤气成分预测的二步建模方法 ·1189· 料单所对应的生产数据建立模型进行预测的预测相 (李海峰,王臣,邹宗树,等.COREX喷煤模型及应用分析. 对误差小39.96%和1.88%,预测均方根误差小 过程工程学报,2009,9(增刊1):349) B]Liu X G,Zeng J S,Zhao M.Mathematical model and its hybrid 3.138和0.2. dynamic mechanism in intelligent control of ironmaking.ron 一倾测样本真实值 Steel Res Int,2007,14(1)7 16 一+·类别B预测值 4]Xu W R,Guo Y L.Wang C.Analysis of the factors affecting the --类别C预测值 14 未聚类预测值 fuel rate in the COREX process and improvement measures.Baost- eel Tech Res,2011,5(1):45 [5]Prachethan K P,Garg L M,Gupta S S.Modelling of Corex process for optimisation of operational parameters.fronmaking Steelmaking,2006,33(1):29 [6]Barman S C,Mrunmaya K P,Ranjan M.Mathematical model de- velopment of raceway parameters and their effects on Corex process.J Iron Steel Res Int,2011,18(5):20 10 15202530354045 7]Prachethan K P,Dasu A V R P,Ranjan M,et al.Influence of 样本综号 operational parameters on silicon in hot metal from Corex.fron- 图6不同方法预测得到的冷煤气C02含量结果比较 making Steelmaking.2008,35 (2)108 Fig.6 Comparison between the predicted results of cold gas CO []Jia GL Process Calculation and Study on Pulverized Coal produc- content by using different prediction methods tion in COREX Melter Gasifier [Dissertation ]Chongqing: Chongqing University,2007 (贾国利.COREX熔脸气化炉工艺计算及煤粉在炉内燃烧行 3结论 为研究[学位论文].重庆:重庆大学,2007) 本文提出了基于熵权模糊C均值聚类和偏最 9] Fang J,Wang X J,Shi Y,et al.Non Blast Furnace lronmaking 小二乘的COREX冷煤气成分含量预测方法,以宝 Process and Theory.2nd Ed.Beijing:Metallurgical Industry Press,2010 钢COREX-1"炉的实际生产数据为实例,对冷煤气 (方觉,王杏娟,石炎,等.非高炉炼铁工艺与理论.2版.北 C0,含量建立了预测模型.现场数据的实验结果表 京:治金工业出版社,2010) 明:基于熵权模糊C均值聚类和偏最小二乘回归方 [10]Shannon C E.A mathematical theory of communication.Bell Syst 法建立的COREX冷煤气CO,含量预测模型可以较 TehJ,1948,27:379 好地预测出实际的C02含量,为冷煤气成分含量的 1]Berdek JC.Pattern Recognition with Fuy Objectire Function Al- gorithms.Norwell:Kluwer Academic Publishers,1981 控制提供了有效的分析手段. [12]Kaufman L.Rousseeuw P J.Finding Groups in Data:an Intro- duction to Cluster Analysis.Wiley Online Library,1990 参考文献 [13]Wang H W,Wu Z B,Meng J.Partial least-squares regression linear and nonlinear methods.Beijing:National Defence Industry [Wu K,Zhang E H.Wan P,et al.Consideration of the theoretical Pres5,2006 combustion temperature formula before tuyere in melting gasifier at (王惠文,吴载斌,孟洁.偏最小二乘回归的线性与非线性 COREX process.J China Coal Soc,2010,35(10):1730 方法.北京:国防工业出版社,2006) (吴铿,张二华,万鹏,等.关于COREX流程熔融气化炉风口 41 Zhang JC,Wu C.Non-inear prediction model for coke thermal 前理论燃烧温度的思考.煤炭学报,2010,35(10):1730) properties based on partial least squares regression.J Cent South Li H F,Wang C,Zou Z S,et al.Coal injection model for Unir Sci Technol,2011,42(5):1406 COREX and its application analysis.Process Eng,2009,9 (张进春,吴超.基于偏最小二乘回归的焦炭热性质非线性 (Suppl 1):349 预测模型.中南大学学报:自然科学版,2011,42(5):1406)
第 10 期 赵晨熙等: COREX 冷煤气成分预测的二步建模方法 料单所对应的生产数据建立模型进行预测的预测相 对误 差 小 39. 96% 和 1. 88% ,预 测 均 方 根 误 差 小 3. 138 和 0. 2. 图 6 不同方法预测得到的冷煤气 CO2含量结果比较 Fig. 6 Comparison between the predicted results of cold gas CO2 content by using different prediction methods 3 结论 本文提出了基于熵权模糊 C 均值聚类和偏最 小二乘的 COREX 冷煤气成分含量预测方法,以宝 钢 COREX--1# 炉的实际生产数据为实例,对冷煤气 CO2含量建立了预测模型. 现场数据的实验结果表 明: 基于熵权模糊 C 均值聚类和偏最小二乘回归方 法建立的 COREX 冷煤气 CO2含量预测模型可以较 好地预测出实际的 CO2含量,为冷煤气成分含量的 控制提供了有效的分析手段. 参 考 文 献 [1] Wu K,Zhang E H,Wan P,et al. Consideration of the theoretical combustion temperature formula before tuyere in melting gasifier at COREX process. J China Coal Soc,2010,35( 10) : 1730 ( 吴铿,张二华,万鹏,等. 关于 COREX 流程熔融气化炉风口 前理论燃烧温度的思考. 煤炭学报,2010,35( 10) : 1730) [2] Li H F,Wang C,Zou Z S,et al. Coal injection model for COREX and its application analysis. J Process Eng,2009,9 ( Suppl 1) : 349 ( 李海峰,王臣,邹宗树,等. COREX 喷煤模型及应用分析. 过程工程学报,2009,9( 增刊 1) : 349) [3] Liu X G,Zeng J S,Zhao M. Mathematical model and its hybrid dynamic mechanism in intelligent control of ironmaking. J Iron Steel Res Int,2007,14( 1) : 7 [4] Xu W R,Guo Y L,Wang C. Analysis of the factors affecting the fuel rate in the COREX process and improvement measures. Baosteel Tech Res,2011,5( 1) : 45 [5] Prachethan K P,Garg L M,Gupta S S. Modelling of Corex process for optimisation of operational parameters. Ironmaking Steelmaking,2006,33( 1) : 29 [6] Barman S C,Mrunmaya K P,Ranjan M. Mathematical model development of raceway parameters and their effects on Corex process. J Iron Steel Res Int,2011,18( 5) : 20 [7] Prachethan K P,Dasu A V R P,Ranjan M,et al. Influence of operational parameters on silicon in hot metal from Corex. Ironmaking Steelmaking,2008,35( 2) : 108 [8] Jia G L. Process Calculation and Study on Pulverized Coal production in COREX Melter Gasifier [Dissertation]. Chongqing: Chongqing University,2007 ( 贾国利. COREX 熔融气化炉工艺计算及煤粉在炉内燃烧行 为研究[学位论文]. 重庆: 重庆大学,2007) [9] Fang J,Wang X J,Shi Y,et al. Non Blast Furnace Ironmaking Process and Theory. 2nd Ed. Beijing: Metallurgical Industry Press,2010 ( 方觉,王杏娟,石炎,等. 非高炉炼铁工艺与理论. 2 版. 北 京: 冶金工业出版社,2010) [10] Shannon C E. A mathematical theory of communication. Bell Syst Tech J,1948,27: 379 [11] Bezdek J C. Pattern Recognition with Fuzzy Objective Function Algorithms. Norwell: Kluwer Academic Publishers,1981 [12] Kaufman L,Rousseeuw P J. Finding Groups in Data: an Introduction to Cluster Analysis. Wiley Online Library,1990 [13] Wang H W,Wu Z B,Meng J. Partial least-squares regression: linear and nonlinear methods. Beijing: National Defence Industry Press,2006 ( 王惠文,吴载斌,孟洁. 偏最小二乘回归的线性与非线性 方法. 北京: 国防工业出版社,2006) [14] Zhang J C,Wu C. Non-linear prediction model for coke thermal properties based on partial least squares regression. J Cent South Univ Sci Technol,2011,42( 5) : 1406 ( 张进春,吴超. 基于偏最小二乘回归的焦炭热性质非线性 预测模型. 中南大学学报: 自然科学版,2011,42( 5) : 1406) ·1189·