第10期 赵晨熙等:COREX冷煤气成分预测的二步建模方法 ·1185· 描述这些变量关系的统计数学模型.Prachethan 等团利用回归分析的方法预测COREX铁水中Si 其中,P= xg'k=1/nn,若P=0,则 含量 Pilnpi=0. 熔融气化炉是一个气一固一液三相高温复杂反 定义第j个属性的权重为 应的容器,在COREX熔融还原炼铁工艺过程中起 0=8 gj=1,2,…,m (2) 着非常重要的作用,主要完成燃煤造气和海绵铁熔 化,熔剂分解、熔化,生铁脱硫、渗碳,造渣和渣铁分 其中,g=1-er 离等反应网.在熔融气化炉中形成的煤气自炉顶排 由式(2)得到各属性的权重,W={0102,…, 出后兑入冷煤气通入热旋风除尘器进行粗除尘.粗 0m}.对于给定的j,x的差异越小,则g越小,说明 除尘后的半净煤气分为两路:一路作为还原气送往 该属性在聚类中提供区分的有用信息少;x:的差异 还原竖炉:另一路经进一步清洗形成冷煤气.还原 越大,则g:越大,说明该属性在聚类中提供区分的 气进入竖炉后向上流动,对矿石进行还原,然后自竖 有用信息多,应重点考察该属性 炉炉顶排出 为消除不同属性间量纲不一致的影响,对原始 熔融气化炉的冷煤气中主要含有C0、C0,和H2 数据X进行标准化处理,即对原始数据减去均值后 等,影响冷煤气成分含量的因素众多,除煤和焦炭的 再除以数据的标准差,保证处理后的每一个变量的 组成外还有吹入熔融气化炉的氧气量、氧气压力、拱 数据均值为0,方差为1.对标准化后的数据X进 顶温度和海绵铁的金属化率等,它们对冷煤气成分 行加权,得到加权后的数据矩阵Z=WX. 含量的影响是一个多因素的复杂过程.找出这些参 1.2模糊C均值聚类方法 数与冷煤气成分含量之间的关系,对生产过程有重 不同料单的原料使用种类、使用量不同,导致产 要的指导价值. 生不同的炉况,而在不同炉况下各参数对冷煤气成 从我们前期的研究发现:原料配比情况是影响 分含量的影响关系是波动变化的.在确定各种原料 炉况的重要因素之一,不同比例的原料配比会产生 权重的基础上,本文采用模糊C均值聚类方法对料 不同的炉况,而不同炉况下各参数对冷煤气成分含 单进行聚类,将其聚成若干种料单类别. 量的影响关系是波动变化的.本文将熵权模糊C均 模糊C均值(fuz四C-mean,FCM)算法是由 值(weighted fuzzy C-means,WFCM)的方法用于对 Bezdek提出的,它是基于模糊集合理论,并把聚 料单的聚类,为每个料单样本赋予一个属于某种料 类归结成一个带约束的非线性规划问题,通过迭代 单类别的隶属度,之后对不同类别的料单,利用偏最 优化求解获得数据集的模糊划分和聚类结果 小二乘(partial least square,PLS)方法分别建立冷 对于加权后的数据集Z={a122,…,zn}∈R, 煤气成分预测模型. 令ut表示第k个样本属于第i类的隶属度,以表示 每个给定样本属于各个类的程度.“的取值范围为 1基于熵权模糊C均值的聚类方法 D,1],并且一个样本的隶属度之和为1.模糊C均 1.1熵值法确定属性的权重 值算法在迭代寻优过程中,不断更新各类的中心和 由于料单中不同属性对聚类的重要性不同,因 隶属度矩阵各元素的值,其目标函数为 此需要采用各个属性权重的选取方法.本文采用熵 J(U,C1,c2,…,c)= uad 权法来确定料单中各种属性的权重. 信息熵是从平均意义上表征信源总体信息测度 (3) 的一个量,同时又是信源输出信息的不确定性和事 其中:c为聚类数目;d4=川:-4‖为第i个聚类中 件发生随机性的量度0,其对于系统内在信息具有 心与第k个样本点间的欧氏距离,V={,2,…,} 较强的刻画能力,所以可以用信息熵来衡量携带信 表示每个类的聚类中心;m是加权指数,通常选取m 息量的多少 为2.聚类准则为求J(U,C)的极小值. 对于给定的数据集X={x1,x2,,xn}∈R",m 2 COREX冷煤气成分含量预测 为属性个数,n为观测样本个数,则第j项属性的熵 值为 冷煤气成分含量是COREX炉反应性、稳定性 的重要指标,其对于正常生产有很大的影响,是现场 g=-k∑ 1 工程师监测炉况是否正常的重要指标之一.C02成第 10 期 赵晨熙等: COREX 冷煤气成分预测的二步建模方法 描述这 些 变 量 关 系 的 统 计 数 学 模 型. Prachethan 等[7]利用回归分析的方法预测 COREX 铁水中 Si 含量. 熔融气化炉是一个气--固--液三相高温复杂反 应的容器,在 COREX 熔融还原炼铁工艺过程中起 着非常重要的作用,主要完成燃煤造气和海绵铁熔 化,熔剂分解、熔化,生铁脱硫、渗碳,造渣和渣铁分 离等反应[8]. 在熔融气化炉中形成的煤气自炉顶排 出后兑入冷煤气通入热旋风除尘器进行粗除尘. 粗 除尘后的半净煤气分为两路: 一路作为还原气送往 还原竖炉; 另一路经进一步清洗形成冷煤气. 还原 气进入竖炉后向上流动,对矿石进行还原,然后自竖 炉炉顶排出[9]. 熔融气化炉的冷煤气中主要含有 CO、CO2和 H2 等,影响冷煤气成分含量的因素众多,除煤和焦炭的 组成外还有吹入熔融气化炉的氧气量、氧气压力、拱 顶温度和海绵铁的金属化率等,它们对冷煤气成分 含量的影响是一个多因素的复杂过程. 找出这些参 数与冷煤气成分含量之间的关系,对生产过程有重 要的指导价值. 从我们前期的研究发现: 原料配比情况是影响 炉况的重要因素之一,不同比例的原料配比会产生 不同的炉况,而不同炉况下各参数对冷煤气成分含 量的影响关系是波动变化的. 本文将熵权模糊 C 均 值( weighted fuzzy C-means,WFCM) 的方法用于对 料单的聚类,为每个料单样本赋予一个属于某种料 单类别的隶属度,之后对不同类别的料单,利用偏最 小二乘( partial least square,PLS) 方法分别建立冷 煤气成分预测模型. 1 基于熵权模糊 C 均值的聚类方法 1. 1 熵值法确定属性的权重 由于料单中不同属性对聚类的重要性不同,因 此需要采用各个属性权重的选取方法. 本文采用熵 权法来确定料单中各种属性的权重. 信息熵是从平均意义上表征信源总体信息测度 的一个量,同时又是信源输出信息的不确定性和事 件发生随机性的量度[10],其对于系统内在信息具有 较强的刻画能力,所以可以用信息熵来衡量携带信 息量的多少. 对于给定的数据集 X = { x1,x2,…,xn } ∈Rm,m 为属性个数,n 为观测样本个数,则第 j 项属性的熵 值为 ej = - k ∑ n i = 1 pij lnpij . ( 1) 其 中,pij = xij ∑ n i = 1 xij ,k = 1 /lnn,若 pij = 0,则 pij lnpij = 0. 定义第 j 个属性的权重为 wj = gj ∑ m i = 1 gi,j = 1,2,…,m. ( 2) 其中,gj = 1 - ej . 由式( 2) 得到各属性的权重,W = { w1,w2,…, wm } . 对于给定的 j,xij的差异越小,则 gj 越小,说明 该属性在聚类中提供区分的有用信息少; xij的差异 越大,则 gj 越大,说明该属性在聚类中提供区分的 有用信息多,应重点考察该属性. 为消除不同属性间量纲不一致的影响,对原始 数据 X 进行标准化处理,即对原始数据减去均值后 再除以数据的标准差,保证处理后的每一个变量的 数据均值为 0,方差为 1. 对标准化后的数据 X* 进 行加权,得到加权后的数据矩阵 Z = WX* . 1. 2 模糊 C 均值聚类方法 不同料单的原料使用种类、使用量不同,导致产 生不同的炉况,而在不同炉况下各参数对冷煤气成 分含量的影响关系是波动变化的. 在确定各种原料 权重的基础上,本文采用模糊 C 均值聚类方法对料 单进行聚类,将其聚成若干种料单类别. 模糊 C 均 值 ( fuzzy C-mean,FCM) 算 法 是 由 Bezdek [11]提出的,它是基于模糊集合理论,并把聚 类归结成一个带约束的非线性规划问题,通过迭代 优化求解获得数据集的模糊划分和聚类结果. 对于加权后的数据集 Z = { z1,z2,…,zn } ∈Rm, 令 uik表示第 k 个样本属于第 i 类的隶属度,以表示 每个给定样本属于各个类的程度. uik的取值范围为 [0,1],并且一个样本的隶属度之和为 1. 模糊 C 均 值算法在迭代寻优过程中,不断更新各类的中心和 隶属度矩阵各元素的值,其目标函数为 J( U,c1,c2,…,cc) = ∑ c i = 1 Ji = ∑ c i = 1 ∑ n k = 1 um ikd2 ik . ( 3) 其中: c 为聚类数目; dik = ‖vi - zk‖为第 i 个聚类中 心与第 k 个样本点间的欧氏距离,V = { v1,v2,…,vc} 表示每个类的聚类中心; m 是加权指数,通常选取 m 为 2. 聚类准则为求 J( U,C) 的极小值. 2 COREX 冷煤气成分含量预测 冷煤气成分含量是 COREX 炉反应性、稳定性 的重要指标,其对于正常生产有很大的影响,是现场 工程师监测炉况是否正常的重要指标之一. CO2成 ·1185·