D0I:10.13374/1.issnl00I103.2008.05.026 第30卷第5期 北京科技大学学报 Vol.30 No.5 2008年5月 Journal of University of Science and Technology Beijing May 2008 多维时序模糊关联规则在高炉炉温预报中的应用 国宏伟)高学东) 陈令坤) 杨天钓) 1)北京科技大学治金与生态工程学院,北京1000832)北京科技大学经济与管理学院,北京100083 3)武汉钢铁集团公司,武汉430083 摘要根据目前高炉炉温预报推理规则都是由高炉专家根据经验制定的情况,提出了一种新的规则生成方法一数据挖 掘获取高炉炉温预报关联规则·针对现有挖掘算法的不足,提出了一种改进的多维时间序列模糊关联规则挖掘算法,该算法 基于时间子序列和子序列间隔的双重模糊化,避免了挖掘结果“时间边界锐化”的问题,该算法应用于武钢的1高炉,挖掘效 果良好 关键词高炉:专家系统;炉温预报;模糊关联规则:时间序列 分类号TF543.1:TP311.13 Application of multidimensional time series fuzzy association rules for hot metal temperature forecasting in a blast furnace GUO Honguei,GAO Xuedong?,CHEN Lingkun.YA NG Tianjun 1)School of Metallurgical and Ecological Engineering,University of Science and Technology Beijing.Beijing 100083.China 2)School of Economies and Management.University of Science and Technology Beijing.Beijing 100083.China 3)Wuhan Iron and Steel Group Corporation.Wuhan 430083.China ABSTRACT Confronted by the present state that the rules for hot metal temperature forecasting are made merely on the base of the experience of blast furnace(BF)experts.a new approach to the rules established through association rules mining from BF data was put forward.The algorithm of multidimensional time series rules mining was improved.The improved algorithm,which bases on the fuzziness of both subsequence and subsequence interval.avoids the influence of "time border sharpness"on the result of mining.The algorithm was applied to No.I BF at Wuhan Iron and Steel Group Corporation,and its effects turned out to be satisfactory. KEY WORDS blast furnace (BF):expert system:hot metal temperature forecast:fuzzy association rules:time series 保持合理的炉温是高炉生产稳定运行的关键因 够从大量的数据中智能地、自动地抽取出有价值的 素之一,由于高炉的参数及其控制操作之间具有黑 信息[].本文提出一种新的炉温预报规则制定方 箱和时间滞后的特点,正确对高炉的炉温预报,提前 法,该方法是结合专家知识,对高炉数据进行关联规 采取措施,一直都是高炉研究者希望解决的问 则挖掘,并对挖掘出的规则进行专家评价,选择有价 题山.目前,研究高炉炉温预报的主要方法有时间 值的规则 序列模型)、神经网络3可和专家系统,其中专家 考虑到高炉的数据是多维时间序列的特点,本 系统的方法因为具有推理透明、结果可解释的特点, 文采用多维时间序列模糊关联规则挖掘方法。但是 逐渐被越来越多的人采用, 目前对于多维时间序列模糊关联规则挖掘算法的研 高炉炉温预报专家系统的核心推理规则是根据 究],只是基于时间子序列的模糊化,虽然避免 专家经验制定的,数据挖掘技术是随着计算机的广 了子序列模式的“边界锐化”,却没有考虑时间“边界 泛应用与数据的大量积累而快速发展起来的,它能 锐化”·本文借鉴前人研究)的基础上,提出了一种 收稿日期:2007-03-15修回日期:2007-05-27 改进的多维时间序列模糊关联规则挖掘算法,该改 基金项目:国家经济贸易委员会资助项目(N。.02BK一108) 进算法是基于时间子序列和子序列间隔的双重模糊 作者简介:国宏伟(1978一),男,讲师,博士, 化,从而彻底避免了挖掘结果“时间边界锐化”的 E-mail:ghwvip@gmail.com 问题
多维时序模糊关联规则在高炉炉温预报中的应用 国宏伟1) 高学东2) 陈令坤3) 杨天钧1) 1) 北京科技大学冶金与生态工程学院北京100083 2) 北京科技大学经济与管理学院北京100083 3) 武汉钢铁集团公司武汉430083 摘 要 根据目前高炉炉温预报推理规则都是由高炉专家根据经验制定的情况提出了一种新的规则生成方法———数据挖 掘获取高炉炉温预报关联规则.针对现有挖掘算法的不足提出了一种改进的多维时间序列模糊关联规则挖掘算法该算法 基于时间子序列和子序列间隔的双重模糊化避免了挖掘结果“时间边界锐化”的问题.该算法应用于武钢的1#高炉挖掘效 果良好. 关键词 高炉;专家系统;炉温预报;模糊关联规则;时间序列 分类号 TF543.1;TP311.13 Application of multidimensional time series fuzzy association rules for hot metal temperature forecasting in a blast furnace GUO Hongwei 1)GA O Xuedong 2)CHEN Lingkun 3)Y A NG Tianjun 1) 1) School of Metallurgical and Ecological EngineeringUniversity of Science and Technology BeijingBeijing100083China 2) School of Economics and ManagementUniversity of Science and Technology BeijingBeijing100083China 3) Wuhan Iron and Steel Group CorporationWuhan430083China ABSTRACT Confronted by the present state that the rules for hot metal temperature forecasting are made merely on the base of the experience of blast furnace (BF) expertsa new approach to the rules established through association rules mining from BF data was put forward.T he algorithm of multidimensional time series rules mining was improved.T he improved algorithmwhich bases on the fuzziness of both subsequence and subsequence intervalavoids the influence of “time border sharpness” on the result of mining.T he algorithm was applied to No.1BF at Wuhan Iron and Steel Group Corporationand its effects turned out to be satisfactory. KEY WORDS blast furnace (BF);expert system;hot metal temperature forecast;fuzzy association rules;time series 收稿日期:2007-03-15 修回日期:2007-05-27 基金项目:国家经济贸易委员会资助项目(No.02BK—101—8) 作者简介:国宏伟(1978—)男讲师博士 E-mail:ghwvip@gmail.com 保持合理的炉温是高炉生产稳定运行的关键因 素之一.由于高炉的参数及其控制操作之间具有黑 箱和时间滞后的特点正确对高炉的炉温预报提前 采取措施一直都是高炉研究者希望解决的问 题[1].目前研究高炉炉温预报的主要方法有时间 序列模型[2]、神经网络[3—5] 和专家系统.其中专家 系统的方法因为具有推理透明、结果可解释的特点 逐渐被越来越多的人采用. 高炉炉温预报专家系统的核心推理规则是根据 专家经验制定的.数据挖掘技术是随着计算机的广 泛应用与数据的大量积累而快速发展起来的它能 够从大量的数据中智能地、自动地抽取出有价值的 信息[6].本文提出一种新的炉温预报规则制定方 法该方法是结合专家知识对高炉数据进行关联规 则挖掘并对挖掘出的规则进行专家评价选择有价 值的规则. 考虑到高炉的数据是多维时间序列的特点本 文采用多维时间序列模糊关联规则挖掘方法.但是 目前对于多维时间序列模糊关联规则挖掘算法的研 究[7—9]只是基于时间子序列的模糊化.虽然避免 了子序列模式的“边界锐化”却没有考虑时间“边界 锐化”.本文借鉴前人研究[9]的基础上提出了一种 改进的多维时间序列模糊关联规则挖掘算法该改 进算法是基于时间子序列和子序列间隔的双重模糊 化从而彻底避免了挖掘结果“时间边界锐化” 的 问题. 第30卷 第5期 2008年 5月 北 京 科 技 大 学 学 报 Journal of University of Science and Technology Beijing Vol.30No.5 May2008 DOI:10.13374/j.issn1001-053x.2008.05.026
,554 北京科技大学学报 第30卷 时间序列是一个不规则时间序列,需要按照前面七 1变量选取 个变量的序列步长转化为标准时间序列.转化的原 充分利用专家的知识选择合适的变量组,能够 则是:对于空值点用零值代替,对非空值点用近邻值 提高挖掘的速度和改善挖掘的结果,本文根据专家 代替. 和现场工作者长期的高炉工作经验,选择了一组与 高炉炉温预报相关的变量。对这些变量的时间序列 2变量的模糊离散化 数据组成的数据库,进行多维时间序列模糊关联规 在关联规则挖掘之前,首先需要对选择变量的 则挖掘,从而找出这些变量和炉温在时间序列上的 时间序列进行离散化处理.这里并非将时间序列形 关系,这些挖掘出的关系也就是关联规则,经过专 态进行确定性归类,而是能将每一个局部序列依据 家评估选择后,加入推理系统的规则库,选取的变 模糊原理归入到某代表形态中,从而避免“边界锐 量有以下八个[0山. 化”,文献[9]的算法只考虑了子序列的模糊离散 (1)炉热指数DQ,代表高炉下部区域的热状 化,这样会使挖掘结果“时间边界锐化”.本文对时 态,可以通过高炉下部区域动态热平衡计算得到, 间子序列和子序列间隔都进行了模糊离散化处理, 以900℃为基准,按下式进行计算: (1)子序列的模糊离散化,分为四步: DQ=Q1+Q2一(Q3+Q4十Q5+Q6) ①设s=(x1,x2,…,xN)为一时间序列,将一 其中,Q1为热风带入的有效热量,Q2为风口前碳 宽度为心的时间窗作用于s形成一长度为w的子 素燃烧热量,Q3为鼓风中水汽分解热,Q4为碳素 序列s=(x:,x+1,…,x十如-1),将时间窗在时间序 溶损反应热量,Q5为炉子下部冷却器壁带走的热 列s上从始点至终点进行单步滑移,形成一系列宽 量,Q6为煤粉分解热 度为0的子序列x1,x2…,xN-0+1,记 (2)上部渣皮指数TIS,能够代表上部渣皮的 0(s,0)=s=1,2,…,N-D+1} 形成、脱落或者气流形成的规模,可以通过冷却壁 为由该时间序列s用宽度心的滑窗滑出的子序列 (10~14段)的热电偶温度值的变化阚值计算得到. 集合 (3)中部渣皮指数MIS,通过冷却壁(8~10 ②将D(s,D)看作D维欧氏空间中的N一w十 段)的热电偶温度值的变化阚值计算得到 1个点,并将他们随机地分到k类中,计算每类中 (4)下部渣皮指数BIS,通过冷却壁(5~7段) 心,即第j类的中心第l坐标为: 的热电偶温度值的变化阚值计算得到, (5)熔损反应碳消耗SLC,用于计算熔损反应 1=方合0,1=1,2…,0j=1,2,k 碳的消耗量 (1) (6)炉顶煤气C0含量的变化,C0的增加标志 ③以这些中心作为每类的代表点,计算集合 着高炉热量水平高,因为过多的焦炭燃烧导致热量 W(,m)中每元素s:属第j类代表点的隶属度函数 过多,同时燃烧区产生的C0含量增加 (s): (7)下料速度MV,能够表现高炉原料下料的 b-1 速度.当下料速度变快时,预热和反应不充分,从而 Si 导致下部区域的温度下降,出炉铁水温度下降 4(s)= L,j=1,2,…,k:b>1 6- (⑧)铁水的温度值,上一次铁水的温度值 PHMT是炉温预报推理的基准值,其代表上一个阶 (2) 段炉温的水平.本次铁水的温度值HMT,也就是预 其中,b>1是一个可以控制聚类结果的模糊程度的 报系统推理的结果, 常数,s一x2表示每一点到第j类代表点距离的 关联规则挖掘的目的就是寻求HMT与DQ、 平方 TIS、MIS、BIS、SLC、CO含量、MV和PHMT在时 ④用当前的隶属度函数更新计算各类中心: 间序列上的关系,虽然本系统选取的推理前件只有 八个变量,但基本上含盖了前人研究)中的所有变 ur 产、 =1 量,并且基于八个变量制定的规则比直接考虑众多 中 ,j=1,2,…,k;l=1,2,…0 变量制定的规则更加简单、实用及有效, 音[巧()]6 推理的结果是本次铁水的温度值,铁水温度的 (3)
1 变量选取 充分利用专家的知识选择合适的变量组能够 提高挖掘的速度和改善挖掘的结果.本文根据专家 和现场工作者长期的高炉工作经验选择了一组与 高炉炉温预报相关的变量.对这些变量的时间序列 数据组成的数据库进行多维时间序列模糊关联规 则挖掘从而找出这些变量和炉温在时间序列上的 关系.这些挖掘出的关系也就是关联规则经过专 家评估选择后加入推理系统的规则库.选取的变 量有以下八个[10—11]. (1)炉热指数 DQ.代表高炉下部区域的热状 态可以通过高炉下部区域动态热平衡计算得到. 以900℃为基准按下式进行计算: DQ= Q1+ Q2—( Q3+ Q4+ Q5+ Q6). 其中Q1 为热风带入的有效热量Q2 为风口前碳 素燃烧热量Q3 为鼓风中水汽分解热Q4 为碳素 溶损反应热量Q5 为炉子下部冷却器壁带走的热 量Q6 为煤粉分解热. (2)上部渣皮指数 TIS.能够代表上部渣皮的 形成、脱落或者气流形成的规模可以通过冷却壁 (10~14段)的热电偶温度值的变化阚值计算得到. (3)中部渣皮指数 MIS.通过冷却壁(8~10 段)的热电偶温度值的变化阚值计算得到. (4)下部渣皮指数 BIS.通过冷却壁(5~7段) 的热电偶温度值的变化阚值计算得到. (5)熔损反应碳消耗 SLC.用于计算熔损反应 碳的消耗量. (6)炉顶煤气 CO 含量的变化.CO 的增加标志 着高炉热量水平高因为过多的焦炭燃烧导致热量 过多同时燃烧区产生的 CO 含量增加. (7)下料速度 MV.能够表现高炉原料下料的 速度.当下料速度变快时预热和反应不充分从而 导致下部区域的温度下降出炉铁水温度下降. (8) 铁 水 的 温 度 值.上 一 次 铁 水 的 温 度 值 PHMT 是炉温预报推理的基准值其代表上一个阶 段炉温的水平.本次铁水的温度值 HMT也就是预 报系统推理的结果. 关联规则挖掘的目的就是寻求 HMT 与 DQ、 TIS、MIS、BIS、SLC、CO 含量、MV 和 PHMT 在时 间序列上的关系.虽然本系统选取的推理前件只有 八个变量但基本上含盖了前人研究[9]中的所有变 量并且基于八个变量制定的规则比直接考虑众多 变量制定的规则更加简单、实用及有效. 推理的结果是本次铁水的温度值.铁水温度的 时间序列是一个不规则时间序列需要按照前面七 个变量的序列步长转化为标准时间序列.转化的原 则是:对于空值点用零值代替对非空值点用近邻值 代替. 2 变量的模糊离散化 在关联规则挖掘之前首先需要对选择变量的 时间序列进行离散化处理.这里并非将时间序列形 态进行确定性归类而是能将每一个局部序列依据 模糊原理归入到某代表形态中从而避免“边界锐 化”.文献[9]的算法只考虑了子序列的模糊离散 化这样会使挖掘结果“时间边界锐化”.本文对时 间子序列和子序列间隔都进行了模糊离散化处理. (1)子序列的模糊离散化.分为四步: ①设 s=( x1x2…x N)为一时间序列将一 宽度为 w 的时间窗作用于 s 形成一长度为 w 的子 序列 si=( xixi+1…xi+ w—1)将时间窗在时间序 列 s 上从始点至终点进行单步滑移形成一系列宽 度为 w 的子序列 x1x2…x N— w+1记 w( sw)={si|i=12…N— w+1} 为由该时间序列 s 用宽度 w 的滑窗滑出的子序列 集合. ②将 w(sw)看作 w 维欧氏空间中的 N— w+ 1个点并将他们随机地分到 k 类中计算每类中 心即第 j 类的中心第 l 坐标为: xjl= 1 h ∑ h i=1 xjlil=12…w;j=12…k (1) ③以这些中心作为每类的代表点计算集合 W( sw)中每元素 si 属第 j 类代表点的隶属度函数 μj( si): μj( si)= 1 |si - xj|2 1 b-1 ∑ k c=1 1 |si - xc|2 1 b-1 j=12…k;b>1 (2) 其中b>1是一个可以控制聚类结果的模糊程度的 常数|si— xj|2 表示每一点到第 j 类代表点距离的 平方. ④用当前的隶属度函数更新计算各类中心: xjl= ∑ N-w+1 i=1 [μj(si)] b xjli ∑ N-w+1 i=1 [μj(si)] b j=12…k;l=12… w (3) ·554· 北 京 科 技 大 学 学 报 第30卷
第5期 国宏伟等:多维时序模糊关联规则在高炉炉温预报中的应用 .555. 重复以上步骤③、④的计算,直到各个样本的隶 (A,∧T2AA2AT2,N…NAAT$-A…Λ 属度稳定,并且将代表点集合记作D={x1,x2, A价ΛT-B. …,x},其中x表示第j个代表点,每个变量的时 间序列离散的类数k可以不同,在高炉炉温规则挖 其钟A∈D,DP∈{D,D2,…,Dm,k=1,2, 掘中,炉热指数和铁水温度的k都为7,其余变量的 …,h,B∈D,p2k表示子集代表形态的序号,对于 k都取5. i,j=1,2,…,h和≠j,有D∩D=0 (2)子序列间隔模糊离散化,前人的研究在对 规则前件“如果当T,时A,发生,当T,时 变量序列离散模糊处理后,就直接进行数据挖掘, A后,发生,…,当T-时A发生,…,当 本文考虑了“时间边界锐化”的问题,对时间序列的 T2-时A2发生”发生的频数定义为: 序列间隔也进行模糊化的处理,首先选择三角型模 F(A2ATAA2nNTA…ΛA2N 糊器: T-N.ΛA2AT-i)= 1- lt-u<Ci n(t)= C (4) (5) 0, 其他 空u(Aar(-TAN( 用r,(t)表示隶属函数的值,其中t为序列间 隔时间(如果是子序列的序号差,需要乘序列步长时 Ne(b)=户a()Au(i-Tm)M 间,进行转换),将时间序列间隔的模糊代表点集合 NE(6+1) (6) 记作Q=T1,T2,,Tr,其中T:代表第i种时 其中b=h时, 间序列间隔状态,∫表示时间序列间隔的状态的种 数.本文中令t1=0.875,c1=0.625,t2=1.5, Ne(A)=产ga()A听-(-Tm)( c2=0.25,t3=1.825,c3=0.325,t4=2.625, 其中,Tr是序列s在T吃k-1间隔B的子序列编号. c4=0.625,t5=3.625,c5=0.625. 由于高炉出铁间隔时间大概在1~2h,配合式(5)的 序列间隔模糊隶属函数的参数设置,保证了TT的 3多维时间序列模糊关联规则挖掘算法 唯一性 模糊规则(A,AT,AA.AT,A…AAA 由于对时间子序列和子序列间隔都进行了模糊 离散化处理,模糊关联规则的频数和置信度的计算 T2-1A…ΛAAT2-)PB的可信度为: 也有所变化,因此给出了频数和置信度的计算公式 c(AAT,AA.AT3,A…AAA 以及模糊关联规则挖掘的算法, T片-人…AAaΛT-i)PB)= (1)频数和置信度的计算.对于m个变量的时 F(A,ATA…AA2AT2-NB) 间序列,经过滑窗处理后得到子序列集合:· F(A.AT,N…AA2.NT-) (8) W(s,0)={s=1,2,,(N-w+1), h=1,2,…,m. 其中F(A2NT,A…AAAT$-N…ΛA2Λ 对W(s,w)中的m个子集{=1,2,…,(N一 T2-1AB)为规则发生的频数,可以通过下式计算 0十1)l,h=1,2,,m均用模糊离散化方法处理 得到: 后,则每个子集均得到个代表形态和该集中各个 F(A,T,AA.AT,N…Λ 子序列到该集各个代表形态的隶属度,每个子集的 AN…ΛA21T2-AB)= 代表点集合记作D=A,A经,…,A,},h=1,2, )(9) ,m,其中A表示第h个子集的第j个代表形态 (A(-T)AT( Q={T,T吃,…,T{,h=1,2,…,m,T代表第h 子集与推理结果(HMT)子集的时间间隔的第j个 T8)gg(-i-mA6+) 模糊形态, (10) 定义模糊关联规则的形式为:如果当T,时 其中b=h时, A,发生,当T,时A,发生,…,当T2-时A2 T=g(-mA) 发生,…,当T-时A2发生,则B发生·记作 (11)
重复以上步骤③、④的计算直到各个样本的隶 属度稳定.并且将代表点集合记作 D={x1x2 …xk}其中 xj 表示第 j 个代表点.每个变量的时 间序列离散的类数 k 可以不同在高炉炉温规则挖 掘中炉热指数和铁水温度的 k 都为7其余变量的 k 都取5. (2)子序列间隔模糊离散化.前人的研究在对 变量序列离散模糊处理后就直接进行数据挖掘. 本文考虑了“时间边界锐化”的问题对时间序列的 序列间隔也进行模糊化的处理.首先选择三角型模 糊器: μTi ( t)= 1— t—ti Ci |t—ti|<Ci 0 其他 (4) 用 μTi ( t)表示隶属函数的值其中 t 为序列间 隔时间(如果是子序列的序号差需要乘序列步长时 间进行转换).将时间序列间隔的模糊代表点集合 记作 Q={T1T2…T f}其中 Ti 代表第 i 种时 间序列间隔状态f 表示时间序列间隔的状态的种 数.本文中令 t1=0∙875c1=0∙625t2=1∙5 c2=0∙25 t3=1∙825c3=0∙325 t4=2∙625 c4=0∙625t5=3∙625c5=0∙625. 3 多维时间序列模糊关联规则挖掘算法 由于对时间子序列和子序列间隔都进行了模糊 离散化处理模糊关联规则的频数和置信度的计算 也有所变化因此给出了频数和置信度的计算公式 以及模糊关联规则挖掘的算法. (1)频数和置信度的计算.对于 m 个变量的时 间序列经过滑窗处理后得到子序列集合:. W( sw)={s h i|i=12…( N— w+1) h=12…m}. 对 W(sw)中的 m 个子集{s h i|i=12…( N— w+1)}h=12…m 均用模糊离散化方法处理 后则每个子集均得到 kh 个代表形态和该集中各个 子序列到该集各个代表形态的隶属度.每个子集的 代表点集合记作 D h={A h 1A h 2…A h k h}h=12 …m其中 A h j 表示第 h 个子集的第 j 个代表形态. Q h={T h 1T h 2…T h f}h=12…mT h j 代表第 h 子集与推理结果(HMT )子集的时间间隔的第 j 个 模糊形态. 定义模糊关联规则的形式为:如果当 T 1 p1 时 A 1 p2发生当 T 2 p3时 A 2 p4发生……当 T k p2k—1时 A k p2k 发生……当 T h p2h—1时 A h p2h发生则 B 发生.记作 ( A 1 p2∧ T 1 p1∧ A 2 p4∧ T 2 p3∧…∧ A k p2k∧ T k p2k—1∧…∧ A h p2h∧ T h p2h—1⇒B. 其中 A k p2k ∈ D kD p ∈{D 1D 2…D m}k =12 …hB∈ D mp2k表示子集代表形态的序号对于 ij=12…h 和 i≠ j有 D i∩ D j=/○. 规则前件“如果当 T 1 p1时 A 1 p2发生当 T 2 p3时 A 2 p4 发 生……当 T k p2k—1 时 A k p2k 发 生……当 T h p2h—1时 A h p2h发生”发生的频数定义为: F( A 1 p2∧T 1 p1∧A 2 p4∧T 2 p3∧…∧A k p2k∧ T k p2k—1∧…∧A h p2h∧T h p2h—1 )= ∑ N-w i=1 uA 1 p1 (s 1 i)∧uT 1 p2 ( i—TT)∧ NE(2) (5) NE( b)= ∑ N-w i=1 uA b p2b ( s b i )∧ uT b 2b—1 ( i— TT )∧ NE( b+1) (6) 其中 b=h 时 NE( h)= ∑ N-w i=1 uA h p2h ( s h i )∧ uT h 2h—1 ( i— TT ) (7) 其中TT 是序列 s k i 在 T k 2k—1间隔 B 的子序列编号. 由于高炉出铁间隔时间大概在1~2h配合式(5)的 序列间隔模糊隶属函数的参数设置保证了 TT 的 唯一性. 模糊规则( A 1 p2∧ T 1 p1∧ A 2 p4∧ T 2 p3∧…∧ A k p2k∧ T k p2k—1∧…∧ A h p2h∧ T h p2h—1 )⇒B 的可信度为: c(( A 1 p2∧ T 1 p1∧ A 2 p4∧ T 2 p3∧…∧ A k p2k∧ T k p2k—1∧…∧ A h p2h∧ T h p2h—1 )⇒B)= F( A 1 p2∧ T 1 p1∧…∧ A h p2h∧ T h p2h—1∧B) F( A 1 p2∧ T 1 p1∧…∧ A h p2h∧ T h p2h—1 ) (8) 其中 F( A 1 p2∧ T 1 p1∧…∧ A k p2k∧ T k p2k—1∧…∧ A h p2h∧ T h p2h—1∧B)为规则发生的频数可以通过下式计算 得到: F( A 1 p2∧ T 1 p1∧ A 2 p4∧ T 2 p3∧…∧ A k p2k∧…∧ A h p2h∧ T h p2h—1∧B)= ∑ N— w i=1 uA 1 p1 ( s 1 i)∧ uT 1 p2 ( i— TT )∧ T E(2) (9) TE(b)= ∑ N-w i=1 uA b p2b (s b i)∧uT b 2b—1 ( i—TT)∧ NE(b+1) (10) 其中 b=h 时 T E( h)= ∑ N-w i=1 uA h p2h ( s h i )∧ uT h 2h—1 ( i— TT )∧ uB( s m TT ) (11) 第5期 国宏伟等: 多维时序模糊关联规则在高炉炉温预报中的应用 ·555·
.556 北京科技大学学报 第30卷 (②)关联规则挖掘算法.借鉴Agrawa等人提出 的Apriori算法121,算法设计主要分为两个阶段:首 4算法应用 先是搜索模式频繁集,然后是根据设置的最小置信 取武钢的1#高炉2005年的数据,按照本文给 度要求,选择符合要求的规则,算法实现的详细步 出的方法进行挖掘,挖掘得到部分规则如表1所示, 骤如下 对表1的规则进行分析如下. 第一阶段:搜索模式频繁集 (1)针对规则1,当下料速度加快时,下一次出 ①根据条件h=1,2,…,m,=1,2,…,kh,= 铁的铁水温度会下降,但由于同时受到其他因素影 1,2,…,f,l=1,2,…,km遍历三项集(A,T, 响,所以置信度不高;而对规则2,由于基本上只有 B). 下料速度一个影响因素,所以置信度比较高,这与 ②按照式(9)~(11),计算所有项集的频数,例 专家知识制定的规则一致,因此挖掘的产生规则的 如三项集f(AAT人B), 方法能够验证专家制定的规则是否正确. ③得到的α项集及其频数,根据预先设置的最 (2)规则3和规则4的置信度都比较高,都是符 小频数,选择频数大于设置的最小频数的项集,生成 合要求的规则,区别不大,只是在SLC的变化,专 频繁α项集.如果没有频繁集,转到步骤⑤:否则转 家没有制定这两条规则,但是通过分析知道:当渣皮 到步骤④. 指数增加时,同时熔损反应增加,说明此时渣皮指数 ④对得到的频繁a项集,进行连接,生成a十2 的升高是因为渣皮脱落的而不是因为边缘气流,分 项集,回到步骤② 析的结果得到专家认可,从而说明挖掘产生的这两 第二阶段:根据设置的最小置信度要求,选择符 条规则是正确的, 合要求的规则 (3)规则5中包含众多因素的共同影响,专家能 ⑤对各项频繁集,按照式(5)~(8)计算置信度, 够意识到不同变量及其时间间隔对于炉温的影响, ⑥对于得到各频繁集的置信度,选择大于预先 但无法准确地表达成规则.数据挖掘是根据历史数 设置的最小置信度要求的频繁集,符合要求的频繁 据计算的,因此能够准确描述规则 集表达的规则就是数据挖掘的结果, 表1部分模糊关联规则 Table 1 Part of fuzzy association rules 规则编号 置信度 频数 规则 1 0.35 349.54 当T2时PHMT很高,T2时MV增加很多,则HMT减少很多 当T2时PHMT很高,T2时MV增加很多,T2时SLC变化不大,T2时C0变化不大,Ts时TIS少 0.77 56.35 量,T:时MIS少量,T3时BIS少量,则HMT减少很多. 0.76 167.32 当T2时PHMT较高,T3时BIS增加很多,T2时SLC增加较多,则HMT减少很多. 0.67 234.43 当T2时PHMT较高,T3时BIS增加很多,T2时SLC变化不大,则HMT变化不大· 当T2时PHMT较高,T3时DQ增加较大,Ts时TIS增加很多,T:时MIS少量,T3时BIS少量, 0.73 41.71 T2时SLC变化不大,T2时C0增加较多,T2时MV增加较多,则HMT略有下降 下优点:(1)可以完善规则库一专家的精力有限, 5结论 数据挖掘能够发现一些没有被专家发现的新规则; 本文提出的炉温预报规则获取方法结合专家知 (2)验证规则一挖掘的结果可以检验专家制定规 识对高炉数据进行关联规则挖掘,并对挖掘出的规 则的正确性;(③)规则的表达更加精确一专家制定 则进行专家评价,选择出有价值的规则, 的规则,有时正确而不精确,挖掘的方法能够弥补这 提出基于时间子序列和子序列间隔双重模糊化 个不足 的多维时间序列模糊关联规则挖掘改进算法,有效 参考文献 避免时间“边界锐化的问题,应用该改进算法对武 钢1高炉2005年数据进行挖掘,证明了该算法对 [1]Yang T J.Xu J W.Blast Furnace Smelting Process Control Model.Beijing:Science Press,1995 于高炉炉温预报规则挖掘的适用性,通过对挖掘结 (杨天钧,徐金梧.高炉治炼过程控制模型北京:科学出版 果分析,说明采用数据挖掘生成规则的方法具有如 社,1995)
(2)关联规则挖掘算法.借鉴 Agrawa 等人提出 的 Apriori 算法[12]算法设计主要分为两个阶段:首 先是搜索模式频繁集然后是根据设置的最小置信 度要求选择符合要求的规则.算法实现的详细步 骤如下. 第一阶段:搜索模式频繁集. ①根据条件 h=12…mj=12…khi= 12…fl =12…km 遍历三项集( A h j T h i Bl). ②按照式(9)~(11)计算所有项集的频数例 如三项集 f ( A h j ∧ T h i ∧Bl). ③得到的 a 项集及其频数根据预先设置的最 小频数选择频数大于设置的最小频数的项集生成 频繁 a 项集.如果没有频繁集转到步骤⑤;否则转 到步骤④. ④对得到的频繁 a 项集进行连接生成 a+2 项集回到步骤②. 第二阶段:根据设置的最小置信度要求选择符 合要求的规则. ⑤对各项频繁集按照式(5)~(8)计算置信度. ⑥对于得到各频繁集的置信度选择大于预先 设置的最小置信度要求的频繁集符合要求的频繁 集表达的规则就是数据挖掘的结果. 4 算法应用 取武钢的1#高炉2005年的数据按照本文给 出的方法进行挖掘挖掘得到部分规则如表1所示. 对表1的规则进行分析如下. (1)针对规则1当下料速度加快时下一次出 铁的铁水温度会下降但由于同时受到其他因素影 响所以置信度不高;而对规则2由于基本上只有 下料速度一个影响因素所以置信度比较高.这与 专家知识制定的规则一致因此挖掘的产生规则的 方法能够验证专家制定的规则是否正确. (2)规则3和规则4的置信度都比较高都是符 合要求的规则区别不大只是在 SLC 的变化.专 家没有制定这两条规则但是通过分析知道:当渣皮 指数增加时同时熔损反应增加说明此时渣皮指数 的升高是因为渣皮脱落的而不是因为边缘气流.分 析的结果得到专家认可从而说明挖掘产生的这两 条规则是正确的. (3)规则5中包含众多因素的共同影响专家能 够意识到不同变量及其时间间隔对于炉温的影响 但无法准确地表达成规则.数据挖掘是根据历史数 据计算的因此能够准确描述规则. 表1 部分模糊关联规则 Table1 Part of fuzzy association rules 规则编号 置信度 频数 规则 1 0.35 349.54 当 T2 时 PHMT 很高T2 时 MV 增加很多则 HMT 减少很多. 2 0.77 56.35 当 T2 时 PHMT 很高T2 时 MV 增加很多T2 时 SLC 变化不大T2 时 CO 变化不大T5 时 TIS 少 量T4 时 MIS 少量T3 时 BIS 少量则 HMT 减少很多. 3 0.76 167.32 当 T2 时 PHMT 较高T3 时 BIS 增加很多T2 时 SLC 增加较多则 HMT 减少很多. 4 0.67 234.43 当 T2 时 PHMT 较高T3 时 BIS 增加很多T2 时 SLC 变化不大则 HMT 变化不大. 5 0.73 41.71 当 T2 时 PHMT 较高T3 时 DQ 增加较大T5 时 TIS 增加很多T4 时 MIS 少量T3 时 BIS 少量 T2 时 SLC 变化不大T2 时 CO 增加较多T2 时 MV 增加较多则 HMT 略有下降. 5 结论 本文提出的炉温预报规则获取方法结合专家知 识对高炉数据进行关联规则挖掘并对挖掘出的规 则进行专家评价选择出有价值的规则. 提出基于时间子序列和子序列间隔双重模糊化 的多维时间序列模糊关联规则挖掘改进算法有效 避免时间“边界锐化”的问题.应用该改进算法对武 钢1#高炉2005年数据进行挖掘证明了该算法对 于高炉炉温预报规则挖掘的适用性.通过对挖掘结 果分析说明采用数据挖掘生成规则的方法具有如 下优点:(1)可以完善规则库———专家的精力有限 数据挖掘能够发现一些没有被专家发现的新规则; (2)验证规则———挖掘的结果可以检验专家制定规 则的正确性;(3)规则的表达更加精确———专家制定 的规则有时正确而不精确挖掘的方法能够弥补这 个不足. 参 考 文 献 [1] Yang T JXu J W. Blast Furnace Smelting Process Control Model.Beijing:Science Press1995 (杨天钧徐金梧.高炉冶炼过程控制模型.北京:科学出版 社1995) ·556· 北 京 科 技 大 学 学 报 第30卷
第5期 国宏伟等:多维时序模糊关联规则在高炉炉温预报中的应用 .557. [2]Waller M.Saxen.Time varying fir models for shortterm predic- Discovery and Data Mining.New York.1998:16 tion of pig iron silicon content/Automation in Mining.Mineral [8]Last M.Klein Y.Kandel A.Knowledge discovery in time series and Metal Processing.Cologne.1999:227 databases.IEEE Trans Syst Man Cybern Pt B.2001,30(1): [3]Singh H.Sridhar N V,Deo B.Artificial neural nets for predic- 160 tion of silicon content of blast furnace hot metal.Steel Res, [9]Wang B X.Fuzzy association rules mining from time series. 1996,67(12):521 Comput Eng Appl.2004.12(4):177 [4]Zuo G Q,Ma JT,Bjorkman B.A neural network model for pre- (王炳雪·时间序列模糊关联规则的挖掘计算机工程与应用, dicting the silicon content of the hot metal at No.2 blast furnace of 2004,12(4):177) SSAB Lulea//55th Ironmaking Conference Proceedings.Pitts- [10]Chen L K.Review on the development of BF expert system in burgh,1996:211 China,Iron Making.2001.20:34 [5]Yao B.Yang T J.Optimizing generation of an expert system (陈令坤.我国高炉专家系统开发现状.炼铁,2001,20(4): based on neural net work by genetic algorithm to predict the silicon 30) content in hot metal.Iron Steel.2000.35(4):14 [11]Chen L S.Fu L C,Yu Z J.Application of BF expert system at (姚斌,杨天钧·铁水硅预报神经网络专家系统的遗传优化生 No.4 blast furnace of Wuhan Iron and Steel Company.Iron 成.钢铁,2000,35(4):14) Making.2001.20(Suppl):71 [6]WuS,Gao X D.Data Warehouse and Data Mining.Beijing: (陈令坤,傅连春,于仲洁·武钢4号高炉专家系统的应用 Metallurgical Industry Press.2003:148 炼铁,2001,20(增刊):71) (武森,高学东·数据仓库与数据挖掘.北京:冶金工业出版 [12]Agrawal R.Mamnila H.Srikant R.et al.Fast discovery of as- 社,2003:148) sociation rules//Fayyad M.Piatetshy Shapiro G.Smyth P. [7]Das C.Lin K.Mannila H.et al.Rule discovery from time series Advances in Knowledge Discovery and Data Mining.Menlo /Proceedings of the 4th International Conference of Knowledge Park:AAAI/Mit Press,1996:307 (上接第539页) Mater,2001,226/230:1400 [6]Tenaud P,Morel A.Kools F.et al.Recent improvement of hard [9]Sang L W.Yong A S.Mossbauer studies of La Zn substitution ferrite permanent magnets based on LaCo substitution.JAlloy effect in strontium ferrite nanoparticles.J Magn Magn Mater, Compd,2004,370:331 2005,290/291:231 [7]Gee S H.Hong Y K.Jeffers F J.et al.Synthesis of nano-sized [10]Gao Y W.Zhuo SZ.Magnetic properties and orientation mag spherical barium"strontium ferrite particles.IEEE Trans Magn. netic field relationship of sintered permanent magnetic material. 2005,41(11):4353 J Magn Mater Devices.1996.27(1):13 [8]Lee S H.Jeung W Y.Anisotropic injection molding of strontium (高汝伟,周寿增.烧结永磁材料的磁性能与取向磁场的关 ferrite powder using a PP/PEG binder system.J Magn Magn 系.磁性材料及器件,1996,27(1):13)
[2] Waller MSaxen.Time-varying fir-models for short-term prediction of pig iron silicon content∥ A utomation in MiningMineral and Metal Processing.Cologne1999:227 [3] Singh HSridhar N VDeo B.Artificial neural nets for prediction of silicon content of blast furnace hot metal. Steel Res 199667(12):521 [4] Zuo G QMa J TBjorkman B.A neural network model for predicting the silicon content of the hot metal at No.2blast furnace of SSAB Lulea∥55th Ironmaking Conference Proceedings.Pittsburgh1996:211 [5] Yao BYang T J.Optimizing generation of an expert system based on neural network by genetic algorithm to predict the silicon content in hot metal.Iron Steel200035(4):14 (姚斌杨天钧.铁水硅预报神经网络专家系统的遗传优化生 成.钢铁200035(4):14) [6] Wu SGao X D.Data Warehouse and Data Mining.Beijing: Metallurgical Industry Press2003:148 (武森高学东.数据仓库与数据挖掘.北京:冶金工业出版 社2003:148) [7] Das GLin KMannila Het al.Rule discovery from time series ∥ Proceedings of the4th International Conference of Knowledge Discovery and Data Mining.New York1998:16 [8] Last MKlein YKandel A.Knowledge discovery in time series databases.IEEE T rans Syst Man Cybern Pt B200130(1): 160 [9] Wang B X.Fuzzy association rules mining from time series. Comput Eng Appl200412(4):177 (王炳雪.时间序列模糊关联规则的挖掘.计算机工程与应用 200412(4):177) [10] Chen L K.Review on the development of BF expert system in ChinaIron Making200120:34 (陈令坤.我国高炉专家系统开发现状.炼铁200120(4): 30) [11] Chen L SFu L CYu Z J.Application of BF expert system at No.4 blast furnace of Wuhan Iron and Steel Company.Iron Making200120(Suppl):71 (陈令坤傅连春于仲洁.武钢4号高炉专家系统的应用. 炼铁200120(增刊):71) [12] Agrawal RMamnila HSrikant Ret al.Fast discovery of association rules ∥ Fayyad MPiatetshy-Shapiro GSmyth P. A dv ances in Knowledge Discovery and Data Mining.Menlo Park:AAAI/Mit Press1996:307 (上接第539页) [6] Tenaud PMorel AKools Fet al.Recent improvement of hard ferrite permanent magnets based on La-Co substitution.J Alloy Compd2004370:331 [7] Gee S HHong Y KJeffers F Jet al.Synthesis of nano-sized spherical barium-strontium ferrite particles.IEEE T rans Magn 200541(11):4353 [8] Lee S HJeung W Y.Anisotropic injection molding of strontium ferrite powder using a PP/PEG binder system.J Magn Magn Mater2001226/230:1400 [9] Sang L WYong A S.Mössbauer studies of La—Zn substitution effect in strontium ferrite nanoparticles.J Magn Magn Mater 2005290/291:231 [10] Gao Y WZhuo S Z.Magnetic properties and orientation magnetic field relationship of sintered permanent magnetic material. J Magn Mater Devices199627(1):13 (高汝伟周寿增.烧结永磁材料的磁性能与取向磁场的关 系.磁性材料及器件199627(1):13) 第5期 国宏伟等: 多维时序模糊关联规则在高炉炉温预报中的应用 ·557·