工程科学学报.第42卷.第3期:348-357.2020年3月 Chinese Journal of Engineering,Vol.42,No.3:348-357,March 2020 https://doi.org/10.13374/j.issn2095-9389.2019.04.02.004;http://cje.ustb.edu.cn 基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报 方法的开发 段海洋1,2),王旭东,2)四,姚曼2) 1)大连理工大学材料科学与工程学院.大连1160242)辽宁省凝固控制与数字化制备技术重点实验室.大连116024 ☒通信作者,E-mail:hler@dlut..edu.cn 摘要针对漏钢时结晶器铜板温度呈现出的“时间滞后”和“空间倒置”等典型特征,本文通过引入动态时间弯曲(DTW)和 机器学习中的密度聚类(DBSCAN)方法,提取、汇集并区分结晶器温度的典型变化模式,在此基础上开发出一种新型的漏钢 预报方法,借助动态时间弯曲度量不同拉速、钢种或工艺操作条件下结晶器热电偶温度的相似性,并运用密度聚类方法聚集 和分离正常工况、黏结漏钢状况下的温度样本,在此基础上检测和预报结晶器漏钢.结果证实,相较于传统的逻辑判断和人 工神经元网络预报结晶器漏钢的方法,基于聚类的漏钢预报方法无需人为设置阈值或参数,能够依据漏钢历史样本中温度变 化的共性规律,提取并融合热电偶温度在时间、空间上典型的变化特征,准确区分和预报结晶器漏钢,具有较好的自适应性 和鲁棒性 关键词连铸:结品器:漏钢预报:密度聚类:动态时间弯曲 分类号TG249.7 Development of prediction method for mold sticking breakout based on density-based spatial clustering of applications with noise and dynamic time warping DUAN Hai-yang2).WANG Xu-dong2,YAO Man2) 1)School of Materials Science and Engineering,Dalian University of Technology,Dalian 116024,China 2)Key Laboratory of Solidification Control and Digital Preparation Technology (Liaoning Province),Dalian 116024,China Corresponding author,E-mail:hler@dlut.edu.cn ABSTRACT As the core component of continuous casting machines,complex behaviors of fluid flow,heat transfer,mass transfer,and solidification occurring inside the mold are the key factors affecting the slabs quality.Breakout is one of the most catastrophic accidents in continuous casting process,which brings severe impacts on personal security,smooth producing,slab quality,and caster equipment. In particular,with the development of the high-speed casting technology,quality defects and sticking breakouts caused by high-load emerge frequently and missing or false alarms for online prediction of breakout occasionally occur.Thus,accurate identification and prediction for the mold breakout is a top priority for online processing control.Considering the typical temperature characteristics of "time lag"and"space inversion"during a breakout,this paper introduced the concepts of dynamic time warping(DTW)and density- based spatial clustering of applications with noise (DBSCAN)in machine learning.On the basis of collecting and distinguishing the typical change modes of mold temperature,an integrated novel method for predicting breakout was developed.The proposed method applied DTW to measure the similarity of mold thermocouple temperature under different casting speeds,steel grades,and other operating conditions,while DBSCAN was used to cluster and separate the temperature samples between normal casting status and 收稿日期:2019-04-02 基金项目:国家自然科学基金资助项目(51974056.51474047):中央高校基本科研业务费资助项目
基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报 方法的开发 段海洋1,2),王旭东1,2) 苣,姚 曼1,2) 1) 大连理工大学材料科学与工程学院,大连 116024 2) 辽宁省凝固控制与数字化制备技术重点实验室,大连 116024 苣通信作者,E-mail:hler@dlut.edu.cn 摘 要 针对漏钢时结晶器铜板温度呈现出的“时间滞后”和“空间倒置”等典型特征,本文通过引入动态时间弯曲 (DTW) 和 机器学习中的密度聚类 (DBSCAN) 方法,提取、汇集并区分结晶器温度的典型变化模式,在此基础上开发出一种新型的漏钢 预报方法. 借助动态时间弯曲度量不同拉速、钢种或工艺操作条件下结晶器热电偶温度的相似性,并运用密度聚类方法聚集 和分离正常工况、黏结漏钢状况下的温度样本,在此基础上检测和预报结晶器漏钢. 结果证实,相较于传统的逻辑判断和人 工神经元网络预报结晶器漏钢的方法,基于聚类的漏钢预报方法无需人为设置阈值或参数,能够依据漏钢历史样本中温度变 化的共性规律,提取并融合热电偶温度在时间、空间上典型的变化特征,准确区分和预报结晶器漏钢,具有较好的自适应性 和鲁棒性. 关键词 连铸;结晶器;漏钢预报;密度聚类;动态时间弯曲 分类号 TG249.7 Development of prediction method for mold sticking breakout based on density-based spatial clustering of applications with noise and dynamic time warping DUAN Hai-yang1,2) ,WANG Xu-dong1,2) 苣 ,YAO Man1,2) 1) School of Materials Science and Engineering, Dalian University of Technology, Dalian 116024, China 2) Key Laboratory of Solidification Control and Digital Preparation Technology (Liaoning Province), Dalian 116024, China 苣 Corresponding author, E-mail: hler@dlut.edu.cn ABSTRACT As the core component of continuous casting machines, complex behaviors of fluid flow, heat transfer, mass transfer, and solidification occurring inside the mold are the key factors affecting the slabs quality. Breakout is one of the most catastrophic accidents in continuous casting process, which brings severe impacts on personal security, smooth producing, slab quality, and caster equipment. In particular, with the development of the high-speed casting technology, quality defects and sticking breakouts caused by high-load emerge frequently and missing or false alarms for online prediction of breakout occasionally occur. Thus, accurate identification and prediction for the mold breakout is a top priority for online processing control. Considering the typical temperature characteristics of “time lag” and “space inversion” during a breakout, this paper introduced the concepts of dynamic time warping (DTW) and densitybased spatial clustering of applications with noise (DBSCAN) in machine learning. On the basis of collecting and distinguishing the typical change modes of mold temperature, an integrated novel method for predicting breakout was developed. The proposed method applied DTW to measure the similarity of mold thermocouple temperature under different casting speeds, steel grades, and other operating conditions, while DBSCAN was used to cluster and separate the temperature samples between normal casting status and 收稿日期: 2019−04−02 基金项目: 国家自然科学基金资助项目 (51974056,51474047);中央高校基本科研业务费资助项目 工程科学学报,第 42 卷,第 3 期:348−357,2020 年 3 月 Chinese Journal of Engineering, Vol. 42, No. 3: 348−357, March 2020 https://doi.org/10.13374/j.issn2095-9389.2019.04.02.004; http://cje.ustb.edu.cn
段海洋等:基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 349· sticking breakout.On the basis of the above mentioned method,the results show that the mold sticking breakout can be effectively detected and predicted.Compared with the traditional method based on logical judgment and artificial neural network,the clustering- based breakout prediction method does not require manual setting of thresholds or parameters.According to the common rule of temperature variation in historical samples of breakout,the typical characteristics of temperature in time and space can be extracted and fused,and the breakout can be accurately distinguished and predicted,which shows good self-adaptability and robustness. KEY WORDS continuous casting:mold:breakout prediction:density-based spatial clustering of applications with noise;dynamic time warping 漏钢是连铸过程中的灾难性事故,不但会严 性.因此,将动态时间弯曲和密度聚类相结合能提 重干扰生产顺行和铸坯质量,而且严重损害结品 取和融合漏钢过程中结品器温度的特征,挖掘热 器、扇形段等连铸机设备,在造成巨大经济损失的 电偶温度变化的共性规律,识别和区分正常与漏 同时,带来重大安全隐患四因此,开发一种准确 钢工况下的温度波动,为机器学习在连铸过程中 而高效的结品器漏钢预报方法对于保障连铸顺行 的应用提供参考和借鉴 具有重要意义, 1黏结漏钢形成机理及温度特征 为了预防和避免漏钢,可利用结晶器与铸坯 之间的摩擦力对其进行预测四.但现有方法主要通 漏钢主要发生在结晶器弯月面附近),由于保 过在结晶器铜板上嵌入测温热电偶,根据热电偶 护渣润滑不良、结晶器液位波动、拉速较大等原 温度的变化来监测是否发生漏钢刂目前,基于 因,较薄的初生坯壳直接与结晶器铜板接触发生 温度测量的漏钢预报方法主要分为两类:逻辑判 黏结⑧叨,在结晶器的振动和冷却作用下,黏结坯 断和人工智能S逻辑判断法对铸机设备、浇铸 壳被反复拉断和愈合,直到黏结点离开结品器,较 工艺和物性参数十分敏感,当工艺调整和拉速提 薄坯壳无法支撑钢水静压力的作用而发生漏钢© 升时,阈值变动大,导致误报率和漏报率大幅上 图1(a)是结晶器铜板热电偶分布示意图.结 升,自适应性和鲁棒性较差:人工智能方法主要通 晶器由四块铜板组成,包括两块宽面铜板和两块 过神经网络、支持向量机等算法识别漏钢发生时 窄面铜板.其中,内、外弧宽面各安装57支热电 单偶和组偶的温度模式,该方法对学习和训练样 偶,左、右侧窄面各安装3支热电偶,四块铜板共 本的要求较高,样本不全或无效时都会严重影响 安装热电偶120支.图1(b)为漏钢时同列的三排 其预报效果,模型的迁移能力较低 热电偶温度变化示意图.正常工况下,结晶器铜板 鉴于漏钢模式温度之间相似度较高,而漏钢 热电偶温度随时间的变化较为平稳,不会出现较 与正常工况模式温度之间差异性较大,本文提出一 大波动.沿浇铸方向,坯壳厚度逐渐增加,铸坯向 种结合动态时间弯曲(DTW)和密度聚类(DBSCAN) 结晶器铜板传热的热阻增加,下排热电偶的温度 的新型漏钢预报方法.动态时间弯曲能够有效提 逐次下降.漏钢发生时,黏结点向下移动.当其经 取漏钢温度模式的相似性,在此基础上,密度聚类 过第一排热电偶时,从坯壳渗出的钢液将与结晶 可以将漏钢样本聚为同一类簇,同时过滤正常工 器铜板直接接触,相应位置的电偶温度会急刷上 况样本,从而最大化漏钢与正常工况温度的差异 升,待黏结点下行远离电偶后,其温度逐渐下降 2 eft side (a) de Loosed side (b) Right Fixed side 号 ● ● mg。。。。。。。。。。。。。。。。。 ●●●●●●●●●●●●●●●●●●● 景120nmm ● ●●●●●●●●●● 150mm lime/s 图1示意图.(a)结品器热电偶分布:(b)黏结漏钢热电偶温度变化 Fig.I Schematic diagram:(a)thermocouple distribution of mold;(b)thermocouple temperature variation of breakout
sticking breakout. On the basis of the above mentioned method, the results show that the mold sticking breakout can be effectively detected and predicted. Compared with the traditional method based on logical judgment and artificial neural network, the clusteringbased breakout prediction method does not require manual setting of thresholds or parameters. According to the common rule of temperature variation in historical samples of breakout, the typical characteristics of temperature in time and space can be extracted and fused, and the breakout can be accurately distinguished and predicted, which shows good self-adaptability and robustness. KEY WORDS continuous casting;mold; breakout prediction; density-based spatial clustering of applications with noise; dynamic time warping 漏钢是连铸过程中的灾难性事故,不但会严 重干扰生产顺行和铸坯质量,而且严重损害结晶 器、扇形段等连铸机设备,在造成巨大经济损失的 同时,带来重大安全隐患[1] . 因此,开发一种准确 而高效的结晶器漏钢预报方法对于保障连铸顺行 具有重要意义. 为了预防和避免漏钢,可利用结晶器与铸坯 之间的摩擦力对其进行预测[2] . 但现有方法主要通 过在结晶器铜板上嵌入测温热电偶,根据热电偶 温度的变化来监测是否发生漏钢[3–4] . 目前,基于 温度测量的漏钢预报方法主要分为两类:逻辑判 断和人工智能[5–6] . 逻辑判断法对铸机设备、浇铸 工艺和物性参数十分敏感,当工艺调整和拉速提 升时,阈值变动大,导致误报率和漏报率大幅上 升,自适应性和鲁棒性较差;人工智能方法主要通 过神经网络、支持向量机等算法识别漏钢发生时 单偶和组偶的温度模式,该方法对学习和训练样 本的要求较高,样本不全或无效时都会严重影响 其预报效果,模型的迁移能力较低. 鉴于漏钢模式温度之间相似度较高,而漏钢 与正常工况模式温度之间差异性较大,本文提出一 种结合动态时间弯曲(DTW)和密度聚类(DBSCAN) 的新型漏钢预报方法. 动态时间弯曲能够有效提 取漏钢温度模式的相似性,在此基础上,密度聚类 可以将漏钢样本聚为同一类簇,同时过滤正常工 况样本,从而最大化漏钢与正常工况温度的差异 性. 因此,将动态时间弯曲和密度聚类相结合能提 取和融合漏钢过程中结晶器温度的特征,挖掘热 电偶温度变化的共性规律,识别和区分正常与漏 钢工况下的温度波动,为机器学习在连铸过程中 的应用提供参考和借鉴. 1 黏结漏钢形成机理及温度特征 漏钢主要发生在结晶器弯月面附近[7] ,由于保 护渣润滑不良、结晶器液位波动、拉速较大等原 因,较薄的初生坯壳直接与结晶器铜板接触发生 黏结[8–9] . 在结晶器的振动和冷却作用下,黏结坯 壳被反复拉断和愈合,直到黏结点离开结晶器,较 薄坯壳无法支撑钢水静压力的作用而发生漏钢[10] . 图 1(a)是结晶器铜板热电偶分布示意图. 结 晶器由四块铜板组成,包括两块宽面铜板和两块 窄面铜板. 其中,内、外弧宽面各安装 57 支热电 偶,左、右侧窄面各安装 3 支热电偶,四块铜板共 安装热电偶 120 支. 图 1(b)为漏钢时同列的三排 热电偶温度变化示意图. 正常工况下,结晶器铜板 热电偶温度随时间的变化较为平稳,不会出现较 大波动. 沿浇铸方向,坯壳厚度逐渐增加,铸坯向 结晶器铜板传热的热阻增加,下排热电偶的温度 逐次下降. 漏钢发生时,黏结点向下移动,当其经 过第一排热电偶时,从坯壳渗出的钢液将与结晶 器铜板直接接触,相应位置的电偶温度会急剧上 升,待黏结点下行远离电偶后,其温度逐渐下降. 900 mm 120 mm 115 mm 150 mm Time/s (a) (b) Thermocouple Temperature/℃ Left side Loosed side Fixed side Right side 图 1 示意图. (a)结晶器热电偶分布;(b)黏结漏钢热电偶温度变化 Fig.1 Schematic diagram: (a) thermocouple distribution of mold; (b) thermocouple temperature variation of breakout 段海洋等: 基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 · 349 ·
350 工程科学学报,第42卷,第3期 随着黏结点继续下移,当其经过第二、三排热电偶 “时滞性”和“温度倒置”的特征与上述情况一致, 时,其电偶温度亦会先上升后下降.同列热电偶温 如图2(b)所示;误报(图2(c))时的温度模式各异, 度上升、下降及其峰值在时间上有明显的“时滞 如误报-1温度同时上升,误报-3和误报-4第二排 性”.部分情况下,也会出现下排热电偶温度高于 温度虽上升,但第一排温度均不具备漏钢特征,误 上排热电偶温度的情况,称之为“温度倒置”.“时 报-2和误报-5温度虽有上升和下降,但不具有 滞性”和“温度倒置“是漏钢的典型特征,也是漏钢 “时滞性”.由此可见,漏钢温度模式相似,而包括 预报方法捕捉和预报漏钢的重要依据山 正常和误报在内的正常工况温度模式却不尽相 图2为正常(N)、漏钢(B)和误报(F)(生产正 同,与漏钢模式差别较大 常而漏钢预报系统发出报警)模式下的温度曲线, 基于逻辑判断的漏钢预报方法需要设定温度 每种情况各展示5个例子.从图2(a)中可以看出, 上升幅值、温度上升速率、温度下降速率以及时 正常模式下温度几乎没有波动,不具备漏钢时典 滞参数等,从图2所示的漏钢温度可以看出,上述 型的“时滞性”和“温度倒置”特征;而漏钢 参数难以统一和准确设定,参数设置不合理将增 (图2(b))时的温度模式具有单一性和相似性,其 大误报率,严重时会引起漏报.基于神经网的漏 90FN-1 -o-The first row (a) B-1 -0-The first row (b) 110 F-1 -0-The first row (c) -o-The second row 100 -0-The second row 850000000000000000000000000 105 -0-The second row 9 100 96 95 000000000o000000000000000 15 94 90 700000000000000000000000000 92 85 65 90 00000000000000000600 80 000000000000000000000 N-2 -o-The first row B-2 -0-The first row F-2 -0-The first row 95 sccond row 144 0 -The second row 93 -o-The second row 136 0 90 87 128 84 120 00 81 80000000000000000000000000 112 78 N.3 -o-The first row 133 B-3 -o-The first row 126 F.3 -o-The first row pooooodoob8eod8%0 -0-The second row -oThe second row 88 ⊙126 119 108 99 105 o f0000000000000000000000000 98 91 000000000000000° 81 72 N-4 -o-The first row B-4 -o-The first row F-4 -o-The first row 100 -o-The second row 105 -o-The second row 110 -o-The second row 0000000000000000000000000 95 100 105 1o0000000000000000 90 95 100 95 0000000000000000000000000 90 00 3 90N-5 -oThe first row B-5 -0-The first row F-5 -o-The first row -The second ro 132 -0-The second row 105 0 The second row 0000o000o0000000g 00000o000000000a。 88 129 100 0000 126 T000000o00d 95 00000000000000000000g°000 123 % 120 000000000000000000o 85 Time/s Time/s Iime/s 图2 不同工况下的温度变化.(a)正常:(b)漏钢:(c)误报 Fig.2 Temperature comparison of different situations:(a)normal;(b)breakout;(c)false alarm
随着黏结点继续下移,当其经过第二、三排热电偶 时,其电偶温度亦会先上升后下降. 同列热电偶温 度上升、下降及其峰值在时间上有明显的“时滞 性”. 部分情况下,也会出现下排热电偶温度高于 上排热电偶温度的情况,称之为“温度倒置”. “时 滞性”和“温度倒置“是漏钢的典型特征,也是漏钢 预报方法捕捉和预报漏钢的重要依据[11] . 图 2 为正常(N)、漏钢(B)和误报(F)(生产正 常而漏钢预报系统发出报警)模式下的温度曲线, 每种情况各展示 5 个例子. 从图 2(a)中可以看出, 正常模式下温度几乎没有波动,不具备漏钢时典 型 的 “ 时 滞 性 ” 和 “ 温 度 倒 置 ” 特 征 ; 而 漏 钢 (图 2(b))时的温度模式具有单一性和相似性,其 “时滞性”和“温度倒置”的特征与上述情况一致, 如图 2(b)所示;误报(图 2(c))时的温度模式各异, 如误报−1 温度同时上升,误报−3 和误报−4 第二排 温度虽上升,但第一排温度均不具备漏钢特征,误 报−2 和误报−5 温度虽有上升和下降,但不具有 “时滞性”. 由此可见,漏钢温度模式相似,而包括 正常和误报在内的正常工况温度模式却不尽相 同,与漏钢模式差别较大. 基于逻辑判断的漏钢预报方法需要设定温度 上升幅值、温度上升速率、温度下降速率以及时 滞参数等,从图 2 所示的漏钢温度可以看出,上述 参数难以统一和准确设定,参数设置不合理将增 大误报率,严重时会引起漏报. 基于神经网络的漏 90 85 80 75 70 65 N-1 The first row (a) The second row 95 90 85 80 N-2 The first row The second row 96 88 80 72 64 N-3 The first row The second row Temperature/℃ 100 95 90 85 80 N-4 The first row The second row 90 88 86 84 N-5 Time/s The first row The second row 100 98 96 94 92 90 B-1 The first row (b) The second row 144 136 128 120 112 B-2 The first row The second row 133 126 119 112 105 98 91 B-3 The first row The second row Temperature/℃ 105 100 95 90 85 B-4 The first row The second row 132 135 129 126 123 120 B-5 Time/s The first row The second row 105 110 100 95 90 85 80 F-1 The first row (c) The second row 93 90 84 87 81 78 F-2 The first row The second row 126 117 108 99 90 81 72 F-3 The first row The second row Temperature/℃ 110 105 100 95 90 F-4 The first row The second row 105 100 95 90 85 F-5 Time/s The first row The second row 图 2 不同工况下的温度变化. (a)正常;(b)漏钢;(c)误报 Fig.2 Temperature comparison of different situations: (a) normal; (b) breakout; (c) false alarm · 350 · 工程科学学报,第 42 卷,第 3 期
段海洋等:基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 351 钢预报方法首先需要积累大量完整的温度变化模 将漏钢样本和正常工况样本组成的样本集聚类为 式,而后从漏钢、正常工况的历史样本中训练网络 两个类簇,分别为漏钢类簇和正常工况类簇 参数,样本数量和质量都会对网络训练结果造成 3基于聚类和动态时间弯曲的漏钢预报方法 影响,此外,当出现了新的温度变化模式时,该方 法难以准确识别和判定,容易导致误报 3.1全时间序列的温度特征提取 为更好地度量温度数据的相似性,需对粗糙 2机器学习中的密度聚类方法 的原始温度数据进行处理,以提炼其共性特征.首 基于以上分析,依据黏结漏钢温度模式的共 先检查第一、二排温度在升温前的波动情况,当升 性特征,可借助机器学习方法对黏结漏钢温度样 温前的温度连续k秒内上下波动超过1℃时,则 本进行学习,以挖掘其温度特征的共性规律,为此 求取波动温度的平均值以替代升温前波动的温 需选择合适的机器学习方法.聚类作为机器学习 度;然后计算第一、二排电偶温度同一测点处的温 中的典型方法,广泛应用于挖掘具有相似特征的 度数据在k秒内的温度变化率及其差值;最后对 数据集.聚类是将数据样本聚集为多个类簇的过 作差后的结果作z-score均值标准化处理.此处 程.经过聚类分析后,在同一类簇中数据样本之间 k取5,计算公式如(1)~(3)所示: 的相似性较高,不同类簇中数据样本之间的相似 吃=I45- .i=1.2.….20 (1) 性较低即差别较大 5 黏结漏钢时温度彼此相似,与正常工况温度 vminus;,=v1i-2i,i=1,2,…,20 (2) 差异较大,并且正常工况下温度的变化模式彼此 (3) 千差万别,针对上述温度数据的特点,本文采用密 vminusi-av12...0 std 度聚类方法对不同模式的温度进行区分和识 式中:,、vminus,、vminusz分别表示温度的变化 别.密度聚类是聚类算法中的一个分支,利用参数 率、变化率差值及上述差值的z-score均值标准化 邻域半径(Eps)和邻域内最少样本数(MinPts)以及 结果,T,表示第i时刻的温度,2,分别表示第 样本之间的相似度或距离将簇聚集为密度相连的 一、二排温度对应的温度变化率,avg、std分别表 样本的最大集合.密度聚类借助参数邻域半径和 示温度变化率差值vminus的平均值、标准差 邻域内最少样本数所形成的样本捕获规则进行聚 式(1)~(3)可以有效提取“时滞”和“倒置”等 类.该规则可表示为:在邻域半径内包含的样本数 典型特征的温度数据,且能将不同拉速及工艺条 量不少于邻域内最少样本数设定值.在聚类时仅 件下相差较大的温度数据缩放至同一变化区间, 捕获数据集中彼此相似即距离较近的样本,如漏 便于相似性度量.图3~5分别为正常、误报和漏 钢样本,然后将捕获的样本聚集为簇:而对于诸如 钢工况下温度及其预处理后的曲线图.从图中可 模式差异较大的正常工况样本,由于其彼此之间 以看出,经过预处理后三种工况下的温度虽处在 距离较大,不满足捕获规则,算法将自动识别为噪 相同的数值区间,但特征明显不同.值得注意的 声样本,从而与漏钢样本分离.因此,密度聚类可 是,预处理不仅保留了漏钢温度的典型特征,还增 100 (a) -O-The first row 2 2.0(b) -◆-The second row 0000000000000000000000000 盖 96 0.5 -0.5 92 0000000000000000000000000 -1.0 90 -1.5 -2.0 88 10 20 25 10 30 Time/s Time/s 图3温度及其特征提取.()正常工况温度:(b)正常工况温度预处理结果 Fig.3 Temperature and features extraction:(a)temperature of normal status;(b)processing results of normal status
钢预报方法首先需要积累大量完整的温度变化模 式,而后从漏钢、正常工况的历史样本中训练网络 参数,样本数量和质量都会对网络训练结果造成 影响,此外,当出现了新的温度变化模式时,该方 法难以准确识别和判定,容易导致误报. 2 机器学习中的密度聚类方法 基于以上分析,依据黏结漏钢温度模式的共 性特征,可借助机器学习方法对黏结漏钢温度样 本进行学习,以挖掘其温度特征的共性规律,为此 需选择合适的机器学习方法. 聚类作为机器学习 中的典型方法,广泛应用于挖掘具有相似特征的 数据集. 聚类是将数据样本聚集为多个类簇的过 程. 经过聚类分析后,在同一类簇中数据样本之间 的相似性较高,不同类簇中数据样本之间的相似 性较低即差别较大. 黏结漏钢时温度彼此相似,与正常工况温度 差异较大,并且正常工况下温度的变化模式彼此 千差万别,针对上述温度数据的特点,本文采用密 度聚类[12] 方法对不同模式的温度进行区分和识 别. 密度聚类是聚类算法中的一个分支,利用参数 邻域半径(Eps)和邻域内最少样本数(MinPts)以及 样本之间的相似度或距离将簇聚集为密度相连的 样本的最大集合. 密度聚类借助参数邻域半径和 邻域内最少样本数所形成的样本捕获规则进行聚 类. 该规则可表示为:在邻域半径内包含的样本数 量不少于邻域内最少样本数设定值. 在聚类时仅 捕获数据集中彼此相似即距离较近的样本,如漏 钢样本,然后将捕获的样本聚集为簇;而对于诸如 模式差异较大的正常工况样本,由于其彼此之间 距离较大,不满足捕获规则,算法将自动识别为噪 声样本,从而与漏钢样本分离. 因此,密度聚类可 将漏钢样本和正常工况样本组成的样本集聚类为 两个类簇,分别为漏钢类簇和正常工况类簇. 3 基于聚类和动态时间弯曲的漏钢预报方法 3.1 全时间序列的温度特征提取 为更好地度量温度数据的相似性,需对粗糙 的原始温度数据进行处理,以提炼其共性特征. 首 先检查第一、二排温度在升温前的波动情况,当升 温前的温度连续 k 秒内上下波动超过 1 ℃ 时,则 求取波动温度的平均值以替代升温前波动的温 度;然后计算第一、二排电偶温度同一测点处的温 度数据在 k 秒内的温度变化率及其差值;最后对 作差后的结果作 z-score 均值标准化处理. 此处 k 取 5,计算公式如(1)~(3)所示: vi = Ti+5 −Ti 5 ,i = 1,2,··· ,20 (1) vminusi = v1i −v2i ,i = 1,2,··· ,20 (2) vminuszi = vminusi−avg std ,i = 1,2,··· ,20 (3) 式中: vi、vminusi、vminuszi 分别表示温度的变化 率、变化率差值及上述差值的 z-score 均值标准化 结果,Ti 表示第 i 时刻的温度,v1i、v2i 分别表示第 一、二排温度对应的温度变化率,avg、std 分别表 示温度变化率差值 vminus 的平均值、标准差. 式(1)~(3)可以有效提取“时滞”和“倒置”等 典型特征的温度数据,且能将不同拉速及工艺条 件下相差较大的温度数据缩放至同一变化区间, 便于相似性度量. 图 3~5 分别为正常、误报和漏 钢工况下温度及其预处理后的曲线图. 从图中可 以看出,经过预处理后三种工况下的温度虽处在 相同的数值区间,但特征明显不同. 值得注意的 是,预处理不仅保留了漏钢温度的典型特征,还增 98 100 96 94 92 (a) The first row The second row 90 88 0 5 10 15 Time/s 20 25 Temperature/℃ 1.5 −1.5 1.0 −1.0 0.5 −0.5 0 2.0 −2.0 (b) 0 5 10 15 Time/s 20 Z-Score of temerature change rate difference 图 3 温度及其特征提取. (a)正常工况温度;(b)正常工况温度预处理结果 Fig.3 Temperature and features extraction: (a) temperature of normal status; (b) processing results of normal status 段海洋等: 基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 · 351 ·
352 工程科学学报,第42卷,第3期 105(a) -O-The first row 1.0 (b) -◇-The second row ●●●●●●●、 ,00000000o00o0000000000000N 100 0.5 95 0 entpioc 90 兰0.5 0fo0000000000o06a00-0000-07 85 -1.0 -1.5 7 -2.0 0 5 1015 20 25 0 10 15 20 Time/s Time/s 图4温度及其特征提取.(a)误报温度:(b)误报温度预处理结果 Fig.4 Temperature and features extraction:(a)temperature of false alarm;(b)processing results of false alarm 125 1.5 (a) -O-The first row (b) ◇-The second row 120F 1.0 ●●● p00000 ●●、 00 0.5 115 00 ● 0/ ● 0.5 105 -1.0 oooooooooooo0oopoa- 100 -1.5 95 -2.0 0 5 10 15 20 25 10 15 20 Time/s Time/s 图5温度及其特征提取.()漏钢温度:(b)漏钢温度预处理结果 Fig.5 Temperature and features extraction:(a)temperature of breakout;(b)processing results of breakout 大了其与正常工况下温度特征的差异性 W表示匹配路径 上述三种类型的历史温度数据,分别选取 图6所示为三例温度样本的特征提取结果,即 20例正常、30例误报及30例漏钢样本作为训练 序列x、y、三,及其欧氏距离(Euclidean)和动态时间 样本 弯曲映射对比示意图,表1为x、y、:彼此之间的 3.2动态时间弯曲样本相似性度量 欧氏距离和动态时间弯曲距离计算结果.从表1 动态时间弯曲)对具有相似波形序列的距离 中可以看出,序列之间的动态时间弯曲距离普遍 或相似性度量具有良好的效果,广泛应用于数据 小于欧氏距离.尤其是波形相似而波峰不对应的 的相似性度量,如时间序列数据.时间序列存在平 序列,如x、八,其动态时间弯曲距离远小于欧氏距 移和伸缩等复杂变形,传统的欧氏距离对时间轴 离.由此表明,对于漏钢温度在不同拉速及工艺条 的变化非常敏感,轻微的变化就会导致欧氏距离 件下的温度极值不对应的情况,运用动态时间弯 发生很大的变动,动态时间弯曲有效克服了欧氏 曲可以有效度量其相似性,避免了因使用其他距 距离的局限46 离度量方式,如欧氏距离,所导致的漏钢温度相似 给定时间序列p、q,动态时间弯曲首先找到它 性差异较大的问题,进而为漏钢样本的聚类打下 们的最佳匹配来计算距离刀具体匹配公式如下: 良好的基础 3.3聚类参数邻域半径和邻域内最少样本数的选择 DTW(p,q)= arg min W=w1.w2.Wk..wK (P-9 k=1,wk=(i,) 参数邻域半径和邻域内最少样本数对密度聚 (4) 类的效果有巨大的影响,因此,选择合适的参数尤 式中:P、9分别表示序列p、q的第i、个元素, 为重要
大了其与正常工况下温度特征的差异性. 上述三种类型的历史温度数据 ,分别选 取 20 例正常、30 例误报及 30 例漏钢样本作为训练 样本. 3.2 动态时间弯曲样本相似性度量 动态时间弯曲[13] 对具有相似波形序列的距离 或相似性度量具有良好的效果,广泛应用于数据 的相似性度量,如时间序列数据. 时间序列存在平 移和伸缩等复杂变形,传统的欧氏距离对时间轴 的变化非常敏感,轻微的变化就会导致欧氏距离 发生很大的变动,动态时间弯曲有效克服了欧氏 距离的局限[14–16] . 给定时间序列 p、q,动态时间弯曲首先找到它 们的最佳匹配来计算距离[17] . 具体匹配公式如下: DTW(p,q) = argmin W=w1,w2,···wk ,···,wK vut ∑ K k=1,wk=(i, j) ( pi −qj )2 (4) 式中 : pi、 qj 分别表示序列 p、 q 的 第 i、 j 个元素 , W 表示匹配路径. 图 6 所示为三例温度样本的特征提取结果,即 序列 x、y、z,及其欧氏距离(Euclidean)和动态时间 弯曲映射对比示意图,表 1 为 x、y、z 彼此之间的 欧氏距离和动态时间弯曲距离计算结果. 从表 1 中可以看出,序列之间的动态时间弯曲距离普遍 小于欧氏距离. 尤其是波形相似而波峰不对应的 序列,如 x、y,其动态时间弯曲距离远小于欧氏距 离. 由此表明,对于漏钢温度在不同拉速及工艺条 件下的温度极值不对应的情况,运用动态时间弯 曲可以有效度量其相似性,避免了因使用其他距 离度量方式,如欧氏距离,所导致的漏钢温度相似 性差异较大的问题,进而为漏钢样本的聚类打下 良好的基础. 3.3 聚类参数邻域半径和邻域内最少样本数的选择 参数邻域半径和邻域内最少样本数对密度聚 类的效果有巨大的影响,因此,选择合适的参数尤 为重要. 95 105 100 90 85 (a) The first row The second row 80 75 0 5 10 15 Time/s 20 25 Temperature/℃ 0.5 −1.5 −1.0 −0.5 0 1.0 −2.0 (b) 0 5 10 15 Time/s 20 Z-Score of temerature change rate difference 图 4 温度及其特征提取. (a)误报温度;(b)误报温度预处理结果 Fig.4 Temperature and features extraction: (a) temperature of false alarm; (b) processing results of false alarm 125 100 105 110 115 120 (a) The first row The second row 95 0 5 10 15 Time/s 20 25 Temperature/℃ 1.5 −1.5 1.0 −1.0 0.5 −0.5 0 −2.0 (b) 0 5 10 15 Time/s 20 Z-Score of temerature change rate difference 图 5 温度及其特征提取. (a)漏钢温度;(b)漏钢温度预处理结果 Fig.5 Temperature and features extraction: (a) temperature of breakout; (b) processing results of breakout · 352 · 工程科学学报,第 42 卷,第 3 期
段海洋等:基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 353 1.5 1.5 (a 1.0 6) 1.0 0.5 0.5 0 0 -0.5 Euclidean 0.5 Dynamic Time Warping -1.0 -1.0 -1.5 1.5 -2.0 -2.0 -2.5 -2.5 0 2 468101214161820 6 8101214161820 Time/s Time/s 1.5 1.5 (c) (d) 1.0 1.0 0.5 0.5 0 0 -0.5 Euclidean 0.5 Dynamic Time Warping -1.0 -1.0 -1.5 -1.5 -2.0 -2.0 -2.5 -2.5 0 2468101214161820 02468101214161820 Time/s Time/s 图6欧氏距离和动态时间弯曲映射对比 Fig.6 Mapping comparison of Euclidean and DTW 表1欧氏距离和动态时间弯曲距离计算结果对比 16 Table 1 Comparison of calculation results for Euclidean and DTW 14 distance 12 Item Sequence y 10 0 11.46 15.12 sip Euclidean y 11.46 0 10.53 8 15.1210.53 0 6 0 2.42 9.39 Eps=3.0 Dynamic Time Warping 2.42 0 9.07 irarxoautD 9.39 9.07 0 0 0 20 40 60 80 Sample index (1)参数邻域半径的确定 国7参数邻域半径选择示意图 首先,计算每个样本与其距离最近的五个样 Fig.7 Diagram of parameter Eps selection 本的平均值:然后,将所有样本对应的平均值距离 MinPtsi=WEps(),x∈Q,i=1,2,…,80 (5) 由大到小排序并做图;最后,选择上述图中明显的 转折点所对应的平均值距离作为参数邻域半径, 然后,计算所有样本对应的上述样本数量的 如图7所示. 平均值: 从图7中可以看出,在平均值距离为3.0处存 MinPts Σ9 MinPts =6.6 (6) 在一个明显的转折点.因此,本文设定邻域半径 80 为3.0 基于上述计算结果,设定邻域内最少样本数 (2)参数邻域内最少样本数的获取 设定为7. 对于每一个样本,计算以该样本为中心、以邻 3.4训练样本密度聚类 域半径为半径的邻域内包含的样本数量,即 使用密度聚类算法对样本库Q实施聚类,算
(1)参数邻域半径的确定. 首先,计算每个样本与其距离最近的五个样 本的平均值;然后,将所有样本对应的平均值距离 由大到小排序并做图;最后,选择上述图中明显的 转折点所对应的平均值距离作为参数邻域半径, 如图 7 所示. 从图 7 中可以看出,在平均值距离为 3.0 处存 在一个明显的转折点. 因此,本文设定邻域半径 为 3.0. (2)参数邻域内最少样本数的获取. 对于每一个样本,计算以该样本为中心、以邻 域半径为半径的邻域内包含的样本数量,即 MinPtsi = NEps (xi), xi ∈ Q,i = 1,2,··· ,80 (5) 然后,计算所有样本对应的上述样本数量的 平均值: MinPts = ∑80 i=1 MinPtsi 80 = 6.6 (6) 基于上述计算结果,设定邻域内最少样本数 设定为 7. 3.4 训练样本密度聚类 使用密度聚类算法对样本库 Q 实施聚类,算 表 1 欧氏距离和动态时间弯曲距离计算结果对比 Table 1 Comparison of calculation results for Euclidean and DTW distance Item Sequence x y z Euclidean x 0 11.46 15.12 y 11.46 0 10.53 z 15.12 10.53 0 Dynamic Time Warping x 0 2.42 9.39 y 2.42 0 9.07 z 9.39 9.07 0 1.5 −1.0 −1.5 −0.5 0 0.5 1.0 y x y x (a) −2.5 −2.0 0 2 4 6 8 10 12 Time/s 14 18 16 20 2 4 6 8 10 12 14 18 16 −1.5 1.5 1.0 −1.0 0.5 −0.5 0 −2.5 −2.0 (b) 0 Time/s Euclidean Dynamic Time Warping 20 Z-Score of temerature change rate difference Z-Score of temerature change rate difference 1.5 −1.0 −1.5 −0.5 0 0.5 1.0 z x z x (c) −2.5 −2.0 0 2 4 6 8 10 12 Time/s 14 18 16 20 2 4 6 8 10 12 14 18 16 −1.5 1.5 1.0 −1.0 0.5 −0.5 0 −2.5 −2.0 (d) 0 Time/s Dynamic Time Warping 20 Z-Score of temerature change rate difference Z-Score of temerature change rate difference Euclidean 图 6 欧氏距离和动态时间弯曲映射对比 Fig.6 Mapping comparison of Euclidean and DTW 14 16 4 2 6 8 10 12 0 0 20 80 40 60 Sample index Eps=3.0 Average distance 图 7 参数邻域半径选择示意图 Fig.7 Diagram of parameter Eps selection 段海洋等: 基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 · 353 ·
354 工程科学学报,第42卷,第3期 法中涉及的核心样本定义为:在样本p的邻域半 Normal training samples 径内包含的样本数量不少于邻域内最少样本数设 O Breakout training samples ◇ 定值,即: 2 WEps(pl≥MinPts (7) 9 式中:NEps(p)={gEDDTW(p,q)≤Eps,D为数据 集,P,q∈D,DTW(p,q)表示样本p、q的动态时间弯 6 曲距离. 密度聚类首先根据参数邻域半径、邻域内最 u6r 少样本数确定样本库Q中所有的核心样本,然后 0 0 10 15 20 以任一核心对象为出发点,找出与其密度相连的 Distance from the cluster center 样本生成类簇,直到所有的核心对象均被访问为 图8训练样本密度聚类可视化结果 止.令邻域半径为3.0、邻域内最少样本数为7, Fig.8 Training samples visual result after DBSCAN clustering 对样本库Q实施密度聚类,聚类结果如表2所示, 其中0和-1分别指代两个类簇标号 3.5漏钢预报方法开发 聚类结束后,共计捕获了30个漏钢样本(标号 依据上述聚类结果及构建的聚类模型,鉴于 为0),其余未被捕获的样本标记记为噪声(标号为 漏钢样本从属于同一类簇,且同一类簇样本属于 -1),包括20个正常模式样本和30个误报模式样 同一类别,可根据新样本在模型中的聚类结果,即 本.将标号为0的类簇称之为漏钢类簇,记为CB, 新样本与样本库Q重新聚类后所属的类簇,对其 将标号为-1的样本归为噪声类簇,即包括正常和 是否属于漏钢进行识别和判定.判定流程如图9 误报在内的正常工况类簇记为CN.训练样本的聚 所示.漏钢识别与判定时首先需要对实时温度数 类可视化结果如图8所示.图中横坐标表示每个 据进行温度预处理,然后将新样本与样本库Q一 样本与其所在类簇的中心的距离,纵坐标表示每 Begin 个样本与其所在类簇中最近的7(邻域内最少样本 数设定值)个样本距离的平均值 Real-time temperature acquisition 表2训练样本密度聚类结果 Table 2 DBSCAN clustering result of training samples Temperature pre-processing Working condition DBSCAN clustering result (label) Temperature change rate Difference of change rate -1-1-1-1-1-1-1-1-1-1 Normal -core normalization -1-1-1-1-1-1-1-1-1-1 -1-1-1-1-1-1-1-1-1-1 Sample similarity measurement False alarm -1-1-1-1-1-1-1-1-1-1 Dynamic Time Warping -1-1-1-1-1-1-1-1-1-1 0000000000 Breakout 0000000000 --- Xnew 0000000000 DBSCAN clustering 从图8中可以看出,正常工况样本彼此较为分 散,因此不能被规则捕获.然而,聚类得到的漏钢 The label ofx is 0? No 类簇样本彼此距离较近且集中,表明其易于被规 则捕获形成类簇.聚类结果与漏钢温度模式相似 Yes 而正常工况下的温度异常样本模式多样化的特点 Breakout alarm 高度吻合,说明采用动态时间弯曲距离度量方式 图9漏钢预报流程 和密度聚类方法是合理的 Fig.9 Flowchart of breakout prediction
法中涉及的核心样本定义为:在样本 p 的邻域半 径内包含的样本数量不少于邻域内最少样本数设 定值,即: NEps (p) ⩾ MinPts (7) NEps (p) = { q ∈ D DTW(p,q) ⩽ Eps} D p,q ∈ D DTW(p,q) 式中 : , 为数据 集, , 表示样本 p、q 的动态时间弯 曲距离. 密度聚类首先根据参数邻域半径、邻域内最 少样本数确定样本库 Q 中所有的核心样本,然后 以任一核心对象为出发点,找出与其密度相连的 样本生成类簇,直到所有的核心对象均被访问为 止[18] . 令邻域半径为 3.0、邻域内最少样本数为 7, 对样本库 Q 实施密度聚类,聚类结果如表 2 所示, 其中 0 和−1 分别指代两个类簇标号. 聚类结束后,共计捕获了 30 个漏钢样本(标号 为 0),其余未被捕获的样本标记记为噪声(标号为 −1),包括 20 个正常模式样本和 30 个误报模式样 本. 将标号为 0 的类簇称之为漏钢类簇,记为 CB, 将标号为−1 的样本归为噪声类簇,即包括正常和 误报在内的正常工况类簇记为 CN. 训练样本的聚 类可视化结果如图 8 所示. 图中横坐标表示每个 样本与其所在类簇的中心的距离,纵坐标表示每 个样本与其所在类簇中最近的 7(邻域内最少样本 数设定值)个样本距离的平均值. 从图 8 中可以看出,正常工况样本彼此较为分 散,因此不能被规则捕获. 然而,聚类得到的漏钢 类簇样本彼此距离较近且集中,表明其易于被规 则捕获形成类簇. 聚类结果与漏钢温度模式相似 而正常工况下的温度异常样本模式多样化的特点 高度吻合,说明采用动态时间弯曲距离度量方式 和密度聚类方法是合理的. 3.5 漏钢预报方法开发 依据上述聚类结果及构建的聚类模型,鉴于 漏钢样本从属于同一类簇,且同一类簇样本属于 同一类别,可根据新样本在模型中的聚类结果,即 新样本与样本库 Q 重新聚类后所属的类簇,对其 是否属于漏钢进行识别和判定. 判定流程如图 9 所示. 漏钢识别与判定时首先需要对实时温度数 据进行温度预处理,然后将新样本与样本库 Q 一 表 2 训练样本密度聚类结果 Table 2 DBSCAN clustering result of training samples Working condition DBSCAN clustering result (label) Normal −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 False alarm −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 Breakout 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 15 3 6 9 12 0 0 5 20 10 15 Distance from the cluster center Normal training samples Breakout training samples Average distance from the nearest neighbor 图 8 训练样本密度聚类可视化结果 Fig.8 Training samples visual result after DBSCAN clustering Begin Real-time temperature acquisition Temperature pre-processing Temperature change rate Difference of change rate Z-score normalization Sample similarity measurement Dynamic Time Warping DBSCAN clustering The label of xnew is 0? No xnew Q Breakout alarm Yes 图 9 漏钢预报流程 Fig.9 Flowchart of breakout prediction · 354 · 工程科学学报,第 42 卷,第 3 期
段海洋等:基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 355· 起实施密度聚类,最后根据聚类结果即新样本的 测试,将测试样本分别与样本库实施密度聚类,得 类簇标号判断新样本是否属于漏钢类簇.如果类 到其所属类簇标号并对其进行判定 簇标号为-1,说明不属于漏钢类簇,则更新温度序 图10中(a)和(b)为正常模式和误报模式测试 列,继续漏钢识别与判定:否则,系统发出漏钢警 样本的第一、二排热电偶温度图;图11中(a)和 报,继而采取降速等相应措施,以避免和预防漏钢 (b)为两例漏钢模式测试样本的第一、二排热电偶 4结果与讨论 温度图.图中右侧垂直线表示在线检测时的当前 时刻,左侧垂直线表示当前时刻之前的第24个时 基于上述漏钢预报方法,本文对未经训练的 刻,两个垂直线之间表示所取的当前时刻及前24s 30例正常工况、20例误报和20例漏钢样本进行 共计25s的温度数据 110 (a) -o-The first row 144 (b) -o-The first row 105 -The second row -The second row 100 136 0000000000000000000000000000d0 95 Current moment 20000000000000000000000000000 Current moment 90 11 25s 112 0 25s 00000000000000000000000000000 75 104 70 1 96 0 101520 25 30 0 5 10 1520 25 30 Time/s Time/s 图10不同工况下测试样本的热电偶温度.(a)正常:(b)误报 Fig.10 Thermocouple temperature of test samples under different working mode:(a)normal;(b)false alarm mode 135 -o-The first row -o-The first row 112 (a) (b) --The second row o-The second row 132 104 1 129 96 0 Current moment◆ 0 0-0 ooo00000oo Current moment 25s 80 25s 72 120 00p0000000000000000000 117 0 5 10152025 30 0 5101520 25 30 Time/s Time/s 图11黏结漏钢测试样本热电偶温度.()漏钢样本实例1:(b)漏钢样本实例2 Fig.11 Thermocouple temperature of test samples at breakout mode:(a)sample 1;(b)sample 2 将未经训练的30例正常模式、20例误报模式 低,且同训练样本一样不满足捕获规则而被过滤 和20例漏钢模式样本分别作为测试样本与样本 为噪声样本.而20例黏结漏钢测试样本对应的位 集聚类,得到其类簇标号,聚类结果如表3所示 置均位于漏钢类簇样本所在区域,分布较为密集, 30例正常模式、20例误报模式和20例漏钢 表明这些测试样本经聚类后与漏钢样本的相似度 模式样本的聚类可视化结果如图12所示.从图中 较高.更重要的是,测试样本的集中分布同样易于 可以看出,包含误报在内的50例正常工况测试样 被规则捕获,从而被识别为漏钢类簇样本.从测试 本对应的二维坐标位置分散在正常类簇中,这些 效果来看,该方法可以有效区分样本特征,准确区 测试样本经聚类后与黏结漏钢样本的相似性较 分和判定正常工况和漏钢样本,可为开发基于聚
起实施密度聚类,最后根据聚类结果即新样本的 类簇标号判断新样本是否属于漏钢类簇. 如果类 簇标号为−1,说明不属于漏钢类簇,则更新温度序 列,继续漏钢识别与判定;否则,系统发出漏钢警 报,继而采取降速等相应措施,以避免和预防漏钢. 4 结果与讨论 基于上述漏钢预报方法,本文对未经训练的 30 例正常工况、20 例误报和 20 例漏钢样本进行 测试,将测试样本分别与样本库实施密度聚类,得 到其所属类簇标号并对其进行判定. 图 10 中(a)和(b)为正常模式和误报模式测试 样本的第一、二排热电偶温度图;图 11 中( a)和 (b)为两例漏钢模式测试样本的第一、二排热电偶 温度图. 图中右侧垂直线表示在线检测时的当前 时刻,左侧垂直线表示当前时刻之前的第 24 个时 刻,两个垂直线之间表示所取的当前时刻及前 24 s 共计 25 s 的温度数据. 将未经训练的 30 例正常模式、20 例误报模式 和 20 例漏钢模式样本分别作为测试样本与样本 集聚类,得到其类簇标号,聚类结果如表 3 所示. 30 例正常模式、20 例误报模式和 20 例漏钢 模式样本的聚类可视化结果如图 12 所示. 从图中 可以看出,包含误报在内的 50 例正常工况测试样 本对应的二维坐标位置分散在正常类簇中,这些 测试样本经聚类后与黏结漏钢样本的相似性较 低,且同训练样本一样不满足捕获规则而被过滤 为噪声样本. 而 20 例黏结漏钢测试样本对应的位 置均位于漏钢类簇样本所在区域,分布较为密集, 表明这些测试样本经聚类后与漏钢样本的相似度 较高. 更重要的是,测试样本的集中分布同样易于 被规则捕获,从而被识别为漏钢类簇样本. 从测试 效果来看,该方法可以有效区分样本特征,准确区 分和判定正常工况和漏钢样本,可为开发基于聚 105 (a) 110 95 90 100 70 75 80 85 0 5 10 15 20 25 30 Time/s The first row The second row Current moment 25 s Temperature/℃ 144 (b) 128 120 136 96 104 112 0 5 10 15 20 25 30 Time/s The first row The second row Current moment 25 s Temperature/℃ 图 10 不同工况下测试样本的热电偶温度. (a)正常;(b)误报 Fig.10 Thermocouple temperature of test samples under different working mode: (a) normal; (b) false alarm mode 112 (a) 96 104 64 72 80 88 0 5 10 15 20 25 30 Time/s The first row The second row Current moment 25 s Temperature/℃ 132 135 (b) 129 123 120 126 117 0 5 10 15 20 25 30 Time/s The first row The second row Current moment Temperature/℃ 25 s 图 11 黏结漏钢测试样本热电偶温度. (a)漏钢样本实例 1;(b)漏钢样本实例 2 Fig.11 Thermocouple temperature of test samples at breakout mode: (a) sample 1; (b) sample 2 段海洋等: 基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 · 355 ·
356 工程科学学报,第42卷,第3期 表3测试样本密度聚类结果 [2]Qin X,Zhu C F,Zheng L W,et al.Molten steel breakout prediction based on thermal friction measurement./Iron Steel Res Table 3 DBSCAN clustering result of samples testing 1m,2011,18(4:24 Working condition DBSCAN clustering result(label) [3】 Liu XX,Liu P Z,Zhou J Q.Numerical simulation and prediction -1-1-1-1-1-1-1-1-1-1 for sticking type breakout behavior in slab continuous casting.J Normal -1-1-1-1-1-1-1-1-1-1 Univ SciTechnol Beijing.1997,19(2):143 -1-1-1-1-1-1-1-1-1-1 (刘晓霞,刘佩忠,周绮清.板坯连铸粘结型漏钢过程模拟及预 -1-1-1-1-1-1-1-1-1-1 报.北京科技大学学报,1997,19(2):143) False alarm [4] -1-1-1-1-1-1-1-1-1-1 Hao P F,Xu X H,Pei YY,et al.The period on collecting breakout data sampling and the fashion of mold thermal-monitoring in 0000000000 breakout continuous casting breakout.J Northeast Univ Nat Sci Ed,1997 0000000000 18(4):400 (郝培锋,徐心和,裴云毅,等连铸漏钢预报系统数据采样与热 Normal testing samples 电偶埋设方式.东北大学学报:自然科学版,1997,18(4):400) Breakout testing samples [5]He F,Zhang L Y.Mold breakout prediction in slab continuous casting based on combined method of GA-BP neural network and 12 logic rules.Int J Ady Manuf Technol,2018,95(9-12):4081 9 [6]Liu Y,Wang X D,Du F M,et al.Computer vision detection of mold breakout in slab continuous casting using an optimized 6 neural network.Int J Ady Manuf Technol,2017,88(1-4):557 [71 Blazek K E,Saucedo I G.Characterization of the formation, propagation,and recovery of sticker/hanger type breakouts.IS 1m,1990,30(6上435 10 15 20 [8] Lu M J,Lin K J,Kuo C H,et al.Sticker breakout theory and its Distance from the cluster center prediction in slab continuous-casting /Proceedings of 67th 图12测试样本密度聚类可视化结果 Steelmaking Conference.Dallas,1993:343 Fig.12 Testing samples visual result after DBSCAN clustering [9]Liu Y Z,Wang X D,Jia QZ,et al.Investigation in the behavior of sticking breakout and its propagation in slab continuous casting 类的新型黏结漏钢预报方法提供参考 mould.Steelmaking,2009,25(3):45 (刘永贞,王旭东,贾启忠,等.结晶器内粘结漏钢及其传播行为 5结论 的研究.炼钢,2009,25(3):45) 本文依据漏钢时结晶器铜板温度变化的单一、 [10]He F,Wu P F.Xu Q Y,et al.Mould temperature change and propagation behavior of sticking-type breakout during continuous 相似特性,提取、融合黏结漏钢温度典型的共性特 casting.J Iron Steel Res,2016,28(2):27 征,将密度聚类和动态时间弯曲算法应用于漏钢 (何飞,吴鹏飞,徐其言,等.连铸粘结漏钢的结品器温度变化及 预报,建立和开发了一种基于机器学习的新型漏 其传播行为.钢铁研究学报,2016,28(2):27) 钢预报方法.结果表明,该方法能够准确地识别正 [11]Liu Y,Wang X D,Shi G Q,et al.Process factors of sticking 常工况样本和黏结漏钢样本的特征,对于未经训 breakout for wide and thick slab continuous casting.J Uniy Sci 练的在线实测样本,该方法亦能准确地判定其是 Technol Beijing,2014,36(6):757 否为漏钢.建立的方法受连铸工艺和铸机设备参 (刘宇,王旭东,施桂钱,等.宽厚板连铸黏结漏钢的工艺因素 数的影响小,在样本的特征识别和判定过程中,不 北京科技大学学报,2014,36(6):757) [12]Ester M,Kriegel H P,Sander J,et al.A density-based algorithm 需依赖人工经验设置相应的预报参数,同时回避 了制作训练样本的繁琐过程,在保证报出率的同 for discovering clusters in large spatial databases with noise/ KDD-96 Proceedings.Second International Conference on 时,可大幅度降低误报次数,具有较好的稳定性 Knowledge Discovery and Data Mining.Portland,1996:226 [13]Salvadora S,Chan P.Toward accurate dynamic time warping in 参考文献 linear time and space.Intell Data Anal,2007,11(5):561 [1]Zhang Y X,Wang WL,Zhang HH.Development of a mold [14]Kate R J.Using dynamic time warping distances as features for cracking simulator:The study of breakout and crack formation in improved time series classification.Data Min Knowl Discov,2016, continuous casting mold.Metall Mater Trans B,2016,47(4): 30(2):283 2244 [15]Anh D T,Thanh L H.An efficient implementation of k-means
类的新型黏结漏钢预报方法提供参考. 5 结论 本文依据漏钢时结晶器铜板温度变化的单一、 相似特性,提取、融合黏结漏钢温度典型的共性特 征,将密度聚类和动态时间弯曲算法应用于漏钢 预报,建立和开发了一种基于机器学习的新型漏 钢预报方法. 结果表明,该方法能够准确地识别正 常工况样本和黏结漏钢样本的特征,对于未经训 练的在线实测样本,该方法亦能准确地判定其是 否为漏钢. 建立的方法受连铸工艺和铸机设备参 数的影响小,在样本的特征识别和判定过程中,不 需依赖人工经验设置相应的预报参数,同时回避 了制作训练样本的繁琐过程,在保证报出率的同 时,可大幅度降低误报次数,具有较好的稳定性. 参 考 文 献 Zhang Y X, Wang W L, Zhang H H. Development of a mold cracking simulator: The study of breakout and crack formation in continuous casting mold. Metall Mater Trans B, 2016, 47(4): 2244 [1] Qin X, Zhu C F, Zheng L W, et al. Molten steel breakout prediction based on thermal friction measurement. J Iron Steel Res Int, 2011, 18(4): 24 [2] Liu X X, Liu P Z, Zhou J Q. Numerical simulation and prediction for sticking type breakout behavior in slab continuous casting. J Univ Sci Technol Beijing, 1997, 19(2): 143 (刘晓霞, 刘佩忠, 周筠清. 板坯连铸粘结型漏钢过程模拟及预 报. 北京科技大学学报, 1997, 19(2):143) [3] Hao P F, Xu X H, Pei Y Y, et al. The period on collecting breakout data sampling and the fashion of mold thermal-monitoring in continuous casting breakout. J Northeast Univ Nat Sci Ed, 1997, 18(4): 400 (郝培锋, 徐心和, 裴云毅, 等. 连铸漏钢预报系统数据采样与热 电偶埋设方式. 东北大学学报: 自然科学版, 1997, 18(4):400) [4] He F, Zhang L Y. Mold breakout prediction in slab continuous casting based on combined method of GA-BP neural network and logic rules. Int J Adv Manuf Technol, 2018, 95(9-12): 4081 [5] Liu Y, Wang X D, Du F M, et al. Computer vision detection of mold breakout in slab continuous casting using an optimized neural network. Int J Adv Manuf Technol, 2017, 88(1-4): 557 [6] Blazek K E, Saucedo I G. Characterization of the formation, propagation, and recovery of sticker/hanger type breakouts. ISIJ Int, 1990, 30(6): 435 [7] Lu M J, Lin K J, Kuo C H, et al. Sticker breakout theory and its prediction in slab continuous-casting // Proceedings of 67th Steelmaking Conference. Dallas, 1993: 343 [8] Liu Y Z, Wang X D, Jia Q Z, et al. Investigation in the behavior of sticking breakout and its propagation in slab continuous casting mould. Steelmaking, 2009, 25(3): 45 (刘永贞, 王旭东, 贾启忠, 等. 结晶器内粘结漏钢及其传播行为 的研究. 炼钢, 2009, 25(3):45) [9] He F, Wu P F, Xu Q Y, et al. Mould temperature change and propagation behavior of sticking-type breakout during continuous casting. J Iron Steel Res, 2016, 28(2): 27 (何飞, 吴鹏飞, 徐其言, 等. 连铸粘结漏钢的结晶器温度变化及 其传播行为. 钢铁研究学报, 2016, 28(2):27) [10] Liu Y, Wang X D, Shi G Q, et al. Process factors of sticking breakout for wide and thick slab continuous casting. J Univ Sci Technol Beijing, 2014, 36(6): 757 (刘宇, 王旭东, 施桂钱, 等. 宽厚板连铸黏结漏钢的工艺因素. 北京科技大学学报, 2014, 36(6):757) [11] Ester M, Kriegel H P, Sander J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise // KDD-96 Proceedings. Second International Conference on Knowledge Discovery and Data Mining. Portland, 1996: 226 [12] Salvadora S, Chan P. Toward accurate dynamic time warping in linear time and space. Intell Data Anal, 2007, 11(5): 561 [13] Kate R J. Using dynamic time warping distances as features for improved time series classification. Data Min Knowl Discov, 2016, 30(2): 283 [14] [15] Anh D T, Thanh L H. An efficient implementation of k-means 表 3 测试样本密度聚类结果 Table 3 DBSCAN clustering result of samples testing Working condition DBSCAN clustering result (label) Normal −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 False alarm −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 breakout 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 15 3 6 9 12 0 0 5 20 10 15 Distance from the cluster center Normal testing samples Breakout testing samples Average distance from the nearest neighbor 图 12 测试样本密度聚类可视化结果 Fig.12 Testing samples visual result after DBSCAN clustering · 356 · 工程科学学报,第 42 卷,第 3 期
段海洋等:基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 357 clustering for time series data with DTW distance.Int J Bus Intell Mah,2017,319:514 Data Min,2015,10(3):213 [18]Wang W T.Wu Y L.Tang C Y,et al.Adaptive density-based [16]Keogh E,Ratanamahatana C A.Exact indexing of dynamic time spatial clustering of applications with noise (DBSCAN)according warping.Knowl InfSyst,2005,7(3):358 to data Il Proceedings of 2015 International Conference on [17]Wan Y,Chen X L,Shi Y.Adaptive cost dynamic time warping Machine Learning and Cybernetics (ICMLC).Guangzhou,2015: distance in time series analysis for classification.Compu Appl 445
clustering for time series data with DTW distance. Int J Bus Intell Data Min, 2015, 10(3): 213 Keogh E, Ratanamahatana C A. Exact indexing of dynamic time warping. Knowl Inf Syst, 2005, 7(3): 358 [16] Wan Y, Chen X L, Shi Y. Adaptive cost dynamic time warping distance in time series analysis for classification. J Comput Appl [17] Math, 2017, 319: 514 Wang W T, Wu Y L, Tang C Y, et al. Adaptive density-based spatial clustering of applications with noise (DBSCAN) according to data // Proceedings of 2015 International Conference on Machine Learning and Cybernetics (ICMLC). Guangzhou, 2015: 445 [18] 段海洋等: 基于密度聚类和动态时间弯曲的结晶器黏结漏钢预报方法的开发 · 357 ·