《工程科学学报》录用稿,htps:/doi.org/10.13374/i,issn2095-9389.2021.08.17.001©北京科技大学2020 工程科学学报DO: 深度学习在炼钢过程中的研究进展及应用现状 王仲亮,顾超驱,王敏,包燕平四 北京科技大学钢铁治金新技术国家重点实验室,北京100083 ☒通信作者,E-mail:guchao@ustb.edu.cn,baoyp@ustb.edu.cn 摘要钢铁作为“工业粮食”是其他产业不可或缺的基础材料,同时,钢铁工业在整个国夜经济中具有举足轻重的 作用。炼钢过程是极其复杂的工业场景,影响因素多且安全性要求极高,是当前深度 长规模应用的领域之 一。本文对深度学习的原理和类型进行了梳理,并结合国内外应用实例,总结了深度 在炼钢过程的发展历程与 研究现状。指出了深度学习在炼钢过程中应用主要有特征提取简单、泛化能力强模型可塑性高的优势,同时也面临 数据依赖性高、预处理难度大、生产安全性有待验证的挑战。提出了未来随着高精度传感器的应用、物联网的普及、计 拿硬件的迭代、算法的创新,深度学习模型可以更加有效地应用予炼钢的更多场景中,将推动治金工业智能化发展。 关键词炼钢过程:深度学习:神经网络:应用场 分类号TF34 非最 Research progress and application s status of deep learning in as激件 WANG Zhong-liang, WANG Min,BAO Yan-ping State Key Laboratory of Advanced Metallurgy,University of Science and Technology Beijing,Beijing 100083,China ☒Corresponding auth nail:guchao@ustb.edu.cn:baoyp@ustb.edu.cn ABSTRACT The steel industry is an important embodiment of the national productivity and plays a role in the development of the national economy and defense construction as a material foundation.In recent years,China's crude steel production has ranked first in the world.and in 2020 it has exceeded I billion tons for the first time,reaching 1.065 billion tons.But at the 收离日期:2021-8-16 演自中央高校基本科研业务费(FF-TP-20-026A1):中国博士后科学基金特别资助项目(2021T140050):钢铁 治金新技术国家重点实验室自主课题(41621014)
工程科学学报 DOI: 深度学习在炼钢过程中的研究进展及应用现状1 王仲亮,顾 超,王 敏,包燕平 北京科技大学钢铁冶金新技术国家重点实验室,北京 100083 通信作者,E-mail: guchao@ustb.edu.cn; baoyp@ustb.edu.cn 摘 要 钢铁作为“工业粮食”是其他产业不可或缺的基础材料,同时,钢铁工业在整个国民经济中具有举足轻重的 作用。炼钢过程是极其复杂的工业场景,影响因素多且安全性要求极高,是当前深度学习尚未大规模应用的领域之 一。本文对深度学习的原理和类型进行了梳理,并结合国内外应用实例,总结了深度学习在炼钢过程的发展历程与 研究现状。指出了深度学习在炼钢过程中应用主要有特征提取简单、泛化能力强、模型可塑性高的优势,同时也面临 数据依赖性高、预处理难度大、生产安全性有待验证的挑战。提出了未来随着高精度传感器的应用、物联网的普及、计 算硬件的迭代、算法的创新,深度学习模型可以更加有效地应用于炼钢的更多场景中,将推动冶金工业智能化发展。 关键词 炼钢过程;深度学习;神经网络;应用场景 分类号 TF34 Research progress and application status of deep learning in steelmaking process WANG Zhong-liang, Gu Chao, WANG Min, BAO Yan-ping State Key Laboratory of Advanced Metallurgy, University of Science and Technology Beijing, Beijing 100083, China Corresponding author, E-mail: guchao@ustb.edu.cn; baoyp@ustb.edu.cn ABSTRACT The steel industry is an important embodiment of the national productivity and plays a role in the development of the national economy and defense construction as a material foundation. In recent years, China's crude steel production has ranked first in the world, and in 2020 it has exceeded 1 billion tons for the first time, reaching 1.065 billion tons. But at the 1收稿日期: 2021-8-16 基金项目: 中央高校基本科研业务费 (FRF-TP-20-026A1);中国博士后科学基金特别资助项目 (2021T140050);钢铁 冶金新技术国家重点实验室自主课题 (41621014) 《工程科学学报》录用稿,https://doi.org/10.13374/j.issn2095-9389.2021.08.17.001 ©北京科技大学 2020 录用稿件,非最终出版稿
same time,the steel industry is also a major energy consumer and polluter.In the current national coordination to do a good job of "carbon peak""carbon neutral"background,the traditional steelmaking process urgently needs to be transformed into intelligent and green.In recent years,as an important branch of machine learning,with artificial neural networks as the basic architecture,deep learning,a nonlinear modeling algorithm that can extract features from data and realize knowledge learning,has been applied in various industrial fields.Steelmaking process is an extremely complex industrial scenario with many influencing factors and high security requirements,which is one of the areas where deep learning has not been applied on a large scale yet.This paper compares the principles and types of deep learning.and summarizes the development history and research status of deep learning in steelmaking process with domestic and foreign application examples.It is pointed out that the application of deep learning in steelmaking process mainly has the advantages of simp extraction,strong generalization ability and high model plasticity,but also faces the challenges of hi ta dependency, difficult pre- processing and production safety to be verified.It is proposed that in the future,with the application of high-precision sensors,the popularization of the Internet of Things,the iteration of computing hardware,and the innovation of algorithms, deep learning models can be more effectively applied to more s sce making,which will promote the intelligent development of metallurgical industry. KEY WORDS Steelmaking process;deep learning;neural network,application scenarios 钢铁工业是国家生产力的重要体现,在国民经济发展与国防建设中起到物质基础的作用山。近 年来我国粗钢产量稳居全球首位,2020年更是首次突破10亿吨,达到10.65亿吨。同时,庞大的 产能背后,钢铁行业也是能耗和污染太户在当前全国统筹做好“碳达峰”“碳中和”背景下,传 统炼钢工艺亟待向智慧化和绿色化转型。炼钢整体流程可划分为初炼、精炼和连铸三个阶段依次进行, 每个阶段又有多道处理又序 我国粗钢产品约90%来自转炉炼钢,其余来自电炉),但无论采用何 种初炼方式,炼钢硫程均具有工序高度复杂、控制过程非线性的特点,难以建立准确的数学模型 进行描述,这使得智慧化之路面临挑战。为应对治炼过程的上述特性,作为机器学习近年来兴起 的重要分支,深度学匀被引入到炼钢领域且已获得广泛应用,这是一种以人工神经网络为基本架构, 对数据进行特征提取并实现知识学习的非线性建模算法),其已成为钢铁行业智慧化的重要手段之 一。本文对深度学习原理进行了介绍,并将前人在深度学习应用于炼钢的工序过程所做的工作以及 优缺点等进行了综合阐述。 1.深度学习原理及类型 深度学习目的在于模拟生物体内的神经网络处理外界信息的过程。与生物神经细胞可接受外界
same time, the steel industry is also a major energy consumer and polluter. In the current national coordination to do a good job of "carbon peak" "carbon neutral" background, the traditional steelmaking process urgently needs to be transformed into intelligent and green. In recent years, as an important branch of machine learning, with artificial neural networks as the basic architecture, deep learning, a nonlinear modeling algorithm that can extract features from data and realize knowledge learning, has been applied in various industrial fields. Steelmaking process is an extremely complex industrial scenario with many influencing factors and high security requirements, which is one of the areas where deep learning has not been applied on a large scale yet. This paper compares the principles and types of deep learning, and summarizes the development history and research status of deep learning in steelmaking process with domestic and foreign application examples. It is pointed out that the application of deep learning in steelmaking process mainly has the advantages of simple feature extraction, strong generalization ability and high model plasticity, but also faces the challenges of high data dependency, difficult preprocessing and production safety to be verified. It is proposed that in the future, with the application of high-precision sensors, the popularization of the Internet of Things, the iteration of computing hardware, and the innovation of algorithms, deep learning models can be more effectively applied to more scenarios in steelmaking, which will promote the intelligent development of metallurgical industry. KEY WORDS Steelmaking process; deep learning; neural network; application scenarios 钢铁工业是国家生产力的重要体现,在国民经济发展与国防建设中起到物质基础的作用[1]。近 年来我国粗钢产量稳居全球首位,2020 年更是首次突破 10 亿吨,达到 10.65 亿吨[2]。同时,庞大的 产能背后,钢铁行业也是能耗和污染大户,在当前全国统筹做好“碳达峰”“碳中和”背景下,传 统炼钢工艺亟待向智慧化和绿色化转型。炼钢整体流程可划分为初炼、精炼和连铸三个阶段依次进行, 每个阶段又有多道处理工序。我国粗钢产品约 90%来自转炉炼钢,其余来自电炉[3],但无论采用何 种初炼方式,炼钢全流程均具有工序高度复杂、控制过程非线性的特点,难以建立准确的数学模型 进行描述,这使得智慧化之路面临挑战[4]。为应对冶炼过程的上述特性,作为机器学习近年来兴起 的重要分支,深度学习被引入到炼钢领域且已获得广泛应用,这是一种以人工神经网络为基本架构 , 对数据进行特征提取并实现知识学习的非线性建模算法[5-7],其已成为钢铁行业智慧化的重要手段之 一。本文对深度学习原理进行了介绍,并将前人在深度学习应用于炼钢的工序过程所做的工作以及 优缺点等进行了综合阐述。 1. 深度学习原理及类型 深度学习目的在于模拟生物体内的神经网络处理外界信息的过程。与生物神经细胞可接受外界 录用稿件,非最终出版稿
刺激或其他细胞信息类似,人工神经网络中的基本单元神经元可以起到相同的作用,可以接受来自 其他神经元的输入或者是外部的数据,然后计算一个输出。如图1所示为神经元的工作原理,首先 每个输入值被赋予一个权值,权值大小取决于这个输入数据的重要性,然后进行激活函数的运算, 常见的激活函数有sigmod函数、relu函数和tanh函数等,目的是给输出值引入非线性,从而用于更 好地描述现实问题阁。与神经细胞相同,当前神经元的输出可以作为其他神经元的输入,反之其他 神经元的输出也可作为当前神经元的输入。 Neuron 最终版 Activation function 八z) Weighting 围1人工神经神经元结构及工作理 Fig.I Structure and working principle of artificial neural network neurons 图2为深度学习模型的基本结构,通常由一个输入层、一个输出层和若干隐藏层构建而成,其 中每层都有若干神经元,每两个神经元之间都有对应权值来决定上级输入数据的重要性。深度学习 模型的输入层用于接收数据,y然后将输入数据传递给第一个隐含层,隐含层会针对这些数据进行函 录用 数运算,并在隐含层内部进行数据传输, 最后一个隐含层会将计算结果传递给输出层,由输出层输 出最终数据。 Input layer Hidden layer Output laye 圆2深度学习模型基本构 Fig.2 Deep learning model basic structure
刺激或其他细胞信息类似,人工神经网络中的基本单元神经元可以起到相同的作用,可以接受来自 其他神经元的输入或者是外部的数据,然后计算一个输出。如图 1 所示为神经元的工作原理,首先 每个输入值被赋予一个权值,权值大小取决于这个输入数据的重要性,然后进行激活函数的运算, 常见的激活函数有 sigmod 函数、relu 函数和 tanh 函数等,目的是给输出值引入非线性,从而用于更 好地描述现实问题[8]。与神经细胞相同,当前神经元的输出可以作为其他神经元的输入,反之其他 神经元的输出也可作为当前神经元的输入。 图 1 人工神经网络神经元结构及工作原理 Fig.1 Structure and working principle of artificial neural network neurons 图 2 为深度学习模型的基本结构,通常由一个输入层、一个输出层和若干隐藏层构建而成,其 中每层都有若干神经元,每两个神经元之间都有对应权值来决定上级输入数据的重要性。深度学习 模型的输入层用于接收数据,然后将输入数据传递给第一个隐含层,隐含层会针对这些数据进行函 数运算,并在隐含层内部进行数据传输,最后一个隐含层会将计算结果传递给输出层,由输出层输 出最终数据。 Input layer Hidden layer Output layer Ă Ă x1 x2 x3 x4 图 2 深度学习模型基本结构 Fig.2 Deep learning model basic structure 录用稿件,非最终出版稿
深度学习作为机器学习的一个重要分支,根据模型中神经元的互联方式以及各层的相互关系, 可分为前馈神经网络、反馈神经网络和自组织神经网络。前馈神经网络指每一层神经元只接受来自前 一层的数据输入,后层对前层没有数据反馈,初始输入数据经过在各层的向前传播,在输出层得到 最终结果,如图3)所示9。此类结构适用于模式识别,数据挖掘和非线性函数逼近,典型的前馈神 经网络包括:利用梯度下降法的BP神经网络,ELM(极限学习机神经网络),RBF(径向基神经 网络),以及包含卷积计算的CNN(卷积神经网络)等。反馈神经网络是指模型中神经元之间有 反馈通道,所有神经元能够任意连接,数据信号可以进行双向传播,输入信号仅仅作为模型的初始 状态,整个模型经过反复循环迭代逐渐收敛至平衡态,如图3b)所示。因此友馈神经网络是一种 动态非线性网络,稳定性是其重要评价指标。此类结构适用于寻找问题最优 典型的反馈神经网 络包括:Hopfield神经网络、Hamming神经网络、WNN(小波神经网络 BAM(双向联系存储网 络)、BM(波耳兹曼机)等。自组织神经网络含有输入层和竞争层两层网络,无隐含层,两层之间 各神经元间双向连接,且竞争层各神经元间也存在双向连接,如图3)所示。此类结构可在无监督 情况下,自组织地改变网络结构和各神经元间权值,进而百动后找原始数据中的特征规律, 典型的 自组织神经网络包括:SOM(自组织映射神经网络) 外对偶传播网络),ART(自适应共 振理论)等。 a Input layer Hidden layer Output layer Hidden layer Output layer C Input layer Competitive layer 国3/神经两够分类(a前神经网蜂:(b)反馈神经丹蜂:(C自组织神经同络 Fig.3 Neural network classification(a)Feed-forward neural network,(b)Feedback neural network,(c)Self-organizing neural network 现今研号 经提出了上百种深度学习模型,优化算法更是层出不穷。但从实际应用角度来 看,广泛研究且大规模使用的模型并不多。在表1中列出了BP、CNN、WNN和SOM等几种常用主 流深度学习方法,并对比了他们之间的优缺点。 表1几种深度学习主流方法特征对比 Table I Comparison of features of several mainstream methods of deep learning Deep Learning Methods Advantages Disadvantages BP (1)Strong non-linear mapping capability (1)Slow convergence speed
深度学习作为机器学习的一个重要分支,根据模型中神经元的互联方式以及各层的相互关系, 可分为前馈神经网络、反馈神经网络和自组织神经网络。前馈神经网络指每一层神经元只接受来自前 一层的数据输入,后层对前层没有数据反馈,初始输入数据经过在各层的向前传播,在输出层得到 最终结果,如图 3a)所示[9]。此类结构适用于模式识别,数据挖掘和非线性函数逼近,典型的前馈神 经网络包括:利用梯度下降法的 BP 神经网络,ELM(极限学习机神经网络),RBF(径向基神经 网络),以及包含卷积计算的 CNN(卷积神经网络)等[10]。反馈神经网络是指模型中神经元之间有 反馈通道,所有神经元能够任意连接,数据信号可以进行双向传播,输入信号仅仅作为模型的初始 状态,整个模型经过反复循环迭代逐渐收敛至平衡态,如图 3b)所示[11]。因此,反馈神经网络是一种 动态非线性网络,稳定性是其重要评价指标。此类结构适用于寻找问题最优解,典型的反馈神经网 络包括:Hopfield 神经网络、Hamming 神经网络、WNN(小波神经网络)、BAM(双向联系存储网 络)、BM(波耳兹曼机)等。自组织神经网络含有输入层和竞争层两层网络,无隐含层,两层之间 各神经元间双向连接,且竞争层各神经元间也存在双向连接,如图 3c)所示[12]。此类结构可在无监督 情况下,自组织地改变网络结构和各神经元间权值,进而自动寻找原始数据中的特征规律,典型的 自组织神经网络包括:SOM(自组织映射神经网络)、CPN(外对偶传播网络),ART(自适应共 振理论)等。 Input layer Hidden layer Output layer Input layer Hidden layer Output layer Input layer Ă Ă Ă Ă a b c Competitive layer 图 3 神经网络分类 (a) 前馈神经网络; (b) 反馈神经网络; (c) 自组织神经网络 Fig.3 Neural network classification (a) Feed-forward neural network; (b) Feedback neural network; (c) Self-organizing neural network 现今研究人员已经提出了上百种深度学习模型,优化算法更是层出不穷。但从实际应用角度来 看,广泛研究且大规模使用的模型并不多。在表 1 中列出了 BP、CNN、WNN 和 SOM 等几种常用主 流深度学习方法,并对比了他们之间的优缺点。 表 1 几种深度学习主流方法特征对比 Table 1 Comparison of features of several mainstream methods of deep learning Deep Learning Methods Advantages Disadvantages BP (1) Strong non-linear mapping capability (1) Slow convergence speed 录用稿件,非最终出版稿
(2)Highly self-learning and self-adaptive capabilities (2)Easy to fall into local minima (3)Some fault tolerance (1)Partial connection (1)Need to normalize the data set CNN (2)Value sharing (2)No memory function (3)Hierarchical expression (3)Poor natural language processing skills (1)Fast network convergence (1)Difficult to determine the nodes in the hidden layer WNN (2)Avoid getting stuck in a local optimum (2)No adaptive selection of functions (3)High precision (1)Self-organization changes network parameters (1)Need to pre-determine the number of neurons SOM (2)Only one neuron becomes the competition winner (2)Randomly generate the i be of the weight vector 2.深度学习在炼钢过程的发展与应用 2.1深度学习在炼铜过程的发展 炼钢过程涉及热力学、动力学及动量热量质量传输等物理化学机玛 但由于过程参数复杂,且 前后工序存在遗传影响,在解释对应治金现象时需要大量假设租简化。而与之相反,深度学习模型 只要有足够多的样本训练就能达到较好的拟合效果,但不能从原理上对现象进行解析。在利用治金 工艺原理进行理论指导的同时将深度学习引人参斜程建模,可以实现优势互补。1943年 [,MeCulloch和Pits参考神经细胞工作原理首次提出神经元数学模型,即M-P模型,这标志着 人工神经网络的开端。Hinton分别在19864年利2006s年两次推动神经网络的巨大进步,先是促进 了BP算法在学习训练中的应用,而后又掀起深度学习新的研究热潮。伴随着神经网络的波动发展, 以及硬件设备计算能力的不断提以深度学习在炼钢过程中的应用主要可分为三个阶段,分别如下: 2.1.1应用探索阶段 神经网络依靠提取数据特征完成训练学习,模仿人脑活动过程,取得对应经验,因此在应用早 期,常与炼钢专家系统相结哈, 共同为现场决策起辅助作用61,解决某个工序点的问题。迫于当 时生产数据难以实时采集,同时专家系统无法获取隐性知识,加之硬件计算能力有限,使得深度学 习模型在炼钢过程中的应用研究没有大的发展,模型精度较低。但国内外学者都进行了有益探索, 部分研究成果在实际生产中开始小范围研究性试用,见表2。 表2深度学习模型探素使用案例 Table 2 Deep learning model exploration use cases NO. Year Country Application companies Process Application 1 1990 USA Copperweld Steel mill Electric arc furnace Process control 2 1990 USA North Star Steel mill Electric arc furnace Process control 1991 Finland Rahhe Steel mill Continuous casting Pourability forecast
(2) Highly self-learning and self-adaptive capabilities (3) Some fault tolerance (2) Easy to fall into local minima CNN (1) Partial connection (2) Value sharing (3) Hierarchical expression (1) Need to normalize the data set (2) No memory function (3) Poor natural language processing skills WNN (1) Fast network convergence (2) Avoid getting stuck in a local optimum (3) High precision (1) Difficult to determine the nodes in the hidden layer (2) No adaptive selection of functions SOM (1) Self-organization changes network parameters (2) Only one neuron becomes the competition winner (1) Need to pre-determine the number of neurons (2) Randomly generate the initial value of the weight vector 2. 深度学习在炼钢过程的发展与应用 2.1 深度学习在炼钢过程的发展 炼钢过程涉及热力学、动力学及动量热量质量传输等物理化学机理,但由于过程参数复杂,且 前后工序存在遗传影响,在解释对应冶金现象时需要大量假设和简化。而与之相反,深度学习模型 只要有足够多的样本训练就能达到较好的拟合效果,但不能从原理上对现象进行解析。在利用冶金 工艺原理进行理论指导的同时将深度学习引入生产过程建模,可以实现优势互补。1943 年 [13],McCulloch 和 Pitts 参考神经细胞工作原理,首次提出神经元数学模型,即 M-P 模型,这标志着 人工神经网络的开端。Hinton 分别在 1986[14]年和 2006[15]年两次推动神经网络的巨大进步,先是促进 了 BP 算法在学习训练中的应用,而后又掀起深度学习新的研究热潮。伴随着神经网络的波动发展 , 以及硬件设备计算能力的不断提升,深度学习在炼钢过程中的应用主要可分为三个阶段,分别如下: 2.1.1 应用探索阶段 神经网络依靠提取数据特征完成训练学习,模仿人脑活动过程,取得对应经验,因此在应用早 期,常与炼钢专家系统相结合,共同为现场决策起辅助作用[16-19],解决某个工序点的问题。迫于当 时生产数据难以实时采集,同时专家系统无法获取隐性知识,加之硬件计算能力有限,使得深度学 习模型在炼钢过程中的应用研究没有大的发展,模型精度较低。但国内外学者都进行了有益探索, 部分研究成果在实际生产中开始小范围研究性试用,见表 2。 表 2 深度学习模型探索使用案例 Table 2 Deep learning model exploration use cases NO. Year Country Application companies Process Application 1 1990 USA Copperweld Steel mill Electric arc furnace Process control 2 1990 USA North Star Steel mill Electric arc furnace Process control 3 1991 Finland Rahhe Steel mill Continuous casting Pourability forecast 录用稿件,非最终出版稿
4 1991 Japan Yawata Steel mill Continuous casting Steel leakage forecast 5 1994 China Guangzhou Steel Mill Electric arc furnace Electrode control 6 1995 China Baoshan Steel Converters Dynamic model 7 1997 China Wuhan Steel Converters Endpoint control 2001 China Xingcheng Special Steel Electric arc furnace Temperature forecast 2.1.2初步结合阶段 上世纪末至本世纪初,炼钢技术迅速发展,深度学习模型也取得长足进步,完全由计算机控制 的全工序“一键炼钢”成为国内外治金从业者研究的热点。特别是以转炉动态控制为代表的实时响 应模型与深度学习模型结合能够在短时间内完成计算分析,并对生产状况做出正确判断。通过初步 结合应用,模型精度有所提升,转炉终点碳温双命中率可达95%, 连续动态调整连铸二冷配水,铸 坯表面实际温度与目标温度误差在±10C以内20-2。深度学习模型开始在全流都多立序点应用。 2.1.3融合发展阶段 近年来,得益于工业传感器和数据存储的技术进步,炼钢过程史更多的数据信号被采集记录, 例如初炼、精炼和连铸过程的物料加入、烟气信息、冷却水信息、设备本体状况、各工序的声音图像等, 为数据驱动的深度学习模型提供了更多可利用的素材。模型精度的大幅提升使得大量钢铁企业将深 度学习用于实际控制,实现了深度学习与炼钢过程搬 展与全工序多维度应用3,如图4为部 分案例。 Steelmaking Continuous casting Endpoint prediction Oven number identification Oxygen blowing Power feed control Surface defect detection Ingredient prediction Electrode con Steel leakage prediction Temperature control Flame re Castability forecast Consumption forecast Cooling water control 圆4深度学习型在修过覆中的部分应用 FPartial application ofthe deep leaming model in the stemaking process 22禄度学习在不同场景中的应用 2.2.1工艺过程预测及控制 钢液在熔融金属反应容器内发生影响因素多、过程复杂的多元多相高温物理化学反应,于整个 工艺过程结束时获得符合要求的温度和成分,期间会积累大量数据信息。但由于缺乏有效的数据分 析处理手段,这些数据资源未能得到充分解析利用,另一方面,熔池内实时信息无法获取,难以直 接对过程做出判断。通过引入深度学习方法,如BP神经网络、RBF神经网络、基于带外源输入的非
4 1991 Japan Yawata Steel mill Continuous casting Steel leakage forecast 5 1994 China Guangzhou Steel Mill Electric arc furnace Electrode control 6 1995 China Baoshan Steel Converters Dynamic model 7 1997 China Wuhan Steel Converters Endpoint control 8 2001 China Xingcheng Special Steel Electric arc furnace Temperature forecast 2.1.2 初步结合阶段 上世纪末至本世纪初,炼钢技术迅速发展,深度学习模型也取得长足进步,完全由计算机控制 的全工序“一键炼钢”成为国内外冶金从业者研究的热点。特别是以转炉动态控制为代表的实时响 应模型与深度学习模型结合能够在短时间内完成计算分析,并对生产状况做出正确判断。 通过初步 结合应用,模型精度有所提升,转炉终点碳温双命中率可达 95%,连续动态调整连铸二冷配水,铸 坯表面实际温度与目标温度误差在±10℃以内[20-22]。深度学习模型开始在全流程多工序点应用。 2.1.3 融合发展阶段 近年来,得益于工业传感器和数据存储的技术进步,炼钢过程中更多的数据信号被采集记录, 例如初炼、精炼和连铸过程的物料加入、烟气信息、冷却水信息、设备本体状况、各工序的声音图像等, 为数据驱动的深度学习模型提供了更多可利用的素材。模型精度的大幅提升使得大量钢铁企业将深 度学习用于实际控制,实现了深度学习与炼钢过程的融合发展与全工序多维度应用[23],如图 4 为部 分案例。 图 4 深度学习模型在炼钢过程中的部分应用 Fig.4 Partial application of the deep learning model in the steelmaking process 2.2 深度学习在不同场景中的应用 2.2.1 工艺过程预测及控制 钢液在熔融金属反应容器内发生影响因素多、过程复杂的多元多相高温物理化学反应,于整个 工艺过程结束时获得符合要求的温度和成分,期间会积累大量数据信息。但由于缺乏有效的数据分 析处理手段,这些数据资源未能得到充分解析利用,另一方面,熔池内实时信息无法获取,难以直 接对过程做出判断。通过引入深度学习方法,如 BP 神经网络、RBF 神经网络、基于带外源输入的非 录用稿件,非最终出版稿
线性自回归神经网络等,可以在利用数据的同时实现工艺过程预测与判断。 (1)转炉终点预测 由于原料成分的波动,吹炼参数及辅料加入有差异,造成转炉治炼终点难以稳定控制,因此建 立预测模型对实际生产具有重要指导意义。利用已有物料信息和实时操作数据,建立终点预测模型, 有针对性地调整工艺,可实现对终点成分的控制。传统的BP模型存在收敛速度慢和容易陷入局部 极小值的问题,李长荣、艾立群等分别利用优化算法改进BP神经网络,以石灰量、铁水量、铁水温 度、萤石量、铁水碳含量、铁水磷含量、吹氧量等为评价参数对转炉终点磷含量进行了预测,误差值 为士0.008%时,命中率可达93.33%4,2。He等提出了一种基于主成分分析和BP神经网络对BOF终 点磷含量进行预测的深度学习模型,利用主成分分析减少影响因素维数,用结果表明, 预测误差 在±0.007%、±0.005%和±0.004%以内时,终点磷含量命中率分别为96.6个93.33%和86.67%2。高 放等提出了基于FA-ELM(因子分析法-超限学习机)的转炉终点磷预测模型, 较传统BP神经网络 模型具有更高的准确性和更强的泛化能力P。铉明涛等利用FOAX果蝇算法)优化后的GRNN(广 义回归神经网络)预报转炉终点碳和温度,使模型具有精 训练简单,计算时间短等优点, 更加适合反应速度快、数据量巨大的转炉治炼过程。祁 怡等采用k-均值聚类算法确定隐藏层中心, 最小二乘法调整RBF神经网络的权值,解决了RB经网络隐含层节点的个数及异类样本距离阈 值难以确定的问题,提升了终点预报精度24 张辉宜利用AP(近邻传播聚类算法)对RBF 神经网络进行训练,大幅提高了Q235B终点预测命中率3o。Wag等通过结合GA(遗传算法)与 BP神经网络的优点,建立了GA-BP神经网络组合模型用于转炉终点锰含量预测,预测误差在 ±0.03%和±0.025%以内时,命中率分别为90%和84%。 (2)电炉终点预测 电炉炼钢相较于转炉炼 过程废钢比更高,对于入炉原料把控显得更为重要,由于废钢成分的 差异性,造成电炉终点碳具有不稳定性。电炉熔池中发生的化学反应与加料、送电等操作间存在强耦 合作用,通过对操作过程进行有效学习,调整模型参数,可实现高命中率终点预报。刘志明等选择 电耗、氧耗、生铁量、废钢量、碳粉量、天然气耗量、石灰量和上一炉留在电弧炉内的C、P元素的质量 分数9个影响因素作为模型的输入,采用BP神经网络建立了终点碳预测模型,误差值为士0.004%时, 命中率可达94%。马戎等对100吨电弧炉建立RBF神经网络模型预测钢水主要成分,并与BP神 经网络对比发现该模型具有收敛速度快,可避免陷入局部极值的特点。刘锟等构建了网络结构简 单,训练量小的增量神经网络,以废钢、铁水、装料制度、通电时间、吨钢氧耗和电耗作为输入特征, 对电弧炉治炼终点的温度、碳和磷含量误差值为±10℃、0.02%和±0.004%时,命中率分别为 93%、75%和86%34
线性自回归神经网络等,可以在利用数据的同时实现工艺过程预测与判断。 (1)转炉终点预测 由于原料成分的波动,吹炼参数及辅料加入有差异,造成转炉冶炼终点难以稳定控制,因此建 立预测模型对实际生产具有重要指导意义。利用已有物料信息和实时操作数据,建立终点预测模型, 有针对性地调整工艺,可实现对终点成分的控制。传统的 BP 模型存在收敛速度慢和容易陷入局部 极小值的问题,李长荣、艾立群等分别利用优化算法改进 BP 神经网络,以石灰量、铁水量、铁水温 度、萤石量、铁水碳含量、铁水磷含量、吹氧量等为评价参数对转炉终点磷含量进行了预测,误差值 为±0.008%时,命中率可达 93.33%[24, 25]。He 等提出了一种基于主成分分析和 BP 神经网络对 BOF 终 点磷含量进行预测的深度学习模型,利用主成分分析减少影响因素维数,应用结果表明,预测误差 在±0.007%、±0.005%和±0.004%以内时,终点磷含量命中率分别为 96.67%、93.33%和 86.67%[26]。高 放等提出了基于 FA-ELM(因子分析法-超限学习机)的转炉终点磷预测模型,较传统 BP 神经网络 模型具有更高的准确性和更强的泛化能力[27]。铉明涛等利用 FOA(果蝇算法)优化后的 GRNN(广 义回归神经网络)预报转炉终点碳和温度,使模型具有精度高,训练简单,计算时间短等优点[28], 更加适合反应速度快、数据量巨大的转炉冶炼过程。祁子怡等采用 k-均值聚类算法确定隐藏层中心, 最小二乘法调整 RBF 神经网络的权值,解决了 RBF 神经网络隐含层节点的个数及异类样本距离阈 值难以确定的问题,提升了终点预报精度[29]。同样,张辉宜利用 AP(近邻传播聚类算法)对 RBF 神经网络进行训练,大幅提高了 Q235B 终点预测命中率[30]。Wang 等通过结合 GA(遗传算法)与 BP 神经网络的优点,建立了 GA-BP 神经网络组合模型用于转炉终点锰含量预测,预测误差在 ±0.03%和±0.025%以内时,命中率分别为 90%和 84%[31]。 (2)电炉终点预测 电炉炼钢相较于转炉炼钢过程废钢比更高,对于入炉原料把控显得更为重要,由于废钢成分的 差异性,造成电炉终点碳具有不稳定性。电炉熔池中发生的化学反应与加料、送电等操作间存在强耦 合作用,通过对操作过程进行有效学习,调整模型参数,可实现高命中率终点预报。 刘志明等选择 电耗、氧耗、生铁量、废钢量、碳粉量、天然气耗量、石灰量和上一炉留在电弧炉内的 C、P 元素的质量 分数 9 个影响因素作为模型的输入,采用 BP 神经网络建立了终点碳预测模型,误差值为±0.004%时, 命中率可达 94%[32]。马戎等对 100 吨电弧炉建立 RBF 神经网络模型预测钢水主要成分,并与 BP 神 经网络对比发现该模型具有收敛速度快,可避免陷入局部极值的特点[33]。刘锟等构建了网络结构简 单,训练量小的增量神经网络,以废钢、铁水、装料制度、通电时间、吨钢氧耗和电耗作为输入特征, 对电弧炉冶炼终点的温度、碳和磷含量误差值为±10℃、±0.02%和±0.004%时,命中率分别为 93%、75%和 86%[34]。 录用稿件,非最终出版稿
(3)精炼过程温度控制 炼钢过程中温度控制是极为重要的环节,转炉后流转过程中温度波动起伏大不仅会造成能源损 失,对钢液品质也不利。为获得合理的精炼温度制度,保证连铸过程稳定的过热度,同时将信息化 程度高的精炼工序所产生的数据充分利用,研究人员开发出不同深度学习模型用于该工序控制。李 强等将专家系统和BP神经网络相结合,建立了LF炉钢水温度预测模型,误差值为±5C时命中率 达到85%。吴扬针对250吨RH-MFB采用具有较高容错抗干扰能力的NARX(基于带外源输入的 非线性自回归神经网络)建立真空精炼钢液温度预测模型,误差值为±5℃时命中率达到了89.5%, 并能准确计算出合金加入量B阿。贺东风、付国庆、冯春松等分别提出了基于传热机理和BP神经网络 的精炼过程钢水温度预报混合模型,克服了单一的数学模型或智能模型的缺 适合实际炼钢过 程应用37-3河。 2.2.2物料消耗优化控制 随着钢铁企业对精益生产的重视程度日益提升,粗放的物料Q制度弊端越来越明显。但由于 炼钢各工序变化因素多,物料消耗难以通过线性模型准确预知。将深度信念网络、Elman神经网络和 对角递归神经网络等引入物料管控过程,依据历史数据预侧当前炉次加料量,能够起到良好的降本 增效作用。 (1)供氧模型 转炉炼钢过程中吹氧主要是为去除杂质元索,控制终点碳和温度,因而转炉治炼吹氧量的确定 对于转炉炼钢至关重要。深度学习模型对历史吹炼数据进行优选,采用自学习的方式改变神经元之 间的连接权值,分析不同条件所刻应的供氧模式。付佳等先利用静态模型计算出原辅料的加入量以 及理想状态下的供氧量, 再利用得到的结果和给定的初始条件,使用BP神经网络预测出转炉吹炼 实际所需供氧量4。为克最BP神经网络收敛慢,易出现过拟合的缺点,艾晓礼等利用LM算法改进 了BP神经网络, 预侧炼钢过程总吹氧量和动态吹炼过程二次吹氧量,李爱莲、张子阳等则分别采 用灰色模型改进学习过程较慢的DBN(深度信念网络)和输出状态存在稳定性问题的Elman神经 网络,依据 〈量原料成分及操作数据,建立了供氧量预测模型,通过加料信息预测炉次氧耗量2, (2)原辅料加入控制模型 以铁水、铁矿石和废钢等为代表的炼钢原料在以合金、渣料等为代表的辅料资源配合下完成了从 含铁资源到钢材产品的转化。但在物料加入过程中不能直接对钢水成分在线连续检测,且存在多项 工艺参数扰动,难以建立准确的传统数学模型进行有效控制,因此需建立非线性的深度学习模型。 杨志勇等利用BP神经网络对铁水预处理粉剂用量进行控制,避免了过吹和欠吹对生产节奏的影响
(3)精炼过程温度控制 炼钢过程中温度控制是极为重要的环节,转炉后流转过程中温度波动起伏大不仅会造成能源损 失,对钢液品质也不利。为获得合理的精炼温度制度,保证连铸过程稳定的过热度,同时将信息化 程度高的精炼工序所产生的数据充分利用,研究人员开发出不同深度学习模型用于该工序 控制。李 强等将专家系统和 BP 神经网络相结合,建立了 LF 炉钢水温度预测模型,误差值为±5℃时命中率 达到 85%[35]。吴扬针对 250 吨 RH-MFB 采用具有较高容错抗干扰能力的 NARX(基于带外源输入的 非线性自回归神经网络)建立真空精炼钢液温度预测模型,误差值为±5℃时命中率达到了 89.5%, 并能准确计算出合金加入量[36]。贺东风、付国庆、冯春松等分别提出了基于传热机理和 BP 神经网络 的精炼过程钢水温度预报混合模型,克服了单一的数学模型或智能模型的缺点,更适合实际炼钢过 程应用[37-39]。 2.2.2 物料消耗优化控制 随着钢铁企业对精益生产的重视程度日益提升,粗放的物料加入制度弊端越来越明显。但由于 炼钢各工序变化因素多,物料消耗难以通过线性模型准确预知。将深度信念网络、Elman 神经网络和 对角递归神经网络等引入物料管控过程,依据历史数据预测当前炉次加料量,能够起到良好的降本 增效作用。 (1)供氧模型 转炉炼钢过程中吹氧主要是为去除杂质元素,控制终点碳和温度,因而转炉冶炼吹氧量的确定 对于转炉炼钢至关重要。深度学习模型对历史吹炼数据进行优选,采用自学习的方式改变神经元之 间的连接权值,分析不同条件所对应的供氧模式。付佳等先利用静态模型计算出原辅料的加入量以 及理想状态下的供氧量,再利用得到的结果和给定的初始条件,使用 BP 神经网络预测出转炉吹炼 实际所需供氧量[40]。为克服 BP 神经网络收敛慢,易出现过拟合的缺点,艾晓礼等利用 LM 算法改进 了 BP 神经网络,预测炼钢过程总吹氧量和动态吹炼过程二次吹氧量[41],李爱莲、张子阳等则分别采 用灰色模型改进学习过程较慢的 DBN(深度信念网络)和输出状态存在稳定性问题的 Elman 神经 网络,依据大量原料成分及操作数据,建立了供氧量预测模型,通过加料信息预测炉次氧耗量[42, 43]。 (2)原辅料加入控制模型 以铁水、铁矿石和废钢等为代表的炼钢原料在以合金、渣料等为代表的辅料资源配合下完成了从 含铁资源到钢材产品的转化。但在物料加入过程中不能直接对钢水成分在线连续检测,且存在多项 工艺参数扰动,难以建立准确的传统数学模型进行有效控制,因此需建立非线性的深度学习模型。 杨志勇等利用 BP 神经网络对铁水预处理粉剂用量进行控制,避免了过吹和欠吹对生产节奏的影响, 录用稿件,非最终出版稿
提高了预处理脱硫效率。为优化辅料加入量,张华等首先使用具有适应时变能力的DRNN(对角 递归神经网络)进行终点预测,而后利用改进的SLS-PSO算法对优化模型求解,使得终点控制过 程辅料节约量为15%左右41。欧青立对LF炉利用常规PID算法加料进行改造,设计了一种PS0 (微粒群优化算法)的BP神经网络应用于配料称重系统,实现了快速精准配料的目标。 2.2.3异常预报与质量评价 炼钢过程存在异常状况研判依据不强,精准预测和防控难度高,产品质量实时在线检测困难等 问题。利用广义回归神经网络、卷积神经网络和残差神经网络等深度学习方法能够根据大数据挖掘提 取预警阈值,并基于设定标准及时判定生产过程的质量问题,对炼钢工序过程形成具有自学习能力 的异常状况预报及产品质量评价系统。 (1)火焰识别 钢液治炼过程中的物理化学变化无法直接观测,技术工人通常采角观测火焰的方法判断反应情 况,但存在主观性强、火焰物性变化大等问题7。随着深度学习研完的化,对治炼炉火焰图像进行 特征提取,数字化之后利用神经网络完成分类预测的相关研完成果不断涌现。Ma等人以AOD治炼 的喷溅过程为研究对象,利用B神经网络建立了喷溅预测模型, 可实现对喷溅的准确判断并能有 效控制4别。庞殊杨等采用抗干扰能力强、检测速度esNt(残差神经网络)对转炉火焰数据集 进行有监督的训练,训练完成后可对正常、轻微跳渣、跳渣、轻微固体喷溅、固液喷溅、液体喷溅、黑 烟和火焰等8种状态火焰进行高准确性实时监测,达到异常情况预报的目的。李超等对转炉终点 时刻炉口火焰图像利用改进的多趋势二进制编码彩色纹理特征表述方法进行特征提取,并选用 GRNN建立预测模型,该模型的收敛速度快,但空间复杂度高,当误差值为0.O2%时,命中率为 95.7%501。 (2)连铸坯表面缺陷检 连铸坯生产中卷渣偏析保护渣性能、结晶器锥度和震动不合理均会造成表面缺陷,生产企业 一般采用人工观察和设备探伤相结合的检测方式,成本高且效率较低。如何满足现场环境快速实时 检测要求是各生色企业面临的难题,将深度学习模型应用于铸坯图像识别中,既能避免人工造成的 误判,又能快速发现并解决问题。毛欣翔等通过gRPC(谷歌远程过程调用)框架构建了基于 YOLO3模型的板坯表面缺陷检测系统,并搭建了基于循环式卷积生成对抗网络的缺陷数据生成平 台,在完成检测要求前提下对表面缺陷图像进行有效扩充BJ。Konovalenko等开发了一种利用 ResNet神经网络进行连铸坯缺陷分类的深度学习模型,对缩孔、裂纹和翘皮三种缺陷识别精度为 96.91%s网。安波等通过传统BP和具有自组织功能的Kohonen两种神经网络并行运算,实际测试中 数据采集、运算和判定总耗时小于3s,铸坯质量判断准确率能够达到92%5)。韩舟利用增加动量因
提高了预处理脱硫效率[44]。为优化辅料加入量,张华等首先使用具有适应时变能力的 DRNN(对角 递归神经网络)进行终点预测,而后利用改进的 SLS-PSO 算法对优化模型求解,使得终点控制过 程辅料节约量为 15%左右[45]。欧青立对 LF 炉利用常规 PID 算法加料进行改造,设计了一种 PSO (微粒群优化算法)的 BP 神经网络应用于配料称重系统,实现了快速精准配料的目标[46]。 2.2.3 异常预报与质量评价 炼钢过程存在异常状况研判依据不强,精准预测和防控难度高,产品质量实时在线检测困难等 问题。利用广义回归神经网络、卷积神经网络和残差神经网络等深度学习方法能够根据大数据挖掘提 取预警阈值,并基于设定标准及时判定生产过程的质量问题,对炼钢工序过程形成具有自学习能力 的异常状况预报及产品质量评价系统。 (1)火焰识别 钢液冶炼过程中的物理化学变化无法直接观测,技术工人通常采用观测火焰的方法判断反应情 况,但存在主观性强、火焰物性变化大等问题[47]。随着深度学习研究的深化,对冶炼炉火焰图像进行 特征提取,数字化之后利用神经网络完成分类预测的相关研究成果不断涌现。Ma 等人以 AOD 冶炼 的喷溅过程为研究对象,利用 BP 神经网络建立了喷溅预测模型,可实现对喷溅的准确判断并能有 效控制[48]。庞殊杨等采用抗干扰能力强、检测速度快的 ResNet(残差神经网络)对转炉火焰数据集 进行有监督的训练,训练完成后可对正常、轻微跳渣、跳渣、轻微固体喷溅、固液喷溅、液体喷溅、黑 烟和火焰等 8 种状态火焰进行高准确性实时监测,达到异常情况预报的目的[49]。李超等对转炉终点 时刻炉口火焰图像利用改进的多趋势二进制编码彩色纹理特征表述方法进行特征提取,并选用 GRNN 建立预测模型,该模型的收敛速度快,但空间复杂度高,当误差值为±0.02%时,命中率为 95.7%[50]。 (2)连铸坯表面缺陷检测 连铸坯生产中卷渣、偏析、保护渣性能、结晶器锥度和震动不合理均会造成表面缺陷,生产企业 一般采用人工观察和设备探伤相结合的检测方式,成本高且效率较低。如何满足现场环境快速实时 检测要求是各生产企业面临的难题,将深度学习模型应用于铸坯图像识别中,既能避免人工造成的 误判,又能快速发现并解决问题。毛欣翔等通过 gRPC(谷歌远程过程调用)框架构建了基于 YOLOv3 模型的板坯表面缺陷检测系统,并搭建了基于循环式卷积生成对抗网络的缺陷数据生成平 台,在完成检测要求前提下对表面缺陷图像进行有效扩充 [51]。Konovalenko 等开发了一种利用 ResNet 神经网络进行连铸坯缺陷分类的深度学习模型,对缩孔、裂纹和翘皮三种缺陷识别精度为 96.91%[52]。安波等通过传统 BP 和具有自组织功能的 Kohonen 两种神经网络并行运算,实际测试中 数据采集、运算和判定总耗时小于 3s,铸坯质量判断准确率能够达到 92%[53]。韩舟利用增加动量因 录用稿件,非最终出版稿
子改进后的BP神经网络建立了铸坯质量判定模型,误差值在±10%以内时,命中率达97.2%5网 (3)连铸漏钢预报 连铸是实现高温钢水由液态向固态转变的工艺,同时由于该工序钢液处于动态过程,因此也是 最容易出现漏钢事故的环节。一旦发生漏钢事故,往往会造成设备损毁和人员伤亡的重大安全生产 责任事故,国内外学者为解决这一问题将深度学习模型引入到连铸漏钢预报中。范建东等利用RBF 神经网络结合漏钢温度特征曲线,建立了连铸漏钢预报模型,有效提高预报精度并且降低误报率 阿。杨琴等针对传统神经网络收敛速度和精度的问题,建立具有较强泛化能力的量子小波神经网络 模型,实现了快速准确的连铸漏钢预警I。Zhang等利用GA-BP神经网络预测连铸过程漏钢,预测 率为100%,准确率为97.56%刃。厉英等采用变步长的改进算法建立了BP神经网络模型, 并引入动 量项和防振荡项来避免局部极小值]。 3.深度学习在炼锅过程的优势与桃战 3.1优势 3.11特征提取简单 级出版 算法准确性高度依赖于数据特征提取,其可视房个数据降维过程,即将原始数据转化为具有 一定区分度和维度特征的数据。机器学习中人工提取特征的方法,例如过滤法、包裹法、嵌入法等, 存在过程复杂、计算量大的缺点。深度学习在没计k模拟了人脑,可以尽可能优化损失函数,自动挖 掘数据潜在特征,不需要确定性编程就可以赋予机器某项技能。炼钢过程提取的原始数据特征是影 响结果预报的重要因子,且由于钢铁生产是一个动态调整过程,原始数据特征除了初始含铁物料如: 废钢、生铁、矿石等加入量是固定的,其他一些信息如:温度、工序时间和成分、吹氧量、补加渣量、 合金加入量等都随生产实际随时变化,这就造成了实际炼钢过程数据呈现高维特征的问题。若将这 些原始数据全部作为输入参量进行传统过程模型计算,容易导致模型过于复杂甚至难以收敛。神经 网络以样本学习的我直接从炼钢过程的输入输出关系中提取信息,通过反复训练不断调整神经 元相互作用的凤道,而无需借鉴先验知识的积累或人工逻辑的归纳与推理。 3.1.2泛化能强 泛化能力是指训练后的神经网络正确预测和识别训练样本集外其他样本的能力。根据机器学习 的经典理论,模型参数量越大,模型的拟合程度越强,但同时泛化能力也会更差。然而在深度学习 中并没有观察到这种现象,深度学习的模型通常有着巨大的参数量,测试数据远多于训练数据,实 际应用中,在真实数据上训练的深度学习模型通常具有很好泛化性能,增大模型的参数量,并不会 使得泛化变差。在炼钢工业场景下应用,可将部分已有生产数据作为训练数据集,深度学习模型能
子改进后的 BP 神经网络建立了铸坯质量判定模型,误差值在±10%以内时,命中率达 97.2%[54] (3)连铸漏钢预报 连铸是实现高温钢水由液态向固态转变的工艺,同时由于该工序钢液处于动态过程,因此也是 最容易出现漏钢事故的环节。一旦发生漏钢事故,往往会造成设备损毁和人员伤亡的重大安全生产 责任事故,国内外学者为解决这一问题将深度学习模型引入到连铸漏钢预报中。范建东等利用 RBF 神经网络结合漏钢温度特征曲线,建立了连铸漏钢预报模型,有效提高预报精度并且降低误报率 [55]。杨琴等针对传统神经网络收敛速度和精度的问题,建立具有较强泛化能力的量子小波神经网络 模型,实现了快速准确的连铸漏钢预警[56]。Zhang 等利用 GA-BP 神经网络预测连铸过程漏钢,预测 率为 100%,准确率为 97.56%[57]。厉英等采用变步长的改进算法建立了 BP 神经网络模型,并引入动 量项和防振荡项来避免局部极小值[58]。 3.深度学习在炼钢过程的优势与挑战 3.1 优势 3.1.1 特征提取简单 算法准确性高度依赖于数据特征提取,其可视作一个数据降维过程,即将原始数据转化为具有 一定区分度和维度特征的数据。机器学习中人工提取特征的方法,例如过滤法、包裹法、嵌入法等, 存在过程复杂、计算量大的缺点。深度学习在设计上模拟了人脑,可以尽可能优化损失函数,自动挖 掘数据潜在特征,不需要确定性编程就可以赋予机器某项技能。炼钢过程提取的原始数据特征是影 响结果预报的重要因子,且由于钢铁生产是一个动态调整过程,原始数据特征除了初始含铁物料如 : 废钢、生铁、矿石等加入量是固定的,其他一些信息如:温度、工序时间和成分、吹氧量、补加渣量、 合金加入量等都随生产实际随时变化,这就造成了实际炼钢过程数据呈现高维特征的问题。若将这 些原始数据全部作为输入参量进行传统过程模型计算,容易导致模型过于复杂甚至难以收敛。神经 网络以样本学习的方式,直接从炼钢过程的输入输出关系中提取信息,通过反复训练不断调整神经 元相互作用的权值,而无需借鉴先验知识的积累或人工逻辑的归纳与推理。 3.1.2 泛化能力强 泛化能力是指训练后的神经网络正确预测和识别训练样本集外其他样本的能力。根据机器学习 的经典理论,模型参数量越大,模型的拟合程度越强,但同时泛化能力也会更差。然而在深度学习 中并没有观察到这种现象,深度学习的模型通常有着巨大的参数量,测试数据远多于训练数据,实 际应用中,在真实数据上训练的深度学习模型通常具有很好泛化性能,增大模型的参数量,并不会 使得泛化变差。在炼钢工业场景下应用,可将部分已有生产数据作为训练数据集,深度学习模型能 录用稿件,非最终出版稿