《工程科学学报》录用稿,htps:/doi.org/10.13374/i,issn2095-9389.2021.06.22.001©北京科技大学2020 工程科学学报DO: 基于机器学习的产品质量在线智能监控方法 徐钢2),黎敏),吕志民),徐金梧)@ 1)北京科技大学钢铁共性技术协同创新中心,北京100083 2)苏州宝联重工有限公司,江苏苏州215131 ☒通信作者,E-mail:jwxu@ustb.edu.cm 摘要目前,我国钢铁企业主要采用“事后”抽检方式,对产品质量进行出厂前检骏。由卡无法对所有产品实现质量 检验,常发生客户索赔和退货,导致钢铁企业重大经济损失。为了提高产品质量的稳定性和阿靠性,利用机器学习方 法实现产品质量在线监控、在线优化和在线预设定,是钢铁企业目前亟待解决的关键最术。针对企业需求,提出基于软 超球体算法的产品质量异常在线识别和异常原因诊断方法、基于流形学习的工艺参数在线优化方法和基于多变量统计 过程控制的工艺规范制定方法。通过将上述方法进行系统集成,并利用工业互联网技术和大数据分析方法,研发了产 品质量在线智能监控系统。目前该系统己在钢铁企业十余条生产线上维广应用,质量在线判定的准确率达到99.2%, 在线检测时间不到0.1秒。 关键词大数据分析:机器学习:质量在线监控:质量在线优? 质量设计 分类号TP274 On-line Intelligent Monitoring Method of Product Quality based on Machine Learning XU Gang'2,LI Min,LV Zhimin 1) Collaborative Innovation Center of echnology,University of Science and Technology Beijing,Beijing 100083,China Suzhou Baolian Heavy Indus 15131,China Corresponding author, .edu.cn ABSTRACT In recent years,Chinese iron and steel enterprises mainly adopt "sampling after the event"method to inspect the product quality before leaving the factory.Because of the lack to achieve quality inspection for all products,customers often claim and return the defective products,which leads to the major economic losses of steel enterprises.In order to improve the stability and reliability of product quality,using machine learning methods to realize on-line monitoring,on-line optimization and on-line preset of product quality are the key technology to be solved in iron and steel enterprises.Therefore,on-line identification and on-line diagnosis of abnormal product quality based on soft hypersphere,on-line optimization of process parameters based on manifold learning,and process specification formulation based on multivariate statistical process control are proposed. 收篇日期: 盖演自:国家“863"重点课题:面向钢铁行业的全流程智能分析技术研究(2013AA040704),自然科学基金: (51004013)、(51204018)
工程科学学报 DOI: 基于机器学习的产品质量在线智能监控方法1 徐 钢 1,2),黎 敏 1) ,吕志民 1),徐金梧 1) 1) 北京科技大学钢铁共性技术协同创新中心,北京 100083 2) 苏州宝联重工有限公司, 江苏苏州 215131 通信作者,E-mail: jwxu@ustb.edu.cn 摘 要 目前,我国钢铁企业主要采用“事后”抽检方式,对产品质量进行出厂前检验。由于无法对所有产品实现质量 检验,常发生客户索赔和退货,导致钢铁企业重大经济损失。为了提高产品质量的稳定性和可靠性,利用机器学习方 法实现产品质量在线监控、在线优化和在线预设定,是钢铁企业目前亟待解决的关键技术。针对企业需求,提出基于软 超球体算法的产品质量异常在线识别和异常原因诊断方法、基于流形学习的工艺参数在线优化方法和基于多变量统计 过程控制的工艺规范制定方法。通过将上述方法进行系统集成,并利用工业互联网技术和大数据分析方法,研发了产 品质量在线智能监控系统。目前该系统已在钢铁企业十余条生产线上推广应用,质量在线判定的准确率达到 99.2%, 在线检测时间不到 0.1 秒。 关键词 大数据分析;机器学习;质量在线监控;质量在线优化;产品质量设计 分类号 TP274 On-line Intelligent Monitoring Method of Product Quality based on Machine Learning XU Gang1,2) , LI Min1) , LV Zhimin1),XU Jinwu1) 1) Collaborative Innovation Center of Steel Technology, University of Science and Technology Beijing, Beijing 100083, China 2) Suzhou Baolian Heavy Industry Co. Suzhou, 215131, China Corresponding author, E-mail: jwxu@ustb.edu.cn ABSTRACT In recent years, Chinese iron and steel enterprises mainly adopt "sampling after the event" method to inspect the product quality before leaving the factory. Because of the lack to achieve quality inspection for all products, customers often claim and return the defective products, which leads to the major economic losses of steel enterprises. In order to improve the stability and reliability of product quality, using machine learning methods to realize on-line monitoring, on-line optimization and on-line preset of product quality are the key technology to be solved in iron and steel enterprises. Therefore, on-line identification and on-line diagnosis of abnormal product quality based on soft hypersphere, on-line optimization of process parameters based on manifold learning, and process specification formulation based on multivariate statistical process control are proposed. 1收稿日期: 基金项目: 国家“863”重点课题:面向钢铁行业的全流程智能分析技术研究(2013AA040704), 自然科学基金: (51004013)、(51204018) 《工程科学学报》录用稿,https://doi.org/10.13374/j.issn2095-9389.2021.06.22.001 ©北京科技大学 2020 录用稿件,非最终出版稿
The integrated methods of on-line monitoring,diagnosis and optimization of product quality is proposed,in which the abnormal point of product quality by the soft hyper-sphere method based on Support Vector Data Description(SVDD)is identified on-line and the process parameters through contribution chart are diagnosed.Then,optimizing in real time the abnormal process parameters via local projective transformation of neighbor points is achieved.The process parameter setting model based on manifold learning by multi-class neighborhoods is established to extract the manifold of process parameters, and process specification model based on the maximum inner rectangle of soft hypersphere is established to obtain an effective control interval of the process parameters. By means of system integration with the proposed methods,using industrial internet technology and big data analysis methods, the system of on-line intelligent monitoring of product quality has been successfully developed.At present,the system has been applied on more than ten production lines in iron and steel enterprises.The accuracy rate of online quality determination is 99.2%.and the online detection time is less than 0.1 second. KEY WORDS Big Data Analysis;Machine Learning:On-line Monitoring of Product Optimization of Quality:Product Quality Design; 钢铁工业是典型的流程工业,产品在制造过程中涉及多个逢续衔接的工序。目前,企业对产品质 量管控的主要手段是通过制定合理的工艺规范,并采用“事后抽样检测方式来判定产品的品质。这 种依赖于生产经验制订的工艺规范及“事后”抽检的方式容易出现批量的产品质量判废,或导致用 户由于质量异议提出索赔和退货。我国钢铁企业每年仅质量判废和质量异议所造成的经济损失近百亿 元,如何利用机器学习方法实现产品质量的在线监在线优化,制定科学的工艺规范和质量设计, 是钢铁企业亟待解决的关键技术。 随着“工业4.0”时代的来临,制造技术正逐步从伯动化、数字化、网化向智能化方向发展。以 大数据分析、人工智能、信息物理系统、工业东联闷为代表的新一代智能技术已成为企业向绿色化、智 能化转型的重要途径。机器学习作为实现人工智能的重要途径,在人工智能领域的应用引起了广泛 的兴趣,如何从海量的高维数据中提取出有价值的信息,并将信息转化为知识是目前机器学习的重 要研究方向4。 近年来,机器学习已在不同领(被广2应用,在材料研发领域,通过高通量计算、高通量表征及 高通量数据分析,实现了基于材料基因组的材料数字化研发6和材料逆向设计0:在化工和高分 子材料领域,通过机器学分法对分子结构和材料实现精准设计”:在医药研发领域,采用多变量 过程统计分析和机器学灾头实现药物的快速研发和质量控制刘,在机器视觉和智能识别领域, 主要通过深度学习实现人脸,语音、图像、字符等识别、自动驾驶和智能机器人。 机器学习方法在业领域也有广泛的应用前景,基于多变量的过程统计分析已用于生产过程控 制和产品质量在线监测2,并利用信息物理系统和机器学习方法建立数字孪生模型,实现制造过程 的无人化2自前,这些方法大多应用于离散制造业的智能制造,不仅提高生产效率且实现客户个 性化定制93。但由于钢铁生产过程的数据具有多元、强耦合、非线性的特征,因此在利用大数据分析 和机器学习方法挖掘数据内在的信息和知识,实现产品质量在线监控还存在一些困难2)。 针对钢铁企业在产品质量在线监控中存在的问题,提出基于软超球体算法的质量异常点在线识 别和异常原因诊断方法、基于流形学习和邻近点局部投影变换的工艺参数在线优化方法,并利用机器 学习方法制定质量设计和工艺规范,提高产品质量的稳定性。这些方法已应用于钢铁企业十余条工业 生产线,证实了方法的有效性和准确性。 1质量在线智能监测与控制方法 实际工业生产中,需要确定不同工序的工艺参数控制范围,即制定不同产品的质量设计和工艺
The integrated methods of on-line monitoring, diagnosis and optimization of product quality is proposed, in which the abnormal point of product quality by the soft hyper-sphere method based on Support Vector Data Description (SVDD) is identified on-line and the process parameters through contribution chart are diagnosed. Then, optimizing in real time the abnormal process parameters via local projective transformation of neighbor points is achieved. The process parameter setting model based on manifold learning by multi-class neighborhoods is established to extract the manifold of process parameters, and process specification model based on the maximum inner rectangle of soft hypersphere is established to obtain an effective control interval of the process parameters. By means of system integration with the proposed methods, using industrial internet technology and big data analysis methods, the system of on-line intelligent monitoring of product quality has been successfully developed. At present, the system has been applied on more than ten production lines in iron and steel enterprises. The accuracy rate of online quality determination is 99.2%, and the online detection time is less than 0.1 second. KEY WORDS Big Data Analysis; Machine Learning; On-line Monitoring of Product Quality; On-line Optimization of Quality; Product Quality Design; 钢铁工业是典型的流程工业,产品在制造过程中涉及多个连续衔接的工序。目前,企业对产品质 量管控的主要手段是通过制定合理的工艺规范,并采用“事后”抽样检测方式来判定产品的品质。这 种依赖于生产经验制订的工艺规范及“事后”抽检的方式容易出现批量的产品质量判废,或导致用 户由于质量异议提出索赔和退货。我国钢铁企业每年仅质量判废和质量异议所造成的经济损失近百亿 元,如何利用机器学习方法实现产品质量的在线监控、在线优化,制定科学的工艺规范和质量设计, 是钢铁企业亟待解决的关键技术。 随着“工业 4.0”时代的来临,制造技术正逐步从自动化、数字化、网络化向智能化方向发展。以 大数据分析、人工智能、信息物理系统、工业互联网为代表的新一代智能技术已成为企业向绿色化、智 能化转型的重要途径[1-3]。机器学习作为实现人工智能的重要途径,在人工智能领域的应用引起了广泛 的兴趣,如何从海量的高维数据中提取出有价值的信息,并将信息转化为知识是目前机器学习的重 要研究方向[4-5]。 近年来,机器学习已在不同领域被广泛应用,在材料研发领域,通过高通量计算、高通量表征及 高通量数据分析,实现了基于材料基因组的材料数字化研发[6-9]和材料逆向设计[10-12];在化工和高分 子材料领域,通过机器学习方法对分子结构和材料实现精准设计[13-17];在医药研发领域,采用多变量 过程统计分析和机器学习方法,实现药物的快速研发和质量控制[18-20];在机器视觉和智能识别领域, 主要通过深度学习实现人脸、语音、图像、字符等识别、自动驾驶和智能机器人。 机器学习方法在工业领域也有广泛的应用前景,基于多变量的过程统计分析已用于生产过程控 制和产品质量在线监测[21-24],并利用信息物理系统和机器学习方法建立数字孪生模型,实现制造过程 的无人化[25-28]。目前,这些方法大多应用于离散制造业的智能制造,不仅提高生产效率且实现客户个 性化定制[29-31]。但由于钢铁生产过程的数据具有多元、强耦合、非线性的特征,因此在利用大数据分析 和机器学习方法挖掘数据内在的信息和知识,实现产品质量在线监控还存在一些困难[32-33]。 针对钢铁企业在产品质量在线监控中存在的问题,提出基于软超球体算法的质量异常点在线识 别和异常原因诊断方法、基于流形学习和邻近点局部投影变换的工艺参数在线优化方法,并利用机器 学习方法制定质量设计和工艺规范,提高产品质量的稳定性。这些方法已应用于钢铁企业十余条工业 生产线,证实了方法的有效性和准确性。 1 质量在线智能监测与控制方法 实际工业生产中,需要确定不同工序的工艺参数控制范围,即制定不同产品的质量设计和工艺 录用稿件,非最终出版稿
规范。当工艺参数(包括原料参数)在该范围内,认为所设定的过程参数能满足产品质量要求,反之, 则可能出现质量异常。目前,钢铁企业在质量设计和工艺规范制定过程中,主要依赖于小批量工业试 制和技术人员的生产经验制定对应的规范。如何利用工业大数据分析和机器学习方法来确定产品质量 可控区的范围是实现质量在线智能监控的重要手段。 1.1质量异常点识别方法 多变量统计过程控制(multivariate statistical process control,.MSPC)考虑了各变量间的相关性,适 用于多元强耦合变量的过程监控43。经典的多变量统计过程控制方法,包括主成分分析(principal component analysis.,PCA)统计控制图、偏最小二乘法(partial least squares,PLS)统计控制图等。但是, 这类多变量统计控制图都有一个假设前提:所有变量满足多变量正态分布(multivariate normality,, MVN)的条件。在这个假设前提下,对于一个稳定的生产过程,正常样本点分布在高维空间中的某个 超椭球体内;一旦样本点超出超椭球体的边界,则认为该生产过程出现了异常超椭球的位置取决于 各变量的均值大小和变量间的相关性,而超椭球的大小则取决于变量的方菱公 质量异常点识别方法是根据所确定的超椭球边界来判断设定的过程参数是香会造成产品质量异 常。主要方法是通过实际生产数据来确定过程参数可控区的边界,也称为单类的分类问题。假 设给定一个数据集S={:,2,,},其中X为p维的数据向量,n为准本个数,需确定该数据集的 边界,即求解包含该数据集的最小封闭超球体。数据集中的每个样本点与超椭球体中心C的距离均应 小于球体的半径R,如图1所示。 Feature 2 Feature 1 1 最小封闭超球体示意图 Fig.1 Minimum hyper-sphere diagram 最小封闭超球体可以 下优化问题 优化解:巴职R2 (1) 约束条件:-C=(:-C)x,-C)≤R2,i=1,2n 在约束条件中加入拉格朗日乘子,≥0,对应的拉格朗日函数为 L(C.R.@)=R+Zal(x-CY-R] 2 对上式求C和R偏导,且令导数值为O,可求出超球体的优化解 L(C.R.@)=R+ZaI(x-CY-R] =Za(x-C) (3) 2s化-
规范。当工艺参数(包括原料参数)在该范围内,认为所设定的过程参数能满足产品质量要求,反之, 则可能出现质量异常。目前,钢铁企业在质量设计和工艺规范制定过程中,主要依赖于小批量工业试 制和技术人员的生产经验制定对应的规范。如何利用工业大数据分析和机器学习方法来确定产品质量 可控区的范围是实现质量在线智能监控的重要手段。 1.1 质量异常点识别方法 多变量统计过程控制 (multivariate statistical process control, MSPC) 考虑了各变量间的相关性,适 用于多元强耦合变量的过程监控[34-36]。经典的多变量统计过程控制方法,包括主成分分析(principal component analysis,PCA)统计控制图、偏最小二乘法(partial least squares, PLS)统计控制图等。但是, 这类多变量统计控制图都有一个假设前提:所有变量满足多变量正态分布(multivariate normality, MVN)的条件。在这个假设前提下,对于一个稳定的生产过程,正常样本点分布在高维空间中的某个 超椭球体内;一旦样本点超出超椭球体的边界,则认为该生产过程出现了异常。超椭球的位置取决于 各变量的均值大小和变量间的相关性,而超椭球的大小则取决于变量的方差。 质量异常点识别方法是根据所确定的超椭球边界来判断设定的过程参数是否会造成产品质量异 常[37-39]。主要方法是通过实际生产数据来确定过程参数可控区的边界,也称为单一类的分类问题。假 设给定一个数据集 1 2 { , , , } S x x x n ,其中 i x 为 p 维的数据向量,n 为样本个数,需确定该数据集的 边界,即求解包含该数据集的最小封闭超球体。数据集中的每个样本点与超椭球体中心 C 的距离均应 小于球体的半径 R,如图 1 所示。 图 1 最小封闭超球体示意图 Fig.1 Minimum hyper-sphere diagram 最小封闭超球体可以表述为如下优化问题 优化解: 2 , min C R R (1) 约束条件: 2 2 ( ) ( ) , 1,2,... T i i x C x C x C R i n i 在约束条件中加入拉格朗日乘子 0 i ,对应的拉格朗日函数为 2 2 2 1 ( , , ) [( ) ] n i i i L R R R C x C (2) 对上式求 C 和 R 偏导,且令导数值为 0,可求出超球体的优化解 2 2 2 1 2 1 1 1 1 ( , , ) [( ) ] ( ) n i i i n i i i n n n i i i i j i j i i j L R R R C x C x C x x x x (3) 录用稿件,非最终出版稿
其中K化,x》表示变量的内积。令a=2a化,x)-22a化,),由式(3》可以求得最小超 人 球体的半径R和球心C R=o(a), (4) 其中α,是由式(3)求得的最优解。 对待测的检测点x,可以由下式来判断该检测点是否正常 f(x)=HIk(x,x)-2>ak(x.x)+Dl. D=a,a(x)-R (5) 若K(x,x)-22a,k(x,x)+pO fx)=1 其中,H(x)表示Heaviside函数。当f(x,)=l,则该检测点在超椭球的处极判为异常点。 但实际生产数据中,过程参数间往往存在多重耦合,变量间有着复杂的非线性特征,因此过程 参数间并不满足多变量正态分布的假设前提。当数据集中存在非线性、非正态分布时,这种线性形式 的超椭球边界易造成误判,如图2所示。 Normal samples Abnormal samples△ △ Feature 1 圖2线性超椭球将异常点判为正常点 Fig.2 Abnormal samples are misjudged as normal samples in linear hyper-sphere 近来年,基于核©数的非线性模式分析方法受到关注,核方法通过非线性核函数来表示数据内 在的复杂结构特征用子确定非线性软超球体的边界o。非线性核函数将原始欧氏空间上的数据集 映射到高维特征空间中,通过映射点(x)和()的内积(对偶形式)求解非线性情况下的封闭超球 体,如图3所标。丛图3中可以看出,原始空间的样本点(左图)分布在一个复杂的封闭体内,而通 过非线性核函数变换后,原先的样本点x映射到特征空间中的点(x)分布在封闭的球体内(右图)。 Samples border in original space Soft-hypersphere border in feature space ● Kernel ⊕ Function 0 AC 园3样本点从原始空间映射到特征空间
其中 ( , ) i j x x 表示变量的内积。令 1 1 1 ( ) ( , ) ( , ) n n n i i i i j i j i i j x x x x ,由式(3)可以求得最小超 球体的半径 R 和球心 C 1 = ), = . n i i i R C x (4) 其中i 是由式(3)求得的最优解。 对待测的检测点 x ,可以由下式来判断该检测点是否正常 1 2 1 1 1 ( ) [ ) 2 [ ( , ) 2 ( , ) ] 0 , ( ) 1 n i i i n n i j i j i j n i i i f H D D R x x x x D f x x x x x x x x 若 (5) 其中, H x( ) 表示 Heaviside 函数。当 f x( ) 1 ,则该检测点在超椭球的界外,被判为异常点。 但实际生产数据中,过程参数间往往存在多重耦合,变量间有着复杂的非线性特征,因此过程 参数间并不满足多变量正态分布的假设前提。当数据集中存在非线性、非正态分布时,这种线性形式 的超椭球边界易造成误判,如图 2 所示。 图 2 线性超椭球将异常点判为正常点 Fig.2 Abnormal samples are misjudged as normal samples in linear hyper-sphere 近来年,基于核函数的非线性模式分析方法受到关注,核方法通过非线性核函数来表示数据内 在的复杂结构特征,用于确定非线性软超球体的边界[40-41]。非线性核函数将原始欧氏空间上的数据集 映射到高维特征空间中,通过映射点( ) x 和( )z 的内积(对偶形式)求解非线性情况下的封闭超球 体,如图 3 所示。从图 3 中可以看出,原始空间的样本点(左图)分布在一个复杂的封闭体内,而通 过非线性核函数变換后,原先的样本点 x 映射到特征空间中的点( ) x 分布在封闭的球体内(右图)。 图 3 样本点从原始空间映射到特征空间 录用稿件,非最终出版稿
Fig.3 Samples are mapped from original space into feature space 通过非线性核函数将原始空间中的样本点映射到特征空间后,可按照式(1)的方式,建立特征 空间中封闭超球体的优化解 优化解: 阳R2+Al (6) 约束条件: x)-CP=x)-C)(x)-C)sR+5 520,i=1,2…n 上式中,常数项A和松弛因子三的乘积项表示允许个别正常样本被判为异常的比例,比如,允许2% 的正常样本被划分在超球体外,比例可根据用户对产品质量保证值的要求动态设定。设定松弛项是为 了更严格的控制产品质量的可靠性,比例的选择与第一类错误和第二类错误有关。经非线性核函数 映射后,拉格朗日函数为 CRa5)=R2+5+2a)-9 =2a,x)-C,)-C) (7 宫as名aa八 上式与式(3)不同之处在于,式(3)是采用线性函数,一因而只能解决简单边界问题,即超椭 球边界,而式(7)采用非线性核函数解决复杂非线牲边界问题。两者差别主要是选择线性函数还是 非线性核函数,而求解的过程与上述所讨论的方法基公致。 在求解式(7)拉格朗日函数的优化解过程中,以发现大部分α,等于0,只有少部分位于超球 体边界的样本o,大于O,这些样本点称为支持向量天support vector).。因此,在异常点的识别时只需 考虑少数支持向量对应的样本点x,和,这样大天简化了异常点的识别过程,使得在线识别系统能 够满足实时性要求。式(8)给出了基于支持向量的非线性封闭超球体异常点检测方法 fx)=HK(x,x)-224太(x,)+D] (8) D=是aga(x,x)-R2-y ==1 其中,X表示待测点, 从为文特向量的个数,Y表示松弛系数,x表示支持向量,心表示支持向 量对应的权重系数。卖际,在判别式(8)中,D是学习样本在训练阶段求得的常量,并不需要在 线计算,而K(X,父根据核函数的定义也是一个常数。与待检测点X有关的项只有 是ax(x,) (9) 因此,∠个待识别样本在线判别时仅需计算式(9),并由式(8)来判定质量是否异常,计算时间 仅需几毫秒,完全满足质量在线监测的实时性要求。 12质量异常原因诊方法 在工业应用中,一旦发现设定的工艺参数已偏离超球体时,应及时、准确地诊断出哪些工序、哪 些工艺参数是造成偏差的原因,以便后续生产中调整工艺参数,避免出现批量的质量异常。质量异常 诊断模型的功能是,从设定的工艺参数中寻找引起偏离可控区边界各工艺参数的贡献值,贡献值大 的工艺参数是偏离可控区的主要原因。 待检测样本X到非线性超球体(软超球体,soft hypersphere)球心的距离平方
Fig.3 Samples are mapped from original space into feature space 通过非线性核函数将原始空间中的样本点映射到特征空间后,可按照式(1)的方式,建立特征 空间中封闭超球体的优化解 优化解: 2 , , 1 min C R R A (6) 约束条件: 2 2 ( ) ( ( ) ) ( ( ) ) 0, 1,2,... T i i i i i x C x C x C R i n 上式中,常数项 A 和松弛因子 的乘积项表示允许个别正常样本被判为异常的比例,比如,允许 2% 的正常样本被划分在超球体外,比例可根据用户对产品质量保证值的要求动态设定。设定松弛项是为 了更严格的控制产品质量的可靠性,比例的选择与第一类错误和第二类错误有关[33]。经非线性核函数 映射后,拉格朗日函数为 2 2 2 1 1 1 1 1 , 1 ( , , , ) [ ( ) ] ( ) , ( ) ( , ) ( , ) n n n i i i i i i i i i n i i i i n n i i i i j i j i i j L C R R A x C R x C x C x x x x (7) 上式与式(3)不同之处在于,式(3)是采用线性函数,因而只能解决简单边界问题,即超椭 球边界,而式(7)采用非线性核函数解决复杂非线性边界问题。两者差别主要是选择线性函数还是 非线性核函数,而求解的过程与上述所讨论的方法基本一致。 在求解式(7)拉格朗日函数的优化解过程中,可以发现大部分i 等于 0,只有少部分位于超球 体边界的样本i 大于 0,这些样本点称为支持向量(support vector)。因此,在异常点的识别时只需 考虑少数支持向量对应的样本点 i x 和i ,这样大大简化了异常点的识别过程,使得在线识别系统能 够满足实时性要求。式(8)给出了基于支持向量的非线性封闭超球体异常点检测方法 * * 1 * * * * 2 1 1 ( ) [ ( , ) 2 ( , ) ] ( , ) q i i i q q i j i j i j f x H x x x x D D x x R (8) 其中, x 表示待测点, q 为支持向量的个数, 表示松弛系数, * i x 表示支持向量, * i 表示支持向 量对应的权重系数。实际上,在判别式(8)中,D 是学习样本在训练阶段求得的常量,并不需要在 线计算,而( , ) x x 根据核函数的定义也是一个常数。与待检测点 x 有关的项只有 * * 1 ( , ) q i i i x x (9) 因此,一个待识别样本在线判别时仅需计算式(9),并由式(8)来判定质量是否异常,计算时间 仅需几毫秒,完全满足质量在线监测的实时性要求。 1.2 质量异常原因诊断方法 在工业应用中,一旦发现设定的工艺参数已偏离超球体时,应及时、准确地诊断出哪些工序、哪 些工艺参数是造成偏差的原因,以便后续生产中调整工艺参数,避免出现批量的质量异常。质量异常 诊断模型的功能是,从设定的工艺参数中寻找引起偏离可控区边界各工艺参数的贡献值,贡献值大 的工艺参数是偏离可控区的主要原因。 待检测样本 x 到非线性超球体(软超球体,soft hypersphere)球心的距离平方 录用稿件,非最终出版稿
R()=K(x.x)-2K()+()-Y (10) 由式(9)可知,造成R(x)变大的原因是上式右边第二项。若采用高斯核函数,则有 - (11) 其中,。为高斯核函数的系数项。可知,若x-x越大,则式(11)的值就越小,使得式(10)中的 R(x)值越大。由此可知,式(10)中待测样本到球心的距离改变量主要取决于 (12) 因而,待测样本X的第变量对偏离的贡献值为 contr(xi x)2 (13) 为了消除变量量纲对贡献值的影响,需对上式做标淮花处理,标准化后变量对偏离的贡献值 x-)21S, (14) 其中S,为变量j的方差,co(x,)中贡献值最大的那些变量是造成质量偏离的主要原因。异常点识别 和异常原因诊断方法的工业应用实例将在下面章节中讨论。 1.3工艺参数在线调整方法 在确定导致质量异常原因后,需要对工艺参数进行在线调整,使生产过程回归到正常状态。常用的 多变量优化算法包括神经元网络、徐渡学习、粒子群算法。这些算法大多采用正向推理方式,通过迭代 找出优化解,但这会影响控制系统的实时性。因此,在实际工业应用中,需要研究多变量、非线性情 况下工艺参数的快速优化算法为了解决工艺参数在线动态优化问题,提出基于流形学习的过程控制 参数优化方法。 产品在制造过程史涉及多个连续衔接的工序,不同工序须严格控制工艺参数才能生产出合格的 产品,如钢材在制造过程中涉及治炼(控制成分、夹杂物)、连铸(控制铸坯组织)、成形(控制形状、 尺寸、组织)和热处理(主要组织和材料性能)等工序的质量指标控制。工序间的质量指标存在遗传 性和关联性,且铬工序设定的工艺参数密切相关。如何从高维、强耦合、非线性复杂数据中,提取低 维数据空间拓扑结构的机器学习方法一流形学习,近年来引起了广泛关注。主流形学习可以理解为, 从实际生产数据中提取出工艺参数随质量指标变化的流向“管道”,在“管道”内的工艺参数可以 满足质量要求。 流形是定义在一个拓扑空间上的某个子集,它建立在欧氏空间(原始空间)中,且与欧氏空间 是微分同胚的。如果数据集X中任意两个不同的样本点a、b,都存在a邻域U及b邻域V,使得 V∩U=VUU=⊙,称(X,x)为Hausdorff拓扑空间。t表示X的子集所组成的一个非空集合,且满足 x中元素的并集仍属于τ,其有限交集及空集⊙和X都属于x,并称π为X的一个拓扑结构。流形学习 包括无监督和有监督数据的流形学习24。无监督流形学习是解决高维数据的低维主流形提取方法, 主要用高维数据的降维和消噪:有监督流形学习是根据标签数据变化规律,提取数据随标签值变化
2 * * * * * * 1 1 1 ( ) ( , ) 2 ( , ) ( , ) - q q q i i i j j i i i j R x x x x x x x (10) 由式(9)可知,造成 2 R x( ) 变大的原因是上式右边第二项。若采用高斯核函数,则有 2 * * * * 2 2 1 1 ( , ) i x x q q i i i i i x x e (11) 其中, 为高斯核函数的系数项。可知,若 * i x x 越大,则式(11)的值就越小,使得式(10)中的 2 R x( ) 值越大。由此可知,式(10)中待测样本到球心的距离改变量主要取决于 * 1 1 2 * * * 2 1 ( ) q p i j i j q i i ij i x x x x (12) 因而,待测样本 x 的第 j 变量对偏离的贡献值为 * * 2 1 ( ) ( ) j q j i ij i contr x x x (13) 为了消除变量量纲对贡献值的影响,需对上式做标准化处理,标准化后变量 j 对偏离的贡献值 * * 2 1 ( ) ( ) / j j q j i ij i contr x x x S (14) 其中 Sj 为变量 j 的方差, ( )j contr x 中贡献值最大的那些变量是造成质量偏离的主要原因。异常点识别 和异常原因诊断方法的工业应用实例将在下面章节中讨论。 1.3 工艺参数在线调整方法 在确定导致质量异常原因后,需要对工艺参数进行在线调整,使生产过程回归到正常状态。常用的 多变量优化算法包括神经元网络、深度学习、粒子群算法。这些算法大多采用正向推理方式,通过迭代 找出优化解,但这会影响控制系统的实时性。因此,在实际工业应用中,需要研究多变量、非线性情 况下工艺参数的快速优化算法。为了解决工艺参数在线动态优化问题,提出基于流形学习的过程控制 参数优化方法。 产品在制造过程中涉及多个连续衔接的工序,不同工序须严格控制工艺参数才能生产出合格的 产品,如钢材在制造过程中涉及冶炼(控制成分、夹杂物)、连铸(控制铸坯组织)、成形(控制形状、 尺寸、组织)和热处理(主要组织和材料性能)等工序的质量指标控制。工序间的质量指标存在遗传 性和关联性,且与各工序设定的工艺参数密切相关。如何从高维、强耦合、非线性复杂数据中,提取低 维数据空间拓扑结构的机器学习方法—流形学习,近年来引起了广泛关注。主流形学习可以理解为, 从实际生产数据中提取出工艺参数随质量指标变化的流向“管道”,在“管道”内的工艺参数可以 满足质量要求。 流形是定义在一个拓扑空间上的某个子集,它建立在欧氏空间(原始空间)中,且与欧氏空间 是微分同胚的。如果数据集X中任意两个不同的样本点 a、b,都存在 a 邻域 U 及 b 邻域 V,使得 V U V U ,称(X,τ)为 Hausdorff 拓扑空间。τ 表示X的子集所组成的一个非空集合,且满足 τ 中元素的并集仍属于 τ,其有限交集及空集和X都属于 τ,并称 τ 为X的一个拓扑结构。流形学习 包括无监督和有监督数据的流形学习[42-45]。无监督流形学习是解决高维数据的低维主流形提取方法, 主要用高维数据的降维和消噪;有监督流形学习是根据标签数据变化规律,提取数据随标签值变化 录用稿件,非最终出版稿
的低维主流形的结构,比如,工艺参数随质量指标的流向。 给定高维的观测数据集X=:,本,x},x,∈RP为独立同分布随机样本,分布在光滑的d维流形上, 即在D维欧氏空间中嵌入d维流形,其中d≤D。流形学习就是从观测数据集X中寻找低维的嵌入映 射,从而求得微分同胚的低维主流形。在建立观测点x,局部邻域的流形时,需要从数据集中抽取与该 观测点邻近(或相似)的数据点构建邻近(相似)矩阵,并计算矩阵的特征向量,通过选择若干最大特 征值对应的特征向量作为主向量,且将数据投影到主向量上得到低维的嵌入映射,即主流形。 在实际工业应用中,高维数据中内在的低维主流形常常是未知的。流形学习的目的是从数据集中, 通过嵌入局部邻域的低维主流形来描述整体的流形结构,在不丢失数据内在的本质特征情况下,消 除数据的次要因素和随机噪声,提取出数据低维的本质结构一主流形,图4给出流形学习的示意图。 Observed sample Manifold M ● ● 00 {S(V)} ■4流形标意图 Fig.4 Manifold learning diagram 流形学习过程包括3个步骤: (1)首先,对样本集进行标准化处理,消除变量的不同量纲在计算几何距离时影响,并建立标 签样本集{(:,)(32S),(:S)(xS)},其中S,表示标签样本的状态,即样本在流形空间中位置。 (2)搜索距样本点x,邻近且与其处牙同类状态的邻近点子集{S,(V)},同时选择与x,相邻, 但处于下一个状态的邻近点子集U,)}。 (3)对所有n个样本点建立郊近点集矩阵{N1,N2,,Nn}作为最终的邻近矩阵,其中子矩阵 N,的维数为k,×D,复观测点x邻近点个数,D为样本空间维度。 对每个子矩阵W个求得坊差矩阵C,=NN,再对协方差矩阵进行特征值分解,求得特征值 U,及对应的特征向量 C=U'AU (15) 最大的特征值所对应的特征向量表示流形在x,局部区域的主流形。由于特征向量相互正交,主流 形构成了局部区域的切空间。主流形的提取实现了高维流形向低维主流形的转换,揭示了流形在局部 区域的主要变化趋势(在图4中由箭头表示),并消除数据中的随机噪声和非主流的变化因素。将邻 域矩阵N,投影到局部区域的切空间T T=NU (16) 其中,向量工表示低维主流形演化方向,)为由式(15)求得的d个最大特征值的特征向量。 对每个观测点邻近矩阵分别计算特征向量,可以构建演化矩阵T=[工,T,,T]。演化矩阵的每
的低维主流形的结构,比如,工艺参数随质量指标的流向。 给定高维的观测数据集 1 2 { , ,... } X x x x n , D i x R 为独立同分布随机样本,分布在光滑的 d 维流形上, 即在 D 维欧氏空间中嵌入 d 维流形,其中 d≤D。流形学习就是从观测数据集 X 中寻找低维的嵌入映 射,从而求得微分同胚的低维主流形。在建立观测点 i x 局部邻域的流形时,需要从数据集中抽取与该 观测点邻近(或相似)的数据点构建邻近(相似)矩阵,并计算矩阵的特征向量,通过选择若干最大特 征值对应的特征向量作为主向量,且将数据投影到主向量上得到低维的嵌入映射,即主流形。 在实际工业应用中,高维数据中内在的低维主流形常常是未知的。流形学习的目的是从数据集中, 通过嵌入局部邻域的低维主流形来描述整体的流形结构,在不丢失数据内在的本质特征情况下,消 除数据的次要因素和随机噪声,提取出数据低维的本质结构—主流形,图 4 给出流形学习的示意图。 图4 流形学习示意图 Fig.4 Manifold learning diagram 流形学习过程包括 3 个步骤: (1)首先,对样本集进行标准化处理,消除变量的不同量纲在计算几何距离时影响,并建立标 签样本集 1 2 {( , ),( , ),...( , )...( , )} i i i j n p x S x S x S x S ,其中 j S 表示标签样本的状态,即样本在流形空间中位置。 (2)搜索距样本点 i x 邻近且与其处于同类状态的邻近点子集{ ( )} S Vi i ,同时选择与 i x 相邻, 但处于下一个状态的邻近点子集{ ( )} S U i i 1 。 (3)对所有 n 个样本点建立邻近点集矩阵 , { ,..., } N N N 1 2 n 作为最终的邻近矩阵,其中子矩阵 Ni 的维数为 i k D , i k 为观测点 i x 邻近点个数,D 为样本空间维度。 对每个子矩阵 Ni 求得协方差矩阵 T C N N i i i ,再对协方差矩阵进行特征值分解,求得特征值 Ui及对应的特征向量 λi T C U U i i i i (15) 最大的特征值所对应的特征向量表示流形在 i x 局部区域的主流形。由于特征向量相互正交,主流 形构成了局部区域的切空间。主流形的提取实现了高维流形向低维主流形的转换,揭示了流形在局部 区域的主要变化趋势(在图 4 中由箭头表示),并消除数据中的随机噪声和非主流的变化因素。将邻 域矩阵 Ni 投影到局部区域的切空间Ti ˆ T N U i i (16) 其中,向量Ti 表示低维主流形演化方向,Uˆ 为由式(15)求得的 d 个最大特征值的特征向量。 对每个观测点邻近矩阵分别计算特征向量,可以构建演化矩阵 , 1 2 [ ,..., ] T T T T n 。演化矩阵的每 录用稿件,非最终出版稿
个向量T,表示流形在局部区域进行线性化处理后演化方向,因此演化矩阵T仍可描述非线性流形结 构,这个方法也称为局部线性化。 在实际工业应用中,除了需掌握流形变化趋势外,还应确定质量优化与调整过程中各工艺参数 的调节量。工艺参数的调节量 △B=TU (17) △B可以理解为当观测点偏离主流形时参数的偏移量。由于向量△B是经过标准化处理,因此需要对 每个变量进行反标准化计算。 基于流形学习的过程控制参数优化方法的优势是,通过机器学习已提取出工艺参数与质量指标 间对应的主流形,掌控工艺参数随质量指标的流向,因此在工艺参数调整时更具针对性和实时性。基 于流形学习的工艺参数在线调整方法的工业应用实例将在下面章节中讨论。 1.4工艺规范的设定方法 由于工艺参数间存在多重耦合和非正态分布的数据结构,数据在高维空间使的分布通常是一个 软超球体,如果凭借目前企业常用的基于参数独立同分布假设的6σ方选人设定的工艺规范必将造成 产品质量的偏差。正确预设定工艺参数的方法应从软超球体中寻找最太内接矩形体(或平行体),最 终根据最大内接矩形体来确定工艺参数的设定范围。 产品制造过程涉及不同工序,每个工序需设定关键质量指标和工艺参数控制范围,才能确保最 终产品的质量。设工序1的关键工艺参数为A1、A2.,工序2关键工艺参数为B1、B2.,最终工序的 工艺参数为C1、C2.Cm,所有工序总计有p维变量。 数的 上、 下限可以表示为 AI[Xio Xi BI[Xio Xil, (18) , Cm[X] 为了满足各工序工艺参数所设定的上限X。和下限X分布在软超球体内,且满足多变量耦合情 况下复杂边界的要求,设定的上《限应限定在软超球体中最大内接矩形体F内 F=(A1∩A2∩.)U(B1∩B2∩.) U(C1∩C2n.Cmn) (19) A1、A2..B1、B2.C1、C2.Cm∈F F∈RP 式(19)以解释为,寻求每个工艺参数在软超球体内最大区间,同时需满足其它工艺参数的 区间范围,即赛最大的并集,具体应用实例将在下章节中讨论。 在实际工业应用中,请注意下面几个问题: 1)关键变量的选择 流程工业在产品制造过程中涉及多个连续相关的工序,工艺参数较多,应将那些与产品质量密 切相关的质量指标和工艺参数作为关键变量。在遴选过程中,可以通过互相关分析来判定工艺参数与 产品质量的关联度,并选择相关系数绝对值大的工艺参数作为工艺规范需优化的关键变量。 2)相关变量的选择 实际工业生产中,工艺参数间常出现强耦合的情况,软超球体会随相关系数的大小出现倾斜, 最大内接矩形体同样也会倾斜(请参看图9)。因此,当两个工艺参数间存在强耦合时,原则上选择 其中一项关键工艺参数的边界来确定关键变量上、下限,另一项关键工艺参数用来修正由前一项工艺
个向量 Ti 表示流形在局部区域进行线性化处理后演化方向,因此演化矩阵 T 仍可描述非线性流形结 构,这个方法也称为局部线性化。 在实际工业应用中,除了需掌握流形变化趋势外,还应确定质量优化与调整过程中各工艺参数 的调节量。工艺参数的调节量 T B TUi i (17) B 可以理解为当观测点偏离主流形时参数的偏移量。由于向量 B 是经过标准化处理,因此需要对 每个变量进行反标准化计算。 基于流形学习的过程控制参数优化方法的优势是,通过机器学习已提取出工艺参数与质量指标 间对应的主流形,掌控工艺参数随质量指标的流向,因此在工艺参数调整时更具针对性和实时性。基 于流形学习的工艺参数在线调整方法的工业应用实例将在下面章节中讨论。 1.4 工艺规范的设定方法 由于工艺参数间存在多重耦合和非正态分布的数据结构,数据在高维空间中的分布通常是一个 软超球体,如果凭借目前企业常用的基于参数独立同分布假设的 6 方法,设定的工艺规范必将造成 产品质量的偏差。正确预设定工艺参数的方法应从软超球体中寻找最大内接矩形体(或平行体),最 终根据最大内接矩形体来确定工艺参数的设定范围。 产品制造过程涉及不同工序,每个工序需设定关键质量指标和工艺参数控制范围,才能确保最 终产品的质量。设工序 1 的关键工艺参数为 A1、A2…,工序 2 关键工艺参数为 B1、B2…,最终工序的 工艺参数为 C1、C2…Cm,所有工序总计有 p 维变量。工艺参数的上、下限可以表示为 1 1 , , , 1[ ], ...... 1[ ], ...... [ ]. low up i i low up p p low up A X X B X X Cm X X (18) 为了满足各工序工艺参数所设定的上限 i Xup 和下限 i Xlow 分布在软超球体内,且满足多变量耦合情 况下复杂边界的要求,设定的上、下限应限定在软超球体中最大内接矩形体 F 内 ( 1 2 ...) ( 1 2 ...) ( 1 2 ... ) 1 2... 1 2... 1 2... p F A A B B C C Cm A A B B C C Cm F F R 、 、 、 (19) 式(19)可以解释为,寻求每个工艺参数在软超球体内最大区间,同时需满足其它工艺参数的 区间范围,即寻求最大的并集,具体应用实例将在下章节中讨论。 在实际工业应用中,请注意下面几个问题: 1)关键变量的选择 流程工业在产品制造过程中涉及多个连续相关的工序,工艺参数较多,应将那些与产品质量密 切相关的质量指标和工艺参数作为关键变量。在遴选过程中,可以通过互相关分析来判定工艺参数与 产品质量的关联度,并选择相关系数绝对值大的工艺参数作为工艺规范需优化的关键变量。 2)相关变量的选择 实际工业生产中,工艺参数间常出现强耦合的情况,软超球体会随相关系数的大小出现倾斜, 最大内接矩形体同样也会倾斜(请参看图 9)。因此,当两个工艺参数间存在强耦合时,原则上选择 其中一项关键工艺参数的边界来确定关键变量上、下限,另一项关键工艺参数用来修正由前一项工艺 录用稿件,非最终出版稿
参数确定的范围是否合理。 3)组合优化问题 根据集合理论,寻求软超球体中最大的内接矩形体是一个最大集合和最小集合的组合优化问题。 通过将软超球体投影到二维平面上寻求最大的内接矩形,并将所有从二维投影所求得的内接矩形边 界来获得所有变量的最小集合(并集),即软超球体的最大内接矩形体。因此,对于复杂边界的软超 球体,组合优化过程需在全域寻求优化解。 4)工艺规范验证 数据的可靠性和完备性对分析结果有着重大影响,应验证数据的可靠性,确保数据准确、可靠: 此外,还需验证数据的完备性,应考虑训练数据是否涵盖了所有区域,尤其是收集出现质量异常的 区域。通常包含一定数量异常点的训练数据集更有利于准确地划分软超球体的边界。 2工业应用实例 钢铁企业需根据客户要求,在生产过程对各工序的工艺参数在线智能 确保产品的最终质 量。下面以汽车用钢为例,讨论运用机器学习方法在产品质量在线监控 在线 优化和在线预设定中的 工业应用实例。 深冲钢(F钢)是汽车构件的重要原材料,在成形与使用中需考虑其冲压性能、力学强度、抗冲 击性能等质量要求,主要性能指标包括:抗拉强度、屈服强度、延伸率、塑性应变比等。深冲钢生产过 程中涉及炼钢、热轧和热处理等工序,不同工序需严格控制相应的工艺参数才能制造出客户要求的质 量指标。炼钢工序应控制治炼过程中钢材中主要成分:碳G锰M、磷P、硫S等元素的质量分数;热 轧工序:加热炉出口温度、精轧入口温度、精轧出口温度卷取温度等:热处理工序:均热平均温度、 快冷出口温度、时效出口温度、缓冷出口温度等。 从实际生产线上采集不同牌号深冲钢的工艺参数质量指标值。原始数据集中有24个工艺参数, 其中12个工艺参数与产品的几何尺寸有关,而与材料性能无直接关系,因此选择12个相关的参数作 为数据学习的样本集,主要成分和工艺参数名称及统计量如表1所示。 表1关工艺参散、质量指标及统计量 Table 1 The key process parameters,quality indexes and statistics No. Parameter name Max Min Mean C(%) 0.0027 0.0011 0.0017 粥稿 Mn(%) 0.160 0.100 0.126 P(%) 0.014 0.007 0.010 S(%) 0.0139 0.0024 0.0077 Exit temperature of heating furnace (C) 1277.3 1247.1 1263.04 Entry temperature of finish rolling (C) 1083.9 1014.0 1039.08 Exit temperature of finish rolling (C) 928.5 898.7 917.17 Coiling temperature (C) 755.4 654.5 711.70 9 Soaking temperature (C) 854.9 789.7 824.27 0 Fast-cooling exit temperature(C) 455.7 378.8 431.13 Aging exit temperature (C) 394.1 345.1 374.52 Slow-cooling exit temperature(C) 676.4 606.0 641.61 Tensile strength(MPa) 308.0 276.0 290.1 2 Yield strength (MPa) 125.0 160.0 139.4 3 Elongation (% 40.5 50.5 45.1 Plastic strain ratio 2.10 3.5 2.85
参数确定的范围是否合理。 3)组合优化问题 根据集合理论,寻求软超球体中最大的内接矩形体是一个最大集合和最小集合的组合优化问题。 通过将软超球体投影到二维平面上寻求最大的内接矩形,并将所有从二维投影所求得的内接矩形边 界来获得所有变量的最小集合(并集),即软超球体的最大内接矩形体。因此,对于复杂边界的软超 球体,组合优化过程需在全域寻求优化解。 4)工艺规范验证 数据的可靠性和完备性对分析结果有着重大影响,应验证数据的可靠性,确保数据准确、可靠; 此外,还需验证数据的完备性,应考虑训练数据是否涵盖了所有区域,尤其是收集出现质量异常的 区域。通常包含一定数量异常点的训练数据集更有利于准确地划分软超球体的边界。 2 工业应用实例 钢铁企业需根据客户要求,在生产过程对各工序的工艺参数在线智能监控,确保产品的最终质 量。下面以汽车用钢为例,讨论运用机器学习方法在产品质量在线监控、在线优化和在线预设定中的 工业应用实例。 深冲钢(IF 钢)是汽车构件的重要原材料,在成形与使用中需考虑其冲压性能、力学强度、抗冲 击性能等质量要求,主要性能指标包括:抗拉强度、屈服强度、延伸率、塑性应变比等。深冲钢生产过 程中涉及炼钢、热轧和热处理等工序,不同工序需严格控制相应的工艺参数才能制造出客户要求的质 量指标。炼钢工序应控制冶炼过程中钢材中主要成分:碳 C、锰 Mn、磷 P、硫 S 等元素的质量分数;热 轧工序:加热炉出口温度、精轧入口温度、精轧出口温度、卷取温度等;热处理工序:均热平均温度、 快冷出口温度、时效出口温度、缓冷出口温度等。 从实际生产线上采集不同牌号深冲钢的工艺参数和质量指标值。原始数据集中有 24 个工艺参数, 其中 12 个工艺参数与产品的几何尺寸有关,而与材料性能无直接关系,因此选择 12 个相关的参数作 为数据学习的样本集,主要成分和工艺参数名称及统计量如表 1 所示。 表 1 关键工艺参数、质量指标及统计量 Table 1 The key process parameters, quality indexes and statistics No. Parameter name Max Min Mean Process parameters 1 C(%) 0.0027 0.0011 0.0017 2 Mn(%) 0.160 0.100 0.126 3 P(%) 0.014 0.007 0.010 4 S(%) 0.0139 0.0024 0.0077 5 Exit temperature of heating furnace (°C) 1277.3 1247.1 1263.04 6 Entry temperature of finish rolling (°C) 1083.9 1014.0 1039.08 7 Exit temperature of finish rolling (°C) 928.5 898.7 917.17 8 Coiling temperature (°C) 755.4 654.5 711.70 9 Soaking temperature (°C) 854.9 789.7 824.27 10 Fast-cooling exit temperature(°C) 455.7 378.8 431.13 11 Aging exit temperature (°C) 394.1 345.1 374.52 12 Slow-cooling exit temperature(°C) 676.4 606.0 641.61 Quality indexes 1 Tensile strength (MPa) 308.0 276.0 290.1 2 Yield strength (MPa) 125.0 160.0 139.4 3 Elongation (%) 40.5 50.5 45.1 4 Plastic strain ratio 2.10 3.5 2.85 录用稿件,非最终出版稿
2.1质■在线监测与诊断 从采集的数据集中随机选取160个样本作为训练样本,并设松弛系数Y=0.02,由式(4)确定 的软超球体R值作为控制限,训练结果如图5所示。从图中可以看到,绝大部分样本均在控制限以 下,这些样本都在软超球体的内部(正常样本),但有3个样本在控制限的边界或超出控制限,可 能存在质量异常的情况。查看原始数据后发现,除第46样本的质量指标略超出标准外,第28、58样 本处在正常范围,但接近临界值。出现这种情况的原因是,在训练阶段设定松弛系数Y=0.02,即允 许个别正常样本被判为异常(在软超球体边界外)。松弛系数会影响软超球体值,因此对质量要 求高的产品,为了严格监控生产过程可以适度降低控制限值。 0.g 0.9 0.a Control limit 0.8 0.7 是0.6 0.6 0.5 0.4 03 0.3 02 0 20 406080100120 140 60 80 100 Number of samples (a) Number of samples (b) ■5训练集的控制限?(5)和在线监测结果(5b) Fig.5 The control limit R2 of the training set(5a)and the on-line monitoring result(5b) 经过训练后的软超球体模型中,有36个支持同量,这些支持向量及对应的权重系数通过式 (8)对产品质量进行在线监测。从生产线上另采集①2Q个样本数据来验证方法的有效性,在线监测 结果如图5b所示。从图5b中可以发现,第2号样本点已超出了控制限,说明工艺参数出现异常:第 57号样本点临近控制限,也可能出现异常。为了查我异常的原因,利用式(14)计算样本点工艺参数 的贡献值(图6a和6b),发现碳质量分数(表1中序号1)和热轧加热炉出口温度(表1中序号5) 贡献值最大。通过在线监控系统的数据显示,25号样本点的碳质量分数为0.0029%,已超出了 0.0027%最大值,加热炉出口温度为1249℃,接近最小值1247℃:57号样本点的碳质量分数为 0.0027%, 加热炉出口温度为124©均为临界值,其它工艺参数均在控制限范围。查看样本点的质 量指标后,发现第25样本点的抗拉强度仅为275MPa,已低于表1中给出的276MPa最小值:第57 样本点的屈服强度为160M是表1中给出的最大值。 15 2 1.5 .mo 56789101112 23456789101112 er of parameters (a) Serial number of parameters 圆6工艺参数(参数序号在表1中)的贡献图:(a)第25样本,(b)第57样本 Fig.6 The contribution chart of parameter:(a)sample No.25,(b)sample No.57 (Serial number of parameters listed in Table I) 由于工艺参数与质量指标间有着密切的关联,因此可以通过工艺参数的在线监测和诊断实现产 品质量在线监控。利用机器学习提取数据中内在的信息和知识,本质上是建立实体对象(工艺装备和
2.1 质量在线监测与诊断 从采集的数据集中随机选取 160 个样本作为训练样本,并设松弛系数 = 0.02,由式(4)确定 的软超球体 2 R 值作为控制限,训练结果如图 5a 所示。从图中可以看到,绝大部分样本均在控制限以 下,这些样本都在软超球体的内部(正常样本),但有 3 个样本在控制限的边界或超出控制限,可 能存在质量异常的情况。查看原始数据后发现,除第 46 样本的质量指标略超出标准外,第 28、58 样 本处在正常范围,但接近临界值。出现这种情况的原因是,在训练阶段设定松弛系数 = 0.02,即允 许个别正常样本被判为异常(在软超球体边界外)。松弛系数会影响软超球体 2 R 值,因此对质量要 求高的产品,为了严格监控生产过程可以适度降低控制限 2 R 值。 0 20 40 60 80 100 120 140 160 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 28 46 58 Number of samples R2 Control limit (a) 0 20 40 60 80 100 120 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 25 57 Number of samples R2 (b) Control limit 图 5 训练集的控制限 R 2(5a)和在线监测结果(5b) Fig. 5 The control limit R2 of the training set(5a) and the on-line monitoring result(5b) 经过训练后的软超球体模型中,有 36 个支持向量,这些支持向量及对应的权重系数通过式 (8)对产品质量进行在线监测。从生产线上另采集 120 个样本数据来验证方法的有效性,在线监测 结果如图 5b 所示。从图 5b 中可以发现,第 25 号样本点已超出了控制限,说明工艺参数出现异常;第 57 号样本点临近控制限,也可能出现异常。为了查找异常的原因,利用式(14)计算样本点工艺参数 的贡献值(图 6a 和 6b),发现碳质量分数(表 1 中序号 1)和热轧加热炉出口温度(表 1 中序号 5) 贡献值最大。通过在线监控系统的数据显示,25 号样本点的碳质量分数为 0.0029%,已超出了 0.0027%最大值,加热炉出口温度为 1249°C,接近最小值 1247°C; 57 号样本点的碳质量分数为 0.0027%,加热炉出口温度为 1247°C,均为临界值,其它工艺参数均在控制限范围。查看样本点的质 量指标后,发现第 25 样本点的抗拉强度仅为 275 MPa,已低于表 1 中给出的 276 MPa 最小值;第 57 样本点的屈服强度为 160 MPa,是表 1 中给出的最大值。 图 6 工艺参数(参数序号在表 1 中)的贡献图:(a)第 25 样本,(b)第 57 样本 Fig.6 The contribution chart of parameter: (a) sample No. 25, (b) sample No.57 (Serial number of parameters listed in Table I) 由于工艺参数与质量指标间有着密切的关联,因此可以通过工艺参数的在线监测和诊断实现产 品质量在线监控。利用机器学习提取数据中内在的信息和知识,本质上是建立实体对象(工艺装备和 录用稿件,非最终出版稿