工程科学学报,第38卷,第12期:1791-1797,2016年12月 Chinese Journal of Engineering,Vol.38,No.12:1791-1797,December 2016 D0l:10.13374/j.issn2095-9389.2016.12.019:http://journals.ustb.edu.cn 基于支持向量数据描述方法的生产过程监控、诊断与 优化 赵启东》,徐钢23》,黎敏)区 1)北京科技大学机械工程学院,北京1000832)北京科技大学计算机与通讯学院,北京100083 3)北京科技大学钢铁共性技术协同创新中心,北京100083 ☒通信作者,E-mail:limin@usth.cdu.cm 摘要提出一种基于支持向量数据描述(support vector data description,SVDD)的生产过程监控、诊断与优化方法.首先,利 用正常样本建立SVDD监控模型,获得控制限:然后,利用贡献图对超过控制限的异常点进行诊断,分析引起异常的主要原 因:最后,利用邻近点替换法对异常的生产样本进行工艺参数优化.将新方法应用于热轧薄板的生产过程中,结果表明:新方 法比传统的监控方法T心具有更高的检出率,且可以实现对异常点的工艺参数优化,使之回到受控状态. 关键词支持向量数据描述:生产过程:监控:诊断:参数优化 分类号TP273 Production process monitoring,diagnosis and optimization based on SVDD ZHAO Qi-dong",XU Gang?3),LI Min 1)School of Mechanical Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)School of Computer and Communication Engineering,University of Science and Technology Beijing,Beijing 100083.China 3)Collaborative Innovation Center of Steel Technology,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:limin@ustb.edu.en ABSTRACT A support vector data description (SVDD)was proposed to be introduced in the monitoring,diagnosis and optimization of processes.Firstly,the SVDD monitor model was established to obtain the control limit based on normal samples.Then,the contri- bution chart was used to diagnose outliners exceeding the control limit in statistics to find the main causes of abnormal production. Finally,the process parameter optimization was performed by the adjacent point replacement.The proposed method was applied to the process of cold rolled sheets.The results show that this method has a higher detection rate than traditional during the production process monitoring,and can optimize the process parameters to make it return to the controlled state. KEY WORDS support vector data description:production processes;monitoring:diagnosis;parameter optimization 随着计算机系统、数据库技术的普及与应用,现代tio,SVDD)D是由TAX等基于支持向量机SVM所 企业信息化系统中拥有丰富的数据资源,从而也提出提出的一种单分类方法,其基本原理是构造一个尽可 采用各种数据分析方法对产品质量进行全流程监控的能小的超球体来包含尽可能多的数据点,该方法已被 迫切需求.如何从海量的数据中提取出有价值的信 成功应用于故障诊断可、图像处理圆、医学信号处理闭 息,完善产品质量管理体系,已成为企业提高管理水平 等领域.SVDD方法最大的优势在于,对数据分布没有 的必然趋势☒ 特殊的要求,从而避免了传统的多变量统计控制方法 支持向量数据描述(support vector data descrip- 需要假设数据服从高斯分布的不足. 收稿日期:2016-05-09 基金项目:“十二五”国家科技支撑计划资助项目(2015BAF30BO1)
工程科学学报,第 38 卷,第 12 期: 1791--1797,2016 年 12 月 Chinese Journal of Engineering,Vol. 38,No. 12: 1791--1797,December 2016 DOI: 10. 13374 /j. issn2095--9389. 2016. 12. 019; http: / /journals. ustb. edu. cn 基于支持向量数据描述方法的生产过程监控、诊断与 优化 赵启东1) ,徐 钢2,3) ,黎 敏3) 1) 北京科技大学机械工程学院,北京 100083 2) 北京科技大学计算机与通讯学院,北京 100083 3) 北京科技大学钢铁共性技术协同创新中心,北京 100083 通信作者,E-mail: limin@ ustb. edu. cn 摘 要 提出一种基于支持向量数据描述( support vector data description,SVDD) 的生产过程监控、诊断与优化方法. 首先,利 用正常样本建立 SVDD 监控模型,获得控制限; 然后,利用贡献图对超过控制限的异常点进行诊断,分析引起异常的主要原 因; 最后,利用邻近点替换法对异常的生产样本进行工艺参数优化. 将新方法应用于热轧薄板的生产过程中,结果表明: 新方 法比传统的监控方法 T2 PCA 具有更高的检出率,且可以实现对异常点的工艺参数优化,使之回到受控状态. 关键词 支持向量数据描述; 生产过程; 监控; 诊断; 参数优化 分类号 TP273 收稿日期: 2016--05--09 基金项目: “十二五”国家科技支撑计划资助项目( 2015BAF30B01) Production process monitoring,diagnosis and optimization based on SVDD ZHAO Qi-dong1) ,XU Gang2,3) ,LI Min3) 1) School of Mechanical Engineering,University of Science and Technology Beijing,Beijing 100083,China 2) School of Computer and Communication Engineering,University of Science and Technology Beijing,Beijing 100083,China 3) Collaborative Innovation Center of Steel Technology,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail: limin@ ustb. edu. cn ABSTRACT A support vector data description ( SVDD) was proposed to be introduced in the monitoring,diagnosis and optimization of processes. Firstly,the SVDD monitor model was established to obtain the control limit based on normal samples. Then,the contribution chart was used to diagnose outliners exceeding the control limit in statistics to find the main causes of abnormal production. Finally,the process parameter optimization was performed by the adjacent point replacement. The proposed method was applied to the process of cold rolled sheets. The results show that this method has a higher detection rate than traditional T2 PCA during the production process monitoring,and can optimize the process parameters to make it return to the controlled state. KEY WORDS support vector data description; production processes; monitoring; diagnosis; parameter optimization 随着计算机系统、数据库技术的普及与应用,现代 企业信息化系统中拥有丰富的数据资源,从而也提出 采用各种数据分析方法对产品质量进行全流程监控的 迫切需求. 如何从海量的数据中提取出有价值的信 息,完善产品质量管理体系,已成为企业提高管理水平 的必然趋势[1--2]. 支持 向 量 数 据 描 述 ( support vector data description,SVDD) [3--4]是由 TAX 等基于支持向量机 SVM 所 提出的一种单分类方法,其基本原理是构造一个尽可 能小的超球体来包含尽可能多的数据点,该方法已被 成功应用于故障诊断[5]、图像处理[6]、医学信号处理[7] 等领域. SVDD 方法最大的优势在于,对数据分布没有 特殊的要求,从而避免了传统的多变量统计控制方法 需要假设数据服从高斯分布的不足.
·1792· 工程科学学报,第38卷,第12期 近几年,众多学者对SVDD在工业过程中的应用 其中,R为超球体的半径,o为超球体的球心.该方法 展开大量的研究.文献8]提出利用单分类方法进行 允许有少量样本点在超球体的外部,因此引入松弛变 多变量过程监控;文献9]提出利用SVDD方法对发 量:对第i个样本点的错分进行惩罚,参数v是对超 电机系统进行非线性监控与诊断;文献0-11]提出 球体大小和所有样本的错分率进行的约束.可以通过 利用主成分分析法(principal component analysis,PCA) 引入拉格朗日乘子α,将式(1)转化为对偶问题 将正常数据分为主元子空间和残差子空间,再在相应 max 的空间中建立SVDD模型来进行监控;文献12-13] ∑a,K(x,x,)+∑∑a,a,K(xx), 利用独立成分分析法(independent component analysis, (2) s.t. ICA)对非高斯信息和残差信息进行分析,构造多个统 ax=1,0≤gs nv 计量指标进行过程监控,以提高监控性能,然而CA算 其中,K(x,x)通常选为高斯核函数 法复杂度高和解的不确定性在一定程度上限制了该方 法的运用.综上所述,目前的研究主要是在SVDD方 K() (3) 法的基础上,构建新的统计量来提高监控的准确性,但 式中,σ为核参数 这无形中增加了对异常点的诊断难度,因此不利于在 通过对式(2)进行求解,可以得到拉格朗日乘子 实际现场的推广使用.此外,现阶段的研究主要集中 ,的值,主要有如下几种形式:α,=0,表示样本点位于 在生产过程的监控和诊断两个方面,对异常情况出现 1 后的工艺参数优化策略尚缺乏研究. 超球体内;a:= 而意味着样本点位于超球体外:0< 另一方面,SVDD方法引入核函数,将原始数据映 射到高维特征空间,可以很好地处理非线性问题.但 &<品则代表样本点在超球面上,通常,将a≠0对 核参数的选择直接决定了监控模型的准确性,因此需 应的样本点统称为支持向量,即位于超球体外和超球 要对核参数进行优化.文献D4]提出利用粒子群优化 体面上的点都是支持向量 核参数;文献5]基于非高斯测度提出参数改进算 超球体有两个关键参数:球心o和半径R,分别可 法,但需要假设样本各分量服从独立同方差的高斯分 以通过式(4)和式(5)来进行求解 布.如何根据数据内在特征,选择合适的方法来优化 核参数是值得研究的内容. (4) 针对以上问题,本文提出基于SVDD方法的生产 R2=‖中(x)-oI2=K(x,x)- 过程监控、诊断和优化.首先,以虚警率作为评价指标 来确定核参数:再利用正常样本建立SVDD监控模型, 2宫)+宫 a). (5) 获得控制限;然后通过贡献图对超过控制限的异常点 式中,中(x)表示超球体内的任意一点,中(x)表示位 进行诊断,分析引起异常的主要原因:最后利用邻近点 于超球面上的点 替换法对异常的生产样本进行工艺参数的优化。将新 通常,在监控过程中,将超球体的半径作为控 方法应用于热轧薄板的生产过程中,验证了该方法的 制限进行实时监控.当新来一个测试样本x时,可以 有效性。 计算该样本点到超球体球心的距离 1原理介绍 D(xa)=‖中(x)-o12= 1.1基于统计量的过程监控 SVDD的基本思想是:对于只有一类数据的训练 1-2aK)+ aaK(xx) 集{x,},x:eR,i=1,2,…,n,通过非线性映射b:R→ (6) F(d<m)将这n个样本点映射到高维特征空间中, 若D(x)<R,说明新来的测试样本点落在超球体 期望在高维空间F"中寻找一个超球体,用尽可能小 内,则该样本点处于正常状态:反之,该样本点则被判 的超球体来包含尽可能多的样本点.因此,这个优化 为异常样本 问题可以描述为 在求取控制限R的过程中,参数v和核参数σ的 [min(R.o,E)=R2+∑, 选择至关重要.本文提出以虚警率作为评价指标来确 定上述这两个参数.虚警率是指正常样本被误判 s.t1b(x)-o2≤R2+,东≥0,i=1,2,…,n 为异常的样本数在总样本数中的比例,即犯第一类错 (1) 误的概率,如下式所示:
工程科学学报,第 38 卷,第 12 期 近几年,众多学者对 SVDD 在工业过程中的应用 展开大量的研究. 文献[8]提出利用单分类方法进行 多变量过程监控; 文献[9]提出利用 SVDD 方法对发 电机系统进行非线性监控与诊断; 文献[10--11]提出 利用主成分分析法( principal component analysis,PCA) 将正常数据分为主元子空间和残差子空间,再在相应 的空间中建立 SVDD 模型来进行监控; 文献[12--13] 利用独立成分分析法( independent component analysis, ICA) 对非高斯信息和残差信息进行分析,构造多个统 计量指标进行过程监控,以提高监控性能,然而 ICA 算 法复杂度高和解的不确定性在一定程度上限制了该方 法的运用. 综上所述,目前的研究主要是在 SVDD 方 法的基础上,构建新的统计量来提高监控的准确性,但 这无形中增加了对异常点的诊断难度,因此不利于在 实际现场的推广使用. 此外,现阶段的研究主要集中 在生产过程的监控和诊断两个方面,对异常情况出现 后的工艺参数优化策略尚缺乏研究. 另一方面,SVDD 方法引入核函数,将原始数据映 射到高维特征空间,可以很好地处理非线性问题. 但 核参数的选择直接决定了监控模型的准确性,因此需 要对核参数进行优化. 文献[14]提出利用粒子群优化 核参数; 文献[15]基于非高斯测度提出参数改进算 法,但需要假设样本各分量服从独立同方差的高斯分 布. 如何根据数据内在特征,选择合适的方法来优化 核参数是值得研究的内容. 针对以上问题,本文提出基于 SVDD 方法的生产 过程监控、诊断和优化. 首先,以虚警率作为评价指标 来确定核参数; 再利用正常样本建立 SVDD 监控模型, 获得控制限; 然后通过贡献图对超过控制限的异常点 进行诊断,分析引起异常的主要原因; 最后利用邻近点 替换法对异常的生产样本进行工艺参数的优化. 将新 方法应用于热轧薄板的生产过程中,验证了该方法的 有效性. 1 原理介绍 1. 1 基于统计量 r 2 的过程监控 SVDD 的基本思想是: 对于只有一类数据的训练 集{ xi} ,xi∈Rd ,i = 1,2,…,n,通过非线性映射∶ Rd → Fm ( d < m) 将这 n 个样本点映射到高维特征空间中, 期望在高维空间 Fm 中寻找一个超球体,用尽可能小 的超球体来包含尽可能多的样本点. 因此,这个优化 问题可以描述为 minf( R,o,ξi ) = R2 + 1 nυ∑ n i = 1 ξi, s. t. ‖( xi ) - o‖2 ≤ R2 + ξi,ξi ≥ 0,i = 1,2,…, { n. ( 1) 其中,R 为超球体的半径,o 为超球体的球心. 该方法 允许有少量样本点在超球体的外部,因此引入松弛变 量 ξi 对第 i 个样本点的错分进行惩罚,参数 υ 是对超 球体大小和所有样本的错分率进行的约束. 可以通过 引入拉格朗日乘子 α,将式( 1) 转化为对偶问题 max∑ n i = 1 αiK( xi,xi ) + ∑ n i = 1 ∑ n j = 1 αiαj K( xi,xj ) , s. t. ∑ n i = 1 αi = 1,0 ≤ αi ≤ 1 nυ { . ( 2) 其中,K( xi,xj ) 通常选为高斯核函数 K( xi,xj ) = e - ‖xi - xj ‖2 σ2 . ( 3) 式中,σ 为核参数. 通过对式( 2) 进行求解,可以得到拉格朗日乘子 αi 的值,主要有如下几种形式: αi = 0,表示样本点位于 超球体内; αi = 1 nυ ,意味着样本点位于超球体外; 0 < αi < 1 nυ ,则代表样本点在超球面上. 通常,将 αi≠0 对 应的样本点统称为支持向量,即位于超球体外和超球 体面上的点都是支持向量. 超球体有两个关键参数: 球心 o 和半径 R,分别可 以通过式( 4) 和式( 5) 来进行求解 o = ∑ n i = 1 αi( xi ) , ( 4) R2 = ‖( xk ) - o‖2 = K( xk,xk ) - 2 ∑ n i = 1 αiK( xk,xi ) + ∑ n i = 1 ∑ n j = 1 αiαj K( xi,xj ) . ( 5) 式中,( xi ) 表示超球体内的任意一点,( xk ) 表示位 于超球面上的点. 通常,在监控过程中,将超球体的半径 R2 作为控 制限进行实时监控. 当新来一个测试样本 xnew时,可以 计算该样本点到超球体球心的距离 D2 ( xnew ) = ‖( xnew ) - o‖2 = 1 - 2 ∑ n i = 1 αiK( xnew,xi ) + ∑ n i = 1 ∑ n j = 1 αiαj K( xi,xj ) . ( 6) 若 D2 ( xnew ) < R2 ,说明新来的测试样本点落在超球体 内,则该样本点处于正常状态; 反之,该样本点则被判 为异常样本. 在求取控制限 R2 的过程中,参数 υ 和核参数 σ 的 选择至关重要. 本文提出以虚警率作为评价指标来确 定上述这两个参数. 虚警率[15]是指正常样本被误判 为异常的样本数在总样本数中的比例,即犯第一类错 误的概率,如下式所示: ·1792·
赵启东等:基于支持向量数据描述方法的生产过程监控、诊断与优化 ·1793· 0 0 n (7) 0 0 0 0 0 其中,n为训练样本的总数,n,为支持向量的个数.由 Ψx:2 于在利用SVDD方法建立监控模型的过程中,只有正 0 0 0 常样本参与建模,而位于超球体外和超球体面上的支 0 持向量x与球心o的距离是大于等于半径R的,即 (12) D(x)≥R.由前面的分析可知,可以作为支持向量 结合式(11)和式(12)可以看出,贡献矩阵C,是 的样本其自身是正常样本,但根据监控准则被判为异 一个p×n的矩阵,只有其中的第j行是有数值的,它 常样本,由此可以用支持向量的个数n来计算虚 警率。 代表的是异常样本点x的第j个变量分别与每个正 常样本的第j个变量之间的相互关系.设有n个正常 为对参数)和核参数进行优化,首先需要给定 样本,那么就将C,中n个非零元素进行加和,可以得 显著性水平a:然后分别确定参数v和核参数σ的取 到异常样本点的第j个变量的能量值E, 值范围,并划分网格,计算每个参数组合下的虚警率, 对n个正常样本求平均值,得到一个新的样本x。, 选出7≈α时的参数u:在确定参数v之后,画出)-0 按照上述计算过程,可以相应获得新样本点的第j个 曲线图,选择η达到稳定时的σ值作为模型中核参数 变量的能量值E。,以此作为后续比较分析的基准值. 值.所提出的参数优化方法的好处在于,完全是根据 定义异常样本点x的第j变量的贡献值为 数据内在的结构特征来确定支持向量的个数,进而获 (13) 得虚警率,并以此作为收敛条件来确定核参数,无需引 6=lg(E:/E). 入其他复杂的优化算法,使得计算过程效率高,易于实 式中:E为异常样本点的第j个变量的能量值:E为正 常样本点的第广个变量的能量值:δ表示异常样本的 现在线监控 第个变量与正常样本的第个变量之间的偏离程度, 1.2基于贡献图的异常点诊断 δ值越大,则说明第j个变量导致样本异常的可能性 利用建立好的监控模型可以对测试样本进行监 控.在核参数σ确定的情况下,式(6)中第三部分 就越大 假设共有p个变量,依次对这p个变量计算出贡 会会aK)主要是由训练集x决定的,但 献值6j=1,2,…,P,便可画出所有变量对异常的贡献 要对新来的测试样本x进行实时监控,主要是取决 图,如图1所示,横坐标代表各个变量,纵坐标则表示 贡献值.贡献值越大所对应的变量,则越有可能引起 于式(6)的第二部分∑a,K(xx,),即 生产过程的异常 ga)=名a业ge (8) 由上式可知,若Ix-x:‖2越大,式(8)的值就 越小,则D(x)就越大.由此可知,式(6)中测试样 本点到球心的距离主要取决于下式: 含。I=宫a医 (9) 式中,x:=xew-x 变量1 变量2 变量即 假设新来的测试样本x超过了R控制限,被判 图1贡献图的示意图 为异常样本.为了实现对异常样本点的诊断,需要将 Fig.1 Schematic diagram of the contribution plot 式(9)中:和a:结合生成一个新矩阵X 1.3基于邻近点替换的工艺参数优化 X,x=[Wa√瓜…Va…√a].((10) 在诊断出由哪些变量引起生产过程的异常后,需 式中,p表示样本的变量个数 要对这些异常样本点进行优化控制,使生产过程及时 在此基础上定义第j个变量的贡献矩阵C,为 调整回到受控状态.基本思路如下所述, C=业X= 在核函数映射的高维特征空间中,设山(y)为异常 [aΨ√aΨ2…aΨ…√a乎] 样本,中(z)为正常样本,见图2.定义异常样本到超球 (11) 体球心的距离为D,正常样本到超球体球心的距离 其中,矩阵业仅有a为1,其余元素全为0,如下式: 为Do
赵启东等: 基于支持向量数据描述方法的生产过程监控、诊断与优化 η = nsv n . ( 7) 其中,n 为训练样本的总数,nsv为支持向量的个数. 由 于在利用 SVDD 方法建立监控模型的过程中,只有正 常样本参与建模,而位于超球体外和超球体面上的支 持向量 xsv与球心 o 的距离是大于等于半径 R 的,即 D2 ( xsv ) ≥R2 . 由前面的分析可知,可以作为支持向量 的样本其自身是正常样本,但根据监控准则被判为异 常样本,由 此 可 以 用 支 持 向 量 的 个 数 nsv 来 计 算 虚 警率. 为对参数 υ 和核参数 σ 进行优化,首先需要给定 显著性水平 α; 然后分别确定参数 υ 和核参数 σ 的取 值范围,并划分网格,计算每个参数组合下的虚警率, 选出 η≈α 时的参数 υ; 在确定参数 υ 之后,画出 η - σ 曲线图,选择 η 达到稳定时的 σ 值作为模型中核参数 值. 所提出的参数优化方法的好处在于,完全是根据 数据内在的结构特征来确定支持向量的个数,进而获 得虚警率,并以此作为收敛条件来确定核参数,无需引 入其他复杂的优化算法,使得计算过程效率高,易于实 现在线监控. 1. 2 基于贡献图的异常点诊断 利用建立好的监控模型可以对测试样本进行监 控. 在核参 数 σ 确 定 的 情 况 下,式( 6 ) 中 第 三 部 分 ∑ n i = 1 ∑ n j = 1 αiαj K( xi,xj ) 主要是由训练集{ xi} 决定的,但 要对新来的测试样本 xnew进行实时监控,主要是取决 于式( 6) 的第二部分 ∑ n i = 1 αiK( xnew,xi ) ,即 ∑ n i = 1 αiK( xnew,xi ) = ∑ n i = 1 αie - ‖xnew - xi‖2 σ2 . ( 8) 由上式可知,若‖xnew - xi‖2 越大,式( 8) 的值就 越小,则 D2 ( xnew ) 就越大. 由此可知,式( 6) 中测试样 本点到球心的距离主要取决于下式: ∑ n i = 1 αi‖xnew - xi‖2 = ∑ n i = 1 αi‖x^ i‖2 . ( 9) 式中,x^ i = xnew - xi . 假设新来的测试样本 xnew超过了 R2 控制限,被判 为异常样本. 为了实现对异常样本点的诊断,需要将 式( 9) 中 x^ i 和 αi 结合生成一个新矩阵 ^ X ^ Xp × n =[槡α1 x^ 1 槡α2 x^ 2… 槡αix^ i… 槡αn x^ n ]. ( 10) 式中,p 表示样本的变量个数. 在此基础上定义第 j 个变量的贡献矩阵 Cj 为 Cj = Ψj ^ X = [槡α1Ψj x^ 1 槡α2Ψj x^ 2…槡αiΨj x^ i…槡αnΨj x^ n ]. ( 11) 其中,矩阵 Ψj 仅有 ajj为 1,其余元素全为 0,如下式: Ψj x^ i = 0 0 … 0 0 0 0 0 ajj 0 0 0 0 0 … 0 0 x^ 1i x^ ji x^ pi = 0 0 ajj x^ ji 0 . ( 12) 结合式( 11) 和式( 12) 可以看出,贡献矩阵 Cj 是 一个 p × n 的矩阵,只有其中的第 j 行是有数值的,它 代表的是异常样本点 xnew的第 j 个变量分别与每个正 常样本的第 j 个变量之间的相互关系. 设有 n 个正常 样本,那么就将 Cj 中 n 个非零元素进行加和,可以得 到异常样本点的第 j 个变量的能量值 Ej . 对 n 个正常样本求平均值,得到一个新的样本 x0, 按照上述计算过程,可以相应获得新样本点的第 j 个 变量的能量值 Ej0,以此作为后续比较分析的基准值. 定义异常样本点 xnew的第 j 变量的贡献值为 δj = lg( E2 j /E2 j0 ) . ( 13) 式中: Ej 为异常样本点的第 j 个变量的能量值; Ej0为正 常样本点的第 j 个变量的能量值; δj 表示异常样本的 第 j 个变量与正常样本的第 j 个变量之间的偏离程度, δj 值越大,则说明第 j 个变量导致样本异常的可能性 就越大. 假设共有 p 个变量,依次对这 p 个变量计算出贡 献值 δj ,j = 1,2,…,p,便可画出所有变量对异常的贡献 图,如图 1 所示,横坐标代表各个变量,纵坐标则表示 贡献值. 贡献值越大所对应的变量,则越有可能引起 生产过程的异常. 图 1 贡献图的示意图 Fig. 1 Schematic diagram of the contribution plot 1. 3 基于邻近点替换的工艺参数优化 在诊断出由哪些变量引起生产过程的异常后,需 要对这些异常样本点进行优化控制,使生产过程及时 调整回到受控状态. 基本思路如下所述. 在核函数映射的高维特征空间中,设 ( y) 为异常 样本,( z) 为正常样本,见图 2. 定义异常样本到超球 体球心的距离为 Dyo,正常样本到超球体球心的距离 为 Dzo . ·1793·
·1794· 工程科学学报,第38卷,第12期 测试数据 训练数据 y D2 7 数据预处理 数据预处理 0 寻优核参数 工艺优化 0=y)-oMPE)-ol SVDD监控模型 D.xD R2立e,r 三BKG) 故障诊断 ò=gE) 7 图2优化过程示意图 样本点 Fig.2 Schematic illustration of the optimization process 是否在控制限内 否 生产异常 0tJkR D。= -2∑a,K(z,x,)+∑∑a,a,K(xx), 生产正常 D. -2∑aKy,x)+2aaK(xx) 图3方法步骤流程图 (14) Fig.3 Flowchart of the methods 定义异常样本到正常样本的距离为D, 量,与控制限R进行比较,可判断新样本正常与否 D,=‖中(z)-中(y)I= (4)若样本异常,则利用式(13)计算各变量的贡 √K(z,z-2K(zy)+Ky,y)=√2-2K(zy. 献值,从而诊断出引起样本异常的原因. (5)根据式(16)确定m个正常样本点,用邻近点 (15) 由此可以得到异常样本中(y)与正常样本中(z)之间的 替换的方法,将异常点调回到受控状态 夹角的余弦值为 2 实验验证分析 cos0=by)-o'b()-o] (16) DD 利用热轧薄板的生产过程数据来验证本文方法的 其中, 有效性,该热轧薄板作为冷轧薄板的原料。选择的钢 种牌号为ST12.由轧制工艺可知,终轧温度和卷取温 -r日-司=-宫Kx)- 度是影响热轧组织的主要因素,而热轧后所获得的组 言a)+宫 a,a,K(xx).(17) 织直接决定着低碳冷轧薄板的深冲性能.因此,选择 终轧温度,卷取温度和带钢的化学成分(碳、硅、锰、磷 由式(16)和式(17)便可求得夹角0.若0越小, 和硫)作为过程变量:带钢的屈服强度作为质量指标, 则表示在核函数映射的高维特征空间中异常样本向正 实现对低碳热轧薄板力学性能的监控、诊断与优化 常样本的方向进行调整时,所需的调整量越小.因此, 以每一卷带钢为一个样本点,正常样本的屈服强度范 选取前m个最小日值,用这些日值对应的正常样本的 围为130~280MPa,超出该范围则认为出现产品质量 平均值来替代异常样本,便可将异常状态调回到受控 异常.取产品质量正常时所对应的生产过程数据共 状态 100个样本为训练样本集:测试样本集中共有63个样 1.4步骤流程图 本,其中有5个样本为异常样本,剩余的58个样本均 基于SVDD生产过程监控、诊断与优化的具体步 为正常样本.训练集的统计特征如表1所示 骤如图3所示 利用训练样本集建立SVDD模型,图4给出的是 (1)数据预处理.首先需要对参与建模的正常样 核参数σ参数v虚警率)的等高线云图.给定显著性 本进行标准化处理,以消除量纲的影响. 水平a=0.1,参数v的范围设置为0.01,0.9],σ的 (2)利用预处理后的样本来建立SVDD监控模 范围设置为,30],两个参数网格划分的步距分别为 型,以虚警率为优化目标来确定参数v和核参数σ,利 0.01和0.5.从图4中可以看出,取虚警率与显著性水 用式(5)计算出监控模型的控制限. 平最接近时的值)=0.11,此时对应的参数v=0.091. (3)利用式(6)对新样本计算得到监控用的统计 在此基础上,为了清晰地选择核参数σ,给出当v=
工程科学学报,第 38 卷,第 12 期 图 2 优化过程示意图 Fig. 2 Schematic illustration of the optimization process Dzo = 1 - 2∑ n i = 1 αiK( z,xi ) + ∑ n i = 1 ∑ n j = 1 槡 αiαj K( xi,xj ) , Dyo = 1 - 2∑ n i = 1 αiK( y,xi ) + ∑ n i = 1 ∑ n j = 1 槡 αiαj K( xi,xj ) { . ( 14) 定义异常样本到正常样本的距离为 Dzy, Dzy = ‖( z) - ( y) ‖ = 槡K( z,z) - 2K( z,y) + K( y,y) = 槡2 - 2K( z,y) . ( 15) 由此可以得到异常样本 ( y) 与正常样本 ( z) 之间的 夹角的余弦值为 cosθ =[( y) - o]T [( z) - o] DzoDyo ( 16) 其中, [( y) - o]T [( z) - o]= K( y,z) - ∑ n i =1 αiK( y,xi ) - ∑ n i = 1 αiK( z,xi ) + ∑ n i = 1 ∑ n j = 1 αiαj K( xi,xj ) . ( 17) 由式( 16) 和式( 17) 便可求得夹角 θ. 若 θ 越小, 则表示在核函数映射的高维特征空间中异常样本向正 常样本的方向进行调整时,所需的调整量越小. 因此, 选取前 m 个最小 θ 值,用这些 θ 值对应的正常样本的 平均值来替代异常样本,便可将异常状态调回到受控 状态. 1. 4 步骤流程图 基于 SVDD 生产过程监控、诊断与优化的具体步 骤如图 3 所示. ( 1) 数据预处理. 首先需要对参与建模的正常样 本进行标准化处理,以消除量纲的影响. ( 2) 利用预处理后的样本来建立 SVDD 监控模 型,以虚警率为优化目标来确定参数 υ 和核参数 σ,利 用式( 5) 计算出监控模型的控制限. ( 3) 利用式( 6) 对新样本计算得到监控用的统计 图 3 方法步骤流程图 Fig. 3 Flowchart of the methods 量,与控制限 R2 进行比较,可判断新样本正常与否. ( 4) 若样本异常,则利用式( 13) 计算各变量的贡 献值,从而诊断出引起样本异常的原因. ( 5) 根据式( 16) 确定 m 个正常样本点,用邻近点 替换的方法,将异常点调回到受控状态. 2 实验验证分析 利用热轧薄板的生产过程数据来验证本文方法的 有效性,该热轧薄板作为冷轧薄板的原料. 选择的钢 种牌号为 ST12. 由轧制工艺可知,终轧温度和卷取温 度是影响热轧组织的主要因素,而热轧后所获得的组 织直接决定着低碳冷轧薄板的深冲性能. 因此,选择 终轧温度,卷取温度和带钢的化学成分( 碳、硅、锰、磷 和硫) 作为过程变量; 带钢的屈服强度作为质量指标, 实现对低碳热轧薄板力学性能的监控、诊断与优化. 以每一卷带钢为一个样本点,正常样本的屈服强度范 围为 130 ~ 280 MPa,超出该范围则认为出现产品质量 异常. 取产品质量正常时所对应的生产过程数据共 100 个样本为训练样本集; 测试样本集中共有 63 个样 本,其中有 5 个样本为异常样本,剩余的 58 个样本均 为正常样本. 训练集的统计特征如表 1 所示. 利用训练样本集建立 SVDD 模型,图 4 给出的是 核参数 σ-参数 υ-虚警率 η 的等高线云图. 给定显著性 水平 α = 0. 1,参数 ν 的范围设置为[0. 01,0. 9],σ 的 范围设置为[1,30],两个参数网格划分的步距分别为 0. 01 和0. 5. 从图4 中可以看出,取虚警率与显著性水 平最接近时的值 η = 0. 11,此时对应的参数 ν = 0. 091. 在此基础上,为了清晰地选择核参数 σ,给出当 ν = ·1794·
赵启东等:基于支持向量数据描述方法的生产过程监控、诊断与优化 ·1795· 0.091时核参数与虚警率的曲线图,如图5所示,取虚 0.9 警率第一次达到0.11时的核参数作为模型中核参数 08 值,此时选择的核参数σ=15.5,经训练得到模型的控 制限为R2=0.0901. 4 0.6 表1训练集的统计特征表 0.5 Table 1 Statistical characteristic table of the training set 0.4 类别 参数 最大值最小值平均值标准差 终轧温度/℃ 97385892622.326 0.3 m15.5 卷取温度/℃ 766 684 72521.202 0.2 011 C质量分数/% 0.0520.0010.0170.015 0.10 15 20 核参数,σ 过程变量 Si质量分数/% 0.0210.0040.0120.004 Mn质量分数/%0.2300.1200.1680.045 图5虚警率与核参数的曲线 P质量分数/%0.0110.0040.0080.002 Fig.5 Curves of false alarm rate and nuclear parameters C质量分数/%0.0100.0040.0060.002 下面讨论本文方法与传统T2方法的差别.为了 质量指标 屈服强度/MPa 255 14220343.586 保证两种方法在相同的置信区间内进行对比,PA的 显著性水平设置为α=0.1≈n.利用PCA提取出四个 主成分,对应的累积贡献率达到90%.SVDD监控图 0.8 和T2A监控图分别如图6所示. 0.7 在测试集中,有No.16~No.18、No.34~No.35共 0 5个异常样本.利用SVDD方法可以有效检测出这五 05 个异常样本的存在,如图6(a)所示.而在图6(b)中, T2只检测出No.18、No.34和No.35共3个异常样 0.3 本,说明在相同的显著性水平下,SVDD方法对异常样 0.2 =15.5 0=18 v=0.091 1=0.9 本具有更高的检出率.此外,T24方法还对No.8和 0=0.11 7=011 0. No.61样本出现误判,即原来的正常样本被误检为异 15 20 25 20 常样本 核参数.σ 表2给出的是5个异常样本的工艺参数和质量指 图4虚警率?的等高线云图 标.为了有效分析引起样本异常的原因,图7是异常 Fig.4 Contour image of false alarm rate 样本的贡献图 0.35 (a) No.34No.35 0.30 35 Na.34No.35 30 TTA控制限 0.25 控制限 正常样本点 异常样本点 0.20 No.18 正常样本点 异常样本点 ◆ 误检样本点 20 15 No.16No.17 No.18 wwwW No.16 o.17 20 3040 60 10 20 30 40 50 60 样本点序号 样本点序号 图6监控图.(a)SVDD2:(b)7PcA Fig.6 Monitoring chart of different methods:(a)SVDD-2:(b)TPCA
赵启东等: 基于支持向量数据描述方法的生产过程监控、诊断与优化 0. 091 时核参数与虚警率的曲线图,如图 5 所示,取虚 警率第一次达到 0. 11 时的核参数作为模型中核参数 值,此时选择的核参数 σ = 15. 5,经训练得到模型的控 制限为 R2 = 0. 0901. 表 1 训练集的统计特征表 Table 1 Statistical characteristic table of the training set 类别 参数 最大值 最小值 平均值 标准差 过程变量 终轧温度/℃ 973 858 926 22. 326 卷取温度/℃ 766 684 725 21. 202 C 质量分数/% 0. 052 0. 001 0. 017 0. 015 Si 质量分数/% 0. 021 0. 004 0. 012 0. 004 Mn 质量分数/% 0. 230 0. 120 0. 168 0. 045 P 质量分数/% 0. 011 0. 004 0. 008 0. 002 C 质量分数/% 0. 010 0. 004 0. 006 0. 002 质量指标 屈服强度/MPa 255 142 203 43. 586 图 4 虚警率 η 的等高线云图 Fig. 4 Contour image of false alarm rate 图 5 虚警率与核参数的曲线 Fig. 5 Curves of false alarm rate and nuclear parameters 下面讨论本文方法与传统 T2 PCA 方法的差别. 为了 保证两种方法在相同的置信区间内进行对比,T2 PCA 的 显著性水平设置为 α = 0. 1≈η. 利用 PCA 提取出四个 主成分,对应的累积贡献率达到 90% . SVDD 监控图 和 T2 PCA 监控图分别如图 6 所示. 在测试集中,有 No. 16 ~ No. 18、No. 34 ~ No. 35 共 5 个异常样本. 利用 SVDD 方法可以有效检测出这五 个异常样本的存在,如图 6( a) 所示. 而在图 6( b) 中, T2 PCA 只检测出 No. 18、No. 34 和 No. 35 共 3 个异常样 本,说明在相同的显著性水平下,SVDD 方法对异常样 本具有更高的检出率. 此外,T2 PCA 方法还对 No. 8 和 No. 61 样本出现误判,即原来的正常样本被误检为异 常样本. 表 2 给出的是 5 个异常样本的工艺参数和质量指 标. 为了有效分析引起样本异常的原因,图 7 是异常 样本的贡献图. 图 6 监控图. ( a) SVDD--r 2 ; ( b) T2 PCA Fig. 6 Monitoring chart of different methods: ( a) SVDD--r 2 ; ( b) T2 PCA ·1795·
·1796 工程科学学报,第38卷,第12期 表2异常样本的工艺参数和质量指标 Table 2 Process parameters and quality indexes of abnormal samples 异常样本 终轧温 卷取温 C质量 Si质量 Mn质量 P质量 S质量 屈服 点的序号 度℃ 度/℃ 分数/% 分数/% 分数/% 分数/% 分数/% 强度/MPa No.16,No.17 890 684 0.033 0.008 0.220 0.011 0.005 295 No.18 897 656 0.044 0.025 0.162 0.008 0.006 295 No.34,Na.35 890 669 0.038 0.030 0.140 0.011 0.003 300 25@ 2.5 (b) 2.0 2.0 1.0 05 05 终轧 卷取 终轧卷取 温度 温度 温度 温度 2.5 2.0 1.5 1.0 0.5 ☑ 终轧卷取 Si Mn 温度温度 图7异常样本点的贡献图.(a)No.16,No.17:(b)No.18:(c)No.34,No.35 Fig.7 Contribution plot of the abnormal samples:(a)No.16,17:(b)No.18;(c)No.34,35 样本点No.16和No.17的屈服强度为295MPa,超 现该样本点的Si含量比18号样本点的Si含量更高,P 出130~280MPa的设定范围.由图7(a)可以发现,P 元素也达到正常样本的最大值,而Si元素和P元素均 含量的贡献值最大,说明造成屈服强度过大的主要原 能提高材料的屈服强度.此外,卷取温度低于训练样 因与P含量有关.进一步分析发现,这两个样本点的P 本的最小值.上述三个因素的综合作用,最终导致这 含量达到正常样本的最大值.根据生产工艺可知,P 两个样本点的屈服强度不满足设定要求 元素具有冷作硬化作用,可以能提高材料的屈服强度, 对上述5个异常点都依次进行优化后,得到如 由此可知P含量过高导致屈服强度过高 图8所示的监控图.对比图6(a)和图8可以发现,优 对于No.18样本,其屈服强度为295MPa,超出设 化后的所有样本点均位在控制限以下,说明生产过程 定的范围.在图7(b)中可以发现,卷取温度和Si含量 已恢复到受控状态.以No.34样本点为例,给出其参 的贡献值较大,这两个因素是造成18号样本点屈服强 数优化前后的结果对比,如表3所示 度过高的主要原因.由表2可知,该样本点的卷取温 表3N。.34样本优化前后的参数值 度仅为656℃,低于表1中正常样本的最小值.由生产 Table 3 Values of the 34th sample before and after optimization 工艺可知,卷取温度低,会增加材料的屈服强度.此 参数 优化前 优化后 外,该样本点的Si质量分数为0.025%,超出表1中正 终轧温度/℃ 890 917 常样本的Si含量最大值,而Si元素含量的增高,也会 卷取温度/℃ 669 695 使材料的屈服强度增加.综上所述,卷取温度和Sⅰ含 C质量分数/% 0.038 0.025 量的不合理性导致No.18样本点屈服强度过高. Si质量分数/% 0.030 0.013 对于No.34和No.35样本点,屈服强度均为 Mn质量分数/% 0.140 0.190 300MPa,超出设定范围.由图7(c)可以发现,卷取温 P质量分数/% 0.010 0.008 度、S含量和P含量的贡献值都比较大,由表2可以发 C质量分数/% 0.003 0.005
工程科学学报,第 38 卷,第 12 期 表 2 异常样本的工艺参数和质量指标 Table 2 Process parameters and quality indexes of abnormal samples 异常样本 点的序号 终轧温 度/℃ 卷取温 度/℃ C 质量 分数/% Si 质量 分数/% Mn 质量 分数/% P 质量 分数/% S 质量 分数/% 屈服 强度/MPa No. 16,No. 17 890 684 0. 033 0. 008 0. 220 0. 011 0. 005 295 No. 18 897 656 0. 044 0. 025 0. 162 0. 008 0. 006 295 No. 34,No. 35 890 669 0. 038 0. 030 0. 140 0. 011 0. 003 300 图 7 异常样本点的贡献图. ( a) No. 16,No. 17; ( b) No. 18; ( c) No. 34,No. 35 Fig. 7 Contribution plot of the abnormal samples: ( a) No. 16,17; ( b) No. 18; ( c) No. 34,35 样本点 No. 16 和 No. 17 的屈服强度为295 MPa,超 出 130 ~ 280 MPa 的设定范围. 由图 7( a) 可以发现,P 含量的贡献值最大,说明造成屈服强度过大的主要原 因与 P 含量有关. 进一步分析发现,这两个样本点的 P 含量达到正常样本的最大值. 根据生产工艺可知,P 元素具有冷作硬化作用,可以能提高材料的屈服强度, 由此可知 P 含量过高导致屈服强度过高. 对于 No. 18 样本,其屈服强度为 295 MPa,超出设 定的范围. 在图 7( b) 中可以发现,卷取温度和 Si 含量 的贡献值较大,这两个因素是造成 18 号样本点屈服强 度过高的主要原因. 由表 2 可知,该样本点的卷取温 度仅为 656 ℃,低于表 1 中正常样本的最小值. 由生产 工艺可知,卷取温度低,会增加材料的屈服强度. 此 外,该样本点的 Si 质量分数为 0. 025% ,超出表 1 中正 常样本的 Si 含量最大值,而 Si 元素含量的增高,也会 使材料的屈服强度增加. 综上所述,卷取温度和 Si 含 量的不合理性导致 No. 18 样本点屈服强度过高. 对于 No. 34 和 No. 35 样 本 点,屈 服 强 度 均 为 300 MPa,超出设定范围. 由图 7( c) 可以发现,卷取温 度、Si 含量和 P 含量的贡献值都比较大,由表 2 可以发 现该样本点的 Si 含量比 18 号样本点的 Si 含量更高,P 元素也达到正常样本的最大值,而 Si 元素和 P 元素均 能提高材料的屈服强度. 此外,卷取温度低于训练样 本的最小值. 上述三个因素的综合作用,最终导致这 两个样本点的屈服强度不满足设定要求. 对上述 5 个异常点都依次进行优化后,得 到 如 图 8 所示的监控图. 对比图 6( a) 和图 8 可以发现,优 化后的所有样本点均位在控制限以下,说明生产过程 已恢复到受控状态. 以 No. 34 样本点为例,给出其参 数优化前后的结果对比,如表 3 所示. 表 3 No. 34 样本优化前后的参数值 Table 3 Values of the 34th sample before and after optimization 参数 优化前 优化后 终轧温度/℃ 890 917 卷取温度/℃ 669 695 C 质量分数/% 0. 038 0. 025 Si 质量分数/% 0. 030 0. 013 Mn 质量分数/% 0. 140 0. 190 P 质量分数/% 0. 010 0. 008 C 质量分数/% 0. 003 0. 005 ·1796·
赵启东等:基于支持向量数据描述方法的生产过程监控、诊断与优化 ·1797· 0.10 in continuous casting.J Unir Sci Technol Beijing,2008,30(1): 0 (杨尚玉,王旭东,姚曼,等.改进的主元分析法在连铸结品 器过程监测中的应用.北京科技大学学报,2008,30(1): 80) B]Tax D M J,Duin R P W.Support vector domain description Pattern Recognit Lett,1999,20(11):1191 4]Tax DM J,Duin R P W.Support vector data description.Mach Leam,2004,54(1):45 一R控制限 [5]Tang M Z,Wang Y B,Yang C H.Modified support vector data 鲁受控样本点 description for fault diagnosis.Control Decis,2011,26(7):967 10 2030405060 (唐明珠,王岳斌,阳春华.一种改进的支持向量数据描述故 样本点序号 障诊断方法.控制与决策,2011,26(7):967) 图8优化后的监控图 [6] Khazai S,Safari A,Mojaradi B,et al.Improving the SVDD ap- Fig.8 Optimized monitoring chart proach to hyperspectral image classification.IEEE Geosci Remote Sens Lett,2012,9(4):594 通过表3可以发现,优化后各变量的值均在正常 ] Yousef A,Charkari N M.A novel method based on physicochemi- 范围内.通过上述优化方法可以及时将异常生产过程 cal properties of amino acids and one class classificationalgorithm 调整为受控状态,尤其是在新品种的开发过程中,可以 for disease gene identification.J Biomed Inf,2015,56:300 有效指导工艺控制参数与来料参数之间的正确匹配. SukchotratT,Kim S B,Tsung F.One-class classification-based control charts for multivariate process monitoring.IIE Trans, 3结论 2009,42(2):107 (1)提出基于虚警率为优化目标的模型参数优化 Na S G,Yang I B,Heo H.Abnormality detection via SVDD tech- 方法,可以根据数据内在的结构特点获得模型参数,无 nique of motor-generator system in HEV.Int J Automot Technol, 2014,15(4):637 需引入复杂的优化算法,可以实现监控模型的实时在 [10]Jiang Q C,Yan X F.Just-in-time reorganized PCA integrated 线调整 with SVDD for chemical process monitoring.AIChE,2014,60 (2)提出基于贡献图的异常点诊断和基于邻近点 (3):949 替换的工艺参数优化方法,可以实现对生产过程的监 01] Shen FF,Song Z H,Zhou L.Improved PCA-SVDD based mo- 控、诊断与优化,为实际生产过程提供更有效的指导. nitoring method for nonlinear process//201325th Chinese Con- (3)将SVDD方法应用于热轧薄板的产品质量监 trol and Decision Conference (CCDC).IEEE,2013:4330 [12]Chen M C.Hsu CC,Malhotra B,et al.An efficient ICA-DW- 控中,与传统的监控方法P2相比,SVDD具有更高的 SVDD fault detection and diagnosis method for non-Gaussian 检出率,能更加准确地监控生产过程的异常状态 processes.Int Prod Res,2016,54(17):1 (4)随着样本的实时在线更新,SVDD算法的计 [13]Jiang Q C,Yan X F,Lv Z M,et al.Independent component 算复杂度也会逐渐提高,难以满足工业现场实时高效 analysis-based non-Gaussian process monitoring with preselecting 的监控需求.因此,针对海量数据,如何提高SVDD算 optimal components and support vector data description.Int J 法的计算效率,以实现生产过程的监控、诊断与优化, Prod Res,2014,52(11):3273 n4] 是下一步需要深入研究的内容 Zhao F,Zhang J Y,Liu J.An optimizing kemel algorithm for improving the performance of support vector domain description 参考文献 Acta Autom Sin,2008,34(9):1122 (赵峰,张军英,刘敬.一种改善支撑向量域描述性能的核 Liang H.Tong C N.Online data-driven modeling for strip thick- 优化算法.自动化学报,2008,34(9):1122) ness based on subtractive clustering.J Unir Sci Technol Beijing, [15]Zhang J M,Xu X Z,Xie L,et al.Performance optimization of 2012,34(11):1338 SVDD and its application in non-Gaussian process monitoring. (梁辉,童朝南.基于减法聚类的带钢厚度数据驱动建模。北 Chem Ind Eng China,2010,61 (8):2072 京科技大学学报,2012,34(11):1338) (张建明,许仙珍,谢磊,等.支持向量数据描述性能优化及 Yang S Y,Wang X D.Yao M,et al.Application of improved 其在非高斯过程监控中的应用.化工学报,2010,61(8): principal component analysis method to mould process monitoring 2072
赵启东等: 基于支持向量数据描述方法的生产过程监控、诊断与优化 图 8 优化后的监控图 Fig. 8 Optimized monitoring chart 通过表 3 可以发现,优化后各变量的值均在正常 范围内. 通过上述优化方法可以及时将异常生产过程 调整为受控状态,尤其是在新品种的开发过程中,可以 有效指导工艺控制参数与来料参数之间的正确匹配. 3 结论 ( 1) 提出基于虚警率为优化目标的模型参数优化 方法,可以根据数据内在的结构特点获得模型参数,无 需引入复杂的优化算法,可以实现监控模型的实时在 线调整. ( 2) 提出基于贡献图的异常点诊断和基于邻近点 替换的工艺参数优化方法,可以实现对生产过程的监 控、诊断与优化,为实际生产过程提供更有效的指导. ( 3) 将 SVDD 方法应用于热轧薄板的产品质量监 控中,与传统的监控方法 T2 PCA 相比,SVDD 具有更高的 检出率,能更加准确地监控生产过程的异常状态. ( 4) 随着样本的实时在线更新,SVDD 算法的计 算复杂度也会逐渐提高,难以满足工业现场实时高效 的监控需求. 因此,针对海量数据,如何提高 SVDD 算 法的计算效率,以实现生产过程的监控、诊断与优化, 是下一步需要深入研究的内容. 参 考 文 献 [1] Liang H,Tong C N. Online data-driven modeling for strip thickness based on subtractive clustering. J Univ Sci Technol Beijing, 2012,34( 11) : 1338 ( 梁辉,童朝南. 基于减法聚类的带钢厚度数据驱动建模. 北 京科技大学学报,2012,34( 11) : 1338) [2] Yang S Y,Wang X D,Yao M,et al. Application of improved principal component analysis method to mould process monitoring in continuous casting. J Univ Sci Technol Beijing,2008,30( 1) : 80 ( 杨尚玉,王旭东,姚曼,等. 改进的主元分析法在连铸结晶 器过程监测中的应用. 北京科技大学学报,2008,30 ( 1 ) : 80) [3] Tax D M J,Duin R P W. Support vector domain description. Pattern Recognit Lett,1999,20( 11) : 1191 [4] Tax D M J,Duin R P W. Support vector data description. Mach Learn,2004,54( 1) : 45 [5] Tang M Z,Wang Y B,Yang C H. Modified support vector data description for fault diagnosis. Control Decis,2011,26( 7) : 967 ( 唐明珠,王岳斌,阳春华. 一种改进的支持向量数据描述故 障诊断方法. 控制与决策,2011,26( 7) : 967) [6] Khazai S,Safari A,Mojaradi B,et al. Improving the SVDD approach to hyperspectral image classification. IEEE Geosci Remote Sens Lett,2012,9( 4) : 594 [7] Yousef A,Charkari N M. A novel method based on physicochemical properties of amino acids and one class classificationalgorithm for disease gene identification. J Biomed Inf,2015,56: 300 [8] Sukchotrat T,Kim S B,Tsung F. One-class classification-based control charts for multivariate process monitoring. IIE Trans, 2009,42( 2) : 107 [9] Na S G,Yang I B,Heo H. Abnormality detection via SVDD technique of motor-generator system in HEV. Int J Automot Technol, 2014,15( 4) : 637 [10] Jiang Q C,Yan X F. Just-in-time reorganized PCA integrated with SVDD for chemical process monitoring. AIChE J,2014,60 ( 3) : 949 [11] Shen F F,Song Z H,Zhou L. Improved PCA-SVDD based monitoring method for nonlinear process / / 2013 25th Chinese Control and Decision Conference ( CCDC) . IEEE,2013: 4330 [12] Chen M C,Hsu C C,Malhotra B,et al. An efficient ICA-DWSVDD fault detection and diagnosis method for non-Gaussian processes. Int J Prod Res,2016,54( 17) : 1 [13] Jiang Q C,Yan X F,Lv Z M,et al. Independent component analysis-based non-Gaussian process monitoring with preselecting optimal components and support vector data description. Int J Prod Res,2014,52( 11) : 3273 [14] Zhao F,Zhang J Y,Liu J. An optimizing kernel algorithm for improving the performance of support vector domain description. Acta Autom Sin,2008,34( 9) : 1122 ( 赵峰,张军英,刘敬. 一种改善支撑向量域描述性能的核 优化算法. 自动化学报,2008,34( 9) : 1122) [15] Zhang J M,Xu X Z,Xie L,et al. Performance optimization of SVDD and its application in non-Gaussian process monitoring. J Chem Ind Eng China,2010,61( 8) : 2072 ( 张建明,许仙珍,谢磊,等. 支持向量数据描述性能优化及 其在非高斯过程监控中的应用. 化工学报,2010,61 ( 8) : 2072 ·1797·