第15卷第5期 智能系统学报 Vol.15 No.5 2020年9月 CAAI Transactions on Intelligent Systems Sep.2020 D0:10.11992/tis.201809040 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20190409.0946.018.html 基于二阶相似度的即时学习软测量建模方法 祁成,史旭东',熊伟丽2 (1.江南大学物联网工程学院,江苏无锡214122:2.江南大学轻工过程先进控制教育部重点实验室,江苏无 锡214122) 摘要:针对即时(惰性)学习模型频率降低间接导致的精度下降问题,提出一种二阶相似性的即时学习方法。 该方法综合顾及到样本集的整体分布特性,在传统一阶相似度准则的基础上建立二阶相似度准则,采用与测试 样本具有绝大部分相同近邻的二阶相似样本建立当前时刻的模型;同时将累计相似度因子用于建立局部模型 时样本量的确定,并采用相似度阈值的方式判断此刻模型是否需要重新建立。该方法在青霉素发酵过程产物 浓度的预测实验中得到了有效的验证。 关键词:即时学习:更新频率;二阶相似度:相似度准则:一阶相似度:局部模型:累计相似度因子;相似度阈值 中图分类号:TP273文献标志码:A文章编号:1673-4785(2020)05-0910-09 中文引用格式:祁成,史旭东,熊伟丽.基于二阶相似度的即时学习软测量建模方法.智能系统学报,2020,15(5): 910-918. 英文引用格式:QI Cheng,.SHI Xudong,XIONG Weili..A just--in-time learning soft sensor modeling method based on the second-.or- der similarityJCAAI transactions on intelligent systems,2020,15(5):910-918. A just-in-time learning soft sensor modeling method based on the second-order similarity QI Cheng',SHI Xudong',XIONG Weili2 (1.School of Internet of Things Engineering,Jiangnan University,Wuxi 214122,China;2.Key Laboratory of Advanced Process Control for Light Industry Jiangnan University,Ministry of Education,Wuxi 214122,China) Abstract:Aiming at the indirect accuracy reduction caused by the frequency reduction of just-in-time (lazy)learning model,a second-order similarity just-in-time learning method is proposed.This method takes into account the overall distribution characteristics of the sample set,establishes a second-order similarity criterion based on the traditional first- order similarity criterion,and uses a second-order similarity sample with most of the same neighbors as the test sample to establish the model at the current time.At the same time,the cumulative similarity factor is used to determine the sample size when the local model is established,and the similarity threshold is used to determine whether the model needs to be rebuilt at this time.This method has been effectively validated in the prediction experiment of the product concentration in the fermentation process of penicillin. Keywords:just-in-time learning;update frequency;second-order similarity;similarity criterion;first-order similarity; local model;cumulative similarity factor;similarity threshold 在某些复杂、环境恶劣的工业生产过程中, 制约,导致这些关键变量无法采用在线仪器测量 由于产品可靠性要求的不断提高,因此需要严格 获得。为了实时精确地预测这些难以测得的变 地监控一些直接或间接影响产品质量的关键变 量,基于数据驱动的软测量技术)得到了快速 量。然而考虑到测量成本或者一些技术条件的 的发展,并逐渐地应用到了化工、制药等工业过 收稿日期:2018-09-21.网络出版日期:2019-04-10. 程中。 基金项目:国家自然科学基金项目(61773182):江苏省自然科 针对某些工况容易随时间发生变化的工业过 学基金项目(BK20170198). 通信作者:熊伟丽.E-mail:greenpre@l63.com 程,传统的全局软测量模型难以满足工业过程的
DOI: 10.11992/tis.201809040 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20190409.0946.018.html 基于二阶相似度的即时学习软测量建模方法 祁成1 ,史旭东1 ,熊伟丽1,2 (1. 江南大学 物联网工程学院,江苏 无锡 214122; 2. 江南大学 轻工过程先进控制教育部重点实验室,江苏 无 锡 214122) 摘 要:针对即时 (惰性) 学习模型频率降低间接导致的精度下降问题,提出一种二阶相似性的即时学习方法。 该方法综合顾及到样本集的整体分布特性,在传统一阶相似度准则的基础上建立二阶相似度准则,采用与测试 样本具有绝大部分相同近邻的二阶相似样本建立当前时刻的模型;同时将累计相似度因子用于建立局部模型 时样本量的确定,并采用相似度阈值的方式判断此刻模型是否需要重新建立。该方法在青霉素发酵过程产物 浓度的预测实验中得到了有效的验证。 关键词:即时学习;更新频率;二阶相似度;相似度准则;一阶相似度;局部模型;累计相似度因子;相似度阈值 中图分类号:TP273 文献标志码:A 文章编号:1673−4785(2020)05−0910−09 中文引用格式:祁成, 史旭东, 熊伟丽. 基于二阶相似度的即时学习软测量建模方法 [J]. 智能系统学报, 2020, 15(5): 910–918. 英文引用格式:QI Cheng, SHI Xudong, XIONG Weili. A just-in-time learning soft sensor modeling method based on the second-order similarity[J]. CAAI transactions on intelligent systems, 2020, 15(5): 910–918. A just-in-time learning soft sensor modeling method based on the second-order similarity QI Cheng1 ,SHI Xudong1 ,XIONG Weili1,2 (1. School of Internet of Things Engineering, Jiangnan University, Wuxi 214122, China; 2. Key Laboratory of Advanced Process Control for Light Industry Jiangnan University, Ministry of Education, Wuxi 214122, China) Abstract: Aiming at the indirect accuracy reduction caused by the frequency reduction of just-in-time (lazy) learning model, a second-order similarity just-in-time learning method is proposed. This method takes into account the overall distribution characteristics of the sample set, establishes a second-order similarity criterion based on the traditional firstorder similarity criterion, and uses a second-order similarity sample with most of the same neighbors as the test sample to establish the model at the current time. At the same time, the cumulative similarity factor is used to determine the sample size when the local model is established, and the similarity threshold is used to determine whether the model needs to be rebuilt at this time. This method has been effectively validated in the prediction experiment of the product concentration in the fermentation process of penicillin. Keywords: just-in-time learning; update frequency; second-order similarity; similarity criterion; first-order similarity; local model; cumulative similarity factor; similarity threshold 在某些复杂、环境恶劣的工业生产过程中, 由于产品可靠性要求的不断提高,因此需要严格 地监控一些直接或间接影响产品质量的关键变 量。然而考虑到测量成本或者一些技术条件的 制约,导致这些关键变量无法采用在线仪器测量 获得。为了实时精确地预测这些难以测得的变 量,基于数据驱动的软测量技术[1-3] 得到了快速 的发展,并逐渐地应用到了化工、制药等工业过 程中。 针对某些工况容易随时间发生变化的工业过 程,传统的全局软测量模型难以满足工业过程的 收稿日期:2018−09−21. 网络出版日期:2019−04−10. 基金项目:国家自然科学基金项目 (61773182);江苏省自然科 学基金项目 (BK20170198). 通信作者:熊伟丽. E-mail:greenpre@163.com. 第 15 卷第 5 期 智 能 系 统 学 报 Vol.15 No.5 2020 年 9 月 CAAI Transactions on Intelligent Systems Sep. 2020
第5期 祁成,等:基于二阶相似度的即时学习软测量建模方法 ·911· 实时性要求且外推能力差,比较普遍的一种解 假设有N个历史训练样本的数据集X{x:∈R" 决方案是采用即时学习s-(just--in-time learning, i=1,2…N,其中m表示输入数据的维度。若预 TL)策略,对于TL相似度准则这一核心,学者 测某一时刻待测样本x,,JTL的方式是在历史集 们做出了大量的研究。Chen等考虑到常见的 中选择与x,拥有最高相似性的一组样本来构建当 相似度准则仅将样本的输入信息联系起来,没有 前的局部模型,同时采用该模型预测xg。相似度 综合样本的输出信息,因此其把输入和输出信息 准则是TL的核心,现对常用的FOS进行描述: 共同考虑构造自适应加权距离作为相似度指标; SI=y vexp(-d2)+(1-y)cos 0 (1) Niu等结合模糊C-均值和传统的JTL这两种方 式中:SI表示某一时刻待测数据x,与训练数据x之 法,首先采用模糊C-均值方法重构收集的历史样 间的相似度值;y表示权重系数且y∈0,]:d为两 本,然后采用TL方法在重构的历史样本集中选 样本的欧氏距离;0为两样本间的夹角,二者计算 取当前的局部相似样本建立软测量模型。然而, 公式为 该类方法没有考虑到TL的耗时问题,在一些实 d=l。-xl2 (2) 时性要求较高的工业过程中无法有效运用。 xiXi 针对上述提出的问题,Ge等9首先计算相邻 6=arccos 2lxa (3) 待测样本之间的一阶相似度,然后与相似度阈值 1.2二阶相似度策略 比较判断是否更新当前时刻模型,仿真结果表明 1.2.1二阶相似度的定义 可以有效地解决模型耗时问题。但是,此方法忽 SOS2定义为:如果两样本的一阶相似样本 略了过程变化较慢时产生的累计误差问题,文献[I0] 大多相同,那么认为两样本拥有较高的二阶相似 将计算相邻两待测数据之间的相似度改进为计算 性。FOS准则仅关注单独两样本之间的相似度, 当前时刻待测样本与前一模型更新时刻待测样本 忽略了样本集总体的二阶相似性。如图1所示, 之间的相似度,可以很好地解决累计误差问题。 数据1与2的FOS很高,数据1和8的近邻大多 但是,上述方法在选择局部样本建模时均采用的 数相同,因此,二者的SOS很高,同理数据2与 是一阶相似度(first-order similarity,FOS)准则,若 8的二阶相似性也较高。假设当前到来待测数据 只在FOS的基础上降低模型更新频率,那么可以 1,若采用FOS准则选取相似集,仅仅选择到数据 很好地解决模型的耗时问题,但是局部模型的精 度会有所降低。牛大鹏等在文献[9]的框架上 2:但改用SOS策略时,不仅可以选择到数据2,还 能选择到数据8。 增加时序性,同时将投影算法用于估计模型未更 新时刻的输出,取得了良好的成果。 综上,本文在FOS选取局部样本建模的基础 上,提出一种二阶相似度(second-order similarity, SOS)准则,SOS准则既考虑到样本总体分布特 性,同时可以更有效地判断当前模型是否需要更 新。对于当前到来的待测样本,采用给定的相似 度阈值判定模型是否更新,若更新,采用所提的 SOS策略选择与待测样本邻居最多的二阶相似数 据,同时采用累积相似度因子自适应的确定局部 图1二维空间例子 建模样本的个数,并将得到的二阶相似样本代入 Fig.1 Two-dimensional space example 高斯过程回归(Gaussian process regress,GPR)建立 SOS算法的伪代码如下: 当前模型,否则,继续采用前一更新之初的模型 输入训练样本集X(x;ERmT,i=1,2…W,测 估计当前待测样本,最后,采用青霉素发酵过程 试样本xg 对所提方法进行验证,结果表明该方法既解决 fori=1:N TL耗时问题,且提高了模型精度。 for j=1:N 1基于二阶相似度的即时学习方法 通过式(1)计算训练样本x:和x,之间的FOS end for 11传统的即时学习方法 end for JⅡTL是根据相似输入产生相似输出的思想, 得到训练样本两两之间的相似度矩阵Swxw
实时性要求且外推能力差[4] ,比较普遍的一种解 决方案是采用即时学习[5-6] (just-in-time learning, JITL) 策略,对于 JITL 相似度准则这一核心,学者 们做出了大量的研究。Chen 等 [7] 考虑到常见的 相似度准则仅将样本的输入信息联系起来,没有 综合样本的输出信息,因此其把输入和输出信息 共同考虑构造自适应加权距离作为相似度指标; Niu 等 [8] 结合模糊 C-均值和传统的 JITL 这两种方 法,首先采用模糊 C-均值方法重构收集的历史样 本,然后采用 JITL 方法在重构的历史样本集中选 取当前的局部相似样本建立软测量模型。然而, 该类方法没有考虑到 JITL 的耗时问题,在一些实 时性要求较高的工业过程中无法有效运用。 针对上述提出的问题,Ge 等 [9] 首先计算相邻 待测样本之间的一阶相似度,然后与相似度阈值 比较判断是否更新当前时刻模型,仿真结果表明 可以有效地解决模型耗时问题。但是,此方法忽 略了过程变化较慢时产生的累计误差问题,文献 [10] 将计算相邻两待测数据之间的相似度改进为计算 当前时刻待测样本与前一模型更新时刻待测样本 之间的相似度,可以很好地解决累计误差问题。 但是,上述方法在选择局部样本建模时均采用的 是一阶相似度 (first-order similarity, FOS) 准则,若 只在 FOS 的基础上降低模型更新频率,那么可以 很好地解决模型的耗时问题,但是局部模型的精 度会有所降低。牛大鹏等[11] 在文献 [9] 的框架上 增加时序性,同时将投影算法用于估计模型未更 新时刻的输出,取得了良好的成果。 综上,本文在 FOS 选取局部样本建模的基础 上,提出一种二阶相似度 (second-order similarity, SOS) 准则,SOS 准则既考虑到样本总体分布特 性,同时可以更有效地判断当前模型是否需要更 新。对于当前到来的待测样本,采用给定的相似 度阈值判定模型是否更新,若更新,采用所提的 SOS 策略选择与待测样本邻居最多的二阶相似数 据,同时采用累积相似度因子自适应的确定局部 建模样本的个数,并将得到的二阶相似样本代入 高斯过程回归 (Gaussian process regress, GPR) 建立 当前模型,否则,继续采用前一更新之初的模型 估计当前待测样本,最后,采用青霉素发酵过程 对所提方法进行验证,结果表明该方法既解决 JITL 耗时问题,且提高了模型精度。 1 基于二阶相似度的即时学习方法 1.1 传统的即时学习方法 JITL 是根据相似输入产生相似输出的思想, X{xi ∈ R m , i = 1,2···N} xq xq xq 假 设 有 N 个历史训练样本的数据集 ,其中 m 表示输入数据的维度。若预 测某一时刻待测样本 ,JITL 的方式是在历史集 中选择与 拥有最高相似性的一组样本来构建当 前的局部模型,同时采用该模型预测 。相似度 准则是 JITL 的核心,现对常用的 FOS 进行描述: SI = γ √ exp(−d 2 )+(1−γ) cos θ (1) xq x1 γ ∈ [0,1] θ 式中:SI 表示某一时刻待测数据 与训练数据 之 间的相似度值;γ 表示权重系数且 ;d 为两 样本的欧氏距离; 为两样本间的夹角,二者计算 公式为 d= xq − xi 2 (2) θ = arc cos x T q xi xq 2 ·∥xi∥2 (3) 1.2 二阶相似度策略 1.2.1 二阶相似度的定义 SOS[12] 定义为:如果两样本的一阶相似样本 大多相同,那么认为两样本拥有较高的二阶相似 性。FOS 准则仅关注单独两样本之间的相似度, 忽略了样本集总体的二阶相似性。如图 1 所示, 数据 1 与 2 的 FOS 很高,数据 1 和 8 的近邻大多 数相同,因此,二者的 SOS 很高,同理数据 2 与 8 的二阶相似性也较高。假设当前到来待测数据 1,若采用 FOS 准则选取相似集,仅仅选择到数据 2;但改用 SOS 策略时,不仅可以选择到数据 2,还 能选择到数据 8。 1 2 3 4 5 6 7 8 x y 0 图 1 二维空间例子 Fig. 1 Two-dimensional space example SOS 算法的伪代码如下: X{xi ∈ R m ,i = 1,2···N} xq 输入 训练样本集 ,测 试样本 for i = 1 : N for j = 1 : N 通过式 (1) 计算训练样本 xi 和 xj 之间的 FOS end for end for 得到训练样本两两之间的相似度矩阵 SN×N 第 5 期 祁成,等:基于二阶相似度的即时学习软测量建模方法 ·911·
·912· 智能系统学报 第15卷 对列方向上进行降序排序,得到对应的索引 5.0 4.5 值矩阵1=i2i…iw for i=1:N 3.5 3.0 通过式(1)计算测试样本x,和训练样本x 2.5 之间的FOS 2.0 15 end for 1.0 得到xg和x:相似度的列向量Swx1,对其进行 0.5 降序排序,得到索引值向量ig,取i和I的前半行 0 0.51.01.52.02.53.03.54.04.55.0 得到和1=[i…w] (a)FOS方法 for i=1:N 5.0 计算i,和,拥有相同索引值的个数 4.5 4.0 end for 3.5 输出索引值的个数,即是xg和x:的SOS 3.0 2.5 1.2.2SOS的特性分析 2.0 采用二维空间中的数值仿真,进一步探讨 1.5 L.0 FOS、SOS准则的区别及特点。图2为二维空间 0.5 中以3个类别中心随机产生的三类数据集。对于 0 0.51.01.52.02.53.03.54.04.55.0 “星型”标记类上一点(3,2.3),图3(a)、(b)中正方形 标记框标记的样本分别是通过FOS与SOS准则 (b)SOS方法 选择到的,与FOS准则相比,SOS准则选择到的 图3FOS方法与SOS方法的区别 相似数据全是同类数据集,这是由于SOS准则在 Fig.3 The difference between FOS and SOS 选择相似数据时不仅考虑数据单点间的相似性, 1.3 累计相似度因子 而且充分考虑了数据集总体分布特征。选择同类 建立局部模型时,数据集个数的选取也是影 别数据建立的局部模型更合理,精度更高。 响ⅡTL模型精度的一个重要因素。若选择的数 据过多会导致信息的冗余,失去了TL相似输人 5.0 45 产生相似输出的本意;过少会引起信息的丢失, 4.0 这两种情况都不利于模型精度的提升。常用的解 3.5 3.0 决方式是根据经验选取局部模型的数据个数,然 2.5 而这样的选取方式具有盲目性。为了有效解决这 2.0 一问题,本文引用累积相似度因子311自适应的 1.5 1.0 选取相似数据的数量,其计算公式为 0.5 00.51.01.52.02.53.03.54.04.55.0 Sk= ,0≤k≤N (4) N 图2产生的3类训练样本集 Fig.2 Three types of training sample sets generated 如图3(a)所示,假设当前时刻到来椭圆中 式中:S为待测数据x,与第i个训练样本之间的 “叉号”标记类的数据点,使用FOS方法计算其与 相似度,且S是经过降序排序,即s1>s2>…s…> 数据点(3,2.3)之间的相似度,那么计算出来的 5gN,类似于PCA,取sk的值为0.85或0.9,表示前 FOS很高,致使模型不会更新,仍采用更新之初 k个最大的相似度占总相似度的贡献率,采用这 模型估计会使模型精度下降;而将SOS准则用 样的方式可以在避免冗余的情况下获得大部分数 于计算其与点(3,2.3)的相似度,二者的SOS较 据信息,比经验选取更有意义。 低,使得模型会更新,进而选择到的局部相似数 2自适应更新机制的GPR模型 据更合理。因此,无论从数据集选取的角度还是 从更新模型角度考虑,SOS在某种程度上都具有 2.1模型更新机制 优势。 针对每个新来的待测数据,JITL都是通过选
I = [ i1 i2 ii ··· iN ] 对列方向上进行降序排序,得到对应的索引 值矩阵 for i = 1 : N 通过式 (1) 计算测试样本 xq 和训练样本 xi 之间的 FOS end for xq xi SN×1 iq iq I ¯iq ¯I = [ ¯i1 ¯i2 ¯ii ··· ¯iN ] 得到 和 相似度的列向量 ,对其进行 降序排序,得到索引值向量 ,取 和 的前半行 得到 和 for i = 1 : N ¯iq ¯i 计算 和 i 拥有相同索引值的个数 end for 输出 索引值的个数,即是 xq 和 xi 的 SOS 1.2.2 SOS 的特性分析 采用二维空间中的数值仿真,进一步探讨 FOS、SOS 准则的区别及特点。图 2 为二维空间 中以 3 个类别中心随机产生的三类数据集。对于 “星型”标记类上一点 (3,2.3),图 3(a)、(b) 中正方形 标记框标记的样本分别是通过 FOS 与 SOS 准则 选择到的,与 FOS 准则相比,SOS 准则选择到的 相似数据全是同类数据集,这是由于 SOS 准则在 选择相似数据时不仅考虑数据单点间的相似性, 而且充分考虑了数据集总体分布特征。选择同类 别数据建立的局部模型更合理,精度更高。 0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 X Y 图 2 产生的 3 类训练样本集 Fig. 2 Three types of training sample sets generated 如图 3(a) 所示,假设当前时刻到来椭圆中 “叉号”标记类的数据点,使用 FOS 方法计算其与 数据点 (3,2.3) 之间的相似度,那么计算出来的 FOS 很高,致使模型不会更新,仍采用更新之初 模型估计会使模型精度下降;而将 SOS 准则用 于计算其与点 (3,2.3) 的相似度,二者的 SOS 较 低,使得模型会更新,进而选择到的局部相似数 据更合理。因此,无论从数据集选取的角度还是 从更新模型角度考虑,SOS 在某种程度上都具有 优势。 (a) FOS 方法 (b) SOS 方法 0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 X Y 0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 X Y 3,2.3 3,2.3 图 3 FOS 方法与 SOS 方法的区别 Fig. 3 The difference between FOS and SOS 1.3 累计相似度因子 建立局部模型时,数据集个数的选取也是影 响 JITL 模型精度的一个重要因素。若选择的数 据过多会导致信息的冗余,失去了 JITL 相似输入 产生相似输出的本意;过少会引起信息的丢失, 这两种情况都不利于模型精度的提升。常用的解 决方式是根据经验选取局部模型的数据个数,然 而这样的选取方式具有盲目性。为了有效解决这 一问题,本文引用累积相似度因子[13-14] 自适应的 选取相似数据的数量,其计算公式为 sk = ∑k i=1 sqi ∑N i=1 sqi ,0 ⩽ k ⩽ N (4) sqi xq i sqi sq1 > sq2 > ···sqi ··· > sqN sk k 式中: 为待测数据 与第 个训练样本之间的 相似度,且 是经过降序排序,即 ,类似于 PCA,取 的值为 0.85 或 0.9,表示前 个最大的相似度占总相似度的贡献率,采用这 样的方式可以在避免冗余的情况下获得大部分数 据信息,比经验选取更有意义。 2 自适应更新机制的 GPR 模型 2.1 模型更新机制 针对每个新来的待测数据,JITL 都是通过选 ·912· 智 能 系 统 学 报 第 15 卷
第5期 祁成,等:基于二阶相似度的即时学习软测量建模方法 ·913· 择到的相似样本建立局部模型,并对待测数据进 ya(xa)=c"(xg)C-Y (6) 行估计。但是,一般的工业生产过程不会频繁发 (xg)=c(xg.xq)-c"(xg)C-'c(xg) (7) 生工况变化。因此,可以继续采用之前建立好的 其中,c(xg)=[c(xg,x),c(xg,2)…,c(xg,xwT为待测 的局部模型预测工况变化较小时刻的待测样本, 输入数据与每个历史数据协方差构成的矩阵,C= 从而减少模型耗时。 Σ+σI是历史输入数据自身之间的协方差矩阵, 通常通过比较两相邻样本相似度与当前阈 c(xgx)为待测输入自身的协方差值。 值(THR)的大小来降低模型更新频率,若小于 GPR有不同的协方差函数可以选择,本文选 THR,则更新模型估计当前待测数据;否则,沿用 取径向基协方差函数,其详细描述如下: 之前建立的局部模型进行估计输出。然而,当生 c(x,x)=vexp 2- (8) 产过程的工况变化较为缓慢时,如果仅计算相邻 = 数据之间的相似度,可能会一直大于THR,从而 其中,v是先验知识的总体度量;ω,为第1维样本 使模型未及时更新引起累计误差问题。所以,可 的权重;d,是Kronecher算子,代表每个辅助变量 以改进为计算当前时刻与前一模型更新时刻数 的重要程度。 据间的相似度来克服累计误差问题。详细描述 通常采用极大似然估计计算式(⑧)中的参数 如下: 8=[v,,1,…,ωm,其对数似然函数为 1)若当前为q时刻,经过计算且模型需要更 新,当来到新的测试数据xa,采用1.2节的方法从 -tog(de(C)--og) (9) 历史样本集中选择与x。SOS最高的一批数据建 首先对超参0进行初始化,然后采用共轭梯 立当前的GPR模型,同时估计xg,并将SOS最高 度法得到优化的参数劉。参数确定后,当来到 的值乘以某一数值(参数)用于判断之后时刻模 新的待测样本,根据式(6)得到模型输出。 型是否需要更新的THR。 3 基于二阶相似度的即时学习建模 2)当q+时刻数据xg到来,计算其和x之间 步骤 的SOS,同时与THR比较,若小于THR,则更新 模型进行估计,同时更新相似度阈值,否则,认为 基于SOS-JITL软测量建模流程图如图4,具 当前工况变化较小,仍采用g时刻的局部模型对 体建模步骤如下: x进行估计。 1)采用式(1)计算历史数据相互间的FOS,得 3)如果q+1未更新模型,在q+2时刻,计算 到相似度矩阵,同时将其降序排序返回索引值矩 测试数据xg+2和前一模型更新时刻数据x,之间 阵I。 的SOS,其他的判断方式与x相同。 2)假如当前9时刻模型需要更新,针对待测 2.2GPR建模方法 数据x,计算其与历史数据之间的FOS,并返回索 GPR是一种非参数概率模型,已经成为机器 引值向量g 学习领域的一种重要的建模方法,并在近些年 3)通过1.2节计算i,与i间的S0S,同时采用 来得到广泛关注与应用s,其基本原理描述 累积相似度因子自适应选取与x近邻最多的一批 如下。 数据建立此刻的GPR模型,并估计x,同时更新模 现有历史训练数据集X{x:∈Rm,i=1,2…N)和 型的THR。 Y{y∈R,i=1,2…N,分别代表m维输入样本和 4)若q+1时刻测试数据x到来,计算其和当 1维输出标签。可以采用如下的关系式表示输人 前模型更新之初时刻数据x,间的SOS,并与 与输出间的关系: THR比较,若小于THR,如步骤3)更新模型和 :=f(x)+8 (5) THR,并采用新模型估x,同时将q+时刻设置为 式中:f为某种未知的函数;ε为均值为0,方差为 模型更新之初时刻:否则,仍采用9时刻模型估计 σ的高斯白噪声。 Xg+lo 对于某一待测数据xg,它的输出预测值y,满 5)对于q+n时刻的待测数据xg+n,重复步骤 足高斯分布,其均值和方差可以分别表示为 4),可得估计值ygn
择到的相似样本建立局部模型,并对待测数据进 行估计。但是,一般的工业生产过程不会频繁发 生工况变化。因此,可以继续采用之前建立好的 的局部模型预测工况变化较小时刻的待测样本, 从而减少模型耗时。 通常通过比较两相邻样本相似度与当前阈 值 (THR) 的大小来降低模型更新频率,若小于 THR,则更新模型估计当前待测数据;否则,沿用 之前建立的局部模型进行估计输出。然而,当生 产过程的工况变化较为缓慢时,如果仅计算相邻 数据之间的相似度,可能会一直大于 THR,从而 使模型未及时更新引起累计误差问题。所以,可 以改进为计算当前时刻与前一模型更新时刻数 据间的相似度来克服累计误差问题。详细描述 如下: xq xq xq 1) 若当前为 q 时刻,经过计算且模型需要更 新,当来到新的测试数据 ,采用 1.2 节的方法从 历史样本集中选择与 SOS 最高的一批数据建 立当前的 GPR 模型,同时估计 ,并将 SOS 最高 的值乘以某一数值 (参数) 用于判断之后时刻模 型是否需要更新的 THR。 q+1 xq+1 xq xq+1 2) 当 时刻数据 到来,计算其和 之间 的 SOS,同时与 THR 比较,若小于 THR,则更新 模型进行估计,同时更新相似度阈值,否则,认为 当前工况变化较小,仍采用 q 时刻的局部模型对 进行估计。 q+1 q+2 xq+2 xq xq+1 3) 如果 未更新模型,在 时刻,计算 测试数据 和前一模型更新时刻数据 之间 的 SOS,其他的判断方式与 相同。 2.2 GPR 建模方法 GPR 是一种非参数概率模型,已经成为机器 学习领域的一种重要的建模方法,并在近些年 来得到广泛关注与应用[15-17] ,其基本原理描述 如下。 X{xi ∈ R m ,i = 1,2···N} {yi ∈ R,i = 1,2···N} m 现有历史训练数据集 和 Y ,分别代表 维输入样本和 1 维输出标签。可以采用如下的关系式表示输入 与输出间的关系: yi = f(xi)+ε (5) f ε σ 2 N 式中: 为某种未知的函数; 为均值为 0,方差为 的高斯白噪声。 对于某一待测数据 xq,它的输出预测值 yq 满 足高斯分布,其均值和方差可以分别表示为 yq(xq) = c T (xq)C −1Y (6) σ 2 yq (xq) = c(xq, xq)− c T (xq)C −1 c(xq) (7) c(xq) = [c(xq, x1), c(xq, x2),··· , c(xq, xN)]T C = Σ +σ 2 N I c(xq, xq) 其中, 为待测 输入数据与每个历史数据协方差构成的矩阵, 是历史输入数据自身之间的协方差矩阵, 为待测输入自身的协方差值。 GPR 有不同的协方差函数可以选择,本文选 取径向基协方差函数,其详细描述如下: c(xi , xj) = v exp − 1 2 ∑m t=1 ωt(xit − xjt) 2 +σ 2 N δi j (8) v ωt δi j 其中, 是先验知识的总体度量; 为第 t 维样本 的权重; 是 Kronecher 算子,代表每个辅助变量 的重要程度。 θ = [ v,σ2 N ,ω1,··· ,ωm ] 通常采用极大似然估计计算式 (8) 中的参数 ,其对数似然函数为 L(θ) = − 1 2 log(det(C))− 1 2 Y TC −1Y − N 2 log(2π) (9) 首先对超参 θ 进行初始化,然后采用共轭梯 度法得到优化的参数[18]。参数确定后,当来到 新的待测样本,根据式 (6) 得到模型输出。 3 基于二阶相似度的即时学习建模 步骤 基于 SOS-JITL 软测量建模流程图如图 4,具 体建模步骤如下: I 1)采用式 (1) 计算历史数据相互间的 FOS,得 到相似度矩阵,同时将其降序排序返回索引值矩 阵 。 iq 2)假如当前 q 时刻模型需要更新,针对待测 数据 xq,计算其与历史数据之间的 FOS,并返回索 引值向量 。 ¯iq ¯ii xq xq 3)通过 1.2 节计算 与 间的 SOS,同时采用 累积相似度因子自适应选取与 近邻最多的一批 数据建立此刻的 GPR 模型,并估计 同时更新模 型的 THR。 q+1 xq+1 xq xq+1 q+1 xq+1 4)若 时刻测试数据 到来,计算其和当 前模型更新之初时刻数据 间 的 SOS , 并 与 THR 比较,若小于 THR,如步骤 3)更新模型和 THR,并采用新模型估 ,同时将 时刻设置为 模型更新之初时刻;否则,仍采用 q 时刻模型估计 。 q+n xq+n yq+n 5) 对于 时刻的待测数据 ,重复步骤 4),可得估计值 。 第 5 期 祁成,等:基于二阶相似度的即时学习软测量建模方法 ·913·
·914· 智能系统学报 第15卷 开始 设当前时刻为初始时 收集过程的 刻,相似度阈值为 训练数据集 THR,模型为fx) 计算x 与初始时 刻样本艺间二阶相似 当q叶n时刻待测 通过式()计算训练样 度,记为ss 样本Xn到来 本两两之间的FOS. 得到相似度矩阵Sw 更新模型和相似度 N 阀值,使qtn时 Ss>THR 刻为新的初始时刻 对列方向上进行降序 y 排序,得到对应的索 引值矩阵1 采用更新后模型 沿用模型fx) 对x进行预测 对进行预测 取I的前半行得到 得到样本x… 的预测值y ! 结束 离线部分 在线部分 图4基于SOS-JITL方法的建模流程图 Fig.4 Modeling flow chart based on SOS-JITL method 4实验仿真 中可以得到,GPR方法的预测值更逼近于实际真 值,表明GPR建模方法的精度更高。 青霉素产生菌在适当的温度、pH值等外部环 1.5r 境条件下生长与抗生素合成这一过程称为青霉素 发酵过程,此过程分为3个阶段,即产生菌生长阶 段、青霉素合成阶段与产生菌的自溶阶段。作 为模拟青霉素发酵过程的Pensim仿真平台,其包 含了众多的输入变量与输出变量,其中青霉素这 05 =====·SVM 一重要产物的浓度在实际发酵过程中难以测得, 因此可以采用软测量建模进行在线预测。本文采 用通气速率、CO2浓度和pH值等6个变量作为输 50 100 150 200 样本个数 入变量,青霉素浓度作为输出变量,建立软测量 (a)SVM 模型。采用Pensim仿真平台产生400组样本,选 1.5 取其中200组作为训练数据,剩余的作为测试数 据来验证所提方法。 为了对比建模方法的性能,分别采用SVM、 PLS、ANN、GPR建模方法预测青霉素浓度。其 ·一真值 中定义ANN的网络层为3层、隐藏层节点数为 -----PLS 20、步长为0.01、迭代次数为100次、训练目标最 小误差为0.001;SVM采用高斯核函数。图5给 -0.5 出了4种方法的预测结果,图中实线表示青霉素 0 50 100 150 200 样本个数 浓度的实际值,虚线表示各方法的预测值。从图 (b)PLS
4 实验仿真 青霉素产生菌在适当的温度、pH 值等外部环 境条件下生长与抗生素合成这一过程称为青霉素 发酵过程,此过程分为 3 个阶段,即产生菌生长阶 段、青霉素合成阶段与产生菌的自溶阶段[19]。作 为模拟青霉素发酵过程的 Pensim 仿真平台,其包 含了众多的输入变量与输出变量,其中青霉素这 一重要产物的浓度在实际发酵过程中难以测得, 因此可以采用软测量建模进行在线预测。本文采 用通气速率、CO2 浓度和 pH 值等 6 个变量作为输 入变量,青霉素浓度作为输出变量,建立软测量 模型。采用 Pensim 仿真平台产生 400 组样本,选 取其中 200 组作为训练数据,剩余的作为测试数 据来验证所提方法。 为了对比建模方法的性能,分别采用 SVM、 PLS、ANN、GPR 建模方法预测青霉素浓度。其 中定义 ANN 的网络层为 3 层、隐藏层节点数为 20、步长为 0.01、迭代次数为 100 次、训练目标最 小误差为 0.001;SVM 采用高斯核函数。图 5 给 出了 4 种方法的预测结果,图中实线表示青霉素 浓度的实际值,虚线表示各方法的预测值。从图 中可以得到,GPR 方法的预测值更逼近于实际真 值,表明 GPR 建模方法的精度更高。 设当前时刻为初始时 刻,相似度阈值为 THR,模型为 f (x) 计算 xq+n 与初始时 刻样本之间二阶相似 度,记为ss ss>THR 更新模型和相似度 阈值,使 q+n 时 刻为新的初始时刻 Y N 采用更新后模型 对 xq+n 进行预测 得到样本 xq+n 的预测值 yq+n 沿用模型 f (x) 对 xq+n 进行预测 当 q+n 时刻待测 样本 xq+n 到来 开始 结束 收集过程的 训练数据集 通过式(1) 计算训练样 本两两之间的 FOS, 得到相似度矩阵 SN×N 对列方向上进行降序 排序,得到对应的索 引值矩阵 I 取I的前半行得到 I 离线部分 在线部分 − 图 4 基于 SOS-JITL 方法的建模流程图 Fig. 4 Modeling flow chart based on SOS-JITL method (a) SVM (b) PLS 0 50 100 150 200 0.5 1.0 1.5 青霉素浓度/(g·L−1 ) 真值 PLS 真值 SVM 样本个数 0 50 100 150 200 0.5 0 −0.5 1.0 1.5 青霉素浓度/(g·L−1 ) 样本个数 ·914· 智 能 系 统 学 报 第 15 卷
第5期 祁成,等:基于二阶相似度的即时学习软测量建模方法 915· 1.5 ITL-GPR)、减少模型耗时的一阶相似度GPR方 法(简写为RJITL-GPR)3种方法与本文方法(pro 1.0 posed)对比,且JITL在选取局部相似样本数目时 均采用累积相似度因子。4种方法预测曲线如 0.5 ·一真值 图6所示,将样本130~190的预测曲线进行放大, ---·AN 0 可以直观的看出,与前3种方法相比,所提方法的 跟踪性能更好。4种方法的预测误差如图7所 -0. 示,其中,图7(d)中的误差曲线在0处抖动幅度 0 50 100 150 200 样本个数 更小,表明该方的预测精度更高。 (c)ANN 1.4 1.4m 12 1.2 一真值 1.0 ---GPR 0.8 一 1.4 1.3 0.6 ·一真值 140160180200 --GPR 江 0.4 0.2 0.2 0 50 100 150 200 样本个数 (d)GPR 50 100 150 200 样本个数 图54种基本建模方法的预测曲线 (a)GPR Fig.5 Prediction curve of the four basic modeling methods 1.4 为了进一步分析GPR方法的优势,采用均方 真值 1.2 根误差2O(RMSE)这一指标对比各种建模方法,其 ---JITL-GPR 计算公式为 1.4 0.8 1.3 0.6 140160180200 RMSE= (10) M 式中:y表示第测试样本的真实值;y为测试样 0.2 本的估计值;M表示测试样本的数目。 表1给出了4种方法的RMSE,从表中可以 50 100150 200 样本个数 清晰地看出本文所采用GPR方法的RMSE最小, (b)JITL-GPR 进一步表明该方法建立的模型估计精度更高,跟 1,4 踪能力更强。 一真值 1.2 ---RJITL-GPR 表14种基本建模方法的RMSE Table 1 RMSE of the four basic modeling methods 1.4 1.3 方法/指标 RMSE 140160180200 SVM 0.0797 PLS 0.0672 0.4 ANN 0.0211 0.2 GPR 0.0193 50 100 150 200 为了验证本文所提方法的预测性能,分别选 样本个数 取GPR方法、一阶相似度的GPR方法(简写为 (c)RJITL-GPR
为了进一步分析 GPR 方法的优势,采用均方 根误差[20] (RMSE) 这一指标对比各种建模方法,其 计算公式为 RMSE= vuuuuuut∑M j=1 (yj −y ∗ j ) 2 M (10) yj j y ∗ j M 式中: 表示第 测试样本的真实值; 为测试样 本的估计值; 表示测试样本的数目。 表 1 给出了 4 种方法的 RMSE,从表中可以 清晰地看出本文所采用 GPR 方法的 RMSE 最小, 进一步表明该方法建立的模型估计精度更高,跟 踪能力更强。 表 1 4 种基本建模方法的 RMSE Table 1 RMSE of the four basic modeling methods 方法/指标 RMSE SVM 0.079 7 PLS 0.067 2 ANN 0.021 1 GPR 0.019 3 为了验证本文所提方法的预测性能,分别选 取 GPR 方法、一阶相似度的 GPR 方法(简写为 JITL-GPR)、减少模型耗时的一阶相似度 GPR 方 法(简写为 RJITL-GPR)3 种方法与本文方法 (proposed) 对比,且 JITL 在选取局部相似样本数目时 均采用累积相似度因子。4 种方法预测曲线如 图 6 所示,将样本 130~190 的预测曲线进行放大, 可以直观的看出,与前 3 种方法相比,所提方法的 跟踪性能更好。4 种方法的预测误差如图 7 所 示,其中,图 7(d)中的误差曲线在 0 处抖动幅度 更小,表明该方的预测精度更高。 (c) ANN (d) GPR -0.5 0 0.5 1.0 1.5 青霉素浓度/(g·L−1 ) 0.2 0 0.4 0.6 0.8 1.0 1.2 1.4 青霉素浓度/(g·L−1 ) 真值 ANN 真值 GPR 0 50 100 150 200 样本个数 50 100 150 200 样本个数 图 5 4 种基本建模方法的预测曲线 Fig. 5 Prediction curve of the four basic modeling methods (a) GPR (b) JITL-GPR (c) RJITL-GPR 0 50 100 150 200 0.2 0.4 0.6 0.8 1.0 1.2 1.4 样本个数 青霉素浓度/(g·L−1 ) 0 50 100 150 200 0.2 0.4 0.6 0.8 1.0 1.2 1.4 样本个数 青霉素浓度/(g·L−1 ) 0 50 100 150 200 0.2 0.4 0.6 0.8 1.0 1.2 1.4 样本个数 青霉素浓度/(g·L−1 ) 140 160 180 200 1.3 1.4 真值 GPR 140160180 200 1.3 1.4 真值 JITL-GPR 140 160 180 200 1.3 1.4 真值 RJITL-GPR 第 5 期 祁成,等:基于二阶相似度的即时学习软测量建模方法 ·915·
·916· 智 能系统学报 第15卷 1.4 为了进一步分析所提方法的优越性,采用 一其值 1.2 -…本文方法 RMSE和模型时耗作为评价标准。表2给出了 1.0 4种方法的RMSE和建模耗时。由表中的信息可 08 以得到,与单一GPR方法相比,JITL-GPR尽管提 0.6 140160180200 高了模型的精度,但是建模所花费的时间太长, 对于一些实时性要求较高的生产过程,该方法可 能无法满足实际要求;RJITL-GPR由于降低了模 0.2 型的更新频率使得建模时间大大缩短,与此同时 50 100. 150 200 降低了模型精度;与前3种方法对比,所提方法不 样本个数 仅降低了模型的时耗,同时提高了模型的精度。 (d本文方法 这是由于SOS在选择局部相似数据时,可以更合 图64种方法的预测曲线 理地选取到相似数据,同时也更准确地判断模型 Fig.6 Prediction curve of the four methods 是否更新,使当前选取的二阶相似样本建立的局 部模型更适用于模型未更新时刻的数据。 0.05 0.05 0.05 0.05 50 100 150 200 50 100 150 200 样本个数 样本个数 (a)GPR (b)JITL-GPR 0.05 0.05 -005 -0.05 50 100 150 200 50 100 150 200 样本个数 样本个数 (c)RJITL-GPR (d本文方法 图74种方法的预测误差曲线 Fig.7 Prediction error curve of the four methods 表24种方法的RMSE和建模时间 5结束语 Table 2 RMSE and modeling time of the four methods 从工业过程实时性角度出发,提出一种基于 方法指标 RMSE 建模时间/s SOS的JITL-GPR方法,在自适应模型更新机制的 GPR 0.0193 1.6 框架下,采用$OS方法从历史数据中选取与当前 JITL-GPR 0.0153 106.9 待测数据用于更多邻居的样本建立此时的局部 RJITL-GPR 0.0195 8.4 GPR模型,同时引入累计相似度因子优化局部模 型的样本数目。与FOS准则相比,SOS准则在选 本文方法 0.0124 20.2 取相似样本时,既关注了两数据单点间的相似
为了进一步分析所提方法的优越性,采用 RMSE 和模型时耗作为评价标准。表 2 给出了 4 种方法的 RMSE 和建模耗时。由表中的信息可 以得到,与单一 GPR 方法相比,JITL-GPR 尽管提 高了模型的精度,但是建模所花费的时间太长, 对于一些实时性要求较高的生产过程,该方法可 能无法满足实际要求;RJITL-GPR 由于降低了模 型的更新频率使得建模时间大大缩短,与此同时 降低了模型精度;与前 3 种方法对比,所提方法不 仅降低了模型的时耗,同时提高了模型的精度。 这是由于 SOS 在选择局部相似数据时,可以更合 理地选取到相似数据,同时也更准确地判断模型 是否更新,使当前选取的二阶相似样本建立的局 部模型更适用于模型未更新时刻的数据。 表 2 4 种方法的 RMSE 和建模时间 Table 2 RMSE and modeling time of the four methods 方法/指标 RMSE 建模时间/s GPR 0.019 3 1.6 JITL-GPR 0.015 3 106.9 RJITL-GPR 0.019 5 8.4 本文方法 0.012 4 20.2 5 结束语 从工业过程实时性角度出发,提出一种基于 SOS 的 JITL-GPR 方法,在自适应模型更新机制的 框架下,采用 SOS 方法从历史数据中选取与当前 待测数据用于更多邻居的样本建立此时的局部 GPR 模型,同时引入累计相似度因子优化局部模 型的样本数目。与 FOS 准则相比,SOS 准则在选 取相似样本时,既关注了两数据单点间的相似 (d) 本文方法 0 50 100 150 200 0.2 0.4 0.6 0.8 1.0 1.2 1.4 样本个数 青霉素浓度/(g·L−1 ) 140 160 180 200 1.3 1.4 真值 本文方法 图 6 4 种方法的预测曲线 Fig. 6 Prediction curve of the four methods (a) GPR 0 50 100 150 200 −0.05 0 0.05 样本个数 误差/(g·L−1 ) (b) JITL-GPR 0 50 100 150 200 −0.05 0 0.05 样本个数 误差/(g·L−1 ) (c) RJITL-GPR 0 50 100 150 200 −0.05 0 0.05 样本个数 误差/(g·L−1 ) (d) 本文方法 0 50 100 150 200 −0.05 0 0.05 样本个数 误差/(g·L−1 ) 图 7 4 种方法的预测误差曲线 Fig. 7 Prediction error curve of the four methods ·916· 智 能 系 统 学 报 第 15 卷
第5期 祁成,等:基于二阶相似度的即时学习软测量建模方法 ·917· 度,同时也考虑了单个数据与历史集总体分布特 tems,2010,104(2:306-317 征之间的关系。因此,所提方法在选择相似样本 [10]张宏伟,李鹏飞,景军锋,等.基于即时学习的软测量建 时更合理,同时也可以更为准确地判断模型是否 模实时性改进).西安工程大学学报,2014,28(6): 更新。采用青霉素发酵过程中青霉素浓度对所提 750-754 方法进行验证,结果表明该方法不仅减少模型的 ZHANG Hongwei,LI Pengfei,JING Junfeng,et al.A 时耗,同时提高了模型的精度。 real-time performance improvement strategy of Just-In- Time-Learning based on soft sensor[J].Journal of Xi'an 参考文献: Polytechnic University,2014,28(6):750-754. [11]牛大鹏,刘元清.基于改进即时学习算法的湿法冶金浸 [1]汤健,柴天佑,刘卓,等.基于更新样本智能识别算法 出过程建模).化工学报,2017,68(7):2873-2879 的自适应集成建模[J].自动化学报,2016,42(7): NIU Dapeng,LIU Yuanging.Modeling hydrometallurgic- 1040-1052 al leaching process based on improved just-in-time learn- TANG Jian,CHAI Tianyou,LIU Zhuo,et al.Adaptive en- ing algorithm[J].CIESC journal,2017,68(7):2873-2879. semble modelling approach based on updating sample in- [12]CRIBBIN T.Discovering latent topical structure by telligent identification[J].Acta automatica sinica,2016, second-order similarity analysis[J].Journal of the Americ- 42(7):1040-1052 an society for information science and technology,2011, [2]ZHENG Junhua,SONG Zhihuan.Semisupervised learn- 62(6):1188-1207. ing for probabilistic partial least squares regression model [13]刘毅,金福江,高增梁.时变过程在线辨识的即时递推 and soft sensor application[].Journal of process control, 核学习方法研究).自动化学报,2013,395):602-609. 2018,64:123-131. LIU Yi,JIN Fujiang,GAO Zengliang.Online identifica- [3]LI Han,YOU Shijun,ZHANG Huan,et al.Analyzing the tion of time-varying processes using just-in-time recurs- impact of heating emissions on air quality index based on ive kernel learning approach[J].Acta automatica sinica, principal component regression[J].Journal of cleaner pro- 2013,39(5):602-609. duction,.2018.171:1577-1592. [14]LIU Yi,GAO Zengliang.Industrial melt index prediction [4]ZHENG Jianqiao,WANG Hongfang,ZHOU Hongpeng,et with the ensemble anti-outlier just-in-time Gaussian pro- al.A using of just-in-time learning based data driven meth- cess regression modeling method [J].Journal of applied od in continuous stirred tank heater[Cl//Proceedings of the polymer science,2015,132(22):41958. 7th International Conference on Intelligent Control and In- [15]WANG Haijun,GAO Xinbo,ZHANG Kaibing,et al formation Processing.Siem Reap,Cambodia,2016:98- Single image super-resolution using Gaussian process re- 104 gression with dictionary-based sampling and student-t [5]PENG Xin,TANG Yang,HE Wangli,et al.A just-in-time likelihood[J].IEEE transactions on image processing, learning based monitoring and classification method for 2017,26(7):3556-3568. hyper/hypocalcemia diagnosis[J].IEEE/ACM transactions [16]HAN Jianan,ZHANG Xiaoping,WANG Fang.Gaussian on computational biology and bioinformatics,2018,15(3): process regression stochastic volatility model for finan- 788-801. cial time series[J].IEEE journal of selected topics in sig- [6]YIN Shen,GAO Huijun,QIU Jianbin,et al.Fault detec- nal processing.2016,10(6):1015-1028 tion for nonlinear process with deterministic disturbances: [17]XIONG Weili,SHI Xudong.Soft sensor modeling with a a just-in-time learning based data driven method[J].IEEE selective updating strategy for Gaussian process regres- transactions on cybernetics,2017,47(11):3649-3657. sion based on probabilistic principle component [7]CHEN Kun,LIU Yi.Adaptive weighting just-in-time- analysis[J].Journal of the franklin institute,2018. learning quality prediction model for an industrial blast 35512):5336-5349. furnace[J].ISIJ international,2017,57(1):107-113 [18]何志昆,刘光斌,赵曦晶,等.高斯过程回归方法综述 [8]NIU Dapeng,GAO Huiyuan,LIU Yuanqing.Modeling of [.控制与决策,2013,28(8):1121-1129,1137 penicillin fermentation process based on FCM and im- HE Zhikun,LIU Guangbin,ZHAO Xijing,et al.Over- proved Just-in-Time learning algorithm[C]//Proceedings of view of Gaussian process regression[J].Control and de- the 36th Chinese Control Conference.Dalian,China,2017: cision,2013,28(8):1121-1129,1137 10328-10332. [19]YU Jie.Multiway Gaussian mixture model based adapt- [9]GE Zhigiang.SONG Zhihuan.A comparative study of ive kernel partial least squares regression method for soft just-in-time-learning based methods for online soft sensor sensor estimation and reliable quality prediction of non- modeling[J].Chemometrics and intelligent laboratory sys- linear multiphase batch processes[J].Industrial engin-
度,同时也考虑了单个数据与历史集总体分布特 征之间的关系。因此,所提方法在选择相似样本 时更合理,同时也可以更为准确地判断模型是否 更新。采用青霉素发酵过程中青霉素浓度对所提 方法进行验证,结果表明该方法不仅减少模型的 时耗,同时提高了模型的精度。 参考文献: 汤健, 柴天佑, 刘卓, 等. 基于更新样本智能识别算法 的自适应集成建模 [J]. 自动化学报, 2016, 42(7): 1040–1052. TANG Jian, CHAI Tianyou, LIU Zhuo, et al. Adaptive ensemble modelling approach based on updating sample intelligent identification[J]. Acta automatica sinica, 2016, 42(7): 1040–1052. [1] ZHENG Junhua, SONG Zhihuan. Semisupervised learning for probabilistic partial least squares regression model and soft sensor application[J]. Journal of process control, 2018, 64: 123–131. [2] LI Han, YOU Shijun, ZHANG Huan, et al. Analyzing the impact of heating emissions on air quality index based on principal component regression[J]. Journal of cleaner production, 2018, 171: 1577–1592. [3] ZHENG Jianqiao, WANG Hongfang, ZHOU Hongpeng, et al. A using of just-in-time learning based data driven method in continuous stirred tank heater[C]//Proceedings of the 7th International Conference on Intelligent Control and Information Processing. Siem Reap, Cambodia, 2016: 98- 104. [4] PENG Xin, TANG Yang, HE Wangli, et al. A just-in-time learning based monitoring and classification method for hyper/hypocalcemia diagnosis[J]. IEEE/ACM transactions on computational biology and bioinformatics, 2018, 15(3): 788–801. [5] YIN Shen, GAO Huijun, QIU Jianbin, et al. Fault detection for nonlinear process with deterministic disturbances: a just-in-time learning based data driven method[J]. IEEE transactions on cybernetics, 2017, 47(11): 3649–3657. [6] CHEN Kun, LIU Yi. Adaptive weighting just-in-timelearning quality prediction model for an industrial blast furnace[J]. ISIJ international, 2017, 57(1): 107–113. [7] NIU Dapeng, GAO Huiyuan, LIU Yuanqing. Modeling of penicillin fermentation process based on FCM and improved Just-in-Time learning algorithm[C]//Proceedings of the 36th Chinese Control Conference. Dalian, China, 2017: 10328-10332. [8] GE Zhiqiang, SONG Zhihuan. A comparative study of just-in-time-learning based methods for online soft sensor modeling[J]. Chemometrics and intelligent laboratory sys- [9] tems, 2010, 104(2): 306–317. 张宏伟, 李鹏飞, 景军锋, 等. 基于即时学习的软测量建 模实时性改进 [J]. 西安工程大学学报, 2014, 28(6): 750–754. ZHANG Hongwei, LI Pengfei, JING Junfeng, et al. A real-time performance improvement strategy of Just-InTime-Learning based on soft sensor[J]. Journal of Xi’an Polytechnic University, 2014, 28(6): 750–754. [10] 牛大鹏, 刘元清. 基于改进即时学习算法的湿法冶金浸 出过程建模 [J]. 化工学报, 2017, 68(7): 2873–2879. NIU Dapeng, LIU Yuanqing. Modeling hydrometallurgical leaching process based on improved just-in-time learning algorithm[J]. CIESC journal, 2017, 68(7): 2873–2879. [11] CRIBBIN T. Discovering latent topical structure by second-order similarity analysis[J]. Journal of the American society for information science and technology, 2011, 62(6): 1188–1207. [12] 刘毅, 金福江, 高增梁. 时变过程在线辨识的即时递推 核学习方法研究 [J]. 自动化学报, 2013, 39(5): 602–609. LIU Yi, JIN Fujiang, GAO Zengliang. Online identification of time-varying processes using just-in-time recursive kernel learning approach[J]. Acta automatica sinica, 2013, 39(5): 602–609. [13] LIU Yi, GAO Zengliang. Industrial melt index prediction with the ensemble anti-outlier just-in-time Gaussian process regression modeling method[J]. Journal of applied polymer science, 2015, 132(22): 41958. [14] WANG Haijun, GAO Xinbo, ZHANG Kaibing, et al. Single image super-resolution using Gaussian process regression with dictionary-based sampling and student-t likelihood[J]. IEEE transactions on image processing, 2017, 26(7): 3556–3568. [15] HAN Jianan, ZHANG Xiaoping, WANG Fang. Gaussian process regression stochastic volatility model for financial time series[J]. IEEE journal of selected topics in signal processing, 2016, 10(6): 1015–1028. [16] XIONG Weili, SHI Xudong. Soft sensor modeling with a selective updating strategy for Gaussian process regression based on probabilistic principle component analysis[J]. Journal of the franklin institute, 2018, 355(12): 5336–5349. [17] 何志昆, 刘光斌, 赵曦晶, 等. 高斯过程回归方法综述 [J]. 控制与决策, 2013, 28(8): 1121–1129, 1137. HE Zhikun, LIU Guangbin, ZHAO Xijing, et al. Overview of Gaussian process regression[J]. Control and decision, 2013, 28(8): 1121–1129, 1137. [18] YU Jie. Multiway Gaussian mixture model based adaptive kernel partial least squares regression method for soft sensor estimation and reliable quality prediction of nonlinear multiphase batch processes[J]. Industrial & engin- [19] 第 5 期 祁成,等:基于二阶相似度的即时学习软测量建模方法 ·917·
·918· 智能系统学报 第15卷 eering chemistry research,2012,51(40):13227-13237. 史旭东,硕士研究生,主要研究方 [20]LIU Ziwei,GE Zhiqiang,CHEN Guangjie,et al.Adapt- 向为工业过程建模。 ive soft sensors for quality prediction under the frame- work of Bayesian network[J].Control engineering prac- tice,2018,72:19-28. 作者简介: 祁成,硕士研究生,主要研究方向 熊伟丽,教授,博土。主要研究方 为工业过程建模。 向为复杂工业过程建模及优化、智能 优化算法及应用。发表学术论文 130余篇。 第三届中国智能教育大会 The 3rd China Intelligence Education Conference (2020) 2020年10月10-11日,由中国人工智能学会、中国教育技术协会、中国语言智能研究中心、中国职业技 术教育学会联合主办的第三届中国智能教育大会将在西安召开。本届大会的举办旨在开展政策、理论、技 术、产品等多层面交流,分析发展机遇,总结实践得失,并进一步探讨人工智能与教育深度融合的趋势与策 略,探索智能教育与教育均衡发展新模式,为实现教育现代化,迈入教育强国行列,推动我国成为学习大国、 人力资源强国和人才强国做出重要贡献,使智能教育真正服务于国计、服务于民生,促进我国教育的全面 发展。 大会设置9场主题报告、10场专题论坛,汇集李德毅院士、戴琼海院士、郑南宁院士、吾守尔·斯拉木院 士、黄维院士、王耀南院士、管晓宏院土、张建伟院士、汉斯·乌思克尔特院士、任福继院士、李明院士、孙茂 松院士、李世鹏院士,13位中外院士在内的超百位知名专家学者,议题覆盖大政方针、学术理论、技术创新、 产品应用等多个方面,将是一场清晰洞察未来教育全貌,精准把握智能教育产业机遇的综合盛会。 第三届中国智能教育大会在前两届成功举办的基础上,将进一步发挥集聚资源、展示成果、促进交流的 平台作用,汇聚人工智能及教育领域的先进思想和研究成果,驱动教育信息化智能化发展。 (相关会议信息参见http://ccai..caai.cn)
eering chemistry research, 2012, 51(40): 13227–13237. LIU Ziwei, GE Zhiqiang, CHEN Guangjie, et al. Adaptive soft sensors for quality prediction under the framework of Bayesian network[J]. Control engineering practice, 2018, 72: 19–28. [20] 作者简介: 祁成,硕士研究生,主要研究方向 为工业过程建模。 史旭东,硕士研究生,主要研究方 向为工业过程建模。 熊伟丽,教授,博士。主要研究方 向为复杂工业过程建模及优化、智能 优化算法及应用。发表学术论文 130 余篇。 第三届中国智能教育大会 The 3rd China Intelligence Education Conference (2020) 2020 年 10 月 10-11 日,由中国人工智能学会、中国教育技术协会、中国语言智能研究中心、中国职业技 术教育学会联合主办的第三届中国智能教育大会将在西安召开。本届大会的举办旨在开展政策、理论、技 术、产品等多层面交流,分析发展机遇,总结实践得失,并进一步探讨人工智能与教育深度融合的趋势与策 略,探索智能教育与教育均衡发展新模式,为实现教育现代化,迈入教育强国行列,推动我国成为学习大国、 人力资源强国和人才强国做出重要贡献,使智能教育真正服务于国计、服务于民生,促进我国教育的全面 发展。 大会设置 9 场主题报告、10 场专题论坛,汇集李德毅院士、戴琼海院士、郑南宁院士、吾守尔·斯拉木院 士、黄维院士、王耀南院士、管晓宏院士、张建伟院士、汉斯·乌思克尔特院士、任福继院士、李明院士、孙茂 松院士、李世鹏院士,13 位中外院士在内的超百位知名专家学者,议题覆盖大政方针、学术理论、技术创新、 产品应用等多个方面,将是一场清晰洞察未来教育全貌,精准把握智能教育产业机遇的综合盛会。 第三届中国智能教育大会在前两届成功举办的基础上,将进一步发挥集聚资源、展示成果、促进交流的 平台作用,汇聚人工智能及教育领域的先进思想和研究成果,驱动教育信息化智能化发展。 (相关会议信息参见 http://ccai.caai.cn/) ·918· 智 能 系 统 学 报 第 15 卷