正在加载图片...
·718· 智能系统学报 第16卷 法,该算法不局限于线性和高斯数据,使用局部 多个子块,对每个子块建立相应的kNN模型,并 近邻距离度量样本相似度,根据故障样本和正常 利用核密度估计方法求出控制限,最后利用贝叶 样本的相似度不同实现故障监测。但是由于每一 斯推断将各子块的监测结果融合,使得整体的监 个样本都需要计算与其他样本的距离,计算量明显 测效果更为直观。本文进一步采用基于马氏距离 增大。为此,学者们提出了许多改进的kNN故障 的故障诊断方法,通过计算样本中各变量与其均 监测算法。例如:文献[9]利用改进K-means聚类 值的马氏距离,找出引发故障的源变量并对其隔 将原始建模数据分成多个类,对每个类分别建立 离。利用田纳西-斯曼(Tennessee Eastmann, kNN监测模型,大大缩短故障检测时间;文献[IO] TE)和实际高炉炼铁过程数据,对所提方法进行 提出将动态PCA和kNN相结合的故障诊断方法, 了仿真,并与几种传统监测方法进行了对比,验 先建立主元模型,再利用kNN获取样本的k个近 证了本文方法的性能。 邻,明显提高了故障的报警率;文献[I1]针对kNN 模型不能及时更新的问题,提出了一种特征空间 1相关算法介绍 自适应k近邻故障检测方法,有效提高模型实时 监测的能力;文献[12]考虑到多模态过程数据具 1.1kNN算法 有多中心、方差差异大等特点,通过构造标准距 k近邻算法是数据挖掘和数据分类中最常用 离,实现了kNN方法对多模态数据的有效监测。 的方法之一,传统kNN算法通过寻找k个近邻样 由于现代工业过程具有多个操作单元、变量 本,采用投票的方法确定待测样本的类别。基于 关系复杂等特点,全局建模策略无法更加准确地 kNN的故障监测,其基本思想是通过计算近邻距离 对过程建模,多块建模策略成为有效的解决方 度量样本间的相似度,若样本点与训练集中前k个 案。Macgrego等l首次提出了多块投影方法,为 近邻样本距离的平方和大于正常样本的相应距离 每个子块以及整个过程建立监测模型。文献[14] 平方和,则该样本点被定义为故障点。监测过程 采用Jarque-Bera(J-B)检测方法并利用变量间的 包括模型建立和故障检测两步,具体描述如下: Hellinger距离获得高斯和非高斯子块,然后分别 1)建立模型 采用不同的方法进行建模,并对每个子块的统计 首先在训练集中,寻找每个样本x的前k个 量进行加权得到总的联合指标实现在线监控:文 近邻样本,记做T(x,k)={x,x,…,,…,},其中, 献[15]将整个过程划分成多个子块单元,然后在每 表示样本:的第j个近邻样本。然后,计算每 个子块单元内分别进行相对变换独立主元分析处 个样本:与其k个近邻样本的欧式距离平方和作 理,实现故障排查和识别:Ge等提出分布式PCA 为统计量,如式(1)所示,其中,表示样本x与 的全流程过程监控方法,利用过程变量在主元方 它的第j个近邻样本的欧氏距离平方。接着,根 向上的贡献度划分子块,有效地提高了监控效果。 据置信度α确定训练模型的控制限D:。 在信息论领域里,互信息(mutual information, D=∑d,G=l-x (1) M)是一种相对成熟的统计分析技术,可以通过 信息嫡度量两个随机变量之间的依赖性,并且这 式中:D表示样本x的统计量。 种度量不局限于数据线性关系的假设条件1例 2)在线故障检测 已经在数据分析与建模领域得到了比较多的应 首先,在训练集中寻找待测样本x的前k个 用。文献[20]利用变量间的互信息定义数据的相 近邻。然后,计算x与其k个近邻样本的欧式距 关性矩阵,为过程数据建立更为精确的描述模 离平方和,记做D。最后,比较D与D的大小, 型。文献[21]利用互信息矩阵之和替代传统主成 若D≥D2,则判定为故障点,反之为正常点。 分分析中的协方差矩阵,计算其特征向量与特征 12 互信息 值,得到较主成分分析更好的降维效果。文献22] 在概率论和信息论领域,互信息是一种非常 利用高维k近邻互信息方法,有效解决建模过程 实用的信息度量方法。它可以度量两个随机变量 中的特征选择问题。 相互依赖的程度,表示出两个变量共享的信息, 综上所述,为了更加充分地对复杂过程变量 反映两个变量的相关性2,这种度量同样适用于 之间的关系进行描述,并提取过程的局部特征, 非线性相关的变量。对于密切相关的变量,它们 利用多块建模策略,提出一种基于互信息的k近 拥有较大的互信息。令随机变量X和Y的联合 邻故障监测算法。该算法在计算训练集样本间的 概率分布及边缘概率分布分别为p(x,y)、p(x)和 互信息基础上,根据互信息值的大小将变量分成 py),其中x∈X,y∈Y,X的熵定义如式(2)所示。法,该算法不局限于线性和高斯数据,使用局部 近邻距离度量样本相似度,根据故障样本和正常 样本的相似度不同实现故障监测。但是由于每一 个样本都需要计算与其他样本的距离,计算量明显 增大。为此,学者们提出了许多改进的 kNN 故障 监测算法。例如:文献 [9] 利用改进 K-means 聚类 将原始建模数据分成多个类,对每个类分别建立 kNN 监测模型,大大缩短故障检测时间;文献 [10] 提出将动态 PCA 和 kNN 相结合的故障诊断方法, 先建立主元模型,再利用 kNN 获取样本的 k 个近 邻,明显提高了故障的报警率;文献 [11] 针对 kNN 模型不能及时更新的问题,提出了一种特征空间 自适应 k 近邻故障检测方法,有效提高模型实时 监测的能力;文献 [12] 考虑到多模态过程数据具 有多中心、方差差异大等特点,通过构造标准距 离,实现了 kNN 方法对多模态数据的有效监测。 由于现代工业过程具有多个操作单元、变量 关系复杂等特点,全局建模策略无法更加准确地 对过程建模,多块建模策略成为有效的解决方 案。Macgrego 等 [13] 首次提出了多块投影方法,为 每个子块以及整个过程建立监测模型。文献 [14] 采用 Jarque-Bera(J-B) 检测方法并利用变量间的 Hellinger 距离获得高斯和非高斯子块,然后分别 采用不同的方法进行建模,并对每个子块的统计 量进行加权得到总的联合指标实现在线监控;文 献 [15] 将整个过程划分成多个子块单元,然后在每 个子块单元内分别进行相对变换独立主元分析处 理,实现故障排查和识别;Ge 等 [16] 提出分布式 PCA 的全流程过程监控方法,利用过程变量在主元方 向上的贡献度划分子块,有效地提高了监控效果。 在信息论领域里,互信息 (mutual information, MI) 是一种相对成熟的统计分析技术,可以通过 信息熵度量两个随机变量之间的依赖性,并且这 种度量不局限于数据线性关系的假设条件[17-19] , 已经在数据分析与建模领域得到了比较多的应 用。文献 [20] 利用变量间的互信息定义数据的相 关性矩阵,为过程数据建立更为精确的描述模 型。文献 [21] 利用互信息矩阵之和替代传统主成 分分析中的协方差矩阵,计算其特征向量与特征 值,得到较主成分分析更好的降维效果。文献 [22] 利用高维 k 近邻互信息方法,有效解决建模过程 中的特征选择问题。 综上所述,为了更加充分地对复杂过程变量 之间的关系进行描述,并提取过程的局部特征, 利用多块建模策略,提出一种基于互信息的 k 近 邻故障监测算法。该算法在计算训练集样本间的 互信息基础上,根据互信息值的大小将变量分成 多个子块,对每个子块建立相应的 kNN 模型,并 利用核密度估计方法求出控制限,最后利用贝叶 斯推断将各子块的监测结果融合,使得整体的监 测效果更为直观。本文进一步采用基于马氏距离 的故障诊断方法,通过计算样本中各变量与其均 值的马氏距离,找出引发故障的源变量并对其隔 离。利用田纳西−斯曼 (Tennessee Eastmann, TE) 和实际高炉炼铁过程数据,对所提方法进行 了仿真,并与几种传统监测方法进行了对比,验 证了本文方法的性能。 1 相关算法介绍 1.1 kNN 算法 k 近邻算法是数据挖掘和数据分类中最常用 的方法之一,传统 kNN 算法通过寻找 k 个近邻样 本,采用投票的方法确定待测样本的类别。基于 kNN 的故障监测,其基本思想是通过计算近邻距离 度量样本间的相似度,若样本点与训练集中前 k 个 近邻样本距离的平方和大于正常样本的相应距离 平方和,则该样本点被定义为故障点。监测过程 包括模型建立和故障检测两步,具体描述如下: 1) 建立模型 xi T(xi , k) = {x 1 i , x 2 i ,··· , x j i ,··· , x k i } x j i xi xi d 2 i j xi D 2 α 首先在训练集中,寻找每个样本 的前 k 个 近邻样本,记做 ,其中, 表示样本 的第 j 个近邻样本。然后,计算每 个样本 与其 k 个近邻样本的欧式距离平方和作 为统计量,如式 (1) 所示,其中, 表示样本 与 它的第 j 个近邻样本的欧氏距离平方。接着,根 据置信度 α 确定训练模型的控制限 。 D 2 i = ∑k j=1 d 2 i j, d 2 i j = xi − x j i 2 (1) D 2 式中: i 表示样本 xi 的统计量。 2) 在线故障检测 x x D 2 x D 2 x D 2 α D 2 x ⩾ D 2 α 首先,在训练集中寻找待测样本 的前 k 个 近邻。然后,计算 与其 k 个近邻样本的欧式距 离平方和,记做 。最后,比较 与 的大小, 若 ,则判定为故障点,反之为正常点。 1.2 互信息 X Y p(x,y) p(x) p(y) x ∈ X y ∈ Y X 在概率论和信息论领域,互信息是一种非常 实用的信息度量方法。它可以度量两个随机变量 相互依赖的程度,表示出两个变量共享的信息, 反映两个变量的相关性[21] ,这种度量同样适用于 非线性相关的变量。对于密切相关的变量,它们 拥有较大的互信息。令随机变量 和 的联合 概率分布及边缘概率分布分别为 、 和 ,其中 , , 的熵定义如式 (2) 所示。 ·718· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有