正在加载图片...
第1期 崔铁军,等:系统故障因果关系分析的智能驱动方式研究 ·93· 素,而不考虑数据与因素关系和人的假设条件, 本文不论述监测和收集问题,因为这些偏重 难以通过智能系统管控分析复杂系统故障。 于硬件。当获得故障数据后如何处理才是关键问 目前关于系统故障数据的智能处理及因果关 题。系统故障一般具有因果关系,即哪些事件导 系研究的文献不多,较新的研究包括:光纤通信 致了故障,故障又导致了哪些事件发生。因此安 故障数据智能检测山;故障因果信息的故障智能 全科学,特别是故障研究最终需要揭示故障之间 诊断;空间故障树与因素空间融合的智能可靠 的因果关系。另一方面,处理故障数据的方法很 性分析;自适应选择融合智能故障分类技术: 多,但目前最常用的是数理统计。数理统计之父 智能变电站网络设备故障定位;智能电表运行 Karl Pearson热衷于从基础数据归类得到表征变 故障监控与预测m,智能电网监控大数据模型 量,然后使用这些变量研究事物的关系6。通过 构建1等。这些研究在各自领域取得了较好成 2个随机变量的联合分布表达它们之间的联系。 果,但并没有解决故障数据处理和故障因果关系 这当然取得了极大成功,奠定了数理统计基础。 分析等本质理论问题。 但这种联系说明了何种问题?例如交通事故和时 作者根据对故障信息转换9、故障状态、故 间的对应分布关系,6:00-8:00和17:00-19:00时间 障对象分类☒,故障的因素影响311及故障演 范围内交通事故达到峰值,并正态分布。说明交 化6等的研究,对上述3个问题提出了解决方 通事故与时间存在联系,但这种关系并非因果关 案。对上述3个问题提出了一些看法。论述了通 系。因为联合分布得到的因果关系具有双向性。 过数理统计方法分析故障数据的弊端;给出了系 即由甲推断乙,同时由乙也可以推断甲。那么这 统故障原因及结果的相关性和关联性区别;最后 个例子就变成了时间与交通事故存在联系,这显 论述了智能系统对故障因果关系分析的4个层 然难以解释。在数理统计发展中也有类似争论。 次。希望能为复杂系统故障分析提供智能方法。 以父亲身高推断儿子身高,发展相关椭圆的主轴 向自变量轴偏转说明具有遗传回归性,即儿子身 故障数据的数理统计 高与父亲身高相关;有人用儿子身高推断父亲身 广义的数据包含了各种数据形式。系统存在 高,得到了同样现象6,说明儿子身高与父亲身高 对人而言就是能获得系统发散出来的数据。数据 互为因果。这使得Pearson的追随者们难以理解, 是系统存在的表现形式。但人受限于技术方法, 并从此在数理统计研究中回避这类问题,一直影 在不能获得数据时将难以判断系统存在,更难以 响到现在。 了解系统特性。这是系统层面的问题,但专业技 正如上述问题,交通事故与时间之间有一个 术领域可能更加严重。 人流的因素,上班时间人流多,而人流多造成交 安全科学相对而言较新,涉及到社会的方方 通事故多;父亲与儿子存在内在的基因联系,他 面面。与其他科学相同,其基础理论的建立需要 们的身高也与环境相关。因此只用数理统计方法 大量数据支持。虽然安全理论多数来源于相关学 研究故障数据中的各种原因和故障关系是不充分 科但也需要这些数据。人们对系统的要求是在规 的。这将直接导致故障原因控制不当,甚至原因 定时间内、规定条件下完成预定功能,即系统的 本身就是错误的。正如本文提出的空间故障网络 可靠性:与之对应的是系统失效性。通常情况在 理论描述系统故障演化过程得到的结论,原因和 给定条件下,系统都具有可靠性。那么系统的可 结果之间可能存在多条通路,错误的因果分析将 靠状态是一种通常状态;当系统遇到意外作用时 造成通路上事件控制不能阻止结果发生。这是由 可能出现失效状态。这种失效是人们关心的问 于没有分析故障发生的本质原因。 题,因此研究系统安全主要关注于系统失效 2系统故障的相关性和关联性 状态。 如上所述,对系统失效的研究也立足于数 相关性和关联性在日常生活中是相近甚至相 据。系统运行时散发的数据可分为正常数据和异 同的,但本文要进行区分。汪培庄教授m提出的 常数据。可靠性和失效性就蕴含在这些数据之 因素空间理论是智能科学的数学基础。该理论认 中。失效性特征蕴含在异常数据,即故障数据 为,关联性层次要高,存在于概念层面:而相关性 中,正常数据也有作用但不直接。因此研究系统 较低,存在于变量层面。因素空间中的“因”不是 安全的主要基础就是故障数据。那么问题是如何 原因而是影响因果关系的因素。故障的原因和结 监测、收集、筛选、分析和处理故障数据。 果实际上是笼统的,其中蕴含了很多影响原因和素,而不考虑数据与因素关系和人的假设条件, 难以通过智能系统管控分析复杂系统故障。 目前关于系统故障数据的智能处理及因果关 系研究的文献不多,较新的研究包括:光纤通信 故障数据智能检测[1] ;故障因果信息的故障智能 诊断[2] ;空间故障树与因素空间融合的智能可靠 性分析[3] ;自适应选择融合智能故障分类技术[4] ; 智能变电站网络设备故障定位[5] ;智能电表运行 故障监控[6] 与预测[7] ;智能电网监控大数据模型 构建[8] 等。这些研究在各自领域取得了较好成 果,但并没有解决故障数据处理和故障因果关系 分析等本质理论问题。 作者根据对故障信息转换[9] 、故障状态[10] 、故 障对象分类[11-12] ,故障的因素影响[13-15] 及故障演 化 [16] 等的研究,对上述 3 个问题提出了解决方 案。对上述 3 个问题提出了一些看法。论述了通 过数理统计方法分析故障数据的弊端;给出了系 统故障原因及结果的相关性和关联性区别;最后 论述了智能系统对故障因果关系分析的 4 个层 次。希望能为复杂系统故障分析提供智能方法。 1 故障数据的数理统计 广义的数据包含了各种数据形式。系统存在 对人而言就是能获得系统发散出来的数据。数据 是系统存在的表现形式。但人受限于技术方法, 在不能获得数据时将难以判断系统存在,更难以 了解系统特性。这是系统层面的问题,但专业技 术领域可能更加严重。 安全科学相对而言较新,涉及到社会的方方 面面。与其他科学相同,其基础理论的建立需要 大量数据支持。虽然安全理论多数来源于相关学 科但也需要这些数据。人们对系统的要求是在规 定时间内、规定条件下完成预定功能,即系统的 可靠性;与之对应的是系统失效性。通常情况在 给定条件下,系统都具有可靠性。那么系统的可 靠状态是一种通常状态;当系统遇到意外作用时 可能出现失效状态。这种失效是人们关心的问 题,因此研究系统安全主要关注于系统失效 状态。 如上所述,对系统失效的研究也立足于数 据。系统运行时散发的数据可分为正常数据和异 常数据。可靠性和失效性就蕴含在这些数据之 中。失效性特征蕴含在异常数据,即故障数据 中,正常数据也有作用但不直接。因此研究系统 安全的主要基础就是故障数据。那么问题是如何 监测、收集、筛选、分析和处理故障数据。 本文不论述监测和收集问题,因为这些偏重 于硬件。当获得故障数据后如何处理才是关键问 题。系统故障一般具有因果关系,即哪些事件导 致了故障,故障又导致了哪些事件发生。因此安 全科学,特别是故障研究最终需要揭示故障之间 的因果关系。另一方面,处理故障数据的方法很 多,但目前最常用的是数理统计。数理统计之父 Karl Pearson 热衷于从基础数据归类得到表征变 量,然后使用这些变量研究事物的关系[16]。通过 2 个随机变量的联合分布表达它们之间的联系。 这当然取得了极大成功,奠定了数理统计基础。 但这种联系说明了何种问题?例如交通事故和时 间的对应分布关系,6:00~8:00 和 17:00~19:00 时间 范围内交通事故达到峰值,并正态分布。说明交 通事故与时间存在联系,但这种关系并非因果关 系。因为联合分布得到的因果关系具有双向性[16]。 即由甲推断乙,同时由乙也可以推断甲。那么这 个例子就变成了时间与交通事故存在联系,这显 然难以解释。在数理统计发展中也有类似争论。 以父亲身高推断儿子身高,发展相关椭圆的主轴 向自变量轴偏转说明具有遗传回归性,即儿子身 高与父亲身高相关;有人用儿子身高推断父亲身 高,得到了同样现象[16] ,说明儿子身高与父亲身高 互为因果。这使得 Pearson 的追随者们难以理解, 并从此在数理统计研究中回避这类问题,一直影 响到现在。 正如上述问题,交通事故与时间之间有一个 人流的因素,上班时间人流多,而人流多造成交 通事故多;父亲与儿子存在内在的基因联系,他 们的身高也与环境相关。因此只用数理统计方法 研究故障数据中的各种原因和故障关系是不充分 的。这将直接导致故障原因控制不当,甚至原因 本身就是错误的。正如本文提出的空间故障网络 理论描述系统故障演化过程得到的结论,原因和 结果之间可能存在多条通路,错误的因果分析将 造成通路上事件控制不能阻止结果发生。这是由 于没有分析故障发生的本质原因。 2 系统故障的相关性和关联性 相关性和关联性在日常生活中是相近甚至相 同的,但本文要进行区分。汪培庄教授[17] 提出的 因素空间理论是智能科学的数学基础。该理论认 为,关联性层次要高,存在于概念层面;而相关性 较低,存在于变量层面。因素空间中的“因”不是 原因而是影响因果关系的因素。故障的原因和结 果实际上是笼统的,其中蕴含了很多影响原因和 第 1 期 崔铁军,等:系统故障因果关系分析的智能驱动方式研究 ·93·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有