第11卷第5期 智能系统学报 Vol.11 No.5 2016年10月 CAAI Transactions on Intelligent Systems 0ct.2016 D0I:10.11992/is.201601024 网络出版地址:htp:/ww.cnki.net/kcms/detail/23.1538.TP.20160824.0929.014.html 基于度和聚类系数的中国航空网络重要性节点分析 闫玲玲12,陈增强123,张青3 (1.南开大学计算机与控制工程学院,天津300350:2.南开大学智能机器人技术天津市重点实验室,天津300350: 3.中国民航大学理学院,天津300300) 摘要:运用度中心性、接近中心性、介数中心性、特征向量中心性和半局部中心性5种方法,对中国航空网络进行节 点重要性排序:对重要节点分别进行蓄意攻击和随机攻击,采用脆弱性指标验证排序方法的有效性,仿真结果表明 介数中心性能够更准确地刻画中国航空网络中节点的重要性;在航空网络的背景下,将节点的直接影响力和节点邻 居之间连接的紧密程度结合起来,提出了一种基于度和聚类系数的新指标,经中国航空网络实例验证,该指标的评 价准确性仅次于介数中心性,但是其时间复杂度比介数中心性低很多。 关键词:航空网络:节点重要性:度:聚类系数:复杂网络 中图分类号:N94文献标志码:A文章编号:1673-4785(2016)05-0586-08 中文引用格式:闫玲玲,陈增强,张青.基于度和聚类系数的中国航空网络重要性节点分析[J].智能系统学报,2016,11(5):586 593. 英文引用格式:YAN Lingling,CHEN Zengqiang,ZHANG Qing.Analysis of Key Nodes in China's Aviation Network Based on the Degree Centrality Indicator and Clustering Coefficient[J].CAAI transactions on intelligent systems,2016,11(5):586-593. Analysis of key nodes in China's aviation network based on the degree centrality indicator and clustering coefficient YAN Lingling'2,CHEN Zengqiang'2.3,ZHANG Qing (1.College of Computer and Control Engineering,Nankai University,Tianjin 300350,China;2.Key Laboratory of Intelligent Robot- ics of Tianjin,Nankai University,Tianjin 300350,China;3.College of Science,Civil Aviation University of China,Tianjin 300300, China) Abstract:This paper determines the key nodes of China's aviation network based on degree centrality,closeness centrality,'betweenness'centrality,eigenvector centrality,semi-local centrality indicators,and then ranks these nodes in descending order of importance.Using a vulnerability index and reviewing risks from deliberate and ran- dom attack the effectiveness of the sorting methods is then evaluated.It is apparent from the corresponding vulnera- bility indices that the aviation network of China is most vulnerable to targeted attacks according to the betweenness centrality indicator.Moreover,based on the aviation network,this paper proposes a new evaluation method,which takes into account not only the number of neighbors,but also the clustering coefficient.Focusing on China's avia- tion network,the experimental results demonstrate that the evaluation accuracy of the new index ranks only second to the betweenness centrality,and is more efficient compared with betweenness centrality as regards time complexity. Keywords:aviation network;key nodes;degree;clustering coefficient;complex network 自20世纪初飞机问世以来,航空运输系统飞速 效、灵活的优势,尤其是在长距离运输和国际客运方 发展。与其他运输方式相比,航空运输具有及时、高 面的重要作用日益凸显[口。航空运输系统是一个 易受环境影响的开放的复杂系统,随着系统规模的 收稿日期:2016-01-15.网络出版日期:2016-08-24. 不断扩大,它在带给人们便利的同时也带来了一系 基金项目:国家自然科学基金项目(61573199):天津自然科学基金项目 列的问题。航班延误已经成为人们司空见惯的现 (14 JCYBJC18700). 通信作者:闫玲玲.E-mail:yanlingling(@mail.nankai.eu.cm 象,于是,在自然灾害或人为因素导致航班不能正常
第 11 卷第 5 期 智 能 系 统 学 报 Vol.11 №.5 2016 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2016 DOI:10.11992 / tis.201601024 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20160824.0929.014.html 基于度和聚类系数的中国航空网络重要性节点分析 闫玲玲1,2 ,陈增强1,2,3 ,张青3 (1.南开大学 计算机与控制工程学院,天津 300350; 2.南开大学 智能机器人技术天津市重点实验室,天津 300350; 3.中国民航大学 理学院, 天津 300300) 摘 要:运用度中心性、接近中心性、介数中心性、特征向量中心性和半局部中心性 5 种方法,对中国航空网络进行节 点重要性排序;对重要节点分别进行蓄意攻击和随机攻击,采用脆弱性指标验证排序方法的有效性,仿真结果表明 介数中心性能够更准确地刻画中国航空网络中节点的重要性;在航空网络的背景下,将节点的直接影响力和节点邻 居之间连接的紧密程度结合起来,提出了一种基于度和聚类系数的新指标,经中国航空网络实例验证,该指标的评 价准确性仅次于介数中心性,但是其时间复杂度比介数中心性低很多。 关键词:航空网络;节点重要性;度;聚类系数;复杂网络 中图分类号:N94 文献标志码:A 文章编号:1673⁃4785(2016)05⁃0586⁃08 中文引用格式:闫玲玲,陈增强,张青.基于度和聚类系数的中国航空网络重要性节点分析[ J]. 智能系统学报, 2016, 11(5): 586⁃ 593. 英文引用格式:YAN Lingling,CHEN Zengqiang,ZHANG Qing.Analysis of Key Nodes in Chinas Aviation Network Based on the Degree Centrality Indicator and Clustering Coefficient[J]. CAAI transactions on intelligent systems, 2016,11(5): 586⁃593. Analysis of key nodes in Chinas aviation network based on the degree centrality indicator and clustering coefficient YAN Lingling 1,2 , CHEN Zengqiang 1,2,3 , ZHANG Qing 3 (1. College of Computer and Control Engineering, Nankai University, Tianjin 300350, China; 2. Key Laboratory of Intelligent Robot⁃ ics of Tianjin, Nankai University, Tianjin 300350, China; 3. College of Science, Civil Aviation University of China, Tianjin 300300, China) Abstract:This paper determines the key nodes of China’ s aviation network based on degree centrality, closeness centrality, ‘betweenness’ centrality, eigenvector centrality, semi⁃local centrality indicators, and then ranks these nodes in descending order of importance. Using a vulnerability index and reviewing risks from deliberate and ran⁃ dom attack the effectiveness of the sorting methods is then evaluated. It is apparent from the corresponding vulnera⁃ bility indices that the aviation network of China is most vulnerable to targeted attacks according to the betweenness centrality indicator. Moreover, based on the aviation network, this paper proposes a new evaluation method, which takes into account not only the number of neighbors, but also the clustering coefficient. Focusing on China’s avia⁃ tion network, the experimental results demonstrate that the evaluation accuracy of the new index ranks only second to the betweenness centrality, and is more efficient compared with betweenness centrality as regards time complexity. Keywords:aviation network; key nodes; degree; clustering coefficient; complex network 收稿日期:2016⁃01⁃15. 网络出版日期:2016⁃08⁃24. 基金项目:国家自然科学基金项目(61573199);天津自然科学基金项目 (14JCYBJC18700). 通信作者:闫玲玲. E⁃mail:yanlingling@ mail.nankai.edu.cn. 自 20 世纪初飞机问世以来,航空运输系统飞速 发展。 与其他运输方式相比,航空运输具有及时、高 效、灵活的优势,尤其是在长距离运输和国际客运方 面的重要作用日益凸显[1] 。 航空运输系统是一个 易受环境影响的开放的复杂系统,随着系统规模的 不断扩大,它在带给人们便利的同时也带来了一系 列的问题。 航班延误已经成为人们司空见惯的现 象,于是,在自然灾害或人为因素导致航班不能正常
第5期 闫玲玲,等:基于度和聚类系数的中国航空网络重要性节点分析 ·587· 起降的突发情况下,航空运输系统能够保持其鲁棒 2E C(i)= 性,成为人们越来越关注的问题。 k(k:-1) 刘宏鲲等)研究表明,中国城市航空网络具有 式中:E是节点,的k:个邻节点之间实际存在的边 较大的聚类系数和较短的平均路径长度,其度分布 数,即节点:的k:个邻节点之间实际存在的邻居对 服从双段幂律分布,是一个具有小世界网络特性的 的数目。聚类系数表征在网络中某一节点的两个相 无标度网络:姚红光等[)通过仿真实验得出,中国 邻节点也相邻的概率,反映的是网络的集聚化程度。 航空网络在面对随机干扰时鲁棒性较强,而在蓄意 2无向网络节点重要性指标 攻击下鲁棒性较差:不同的城市节点对于网络鲁棒 性的贡献程度不同,目前有40余个核心城市在中国 在复杂网络领域里评价节点重要性的方法有很 航空网络中占有举足轻重的地位。 多,本质上都是源于图论和基于图的数据挖掘,主要 航空网络中,准确地评估和度量节点的重要性 分为以下3类:社会网络分析、系统科学分析、信息 在提高网络的可靠性与抗毁性方面扮演着非常重要 搜索领域分析)。其本质上都是源于图论以及基 的角色。在由城市节点和通航城市间的直飞航线所 于图的数据挖掘,主要从网络拓扑结构入手进行 构成的航空网络中,如果受突发事件的影响,某城 分析。 市节点陷入瘫痪,那么这就意味着同时取消了与该 社会网络分析方法起始于20世纪40年代末, 城市节点相连的所有的航线,从而有可能引发网络 在评价节点重要性的研究领域中是比较常见的。它 中其他通航城市之间的一些运输路径中断[4)。例 主要基于这样一种假设:“重要性等价于显著性”, 如,2015年7月11日,超强台风“灿鸿”逼近上海, 即节点的重要性等价于该节点与其他节点的连接而 受台风“灿鸿”影响,上海机场终端区的通行能力下 使其具有的显著性[6)。该方法主要以网络的拓扑 降50%左右,共计取消航班300多个架次。因此,准 结构为切入点,在不破坏网络连通性的前提下对重 确评估航空网络中的重要节点,并针对其可能发生 要节点进行研究,并且通常不考虑节点集的重要 的突发状况提前制定完备的候选方案和补救措施, 性[)。通过分析网络中的某种有用信息来区分不 可以有效避免网络因受到外界干扰而造成航班大面 同节点的重要性差异,其主要的分析指标包括节点 积延误,从而保证航空运输安全高效地运营。 的度(degree)、接近度(closeness)、介数(between- ness)、特征向量(eigenvector)等。 1理论基础 2.1度中心性 将航空网络抽象为一个由点集V=[12…n] 度中心性(degree centrality)[s),就是按照度值 和边集E=[e1e2…em]组成的无向图G=[VE],顶 的大小对节点进行排列。它是网络中刻画节点重要 点数记为N=1VI,边数记为M=IE1。图的邻接矩 性最简单而又非常重要的指标。具有相同度值的节 阵记为Axn=(a),当且仅当节点:与之间有连 点在不同规模的网络中的重要程度是不同的,因此 边时ag=1,否则ag=0。 为了便于比较,将节点的度中心性进行归一化处理: 定义1无向网络中节点,的度k,是指与节点 k: 直接相连的边的数目。它与节点的重要程度有很大 upe(i)=N-1 的关系。一般而言,k的值越大,节点就越重要。其 显然,度中心性描述的是节点对于其邻居节点 表达形式为 的直接影响力,它认为一个节点的度值越大,与之有 直接联系的邻居就越多,也就越重要)。这种方法 k=工ag j=1 简单直观,计算的复杂度低,但是它仅仅考虑了节点 定义2节点距离定义为连接这两个节点的最 的最局部的信息,具有非常大的片面性,没有办法准 短路径上的边的数目,用d表示。 确地刻画网络中节点的重要程度。例如,“桥节点” 定义3网络的平均路径长度L定义为任意两 虽然只有两条边相连,但是在网络中处于重要的核 个节点之间距离的平均值,即 心地位。 2 2.2接近中心性 L=- ΓN(N-1) 接近中心性(closeness centrality)[ioj反映的是 定义4网络中一个度为k:的节点:的聚类系 节点在网络中居于中心的程度。它的基本思想是如 数C()定义为 果一个节点能很容易地与所有其他节点进行互动
起降的突发情况下,航空运输系统能够保持其鲁棒 性,成为人们越来越关注的问题。 刘宏鲲等[2]研究表明,中国城市航空网络具有 较大的聚类系数和较短的平均路径长度,其度分布 服从双段幂律分布,是一个具有小世界网络特性的 无标度网络; 姚红光等[3] 通过仿真实验得出,中国 航空网络在面对随机干扰时鲁棒性较强,而在蓄意 攻击下鲁棒性较差;不同的城市节点对于网络鲁棒 性的贡献程度不同,目前有 40 余个核心城市在中国 航空网络中占有举足轻重的地位。 航空网络中,准确地评估和度量节点的重要性 在提高网络的可靠性与抗毁性方面扮演着非常重要 的角色。 在由城市节点和通航城市间的直飞航线所 构成的航空网络中, 如果受突发事件的影响,某城 市节点陷入瘫痪,那么这就意味着同时取消了与该 城市节点相连的所有的航线,从而有可能引发网络 中其他通航城市之间的一些运输路径中断[4] 。 例 如,2015 年 7 月 11 日,超强台风“灿鸿”逼近上海, 受台风“灿鸿”影响,上海机场终端区的通行能力下 降 50%左右,共计取消航班 300 多个架次。 因此,准 确评估航空网络中的重要节点,并针对其可能发生 的突发状况提前制定完备的候选方案和补救措施, 可以有效避免网络因受到外界干扰而造成航班大面 积延误,从而保证航空运输安全高效地运营。 1 理论基础 将航空网络抽象为一个由点集 V= [v1 v2… vn ] 和边集 E= [e1 e2… em ]组成的无向图 G = [V E],顶 点数记为 N= |V| ,边数记为 M = | E | 。 图的邻接矩 阵记为 An×n = (aij),当且仅当节点 vi 与 vj 之间有连 边时 aij = 1,否则 aij = 0。 定义 1 无向网络中节点 vi 的度 ki 是指与节点 直接相连的边的数目。 它与节点的重要程度有很大 的关系。 一般而言,ki 的值越大,节点就越重要。 其 表达形式为 ki = ∑ N j = 1 aij 定义 2 节点距离定义为连接这两个节点的最 短路径上的边的数目,用 dij表示。 定义 3 网络的平均路径长度 L 定义为任意两 个节点之间距离的平均值,即 L = 2 N(N - 1)∑i≥j dij 定义 4 网络中一个度为 ki 的节点 vi 的聚类系 数C(i)定义为 C(i) = 2Ei ki(ki - 1) 式中:Ei 是节点 vi 的 ki 个邻节点之间实际存在的边 数,即节点 vi 的 ki 个邻节点之间实际存在的邻居对 的数目。 聚类系数表征在网络中某一节点的两个相 邻节点也相邻的概率,反映的是网络的集聚化程度。 2 无向网络节点重要性指标 在复杂网络领域里评价节点重要性的方法有很 多,本质上都是源于图论和基于图的数据挖掘,主要 分为以下 3 类:社会网络分析、系统科学分析、信息 搜索领域分析[5] 。 其本质上都是源于图论以及基 于图的数据挖掘,主要从网络拓扑结构入手进行 分析。 社会网络分析方法起始于 20 世纪 40 年代末, 在评价节点重要性的研究领域中是比较常见的。 它 主要基于这样一种假设:“重要性等价于显著性”, 即节点的重要性等价于该节点与其他节点的连接而 使其具有的显著性[6] 。 该方法主要以网络的拓扑 结构为切入点,在不破坏网络连通性的前提下对重 要节点进行研究,并且通常不考虑节点集的重要 性[7] 。 通过分析网络中的某种有用信息来区分不 同节点的重要性差异,其主要的分析指标包括节点 的度( degree)、接近度( closeness)、介数( between⁃ ness)、特征向量(eigenvector)等。 2.1 度中心性 度中心性( degree centrality) [8] ,就是按照度值 的大小对节点进行排列。 它是网络中刻画节点重要 性最简单而又非常重要的指标。 具有相同度值的节 点在不同规模的网络中的重要程度是不同的,因此 为了便于比较,将节点的度中心性进行归一化处理: μDC(i) = ki N - 1 显然,度中心性描述的是节点对于其邻居节点 的直接影响力,它认为一个节点的度值越大,与之有 直接联系的邻居就越多,也就越重要[9] 。 这种方法 简单直观,计算的复杂度低,但是它仅仅考虑了节点 的最局部的信息,具有非常大的片面性,没有办法准 确地刻画网络中节点的重要程度。 例如,“桥节点” 虽然只有两条边相连,但是在网络中处于重要的核 心地位。 2.2 接近中心性 接近中心性( closeness centrality) [10] 反映的是 节点在网络中居于中心的程度。 它的基本思想是如 果一个节点能很容易地与所有其他节点进行互动, 第 5 期 闫玲玲,等:基于度和聚类系数的中国航空网络重要性节点分析 ·587·
·588 智能系统学报 第11卷 那么它就处在网络的中心位置,也就是说它到其他 那么这个节点就越有影响力。与此同时,这也意味 所有节点的距离要足够短。因此,接近中心性可以 着该节点更容易发生拥塞,成为网络的瓶颈。介数 用最短距离来刻画。假设节点:和:之间的最短 中心性能够非常准确地找到网络中“流量”大的节 距离记为d,则可以计算任意一个节点心,到网络中 点,但是它的时间复杂度为O(N3),计算效率低,对 其他节点的平均最短距离: 于大型的网络并不适用 1 4w-A4, 2.4特征向量中心性 特征向量中心性(eigenvector centrality)[]是评 于是节点v的接近中心性定义为山的倒数,即: 价网络中节点重要性的一个重要指标。前面介绍的 ucc(i)= 1-N-1 几种方法把周围的邻居节点视为同等重要,仅仅从 d ∑dg (1) 邻居节点的数量上来考虑节点的重要性。而特征向 iz 该定义只能在连通的网络中使用,因此文献 量中心性同时兼顾了邻居节点的数量和质量对节点 [11]对上式进行了改进,使其能够用于非连通网络 重要性的影响,认为一个节点的重要性不仅取决于 中,即: 该节点邻居的数量,而且取决于每个邻居节点的重 要程度。特征向量中心性指标是指网络邻接矩阵对 h(i)=∑ 应其最大特征值的特征向量,即: 如果节点:和v,之间没有路径可达,则定义 4a(0= d,=o,即1/d,=0。 j=1 由上式可知,节点的接近中心性越大,表明该节 式中:入为邻接矩阵A的最大特征值,e= [e,e2…en]T为邻接矩阵A的最大特征值A对应的 点越接近网络的中心位置,那么它在网络中就越重 特征向量。 要。这一类节点与其他节点的联系并非最多,但是 2.5半局部中心性 与网络中其他节点的距离总和最短,也就是该节点 在以上提出的几种方法中,度中心性虽然简单 在网络中具有最佳视野,可以察知网络中所发生的 直观,计算的复杂度低,但只考虑了局部信息,并不 事情以及信息的流通方向。与前面的度中心性相 能准确刻画节点的重要程度。介数中心性和接近中 比,接近中心性更能反映网络的全局结构,但是这种 心性等基于全局信息的指标,虽然能够准确的定义 方法的计算复杂度较高,并且对网络的拓扑结构具 重要节点,但是由于其计算的复杂性,不能应用于大 有依赖性,例如它可以准确地发现星形网络结构的 规模的复杂网络。为了兼顾算法的准确度和计算效 中心节点,但是并不适用于随机网络。 率,Chent)等选取网络中节点的四阶邻居信息,提 2.3介数中心性 出了基于半局部信息的节点重要性排序方法,称为 介数中心性[(betweenness centrality)一般是 半局部中心性(semi-local centrality)。 指最短路径介数中心性(shortest path BC)。简单地 半局部中心性uc(i)定义为 讲,它刻画了节点对网络中沿最短路径传输的网络 流的控制力,很好地描述了网络中节点可能需要承 QG)=ΣN(o) wer(j) 载的流量。 uc(i)=∑QG) 节点:的介数定义为 jer(i) 式中:T()表示节点:的一阶邻居节点的集合, hc(i)=∑S N(心)指从出发两步内可以到达的邻居的数目, ifs,in1s1 8st 称为节点v的两层邻居度。 式中:8.代表从节点),到v,的所有最短路径的数 相比于度中心性的一阶邻居信息,半局部中心 目,g代表从节点巴到,的g条最短路径中经过 性考虑了节点的四阶邻居信息,因此其准确性比度 的最短路径的数目。在包含n个节点的连通网络 中心性更好。于此同时,计算N(w)只需要遍历节 中,一个节点的介数最大可能取值为星形网络中心 点:.的两层邻居节点,因此其计算的复杂度相较于 节点的介数值,即(n-1)(n-2)/2。于是可以对节 介数中心性和接近中心性更低。 点心:的介数进行归一化处理: 3中国航空网络重要性节点分析 40=n-a-2 2 g 3.1网络构建与结构特性 节点的介数值越高,表明流经它的网络流越多, 以中国民用航空局官方网站公布的夏秋航季客
那么它就处在网络的中心位置,也就是说它到其他 所有节点的距离要足够短。 因此,接近中心性可以 用最短距离来刻画。 假设节点 vi 和 vj 之间的最短 距离记为 dij,则可以计算任意一个节点 vi 到网络中 其他节点的平均最短距离: di = 1 N - 1∑ j≠i dij 于是节点 vi 的接近中心性定义为 di 的倒数,即: μCC(i) = 1 di = N - 1 ∑ j≠i dij (1) 该定义只能在连通的网络中使用,因此文献 [11]对上式进行了改进,使其能够用于非连通网络 中,即: μCC(i) = ∑ N j = 1 1 dij 如果节点 vi 和 vj 之间没有路径可达,则定义 dij =¥,即 1 / dij = 0。 由上式可知,节点的接近中心性越大,表明该节 点越接近网络的中心位置,那么它在网络中就越重 要。 这一类节点与其他节点的联系并非最多,但是 与网络中其他节点的距离总和最短,也就是该节点 在网络中具有最佳视野,可以察知网络中所发生的 事情以及信息的流通方向。 与前面的度中心性相 比,接近中心性更能反映网络的全局结构,但是这种 方法的计算复杂度较高,并且对网络的拓扑结构具 有依赖性,例如它可以准确地发现星形网络结构的 中心节点,但是并不适用于随机网络。 2.3 介数中心性 介数中心性[12] ( betweenness centrality) 一般是 指最短路径介数中心性(shortest path BC)。 简单地 讲,它刻画了节点对网络中沿最短路径传输的网络 流的控制力,很好地描述了网络中节点可能需要承 载的流量。 节点 vi 的介数定义为 μBC(i) = i≠s∑,i≠t,s≠t g i st gst 式中:gst 代表从节点 vs 到 vt 的所有最短路径的数 目,g i st代表从节点 vs 到 vt 的 gst条最短路径中经过 vi 的最短路径的数目。 在包含 n 个节点的连通网络 中,一个节点的介数最大可能取值为星形网络中心 节点的介数值,即( n-1) ( n-2) / 2。 于是可以对节 点 vi 的介数进行归一化处理: μBC ′(i) = 2 (n - 1)(n - 2)∑ g i st gst 节点的介数值越高,表明流经它的网络流越多, 那么这个节点就越有影响力。 与此同时,这也意味 着该节点更容易发生拥塞,成为网络的瓶颈。 介数 中心性能够非常准确地找到网络中“流量” 大的节 点,但是它的时间复杂度为 O(N 3 ),计算效率低,对 于大型的网络并不适用。 2.4 特征向量中心性 特征向量中心性( eigenvector centrality) [8] 是评 价网络中节点重要性的一个重要指标。 前面介绍的 几种方法把周围的邻居节点视为同等重要,仅仅从 邻居节点的数量上来考虑节点的重要性。 而特征向 量中心性同时兼顾了邻居节点的数量和质量对节点 重要性的影响,认为一个节点的重要性不仅取决于 该节点邻居的数量, 而且取决于每个邻居节点的重 要程度。 特征向量中心性指标是指网络邻接矩阵对 应其最大特征值的特征向量,即: μEC(i) = λ -1∑ N j = 1 aij ej 式中: λ 为 邻 接 矩 阵 A 的 最 大 特 征 值, e = [e1 e2… en ] T 为邻接矩阵 A 的最大特征值 λ 对应的 特征向量。 2.5 半局部中心性 在以上提出的几种方法中,度中心性虽然简单 直观,计算的复杂度低,但只考虑了局部信息,并不 能准确刻画节点的重要程度。 介数中心性和接近中 心性等基于全局信息的指标,虽然能够准确的定义 重要节点,但是由于其计算的复杂性,不能应用于大 规模的复杂网络。 为了兼顾算法的准确度和计算效 率,Chen [13]等选取网络中节点的四阶邻居信息,提 出了基于半局部信息的节点重要性排序方法,称为 半局部中心性(semi⁃local centrality)。 半局部中心性 μSLC(i)定义为 Q(j) = w∑∈Γ(j) N(w) μSLC(i) = j∈∑Γ(i) Q(j) 式中:Γ( j) 表示节点 vj 的一阶邻居节点的集合, N(w)指从 vw 出发两步内可以到达的邻居的数目, 称为节点 vw 的两层邻居度。 相比于度中心性的一阶邻居信息,半局部中心 性考虑了节点的四阶邻居信息,因此其准确性比度 中心性更好。 于此同时,计算 N(w)只需要遍历节 点 vw 的两层邻居节点,因此其计算的复杂度相较于 介数中心性和接近中心性更低。 3 中国航空网络重要性节点分析 3.1 网络构建与结构特性 以中国民用航空局官方网站公布的夏秋航季客 ·588· 智 能 系 统 学 报 第 11 卷
第5期 闫玲玲,等:基于度和聚类系数的中国航空网络重要性节点分析 ·589. 运航线相关数据为样本构建中国航空网络模型,其 109 中机场所在的城市为网络节点,通航城市之间的直 飞航线为网络的边。这样形成了148个节点,1153 10- 条无向边(2306条航线)的中国航空网络(见 图1)。将中国航空网络用一个148×148的邻接矩 10 阵A表示,如果节点:和之间有可达的航班,则 a=1;反之a=0,于是得到一个对称矩阵。 10 10 10 10 10 节点的度k 图2中国航空网络城市节点度分布 Fig.2 Degree distribution of Chinese aviation network 1.0* 0.9 0.8 0.7 0.6 0.5 0.4 t. 0.3 0.2 0 图1中国航空网络结构图 0 20 406080100120 Fig.1 The structure of Chinese aviation network 节点的度k 在此需要说明的是: 1)网络中所选的航线均为往返航线,因此在后 图3中国航空网络城市节点度与聚类系数相关性 期运算过程中不需要考虑航线的方向问题: Fig.3 Correlation between degree and clustering coeffi- cient of Chinese aviation network 2)对于拥有两个及以上机场的城市,将其数据 3.2中国航空网络重要性节点排序 进行合并,如上海的浦东机场和虹桥机场的数据可 下面用本文中提到的几种无向网络节点重要性 统一合并成到城市节点“上海”中。 评价指标中国航空网络模型的节点重要程度进行排 节点的度、平均路径长度和聚类系数是描述复 序,排序结果见表1。 杂网络拓扑结构最基本的特征参量。本文使用的中 节点的度反映了该机场与其他机场通航能力的 国航空网络样本,平均度为15.58,也就是说平均每 大小。中国航空网络的度分布呈现出明显的东西差 个城市机场约与其他16个城市有直接的航空联系: 异,结合中国航空网网络的空间结构,从表1中可以 Pearson相关系数[r=-0.3843,说明中国航空网 看出,度值较大的节点主要集中东部较发达地区,如 络是度一度负相关的,度值大的节点更倾向于和度 北京(102)、上海(83)、广州(83)、深圳(69)、杭州 值小的节点相连接。平均路径长度为2.2165,意味 (52)、南京(51)以及各个省会城市,如成都(61)、西 着任意两个城市机场通过不到2次转机就可以相互 安(56)、昆明(56)、重庆(56)。 连通;聚类系数为0.6877,表现出较强集聚性,说明 接近中心性是用网络中的节点到其他节点的平 中国航空网络各节点城市之间更倾向于形成短距离 均最短距离来衡量的,因此接近中心性越小,意味着 的联系5]。由此可见,中国航空网络具有较大的聚 该节点在网络中越处于中心地位,从而也就越不容 类系数和较小的平均路径长度,表现出了小世界网 易受到其他结点连通情况的控制。也就是说,接近 络特性。而图2表明,中国航空网络服从双幂律分 中心性数值较大的机场相对于数值较小的机场独立 布,具有无标度特性。 性更强,不太容易受到其他机场通航状况的影响。 中国航空网络城市节点度与聚类系数相关性如 而接近中心性TopI0的节点排序结果基本上跟度中 图3所示。可以看出,随着节点度值k的不断增加, 心性保持一致,都表现出明显的东西差异,这一点在 聚类系数C(k)的数值是不断下降的,也就是说节点 特征向量中心性和半局部中心性中都有所体现。 的度和聚类系数呈负相关。这说明在中国航空网络 节点的介数中心性反映了该机场在网络运输中 中,度值小的城市节点比度值大的城市节点更趋向 的中转和衔接能力。介数中心性高的节点在地区网 于聚集成团
运航线相关数据为样本构建中国航空网络模型,其 中机场所在的城市为网络节点,通航城市之间的直 飞航线为网络的边。 这样形成了 148 个节点,1 153 条无向边 ( 2 306 条航线) 的中国航空网 络 ( 见 图 1)。 将中国航空网络用一个 148×148 的邻接矩 阵 A 表示,如果节点 vi 和 vj 之间有可达的航班,则 aij = 1;反之 aij = 0,于是得到一个对称矩阵。 图 1 中国航空网络结构图 Fig.1 The structure of Chinese aviation network 在此需要说明的是: 1)网络中所选的航线均为往返航线,因此在后 期运算过程中不需要考虑航线的方向问题; 2)对于拥有两个及以上机场的城市,将其数据 进行合并,如上海的浦东机场和虹桥机场的数据可 统一合并成到城市节点“上海”中。 节点的度、平均路径长度和聚类系数是描述复 杂网络拓扑结构最基本的特征参量。 本文使用的中 国航空网络样本,平均度为 15.58,也就是说平均每 个城市机场约与其他 16 个城市有直接的航空联系; Pearson 相关系数[14] r = -0.384 3,说明中国航空网 络是度—度负相关的,度值大的节点更倾向于和度 值小的节点相连接。 平均路径长度为 2.216 5,意味 着任意两个城市机场通过不到 2 次转机就可以相互 连通;聚类系数为 0.687 7,表现出较强集聚性,说明 中国航空网络各节点城市之间更倾向于形成短距离 的联系[15] 。 由此可见,中国航空网络具有较大的聚 类系数和较小的平均路径长度,表现出了小世界网 络特性。 而图 2 表明,中国航空网络服从双幂律分 布,具有无标度特性。 中国航空网络城市节点度与聚类系数相关性如 图 3 所示。 可以看出,随着节点度值 k 的不断增加, 聚类系数 C(k)的数值是不断下降的,也就是说节点 的度和聚类系数呈负相关。 这说明在中国航空网络 中,度值小的城市节点比度值大的城市节点更趋向 于聚集成团。 图 2 中国航空网络城市节点度分布 Fig.2 Degree distribution of Chinese aviation network 图 3 中国航空网络城市节点度与聚类系数相关性 Fig.3 Correlation between degree and clustering coeffi⁃ cient of Chinese aviation network 3.2 中国航空网络重要性节点排序 下面用本文中提到的几种无向网络节点重要性 评价指标中国航空网络模型的节点重要程度进行排 序,排序结果见表 1。 节点的度反映了该机场与其他机场通航能力的 大小。 中国航空网络的度分布呈现出明显的东西差 异,结合中国航空网网络的空间结构,从表 1 中可以 看出,度值较大的节点主要集中东部较发达地区,如 北京 (102)、上海(83)、广州(83)、深圳(69)、杭州 (52)、南京(51)以及各个省会城市,如成都(61)、西 安(56)、昆明(56)、重庆(56)。 接近中心性是用网络中的节点到其他节点的平 均最短距离来衡量的,因此接近中心性越小,意味着 该节点在网络中越处于中心地位,从而也就越不容 易受到其他结点连通情况的控制。 也就是说,接近 中心性数值较大的机场相对于数值较小的机场独立 性更强,不太容易受到其他机场通航状况的影响。 而接近中心性 Top10 的节点排序结果基本上跟度中 心性保持一致,都表现出明显的东西差异,这一点在 特征向量中心性和半局部中心性中都有所体现。 节点的介数中心性反映了该机场在网络运输中 的中转和衔接能力。 介数中心性高的节点在地区网 第 5 期 闫玲玲,等:基于度和聚类系数的中国航空网络重要性节点分析 ·589·
·590. 智能系统学报 第11卷 络间的连接中起到了桥梁的作用。中国航空网络节 排在第七位。从空间结构上可以看出新疆地区的城市 点的介数中心性排序中,北京依然排在第1位,但是 节点大多数通过乌鲁木齐与整个航空网络连接,若移 排在第2位的乌鲁木齐在其他排序结果的前十中从 除乌鲁木齐,则新疆地区的大部分城市节点将变为孤 未出现过,排在第3位的昆明只在度中心性排序中 立节点,而昆明也同样起到非常重要的桥梁作用。 表1排名前10中国航空网络各中心性指标 Table 1 The Top10 centrality index of Chinese aviation network 介数中心性 特征向量 半局部中心性 次序城市 度中心性 城市接近中心性 城市 城市 城市 (×103) 中心性 (×10) 1北京 0.694 北京 0.762 北京 4.475 北京 0.220 北京 0.281 2上海 0.565 上海 0.693 乌鲁木齐 2.835 广州 0.207 广州 0.268 3广州 0.565 广州 0.693 昆明 2.353 上海 0.207 上海 0.267 4深圳 0.470 深圳 0.650 广州 2.231 深圳 0.196 深圳 0.257 5成都 0.415 成都 0.628 上海 2.223 成都 0.184 成都 0.245 6西安 0.381 西安 0.615 成都 1.565 南京 0.180 南京 0.242 7昆明 0.381 重庆 0.610 西安 1.508 杭州 0.178 杭州 0.240 8重庆 0.374 杭州 0.603 深圳 1.121 重庆 0.174 重庆 0.233 9杭州 0.354 南京 0.603 重庆 0.825 长沙 0.172 长沙 0.232 10南京 0.347 长沙 0.598 长沙 0.790 郑州 0.170 郑州 0.231 3.3用网络的鲁棒性和脆弱性评价排序算法 V=1/2-R 利用之前的节点重要性评价方法对中国航空网 可见,脆弱性指标的值越大,表明采用的攻击方 络的重要节点进行排序之后,分别按照节点的重要 法效果越好。于是,分别采用度中心性、接近中心 性从大到小的顺序,依次删除网络中的节点。则节 性、介数中心性、特征向量中心性和半局部中心性5 点移除后网络的破坏程度可以用最大连通子图的相 种方法对中国航空网络进行攻击,画出/n和 对大小,全局效率以及脆弱性指标来进行评价。 σ(i/n)在二维坐标上的曲线,并用脆弱性指标考察 最大连通子图概念的提出,是为了描述网络中 这5种方法的攻击效果,同时与随机攻击网络的方 的节点或连边由于一些内部或外部的原因所发生的 法得到的效果进行比较。 变化。简单来说,最大连通子图就是一个网络的众 图4为对中国航空网络模型分别进行随机攻击 多连通子图中包含节点最多的那个子图。 和蓄意攻击后,网络中移除节点的比例和最大连通 网络中,节点:和:之间的效率为两点之间最 集的规模之间的关系。在此需要说明的是,采用的 短距离的倒数,即1/d。于是网络的全局效率16就 攻击方式是同时移除i/n比例的节点,计算剩余网 定义为所有节点对效率的平均值,即 络中最大连通集所占的比例。 EG=2-m多 1 1.0 0.9 如果用i/n表示移除的节点比例,用c(i/n)表 0.8 0.7 示移除i/n比例的节点后最大连通子图的相对大 0.6 0.5 小,则该节点移除方式下网络的鲁棒性(robustness) 04 可以用R-指标)来评价。具体定义为 0.3 0.2 R=(i/m) n i=1 00.10.20.30.40.50.60.70.80.91.0 显然,无论针对哪种算法都能得到如下结果 移除节点的比例n 1-1/m 注释:1.度数中心性(0.3603):2.介数中心性(v,0.4787) R = 2 完全图 3.接近中心性(v=0.341:4.半局部中心性(y=0.314: 5.特征向量中心性(v0.3119):6.随机攻击(,0.0243) 。11 星形图 图4移除节点比例和最大连通集规模的关系(传统方 法的攻击效果】 所以在任何网络中,无论用何种算法移除节点, Fig.4 The relationship between the proportion of removed R∈(0,1/2)。因此,文献[18]定义V-指标来衡量网 nodes and the scale of the largest connected compo- 络对所实施的节点移除方法的脆弱性(vulnerability)。 nent (Effect of traditional attack methods)
络间的连接中起到了桥梁的作用。 中国航空网络节 点的介数中心性排序中,北京依然排在第 1 位,但是 排在第 2 位的乌鲁木齐在其他排序结果的前十中从 未出现过,排在第 3 位的昆明只在度中心性排序中 排在第七位。 从空间结构上可以看出新疆地区的城市 节点大多数通过乌鲁木齐与整个航空网络连接,若移 除乌鲁木齐,则新疆地区的大部分城市节点将变为孤 立节点,而昆明也同样起到非常重要的桥梁作用。 表 1 排名前 10 中国航空网络各中心性指标 Table 1 The Top10 centrality index of Chinese aviation network 次序 城市 度中心性 城市 接近中心性 城市 介数中心性 (×10 3 ) 城市 特征向量 中心性 城市 半局部中心性 (×10 6 ) 1 北京 0.694 北京 0.762 北京 4.475 北京 0.220 北京 0.281 2 上海 0.565 上海 0.693 乌鲁木齐 2.835 广州 0.207 广州 0.268 3 广州 0.565 广州 0.693 昆明 2.353 上海 0.207 上海 0.267 4 深圳 0.470 深圳 0.650 广州 2.231 深圳 0.196 深圳 0.257 5 成都 0.415 成都 0.628 上海 2.223 成都 0.184 成都 0.245 6 西安 0.381 西安 0.615 成都 1.565 南京 0.180 南京 0.242 7 昆明 0.381 重庆 0.610 西安 1.508 杭州 0.178 杭州 0.240 8 重庆 0.374 杭州 0.603 深圳 1.121 重庆 0.174 重庆 0.233 9 杭州 0.354 南京 0.603 重庆 0.825 长沙 0.172 长沙 0.232 10 南京 0.347 长沙 0.598 长沙 0.790 郑州 0.170 郑州 0.231 3.3 用网络的鲁棒性和脆弱性评价排序算法 利用之前的节点重要性评价方法对中国航空网 络的重要节点进行排序之后,分别按照节点的重要 性从大到小的顺序,依次删除网络中的节点。 则节 点移除后网络的破坏程度可以用最大连通子图的相 对大小,全局效率以及脆弱性指标来进行评价。 最大连通子图概念的提出,是为了描述网络中 的节点或连边由于一些内部或外部的原因所发生的 变化。 简单来说,最大连通子图就是一个网络的众 多连通子图中包含节点最多的那个子图。 网络中,节点 vi 和 vj 之间的效率为两点之间最 短距离的倒数,即 1 / dij。 于是网络的全局效率[16]就 定义为所有节点对效率的平均值,即 E(G) = 2 N(N - 1)∑i > j 1 dij 如果用 i / n 表示移除的节点比例,用 σ(i / n)表 示移除 i / n 比例的节点后最大连通子图的相对大 小,则该节点移除方式下网络的鲁棒性(robustness) 可以用 R⁃指标[17]来评价。 具体定义为 R = 1 n ∑ n i = 1 σ(i / n) 显然,无论针对哪种算法都能得到如下结果 Rmax = 1 - 1 / n 2 , 完全图 Rmin = 1 n - 1 n 2 , 星形图 ì î í ï ï ï ï 所以在任何网络中,无论用何种算法移除节点, R∈(0,1/ 2)。 因此,文献[18]定义 V⁃指标来衡量网 络对所实施的节点移除方法的脆弱性(vulnerability)。 V = 1 / 2 - R 可见,脆弱性指标的值越大,表明采用的攻击方 法效果越好。 于是,分别采用度中心性、接近中心 性、介数中心性、特征向量中心性和半局部中心性 5 种方 法 对 中 国 航 空 网 络 进 行 攻 击, 画 出 i / n 和 σ(i / n)在二维坐标上的曲线,并用脆弱性指标考察 这 5 种方法的攻击效果,同时与随机攻击网络的方 法得到的效果进行比较。 图 4 为对中国航空网络模型分别进行随机攻击 和蓄意攻击后,网络中移除节点的比例和最大连通 集的规模之间的关系。 在此需要说明的是,采用的 攻击方式是同时移除 i / n 比例的节点,计算剩余网 络中最大连通集所占的比例。 图 4 移除节点比例和最大连通集规模的关系(传统方 法的攻击效果) Fig.4 The relationship between the proportion of removed nodes and the scale of the largest connected compo⁃ nent (Effect of traditional attack methods) ·590· 智 能 系 统 学 报 第 11 卷
第5期 闫玲玲,等:基于度和聚类系数的中国航空网络重要性节点分析 ·591· 从图4可以看出,相比于蓄意攻击,随机攻击呈 表3机场失效后网络的全局传输效率 现的攻击效果较差,这表明中国航空网络对于随机 Table 3 The global transmission efficiency of the network 攻击具有较好的鲁棒性。在蓄意攻击的仿真实验 with the failure of airport 中,基于介数攻击下的指标下降率远远高于基于其 次序城市 (i/n) E △E/Eo 北京 0.993 0.479 0.047 他4种方法攻击下的指标下降率,而且下降速度很 2乌鲁木齐 0.966 0.466 0.077 快,呈陡峭直线下降趋势。这表明针对中国航空网 3 昆明 0.960 0.464 0.079 络,基于介数中心性的节点重要性排序方法效果是 4 广州 0.987 0.483 0.037 上海 0.987 0.484 0.035 最好的,介数中心性能够更准确地刻画网络中节点 6 成都 0.980 0.480 0.045 的重要性。 7 西安 0.980 0.480 0.043 基于各种攻击方法的中国航空网络脆弱性指标 8 深圳 0.993 0.491 0.022 排序在表2中给出,对比发现,蓄意攻击下的脆弱性 9 重庆 0.993 0.491 0.020 10 长沙 0.980 0.482 0.040 指标远远高于随机攻击。在蓄意攻击中,介数中心 11呼和浩特 0.993 0.493 0.017 性的指标V。明显高于其他4种,排名第4的半局部 12 贵阳 0.987 0.488 0.026 中心性和排名第5的特征向量中心性在数值上比较 13 沈阳 0.993 0.493 0.018 14 接近。此外,从最大连通集的曲线图中也不难发现, 哈尔滨 0.987 0.489 0.026 15 大连 0.993 0.493 0.018 半局部中心性和特征向量中心性的曲线是非常相近 6 杭州 0.993 0.492 0.019 的。这就证明对于中国航空网络,半局部中心性和 17 合肥 0.987 0.488 0.026 特征向量中心性的评价方法效果类似。 18 长春 0.987 0.489 0.025 19 厦门 0.993 0.492 0.018 表2中国航空网络脆弱性指标排序 20 桂林 0.993 0.493 0.018 Table 2 The ranking of vulnerability index of Chinese avi- 用σ(i/n)表示移除i/n比例的节点后最大连 ation network 通子图的相对大小,E为网络的全局效率,E。为原 次序 攻击方法 脆弱性指标 始网络的全局效率,△E为网络减少的效率。结果表 1 介数中心性 0.479 明,昆明机场的移除对网络的全局效率影响最大,其 2 度中心性 0.360 次是乌鲁木齐和北京。这也就进一步说明,昆明和 3 接近中心性 0.341 乌鲁木齐在中国航空网络中的影响力不容小觑,从 半局部中心性 0.314 而验证了介数中心性指标的准确性。 这些城市在空间结构上基本上覆盖了中东部各 特征向量中心性 0.312 地区,进一步观察局部地区的机场影响力情况,得到 6 随机攻击 0.024 各个地区影响力最强的机场城市:华北地区一北 另外,值得注意的是,当采用介数中心性对网络 京、华东地区—上海、华中地区—长沙、华南地 进行攻击的时候,曲线一开始就陡然下降,这一现象 区一广州、西北地区一乌鲁木齐、西南地区— 在其他攻击方法下并没有出现。单独观察介数攻击 昆明以及东北地区—哈尔滨。 下网络的变化,发现在对北京进行攻击之后,网络的 4 簇度指标的提出 最大连通子图相对大小为0.993,而当对乌鲁木齐进 行攻击之后,网络的最大连通子图相对大小骤然下 在航空网络的背景下,介数中心性能够准确评 降至0.047,网络几乎陷入瘫痪状态,这表明类似于 价网络中节点的重要性,但其算法的时间复杂度较 高,使其在实际应用中受到限制。 乌鲁木齐这样的“桥”节点对于网络鲁棒性的影响 研究表明,除了节点邻居的直接影响力之外,邻 举足轻重。 居之间相互联系的紧密程度在节点的重要性评价中 根据脆弱性指标判断,介数中心性能够更准确 也起着至关重要的作用。Ugander等[i9对Facebook 地描述节点的重要性,因此取基于介数中心性方法 上一个用户收到某个邮件联系人的邀请信而成为 排列出的前20名节点城市,分别单独移除这些节 Facebook用户情况进行了分析,发现影响节点重要 点,用分析对网络造成的影响,具体数据见表3。 性的决定性因素不是邻居节点的数目,而是邻居节
从图 4 可以看出,相比于蓄意攻击,随机攻击呈 现的攻击效果较差,这表明中国航空网络对于随机 攻击具有较好的鲁棒性。 在蓄意攻击的仿真实验 中,基于介数攻击下的指标下降率远远高于基于其 他 4 种方法攻击下的指标下降率,而且下降速度很 快,呈陡峭直线下降趋势。 这表明针对中国航空网 络,基于介数中心性的节点重要性排序方法效果是 最好的,介数中心性能够更准确地刻画网络中节点 的重要性。 基于各种攻击方法的中国航空网络脆弱性指标 排序在表 2 中给出,对比发现,蓄意攻击下的脆弱性 指标远远高于随机攻击。 在蓄意攻击中,介数中心 性的指标 Vb 明显高于其他 4 种,排名第 4 的半局部 中心性和排名第 5 的特征向量中心性在数值上比较 接近。 此外,从最大连通集的曲线图中也不难发现, 半局部中心性和特征向量中心性的曲线是非常相近 的。 这就证明对于中国航空网络,半局部中心性和 特征向量中心性的评价方法效果类似。 表 2 中国航空网络脆弱性指标排序 Table 2 The ranking of vulnerability index of Chinese avi⁃ ation network 次序 攻击方法 脆弱性指标 1 介数中心性 0.479 2 度中心性 0.360 3 接近中心性 0.341 4 半局部中心性 0.314 5 特征向量中心性 0.312 6 随机攻击 0.024 另外,值得注意的是,当采用介数中心性对网络 进行攻击的时候,曲线一开始就陡然下降,这一现象 在其他攻击方法下并没有出现。 单独观察介数攻击 下网络的变化,发现在对北京进行攻击之后,网络的 最大连通子图相对大小为 0.993,而当对乌鲁木齐进 行攻击之后,网络的最大连通子图相对大小骤然下 降至 0.047,网络几乎陷入瘫痪状态,这表明类似于 乌鲁木齐这样的“桥”节点对于网络鲁棒性的影响 举足轻重。 根据脆弱性指标判断,介数中心性能够更准确 地描述节点的重要性,因此取基于介数中心性方法 排列出的前 20 名节点城市,分别单独移除这些节 点,用分析对网络造成的影响,具体数据见表 3。 表 3 机场失效后网络的全局传输效率 Table 3 The global transmission efficiency of the network with the failure of airport 次序 城市 σ(i / n) E ΔE/ E0 1 北京 0.993 0.479 0.047 2 乌鲁木齐 0.966 0.466 0.077 3 昆明 0.960 0.464 0.079 4 广州 0.987 0.483 0.037 5 上海 0.987 0.484 0.035 6 成都 0.980 0.480 0.045 7 西安 0.980 0.480 0.043 8 深圳 0.993 0.491 0.022 9 重庆 0.993 0.491 0.020 10 长沙 0.980 0.482 0.040 11 呼和浩特 0.993 0.493 0.017 12 贵阳 0.987 0.488 0.026 13 沈阳 0.993 0.493 0.018 14 哈尔滨 0.987 0.489 0.026 15 大连 0.993 0.493 0.018 16 杭州 0.993 0.492 0.019 17 合肥 0.987 0.488 0.026 18 长春 0.987 0.489 0.025 19 厦门 0.993 0.492 0.018 20 桂林 0.993 0.493 0.018 用 σ( i / n)表示移除 i / n 比例的节点后最大连 通子图的相对大小,E 为网络的全局效率,E0 为原 始网络的全局效率,ΔE 为网络减少的效率。 结果表 明,昆明机场的移除对网络的全局效率影响最大,其 次是乌鲁木齐和北京。 这也就进一步说明,昆明和 乌鲁木齐在中国航空网络中的影响力不容小觑,从 而验证了介数中心性指标的准确性。 这些城市在空间结构上基本上覆盖了中东部各 地区,进一步观察局部地区的机场影响力情况,得到 各个地区影响力最强的机场城市:华北地区———北 京、华东地区———上海、华中地区———长沙、华南地 区———广州、西北地区———乌鲁木齐、西南地区——— 昆明以及东北地区———哈尔滨。 4 簇度指标的提出 在航空网络的背景下,介数中心性能够准确评 价网络中节点的重要性,但其算法的时间复杂度较 高,使其在实际应用中受到限制。 研究表明,除了节点邻居的直接影响力之外,邻 居之间相互联系的紧密程度在节点的重要性评价中 也起着至关重要的作用。 Ugander 等[19]对 Facebook 上一个用户收到某个邮件联系人的邀请信而成为 Facebook 用户情况进行了分析, 发现影响节点重要 性的决定性因素不是邻居节点的数目,而是邻居节 第 5 期 闫玲玲,等:基于度和聚类系数的中国航空网络重要性节点分析 ·591·
·592. 智能系统学报 第11卷 点间形成的连通子图的数目。Centola[2o]认为节点 5 实验分析 的传播影响力与节点的聚类系数有关,聚类系数越 大越不利于信息的广泛传播。Chen等2)]在此基础 为了验证簇度指标对节点重要性的度量效果, 上提出了一种针对有向网络的ClusterRank算法,采 分别采用簇度指标以及上文提到的6种方法对中国 用SR传播模型进行仿真实验,结果表明该算法优 航空网络进行蓄意攻击仿真实验,并用脆弱性指标 于一些基准算法。任卓明等)将节点的二阶邻居 来评价攻击效果。 度和聚类系数结合起来,提出了一种新的节点重要 经过调试得出,对于函数c(i),当a的取值 范围为[4724,4952]时,脆弱性指标取最大值 性评价方法,并分别用美国航空网络以及美国西部 0.436,即得到的攻击效果最好。 电力网验证了方法的有效性。 网络中移除节点的比例和最大连通集的规模之 由此得出结论,局部聚类系数的增大对信息的 间的关系由图6给出。从图6中可以看出,按照簇 传播是具有阻碍作用的,如果节点的邻居节点更倾 度指标排列出的节点重要性顺序对中国航空网络进 向于互相连接,那么以节点为起始点,更容易形成一 行蓄意攻击,得到的脆弱性指标数值为0.405,攻击 个局部的区域:相反,如果节点的邻居更倾向于连接 效果仅次于介数中心性。但是介数的时间复杂度为 除其邻居外的其他节点,那么信息才能够迅速在较 O(N3):而该指标的时间复杂度为O(N),比介数中 大的范围内传播。例如在图5中,节点3和节点5 心性要快很多。例如在中国航空网络中,用介数排 序需要0.03s,而用簇度指标排序只需要0.01s。 具有相同的度值k:以及相同的其邻居度之和,即 10 k=k=3f=∫3=9,但是节点5的聚类系数比节点3 0.9 更小(C,=0.33,C=0),也就意味着节点5拥有比 0.8 0.7 节点3更高的影响力。这是因为节点5的邻居节点 趣0.6 0.5 更倾向于连接其他节点而不是互相连接,这样就能 0.4 0.3 把信息传播到更广的范围内。 曼 0.2 0.1 0■ 0.10.2030.40.50.60.70.80.91.0 移除节点的比例in 注释:1.D-Cluster(v.=0.4046):2.随机攻击(v=0.0243): 3.介数中心性(v0.4787):4.度数中心性(y=0.3603) 5接近中心性(v=0.341)6.半局部中心性(v,-0.314: 7特征:向量中心性(v=0.3119) 图6移除节点比例和最大连通集规模的关系(簇度指 图5示例网络拓扑结构 标与传统方法的攻击效果对比)】 Fig.5 The topology of example network Fig.6 The relationship between the proportion of re- 可见,节点的度和聚类系数对刻画其重要性都 moved nodes and the scale of the largest con- 具有非常重要的意义。将节点的直接影响力和节点 nected component(Comparison of D-cluster in- dex and traditional methods) 邻居之间连接的紧密程度结合起来,提出一种新的 指标即簇度指标为: 6 结束语 upe(i)=k:·ac0(a>1) 本文分别用度中心性、接近中心性、介数中心 式中:k为节点v:的度,a为可调参数,C()为节点 性、特征向量中心性和半局部中心性5种方法对中 i的聚类系数。 国航空网络模型进行了分析,将网络中的节点按照 在此需要说明的是: 重要性从大到小进行排序,并列出了重要性排名前 1)Chen和任卓明等在构造节点重要性指标中 10的节点城市:然后按排列出的节点次序对中国航 用到了二阶邻居度,但是由于航空网络的特殊性,即 空网络进行蓄意攻击,用脆弱性指标考察这5种方 中转成本造成的平均路径长度较小,节点的直接影 法的攻击效果。仿真结果表明,相比于其他4种方 响力在评价节点重要性的过程中占主导地位。 法,基于介数中心性的节点重要性排序方法能够更 2)由于节点的聚类系数C(i)可能为0,故构造 准确地刻画网络中节点的重要性。进而根据介数中 减函数ac((a>1),并通过仿真实验得到α的最优 心性得到的排序结果分别单独攻击各个城市节点, 值,在后面的分析中我们将以中国航空网络为样本 观察机场失效后网络的全局效率,分析得出各个局 作出详细的描述。 部地区的重要性节点
点间形成的连通子图的数目。 Centola [20] 认为节点 的传播影响力与节点的聚类系数有关,聚类系数越 大越不利于信息的广泛传播。 Chen 等[21] 在此基础 上提出了一种针对有向网络的 ClusterRank 算法,采 用 SIR 传播模型进行仿真实验,结果表明该算法优 于一些基准算法。 任卓明等[4] 将节点的二阶邻居 度和聚类系数结合起来,提出了一种新的节点重要 性评价方法,并分别用美国航空网络以及美国西部 电力网验证了方法的有效性。 由此得出结论,局部聚类系数的增大对信息的 传播是具有阻碍作用的,如果节点的邻居节点更倾 向于互相连接,那么以节点为起始点,更容易形成一 个局部的区域;相反,如果节点的邻居更倾向于连接 除其邻居外的其他节点,那么信息才能够迅速在较 大的范围内传播。 例如在图 5 中,节点 3 和节点 5 具有相同的度值 ki 以及相同的其邻居度之和,即 k3 = k5 = 3,f 3 = f 5 = 9,但是节点 5 的聚类系数比节点 3 更小(C3 = 0.33,C5 = 0),也就意味着节点 5 拥有比 节点 3 更高的影响力。 这是因为节点 5 的邻居节点 更倾向于连接其他节点而不是互相连接,这样就能 把信息传播到更广的范围内。 图 5 示例网络拓扑结构 Fig.5 The topology of example network 可见,节点的度和聚类系数对刻画其重要性都 具有非常重要的意义。 将节点的直接影响力和节点 邻居之间连接的紧密程度结合起来,提出一种新的 指标即簇度指标为: μDCL(i) = ki·α -C(i) (α > 1) 式中:ki 为节点 vi 的度,α 为可调参数,C(i)为节点 i 的聚类系数。 在此需要说明的是: 1)Chen 和任卓明等在构造节点重要性指标中 用到了二阶邻居度,但是由于航空网络的特殊性,即 中转成本造成的平均路径长度较小,节点的直接影 响力在评价节点重要性的过程中占主导地位。 2)由于节点的聚类系数 C(i)可能为 0,故构造 减函数 α -C(i) (α>1),并通过仿真实验得到 α 的最优 值,在后面的分析中我们将以中国航空网络为样本 作出详细的描述。 5 实验分析 为了验证簇度指标对节点重要性的度量效果, 分别采用簇度指标以及上文提到的 6 种方法对中国 航空网络进行蓄意攻击仿真实验,并用脆弱性指标 来评价攻击效果。 经过调试得出,对于函数 μDCL(i),当 α 的取值 范围为 [ 4 724, 4 952] 时, 脆弱性指标取最大值 0.436,即得到的攻击效果最好。 网络中移除节点的比例和最大连通集的规模之 间的关系由图 6 给出。 从图 6 中可以看出,按照簇 度指标排列出的节点重要性顺序对中国航空网络进 行蓄意攻击,得到的脆弱性指标数值为 0.405,攻击 效果仅次于介数中心性。 但是介数的时间复杂度为 O(N 3 );而该指标的时间复杂度为 O(N),比介数中 心性要快很多。 例如在中国航空网络中,用介数排 序需要 0.03 s,而用簇度指标排序只需要 0.01 s。 图 6 移除节点比例和最大连通集规模的关系(簇度指 标与传统方法的攻击效果对比) Fig.6 The relationship between the proportion of re⁃ moved nodes and the scale of the largest con⁃ nected component(Comparison of D⁃cluster in⁃ dex and traditional methods) 6 结束语 本文分别用度中心性、接近中心性、介数中心 性、特征向量中心性和半局部中心性 5 种方法对中 国航空网络模型进行了分析,将网络中的节点按照 重要性从大到小进行排序,并列出了重要性排名前 10 的节点城市;然后按排列出的节点次序对中国航 空网络进行蓄意攻击,用脆弱性指标考察这 5 种方 法的攻击效果。 仿真结果表明,相比于其他 4 种方 法,基于介数中心性的节点重要性排序方法能够更 准确地刻画网络中节点的重要性。 进而根据介数中 心性得到的排序结果分别单独攻击各个城市节点, 观察机场失效后网络的全局效率,分析得出各个局 部地区的重要性节点。 ·592· 智 能 系 统 学 报 第 11 卷
第5期 闫玲玲,等:基于度和聚类系数的中国航空网络重要性节点分析 ·593. 此外,在航空网络的背景下,将节点的直接影响 world networks J].Physical review letters,2001,87: 力和节点邻居之间连接的紧密程度结合起来,提出 198701. [12]FREEMAN L C.A set of measures of centrality based upon 了一种基于度和聚类系数的新指标。对中国航空网 betweenness[J].Sociometry,1977,40(1):35-41. 络的仿真研究结果表明,该指标的评价准确性仅次 [13]CHEN Duanbing,LO Linyuan,SHANG Mingsheng,et al. 于介数中心性,但是其时间复杂度比介数中心性低 Identifying influential nodes in complex networks [J]. Physica A,2012,391(4):1777-1787. 很多,具有很好的实用价值。 [14]NEWMAN M E J.The structure and function of complex 参考文献: networks[J].SIAM review,2003,45(2)167-256. 「151王姣娥,莫辉辉,金凤君.中国航空网络空间结构的复 杂性[J].地理学报,2009,64(8):899-910. [1]刘宏鲲,周涛.中国城市航空网络的实证研究与分析 WANG Jiao'e,MO Huihui,JIN Fengjun.Spatial structur- [J].物理学报,2007,56(1):106-112. al characteristics of Chinese aviation network based on LIU Hongkun,ZHOU Tao.Empirical study of Chinese city complex network theory[J].Acta geographica sinica, airline network J].Acta physica sinica,2007,56(1 ) 2009,64(8):899-910. 106-112. [16]LATORA V,MARCHIORI M.Efficient behavior of small- [2]刘宏鲲.中国航空网络的结构及其影响因素分析[D] world networks[J].Physical review letters,2001,87 成都:西南交通大学,2007. (19):198701. LIU Hongkun.Analyzing the structure of Chinese aviation [17]SCHNEIDER C M,MOREIRA AA,ANDRADE JR J S. network and impact factors[D].Chengdu:Southwest Jiao- et al.Mitigation of malicious attacks on networks[]]Pro- tong University,2007. ceedings of the national academy of sciences of the United [3]姚红光,朱丽萍.基于仿真分析的中国航空网络鲁棒性 States of America,2011,108(10):3838-3841 研究[J].武汉理工大学学报:交通科学与工程版, [18]IYER S,KILLINGBACK T,SUNDARAM B,et al.Attack 2012,36(1):42-46. robustness and centrality of complex networks J].PLoS YAO Hongguang,ZHU Liping.Research on robustness of one,2013,8(4):e59613 China's aviation network based on simulation analysis [J]. [19]UGANDER J,BACKSTROM L,MARLOW C,et al. Journal of Wuhan university of technology:transportation Structural diversity in social contagion[J].Proceedings of science engineering,2012,36(1):42-46. the national academy of sciences of the United States of A- [4]任卓明,邵凤,刘建国,等.基于度与集聚系数的网络 merica,2012,109(16):5962-5966. 节点重要性度量方法研究[J].物理学报,2013,62 [20]CENTOLA D.The spread of behavior in an online social (12):128901. network experiment J].Science,2010,329 5996): REN Zhuoming,SHAO Feng,LIU Jianguo,et al.Node im- 1194-1197. portance measurement based on the degree and clustering [21]CHEN Duanbing,GAO Hui,LO Linyuan,et al.Identif- coefficient information[J].Acta physica sinica,2013,62 (12):128901. ying influential nodes in large-scale directed networks:the role of clustering[J].PLoS one,2013,8(10):e77455. [5]张珍,张振宇,宋蔓蔓.一种基于最短路径介数的重要 作者简介: 节点发现算法[J].计算机工程与应用,2013,49(21): 闫玲玲,女,1990年生,硕士研究 98-100 生,主要研究方向为复杂网络。 ZHANG Zhen,ZHANG Zhenyu,SONG Manman.Important node searching algorithm based on shortest-path betweeness [J].Computer engineering and applications,2013,49 (21):98-100. [6]BURT R S,MINOR M J.Applied Network Analysis M] Newbury Park,CA:Sage,1983:195-222. [7]赫南,李德毅,淦文燕,等.复杂网络中重要性节点发 陈增强,男,1964年生,教授,博士 掘综述[J].计算机科学,2007,34(12):1-5,17. 生导师,主要研究方向为智能控制、智 HE Nan,LI Deyi,GAN Wenyan,et al.Mining vital nodes 能信息处理,曾获天津市自然科学二等 in complex networks J].Computer science,2007,34 奖,发表学术论文100余篇。 (12):1-5.17. [8]BONACICH P.Factoring and weighting approaches to status scores and clique identification[J].The journal of mathe- matical sociology,1972,2(1):113-120. [9]汪小帆,李翔,陈关荣.网络科学导论[M].北京:高等 张青,女,1965年生,教授,主要研 教育出版社,2012. 究方向为复杂系统建模与控制、多智能 WANG Xiaofan,LI Xiang,CHEN Guanrong.Network sci- 体系统,发表学术论文30余篇。 ence:an introduction M].Beijing:Higher Education Press,2012. [10]FREEMAN L C.Centrality in social networks conceptual clarification[]].Social networks,1978,1(3):215-239. [11]LATORA V,MARCHIORI M.Efficient behavior of small-
此外,在航空网络的背景下,将节点的直接影响 力和节点邻居之间连接的紧密程度结合起来,提出 了一种基于度和聚类系数的新指标。 对中国航空网 络的仿真研究结果表明,该指标的评价准确性仅次 于介数中心性,但是其时间复杂度比介数中心性低 很多,具有很好的实用价值。 参考文献: [1]刘宏鲲, 周涛. 中国城市航空网络的实证研究与分析 [J]. 物理学报, 2007, 56(1): 106⁃112. LIU Hongkun, ZHOU Tao. Empirical study of Chinese city airline network[ J]. Acta physica sinica, 2007, 56 ( 1): 106⁃112. [2]刘宏鲲. 中国航空网络的结构及其影响因素分析[D]. 成都: 西南交通大学, 2007. LIU Hongkun. Analyzing the structure of Chinese aviation network and impact factors[D]. Chengdu: Southwest Jiao⁃ tong University, 2007. [3]姚红光, 朱丽萍. 基于仿真分析的中国航空网络鲁棒性 研究[J]. 武汉理工大学学报: 交通科学与工程版, 2012, 36(1): 42⁃46. YAO Hongguang, ZHU Liping. Research on robustness of Chinas aviation network based on simulation analysis [ J]. Journal of Wuhan university of technology: transportation science & engineering, 2012, 36(1): 42⁃46. [4]任卓明, 邵凤, 刘建国, 等. 基于度与集聚系数的网络 节点重要性度量方法研究[ J]. 物理学报, 2013, 62 (12): 128901. REN Zhuoming, SHAO Feng, LIU Jianguo, et al. Node im⁃ portance measurement based on the degree and clustering coefficient information[ J]. Acta physica sinica, 2013, 62 (12): 128901. [5]张珍, 张振宇, 宋蔓蔓. 一种基于最短路径介数的重要 节点发现算法[ J]. 计算机工程与应用, 2013, 49(21): 98⁃100. ZHANG Zhen, ZHANG Zhenyu, SONG Manman. Important node searching algorithm based on shortest⁃path betweeness [ J ]. Computer engineering and applications, 2013, 49 (21): 98⁃100. [6]BURT R S, MINOR M J. Applied Network Analysis[M]. Newbury Park, CA: Sage, 1983: 195⁃222. [7]赫南, 李德毅, 淦文燕, 等. 复杂网络中重要性节点发 掘综述[J]. 计算机科学, 2007, 34(12): 1⁃5, 17. HE Nan, LI Deyi, GAN Wenyan, et al. Mining vital nodes in complex networks [ J ]. Computer science, 2007, 34 (12): 1⁃5, 17. [8]BONACICH P. Factoring and weighting approaches to status scores and clique identification[ J]. The journal of mathe⁃ matical sociology, 1972, 2(1): 113⁃120. [9]汪小帆, 李翔, 陈关荣. 网络科学导论[M]. 北京: 高等 教育出版社, 2012. WANG Xiaofan, LI Xiang, CHEN Guanrong. Network sci⁃ ence: an introduction [ M ]. Beijing: Higher Education Press, 2012. [10] FREEMAN L C. Centrality in social networks conceptual clarification[J]. Social networks, 1978, 1(3): 215⁃239. [11]LATORA V, MARCHIORI M. Efficient behavior of small⁃ world networks [ J]. Physical review letters, 2001, 87: 198701. [12]FREEMAN L C. A set of measures of centrality based upon betweenness[J]. Sociometry, 1977, 40(1): 35⁃41. [13]CHEN Duanbing, LÜ Linyuan, SHANG Mingsheng, et al. Identifying influential nodes in complex networks [ J ]. Physica A, 2012, 391(4): 1777⁃1787. [14]NEWMAN M E J. The structure and function of complex networks[J]. SIAM review, 2003, 45(2): 167⁃256. [15]王姣娥, 莫辉辉, 金凤君. 中国航空网络空间结构的复 杂性[J]. 地理学报, 2009, 64(8): 899⁃910. WANG Jiao’e, MO Huihui, JIN Fengjun. Spatial structur⁃ al characteristics of Chinese aviation network based on complex network theory [ J ]. Acta geographica sinica, 2009, 64(8): 899⁃910. [16]LATORA V, MARCHIORI M. Efficient behavior of small⁃ world networks [ J ]. Physical review letters, 2001, 87 (19): 198701. [17]SCHNEIDER C M, MOREIRA A A, ANDRADE JR J S, et al. Mitigation of malicious attacks on networks[J]. Pro⁃ ceedings of the national academy of sciences of the United States of America, 2011, 108(10): 3838⁃3841. [18]IYER S, KILLINGBACK T, SUNDARAM B, et al. Attack robustness and centrality of complex networks [ J]. PLoS one, 2013, 8(4): e59613. [ 19 ] UGANDER J, BACKSTROM L, MARLOW C, et al. Structural diversity in social contagion[J]. Proceedings of the national academy of sciences of the United States of A⁃ merica, 2012, 109(16): 5962⁃5966. [20]CENTOLA D. The spread of behavior in an online social network experiment [ J ]. Science, 2010, 329 ( 5996 ): 1194⁃1197. [21]CHEN Duanbing, GAO Hui, LÜ Linyuan, et al. Identif⁃ ying influential nodes in large⁃scale directed networks: the role of clustering[J]. PLoS one, 2013, 8(10): e77455. 作者简介: 闫玲玲,女, 1990 年生,硕士研究 生,主要研究方向为复杂网络。 陈增强,男,1964 年生,教授, 博士 生导师,主要研究方向为智能控制、 智 能信息处理,曾获天津市自然科学二等 奖,发表学术论文 100 余篇。 张青,女,1965 年生,教授,主要研 究方向为复杂系统建模与控制、多智能 体系统,发表学术论文 30 余篇。 第 5 期 闫玲玲,等:基于度和聚类系数的中国航空网络重要性节点分析 ·593·