第10卷第6期 智能系统学报 Vol.10 No.6 2015年12月 CAAI Transactions on Intelligent Systems Dec.2015 D0L:10.11992/is.201507042 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.tp.20151110.1354.012.html 复杂网络中的在线社交网络演化模型 王景丽1,许立波2,庞超逸 (1.宁波大红鹰学院信息工程学院,浙江宁波315175:2.浙江大学宁波理工学院,浙江宁波315000:3.浙江大学 宁波理工学院,浙江宁波315000) 摘要:在线社交网络是一种广泛存在的社会网络,其节点度遵循幂率分布规律,但对于其结构演化模型方面的相 关研究还不多。基于复杂网络理论研究在线社交网络内部结构特征,提出一种结合内增长、外增长及内部边更替的 演化模型,借助平均场理论分析该模型的拓扑特性,实验和理论分析表明由该模型生成的网络,其度分布服从幂率 分布,且通过调整参数,幂率指数在1~3,能较好地反映不同类型的真实在线社交网络的度分布特征,因此具有广泛 适用性。 关键词:复杂网络:社交网络:度分布:幂率分布:演化:平均场:节点度:拓扑 中图分类号:TP393文献标志码:A文章编号:1673-4785(2015)06-0949-05 中文引用格式:王景丽,许立波,庞超逸.复杂网络中的在线社交网络演化模型[J].智能系统学报,2015,10(6):949-953. 英文引用格式:WANG Jingli,XU Libo,PANG Chaoyi..Evolution model of online social networks based on complex networks[J]. CAAI Transactions on Intelligent Systems,2015,10(6):949-953. Evolution model of online social networks based on complex networks WANG Jingli',XU Libo2,PANG Chaoyi3 (1.Information Engineering,Ningbo Dahongying University,Ningbo 315175,China;2.Research Center on Intelligent Computing and Data Management Ningbo Institute of Technology,Zhejiang University,Ningbo 315000,China;3.Research Center on Intelligent Com- puting and Data Management Ningbo Institute of Technology,Zhejiang University,Ningbo 315000,China) Abstract:As a widespread social network,the node degree of online social networks has been proven by many re- searchers to follow the power-law distribution.However,there are few studies modeling the evolution of its struc- ture.In this paper,we propose an evolution model that combines the inside growth,outside growth,and edge re- placement based on those of complex networks.The topology properties of this model are analyzed using the mean- field theory.Experiment and theoretical analyses show that the degree of a node in a network generated by the new evolution model follows the power-law distribution and that the power-law index ranges between 1 and 3.Therefore, the proposed model can better reflect the node degree distribution characteristics of different types of real online so- cial networks and will have wide applicability. Keywords:complex network;social network;degree distribution;power-law distribution;evolution;mean field; node degree;topology 复杂网络作为刻画和研究复杂系统结构及其动 态发展的强有力工具之一,近年来迅速成为学术界 研究的热点,并与计算机科学、生物学、社会学、经济 收稿日期:2015-07-05.网络出版日期:2015-11-10. 学等学科交叉融合,广泛应用于诸如生物网络、传染 基金项目:国家自然科学基金资助项目(71271191):宁波市自然科学基 病控制、知识网络、电力网、互联网等各种自然和社 金资助项目(2015A610138). 通信作者:王景丽.E-mailjingli.wang@nbdhyu..cd.cn 会动态网络及系统研究中.复杂网络的研究涵盖很
第 10 卷第 6 期 智 能 系 统 学 报 Vol.10 №.6 2015 年 12 月 CAAI Transactions on Intelligent Systems Dec. 2015 DOI:10.11992 / tis.201507042 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.tp.20151110.1354.012.html 复杂网络中的在线社交网络演化模型 王景丽1 ,许立波2 ,庞超逸3 (1. 宁波大红鹰学院 信息工程学院,浙江 宁波 315175; 2. 浙江大学 宁波理工学院, 浙江 宁波 315000; 3. 浙江大学 宁波理工学院, 浙江 宁波 315000) 摘 要:在线社交网络是一种广泛存在的社会网络,其节点度遵循幂率分布规律,但对于其结构演化模型方面的相 关研究还不多。 基于复杂网络理论研究在线社交网络内部结构特征,提出一种结合内增长、外增长及内部边更替的 演化模型,借助平均场理论分析该模型的拓扑特性,实验和理论分析表明由该模型生成的网络,其度分布服从幂率 分布,且通过调整参数,幂率指数在 1~ 3,能较好地反映不同类型的真实在线社交网络的度分布特征,因此具有广泛 适用性。 关键词:复杂网络;社交网络;度分布;幂率分布;演化;平均场;节点度;拓扑 中图分类号:TP393 文献标志码:A 文章编号:1673⁃4785(2015)06⁃0949⁃05 中文引用格式:王景丽,许立波,庞超逸. 复杂网络中的在线社交网络演化模型[J]. 智能系统学报, 2015, 10(6): 949⁃953. 英文引用格式:WANG Jingli, XU Libo, PANG Chaoyi. Evolution model of online social networks based on complex networks[J]. CAAI Transactions on Intelligent Systems, 2015, 10(6): 949⁃953. Evolution model of online social networks based on complex networks WANG Jingli 1 , XU Libo 2 , PANG Chaoyi 3 (1. Information Engineering, Ningbo Dahongying University, Ningbo 315175, China; 2. Research Center on Intelligent Computing and Data Management Ningbo Institute of Technology, Zhejiang University, Ningbo 315000, China; 3. Research Center on Intelligent Com⁃ puting and Data Management Ningbo Institute of Technology, Zhejiang University, Ningbo 315000, China) Abstract:As a widespread social network, the node degree of online social networks has been proven by many re⁃ searchers to follow the power⁃law distribution. However, there are few studies modeling the evolution of its struc⁃ ture. In this paper, we propose an evolution model that combines the inside growth, outside growth, and edge re⁃ placement based on those of complex networks. The topology properties of this model are analyzed using the mean⁃ field theory. Experiment and theoretical analyses show that the degree of a node in a network generated by the new evolution model follows the power⁃law distribution and that the power⁃law index ranges between 1 and 3. Therefore, the proposed model can better reflect the node degree distribution characteristics of different types of real online so⁃ cial networks and will have wide applicability. Keywords: complex network; social network; degree distribution; power⁃law distribution; evolution; mean field; node degree; topology 收稿日期:2015⁃07⁃05. 网络出版日期:2015⁃11⁃10. 基金项目:国家自然科学基金资助项目(71271191);宁波市自然科学基 金资助项目(2015A610138). 通信作者:王景丽.E⁃mailjingli.wang@ nbdhyu.edu.cn 复杂网络作为刻画和研究复杂系统结构及其动 态发展的强有力工具之一,近年来迅速成为学术界 研究的热点,并与计算机科学、生物学、社会学、经济 学等学科交叉融合,广泛应用于诸如生物网络、传染 病控制、知识网络、电力网、互联网等各种自然和社 会动态网络及系统研究中.复杂网络的研究涵盖很
·950· 智能系统学报 第10卷 多方面,其中网络的演化及建模研究能够相当程度 能一定程度地模拟真实在线社交网络的度分布特征。 地揭示实际网络及系统的结构组成及变化规律,从 1 而能够对系统的未来发展做出预测并提早设置改进 在线社交网络演化模型 措施。因此演化模型一直是复杂网络研究的热点之 本文构造无向的网络演化模型,模拟了内部增 一,并提出了很多网络演化模型,以刻画现实中各种 长即网络中现有节点间添加新连接、内部调整即现 不同网络的特征及结构。 有节点间重连接及网增长即新节点和现有节点的 Watts等]提出小世界模型,具有短路径、高 连接等机制,对于有向网络亦可以参照文中分析。 聚类和强传递性特征,模拟人际关系网络的演化 具体演化步骤如下: 过程。Barabasi等[)在研究万维网时提出基于增 1)初始化:初始网络包含m,个节点,每个节点 长和优先连接的无标度BA模型,连接概率与节 与其余m。-1个节点相连; 点度成线性正比,较好地模拟出万维网中幂率度 2)随机增长:每个时间步添加一个新节点,并 分布特征和马太效应。之后,研究者们发现幂率 连接到m,个原有节点上,且满足m,<mo; 度分布特征广泛存在于各种现实网络,随着Fala- 3)优先连接:新节点与原有节点i相连接的概 tous等[3]发现互联网拓扑的幂率特性,AB模 率Ⅱ表达式为 型[]被提出应用于互联网拓扑建模,其在BA模 型基础上增加了内部连接和重配置过程:基于现 Ⅱ= (1) 实互联网连接倾向度更高的观测现象,广义线性 i 优先模型s)改进BA模型以模拟新节点连接对高 式中:k:为节点i的度; 度hub的优先选择性:动态优先模型[6)]基于不同 4)内部随机增长:每个时间步在网络内增加m2 层级A$间的关系,反映出互联网中的小世界特 条边,节点i被选为新增边的端点的概率Ⅱ,按式 性:多局域世界模型]考虑节点连接的局域特 (1)计算,且m2<mo 征,能较好反映节点层次性和聚类性。众多研究 5)内部优先连接更替:每个时间步选择m条边进 表明,合作网络[)、软件组件系统[1]、蛋白质网 行更替,更替方法为先随机选择节点i,随机移除与节 络[)、在线社交网络12]、传感器网络[1]等都呈 点i相连的某条边l:,添加以连接节点j和节点r的边 现出了度分布幂率特性,局部事件模型被用来模 l.,节点r按Ⅱ,概率择优选取,Ⅱ,按式(1)计算。 拟软件组件系统的无标度特性:顶点复制模 相比一般网络,在线社交网络中的连接度大的 型描述知识引用网络和新陈代谢网络,新节 节点可能更容易得到大量连接,因此在演化模型中, 点不完全遵循优先连接机制,而是通过模仿已有 除了新节点和内部增长具有优先连接机制外,内部 节点来构建模型。 优先连接更替也不同于一般模型中的重连机制,后 在线社交网络如微博、交友等是社会网络的一 者通常是以边l替代1,节点i的度不发生变化;而 种典型关系网络,将每个用户看作网络节点,许多研 内部优先连接更替是以l,替代。,更加强化高连接 究已经表明其节点度遵循幂率分布规律,但对于其 度节点间的连接倾向,且为防止出现孤立节点,模型 结构演化模型方面的相关研究还比较少。一方面, 设定当被选择节点度为1时,进行重新选点。 目前研究集中于通过抽样数据来进行数据分析,从 统计角度发现拓扑特征,虽然能较好还原真实网络 2演化模型的度分布属性 特性,但这种研究属于静态分析,不能模拟动态过程 根据平均场理论对模型的度分布进行近似分析, 以及添加行为过程:另一方面,研究表明在线社交网 假设节点度k随时间t连续变化,对k变化率求解: 络节点可能比一般网络更倾向于连接度大的节点, 很多传统模型不能直接适用,需要进行一定的改进。 随机增长:当新节点加入时,按概率Ⅱ连接到 本文提出一种在线社交网络演化模型,以注册用 m,个原节点上,则k变化率方程为 户作为网络节点,节点间的连边就是注册用户间的关 ak;(t) =m1Ⅱ (2) 注关系,节点和连边共同构成网络,不失一般性,本文 将此网络抽象成无向网络图。演化模型考虑随机增 内部随机增长:边的端点按概率Ⅱ,优先选择, 长、优先连接、内部增长及连接更替4种机制,采用平 边有2个端点,则k:变化率方程为 均场理论对模型度分布进行理论分析。理论分析和 ak;(t) dt =2m2Ⅱ (3) 仿真表明,演化模型网络的度呈现无尺度特征,且能 够模拟较大范围的幂率分布,具有广泛的适用性,并 内部优先连接更替:包含2个过程,首先是移除
多方面,其中网络的演化及建模研究能够相当程度 地揭示实际网络及系统的结构组成及变化规律,从 而能够对系统的未来发展做出预测并提早设置改进 措施。 因此演化模型一直是复杂网络研究的热点之 一,并提出了很多网络演化模型,以刻画现实中各种 不同网络的特征及结构。 Watts 等[ 1] 提出小世界模型,具有短路径、高 聚类和强传递性特征,模拟人际关系网络的演化 过程。 Barabási 等[ 2] 在研究万维网时提出基于增 长和优先连接的无标度 BA 模型,连接概率与节 点度成线性正比,较好地模拟出万维网中幂率度 分布特征和马太效应。 之后,研究者们发现幂率 度分布特征广泛存在于各种现实网络,随着 Fala⁃ tous 等[ 3] 发 现 互 联 网 拓 扑 的 幂 率 特 性, AB 模 型[ 4] 被提出应用于互联网拓扑建模,其在 BA 模 型基础上增加了内部连接和重配置过程;基于现 实互联网连接倾向度更高的观测现象,广义线性 优先模型[ 5] 改进 BA 模型以模拟新节点连接对高 度 hub 的优先选择性;动态优先模型[ 6] 基于不同 层级 AS 间的关系,反映出互联网中的小世界特 性;多局域世界模型[ 7⁃8] 考虑节点连接的局域特 征,能较好反映节点层次性和聚类性。 众多研究 表明,合作网络[ 9] 、软件组件系统[ 10] 、蛋白质网 络[ 11] 、在线社交网络[ 12] 、传感器网络[ 13] 等都呈 现出了度分布幂率特性,局部事件模型被用来模 拟软 件 组 件 系 统 的 无 标 度 特 性; 顶 点 复 制 模 型[ 14] 描述知识引用网络和新陈代谢网络,新节 点不完全遵循优先连接机制,而是通过模仿已有 节点来构建模型。 在线社交网络如微博、交友等是社会网络的一 种典型关系网络,将每个用户看作网络节点,许多研 究已经表明其节点度遵循幂率分布规律,但对于其 结构演化模型方面的相关研究还比较少。 一方面, 目前研究集中于通过抽样数据来进行数据分析,从 统计角度发现拓扑特征,虽然能较好还原真实网络 特性,但这种研究属于静态分析,不能模拟动态过程 以及添加行为过程;另一方面,研究表明在线社交网 络节点可能比一般网络更倾向于连接度大的节点, 很多传统模型不能直接适用,需要进行一定的改进。 本文提出一种在线社交网络演化模型,以注册用 户作为网络节点,节点间的连边就是注册用户间的关 注关系,节点和连边共同构成网络,不失一般性,本文 将此网络抽象成无向网络图。 演化模型考虑随机增 长、优先连接、内部增长及连接更替 4 种机制,采用平 均场理论对模型度分布进行理论分析。 理论分析和 仿真表明,演化模型网络的度呈现无尺度特征,且能 够模拟较大范围的幂率分布,具有广泛的适用性,并 能一定程度地模拟真实在线社交网络的度分布特征。 1 在线社交网络演化模型 本文构造无向的网络演化模型,模拟了内部增 长即网络中现有节点间添加新连接、内部调整即现 有节点间重连接及网络增长即新节点和现有节点的 连接等机制,对于有向网络亦可以参照文中分析。 具体演化步骤如下: 1)初始化:初始网络包含 m0个节点,每个节点 与其余 m0 -1 个节点相连; 2)随机增长:每个时间步添加一个新节点,并 连接到 m1个原有节点上,且满足 m1< m0 ; 3)优先连接:新节点与原有节点 i 相连接的概 率 Πi 表达式为 Πi = ki ∑ j kj (1) 式中:ki为节点 i 的度; 4)内部随机增长:每个时间步在网络内增加 m2 条边,节点 i 被选为新增边的端点的概率 Πi 按式 (1)计算,且 m2< m0 ; 5)内部优先连接更替:每个时间步选择 m3条边进 行更替,更替方法为先随机选择节点 i,随机移除与节 点 i 相连的某条边 l ij,添加以连接节点 j 和节点 r 的边 l jr,节点 r 按 Πr 概率择优选取,Πr 按式(1)计算。 相比一般网络,在线社交网络中的连接度大的 节点可能更容易得到大量连接,因此在演化模型中, 除了新节点和内部增长具有优先连接机制外,内部 优先连接更替也不同于一般模型中的重连机制,后 者通常是以边 l ir替代 l ij,节点 i 的度不发生变化;而 内部优先连接更替是以 l jr替代 l ij,更加强化高连接 度节点间的连接倾向,且为防止出现孤立节点,模型 设定当被选择节点度为 1 时,进行重新选点。 2 演化模型的度分布属性 根据平均场理论对模型的度分布进行近似分析, 假设节点度 ki随时间 t 连续变化,对 ki变化率求解: 随机增长:当新节点加入时,按概率 Πi 连接到 m1个原节点上,则 ki变化率方程为 ∂ki(t) ∂t = m1Πi (2) 内部随机增长:边的端点按概率 Πi 优先选择, 边有 2 个端点,则 ki变化率方程为 ∂ki(t) ∂t = 2m2Πi (3) 内部优先连接更替:包含 2 个过程,首先是移除 ·950· 智 能 系 统 学 报 第 10 卷
第6期 王景丽,等:复杂网络中的在线社交网络演化模型 .951- 2(1*2 过程,节点i被随机选中的概率为尺,N为节点总 m a m1+2m2*m3 k-a 数,被选择为移除边的另一端的概率为m3Ⅱ,;其次 假设时间t→0时,网络节点的度具有稳态分 是更替过程,被选择为更替边的两端的概率为2m3 布P(k): Ⅱ,因此整个更替过程k变化率方程为 aP(k;(t) (8) 理论表达式(9)近似给出。 k-a 10° 式中:a= 2m3(m1+m2) 模型假设节点是以相对时 m1+2m2+m3 10 y=2.5 间间隔进入网络的,因此节点i的到达时间t:具有 101 10 常数概率密度: 10 P(t:)=1/N≈1/t 故有 10 10 10 10 10 2(m1*2) mi -a m1022m3 图1演化模型度分布(m,=2,m2=1,m3=0) P(t;> t)= Lk-a Fig.1 Degree distribution of evolution model(m,=2, 2(m1*2) m2=1,m3=0) m -a m1+22*m3 1-P(t:≤ t)≈
过程,节点 i 被随机选中的概率为 m3 N , N 为节点总 数,被选择为移除边的另一端的概率为 m3Πi;其次 是更替过程,被选择为更替边的两端的概率为 2m3 Πi,因此整个更替过程 ki变化率方程为 ∂ki(t) ∂t = - m3 N - m3Πi + 2m3Πi = m3Πi - m3 N (4) 综合式(2) ~ (4),得到演化模型 ki变化率方程为 ∂ki(t) ∂t = m1Πi + 2m2Πi + m3Πi - m3 N (5) 由网络节点平均度数为 2(m1 + m2 ),并且对于 充分大的 t,t 时刻节点总数 N 为 m0 + t ≈ t ,因此网 络节点总度数 ∑ j kj ≈ 2(m1 + m2 )t ,得 ∂ki(t) ∂t = (m1 + 2m2 + m3 )Πi - m3 N ≈ (m1 + 2m2 + m3 )ki(t) 2(m1 + m2 )t - m3 t (6) 用变量分离法解此一阶微分方程可得 ki(t) = 2m3(m1 + m2 ) m1 + 2m2 + m3 + Ct m1 +2m2 +m3 2(m1 +m2 ) (7) 设节点 i 是在 t i时刻进入网络,则有初始条件 ki(t i) = m1 ,结合式(7)可得 ki(t) = 2m3(m1 + m2 ) m1 + 2m2 + m3 + m1 - 2m3(m1 + m2 ) m1 + 2m2 + m3 é ë ê ê ù û ú ú ( t t i ) m1 + 2m2 + m3 2(m1 + m2 ) 网络中节点 i 的度 ki(t)小于 k 的概率为 P(ki(t) < k) = P( 2m3(m1 + m2 ) m1 + 2m2 + m3 + m1 - 2m3(m1 + m2 ) m1 + 2m2 + m3 é ë ê ê ù û ú ú ( t t i ) m1 +2m2 +m3 2(m1 +m2 ) = P(t i > m1 - a k - a é ë ê ê ù û ú ú m1 +2m2 +m3 2(m1 +m2 ) t) (8) 式中: a = 2m3(m1 + m2 ) m1 + 2m2 + m3 模型假设节点是以相对时 间间隔进入网络的,因此节点 i 的到达时间 t i具有 常数概率密度: P(t i) = 1 / N ≈ 1 / t 故有 P(t i > m1 - a k - a é ë ê ê ù û ú ú 2(m1 +m2 ) m1 +2m2 +m3 t) = 1 - P(t i ≤ m1 - a k - a é ë ê ê ù û ú ú 2(m1 +m2 ) m1 +2m2 +m3 t) ≈ 1 - m1 - a k - a é ë ê ê ù û ú ú 2(m1 +m2 ) m1 +2m2 +m3 假设时间 t → ∞ 时,网络节点的度具有稳态分 布 P(k): P(k) = ∂P(ki(t) < k) ∂k = 2(m1 + m2 ) m1 + 2m2 + m3 (m1 - a) 2(m1 +m2 ) m1 +2m2 +m3( k - a) - γ(9) 则度分布指数 γ = 2 - m3 - m1 m1 + 2m2 + m3 (10) 上述理论分析表明,由本演化模型生成的网络 具有无标度特性,且通过调整 m1 、m2 和 m3 的取值, 能 得 到 不 同 的 分 布 指 数。 由 - 1 ≤ m3 - m1 m1 + 2m2 + m3 < 1,可得 1 < γ ≤ 3。 当 m2 = m3 = 0 时, γ = 3,无标度 BA 模型成为本演化模型的一个 特例。 现有研究表明,绝大多数无标度网络的幂指 数都在 1~3,因此本演化模型具有广泛的适用性。 3 仿真实验和讨论 仿真实验分为 2 部分:1)采用 MATLAB 软件开 发仿真程序,通过程序运行的结果来分析演化模型的 度统计特性、相关参数的影响以及理论分析的准确 性;2)通过 MATLAB 软件分析真实社交网络数据的 度统计特性,观察演化模型理论分析值的模拟程度。 分析度分布指数 γ 的表达式(10),可以看到 3 个参数的作用各不相同,m1和 m3决定 γ 取值大于 2 或者小于 2,m2则只影响值的大小,而 m1和 m2又影 响网络的节点规模和平均度数。 图 1、2、3 分别显示 了 1 500 节点网络演化模型在不同参数取值下的度 分布情况,演化网络度分布呈现幂率特征,且根据参 数取值的不同在 1~3 之间变化,图中直线由度分布 理论表达式(9)近似给出。 图 1 演化模型度分布(m1 = 2,m2 = 1,m3 = 0) Fig.1 Degree distribution of evolution model(m1 = 2 , m2 = 1 ,m3 = 0) 第 6 期 王景丽,等:复杂网络中的在线社交网络演化模型 ·951·
.952. 智能系统学报 第10卷 可以看到,在m,和m2值不变的条件下,m3值越大, 模型的度分布幂率在2~3,不能较好地表征博客网 无标度特性越大。图4则显示在m,和m值不变的 络的度分布特征。图中拟合直线幂率值为1.4,由本 条件下,m,值变化对度分布幂率的影响,分布幂率 文表达式(9)直接给出,其中参数取值m,=2、m2= 值随着m,值变大而增大,但逐步接近某固定值,由 0、m3=8,实际上有很多种参数取值方案,这里只给 式(10)可知,此值为2。 出其中一种仅用于说明效果。通过调整参数,演化 10° 模型能较好地模拟美国政治家博客用户网络的度分 10 布特征。 10° 10 10 2=1.9 10 是10 1010 10 a 10 10 1=1.4 10 图2演化模型度分布(m1=2,m2=1,m3=3) Fig.2 Degree distribution of evolution model(m=2, 1010 10 10 10 m2=1,m3=3) 图5政治家博客用户网络度分布幂率 10°i Fig.5 Power-law degree distribution network of Polit- 10 ical blogs 10 =1.6 图6显示维基选举社交网络[1度分布情况,该 10 网络节点为维基用户,边表示为用户间的选举行为, 10 包含7000多节点。该网络度分布幂率也在1~2之 1010 10 间,传统模型不能较准确地表征。图中拟合直线幂 10 10 率值为1.5,由表达式(9)直接给出,其中参数取值 图3演化模型度分布(m,=2,m2=1,m3=6) m1=2、m2=0、m3=6,这里同样只给出一种取值方案 Fig.3 Degree distribution of evolution model (m=2, 用于说明效果。可以看到,通过调整参数,演化模型 m2=1,m3=6)】 能较好地模拟维基选举社交网络的度分布特征。 10f 10 10 m,=0 10 m2= 10 …m= …m,=8 是10i 10 10 10 y-1.5 1 10 10 10 10 10 10 0 10 10 10 图6维基选举社交网络度分布幂率 Fig.6 Power-law degree distribution of Wiki vote 图4m,取不同值时的度分布变化(m,=2,m,=8) Fig.4 Degree distribution changes according to differ- 结束语 ent values of m,(m =2,m=8) 在线社交网络作为一种普遍存在的社会网络, 采用真实在线社交网络与本文演化模型的度分 已经引起广泛的研究并证实其具有无标度特性,但 布进行对比分析。图5显示一个美国政治家博客用 对其结构演化模型的研究相对较少。本文提出一种 户网络)的度分布情况,该网络节点为博客网页, 基于内增长、外增长及内部边更替的在线社交网络 边表示为网页间的超链接,包含1224个节点和 演化模型,其优先连接机制具有强化高连接度节点 16714条无向边。可以看到,博客网页网络的度分 间的连接倾向的特征。理论分析和实验表明,该模 布幂率在1~2,传统很多演化模型如BA及其变型 型具有无标度特性,且通过调整参数的不同取值,度
可以看到,在 m1和 m2值不变的条件下,m3值越大, 无标度特性越大。 图 4 则显示在 m1和 m3值不变的 条件下,m2值变化对度分布幂率的影响,分布幂率 值随着 m2值变大而增大,但逐步接近某固定值,由 式(10)可知,此值为 2。 图 2 演化模型度分布(m1 = 2,m2 = 1,m3 = 3) Fig.2 Degree distribution of evolution model(m1 = 2, m2 = 1,m3 = 3) 图 3 演化模型度分布(m1 = 2,m2 = 1,m3 = 6) Fig.3 Degree distribution of evolution model(m1 = 2, m2 = 1,m3 = 6) 图 4 m2取不同值时的度分布变化(m1 = 2,m3 = 8) Fig.4 Degree distribution changes according to differ⁃ ent values of m2(m1 = 2,m3 = 8) 采用真实在线社交网络与本文演化模型的度分 布进行对比分析。 图 5 显示一个美国政治家博客用 户网络[15]的度分布情况,该网络节点为博客网页, 边表示为网页间的超链接,包含 1 224 个节点和 16 714条无向边。 可以看到,博客网页网络的度分 布幂率在 1~ 2,传统很多演化模型如 BA 及其变型 模型的度分布幂率在 2 ~ 3,不能较好地表征博客网 络的度分布特征。 图中拟合直线幂率值为 1.4,由本 文表达式(9) 直接给出,其中参数取值m1 = 2、m2 = 0、m3 = 8,实际上有很多种参数取值方案,这里只给 出其中一种仅用于说明效果。 通过调整参数,演化 模型能较好地模拟美国政治家博客用户网络的度分 布特征。 图 5 政治家博客用户网络度分布幂率 Fig.5 Power⁃law degree distribution network of Polit⁃ ical blogs 图 6 显示维基选举社交网络[15]度分布情况,该 网络节点为维基用户,边表示为用户间的选举行为, 包含 7 000 多节点。 该网络度分布幂率也在 1~2 之 间,传统模型不能较准确地表征。 图中拟合直线幂 率值为 1.5,由表达式(9)直接给出,其中参数取值 m1 = 2、m2 = 0、m3 = 6,这里同样只给出一种取值方案 用于说明效果。 可以看到,通过调整参数,演化模型 能较好地模拟维基选举社交网络的度分布特征。 图 6 维基选举社交网络度分布幂率 Fig.6 Power⁃law degree distribution of Wiki vote 4 结束语 在线社交网络作为一种普遍存在的社会网络, 已经引起广泛的研究并证实其具有无标度特性,但 对其结构演化模型的研究相对较少。 本文提出一种 基于内增长、外增长及内部边更替的在线社交网络 演化模型,其优先连接机制具有强化高连接度节点 间的连接倾向的特征。 理论分析和实验表明,该模 型具有无标度特性,且通过调整参数的不同取值,度 ·952· 智 能 系 统 学 报 第 10 卷
第6期 王景丽,等:复杂网络中的在线社交网络演化模型 ·953. 分布幂率指数在1~3,具有普遍适用性。通过和真 2001,98(2):404-409 实在线社交网络结构的模拟分析,本文提出的演化 [10]MYERS C R.Software systems as complex networks:struc- 模型能较好地反映出在线社交网络的度分布特征, ture,function,and evolvability of software collaboration 且能够刻画不同类型的社交网络,具有较强的实用 graphs J].Physical Review E,2003,68 (4Pt2): 意义。 046116. [11 ]JEONG H,MASON S P,BARABASI A L,et al.Lethality 本文演化模型是基于最基本的无向无权网络, and centrality in protein networks[J].Nature,2001,411 下一步的工作考虑扩展到复杂的多属性异构网络, (6833):41-42. 这些属性包括有向、权值、节点能力等。借助因素空 [12]王亚奇,王静,杨海滨.基于复杂网络理论的微博用户 间理论[6],将多属性异构网络映射成因素空间网 关系网络演化模型研究[J].物理学报,2014,63(20): 络,网络节点映射成因素空间对象,使其更加贴近于 208902. 现实网络,通过权变、拓扑结构、动态时空等因素空 WANG Yaqi,WANG Jing,YANG Haibin.An evolution 间理论工具研究演化网络模型和实际在线社会网络 model of microblog user relationship networks based on 的生成、发展及其特征。 complex network theory J].Acta Physica Sinica,2014, 63(20):208902. 参考文献: [13]刘浩然,尹文晓,董明如,等.一种强容侵能力的无线 传感器网络无标度拓扑模型研究[J].物理学报,2014, [1]WATTS D J,STROGATZ S H.Collective dynamics of 63(9):090503. small-world'networks [J].Nature,1998,393 (6684): LIU Haoran,YIN Wenxiao,DONG Mingru,et al.Study 440-442. on the scale-free topology model with strong intrusion-toler- [2]BARABASI A L,ALBERT R.Emergence of scaling in ran- ance ability in wireless sensor networks[].Acta Physica dom networks[J].Science,1999,286(5439):509-512. Sinica,2014,63(9):090503. [3]FALOUTSOS M,FALOUTSOS P,FALOUTSOS C.On pow- [14]SOLE R V,PASTOR-SATORRAS R,SMITH E,et al.A er-law relationships of the Internet topology[J].ACM SIG- model of large-scale proteome evolution[J].Advances in COMM Computer Communication Review Homepage,1999, Complex Systems,2002,5(1):43-54. 29(4):251-262. [15]维基选举社交网络[0L/EB].[2014-12-21].http:/ [4]ALBERT R,BARABASI A L.Topology of evolving net- works:local events and universality[J].Physical Review www.linkprediction.org/index.php/link/resource/data. [16]汪培庄.因素空间与因素库[J].辽宁工程技术大学学 Letters2000,85(24):5234-5237. 报:自然科学版,2013,32(10):1297-1304. [5]BU T,TOWSLEY D.On distinguishing between Internet WANG Peizhuang.Factor spaces and factor data-bases[J]. power law topology generators[C]//Proceedings of INFO- Journal of Liaoning Technical University:Natural Science, COM 2002.Twenty-First Annual Joint Conference of the 2013,32(10):1297-1304. IEEE Computer and Communications Societies.New York, [17]汪培庄.因素空间与数据科学[J】.辽宁工程技术大学 NY:EEE,2002,2:638-647. 学报:自然科学版,2015,34(2):273-280. [6]PARK S T,PENNOCK D M,GILES C L.Comparing static WANG Peizhuang.Factor spaces and data science [J]. and dynamic measurements and models of the Internet's as Journal of Liaoning Technical University:Natural Science, topology[C]//Proceedings of the 23rd Annual Joint Confer- 2015,34(2):273-280. ence of the IEEE Computer and Communications Societies. 作者简介: Hong Kong:EEE,2004,3:1616-1627. 王景丽,女,1981年生,讲师。主要 [7]CHEN Guangrong,FAN Zhenping,LI Xiang.Modeling the 研究方向为复杂网络。 complex Internet topology[C]//KOCAREV L,VATTAY G. Complex Dynamics in Communication Networks.Berlin Hei- delberg:Springer,2005. [8]田思,李慧嘉,赵岳.一种新型多局域世界网络模型分 析J].计算机应用研究,2013,30(3):869-872. 许立波,男,1976年生,讲师,博士。 TIAN Si,LI Huijia,ZHAO Yue.Analysis of novel multi-lo- 主要研究方向为复杂网络、overlay网 cal world network model[J].Application Research of Com- 络。 puters,.2013,30(3):869-872. 9 NEWMAN M E J.The structure of scientific collaboration networks[C].Proceedings of National Academy Sciences
分布幂率指数在 1 ~ 3,具有普遍适用性。 通过和真 实在线社交网络结构的模拟分析,本文提出的演化 模型能较好地反映出在线社交网络的度分布特征, 且能够刻画不同类型的社交网络,具有较强的实用 意义。 本文演化模型是基于最基本的无向无权网络, 下一步的工作考虑扩展到复杂的多属性异构网络, 这些属性包括有向、权值、节点能力等。 借助因素空 间理论[16⁃17] ,将多属性异构网络映射成因素空间网 络,网络节点映射成因素空间对象,使其更加贴近于 现实网络,通过权变、拓扑结构、动态时空等因素空 间理论工具研究演化网络模型和实际在线社会网络 的生成、发展及其特征。 参考文献: [1] WATTS D J, STROGATZ S H. Collective dynamics of ' small⁃world′ networks [ J]. Nature, 1998, 393 ( 6684): 440⁃442. [2]BARABASI A L, ALBERT R. Emergence of scaling in ran⁃ dom networks[J]. Science, 1999, 286(5439): 509⁃512. [ 3]FALOUTSOS M, FALOUTSOS P, FALOUTSOS C. On pow⁃ er⁃law relationships of the Internet topology[ J]. ACM SIG⁃ COMM Computer Communication Review Homepage, 1999, 29(4): 251⁃262. [4] ALBERT R, BARABASI A L. Topology of evolving net⁃ works: local events and universality [ J]. Physical Review Letters 2000, 85(24): 5234⁃5237. [5] BU T, TOWSLEY D. On distinguishing between Internet power law topology generators[C] / / Proceedings of INFO⁃ COM 2002. Twenty⁃First Annual Joint Conference of the IEEE Computer and Communications Societies. New York, NY: IEEE, 2002, 2: 638⁃647. [6]PARK S T, PENNOCK D M, GILES C L. Comparing static and dynamic measurements and models of the Internet's as topology[C] / / Proceedings of the 23rd Annual Joint Confer⁃ ence of the IEEE Computer and Communications Societies. Hong Kong: IEEE, 2004, 3: 1616⁃1627. [7]CHEN Guangrong, FAN Zhenping, LI Xiang. Modeling the complex Internet topology[C] / / KOCAREV L, VATTAY G. Complex Dynamics in Communication Networks. Berlin Hei⁃ delberg: Springer, 2005. [8]田思, 李慧嘉, 赵岳. 一种新型多局域世界网络模型分 析[J]. 计算机应用研究, 2013, 30(3): 869⁃872. TIAN Si, LI Huijia, ZHAO Yue. Analysis of novel multi⁃lo⁃ cal world network model[J]. Application Research of Com⁃ puters, 2013, 30(3): 869⁃872. [9] NEWMAN M E J. The structure of scientific collaboration networks[C]. Proceedings of National Academy Sciences, 2001, 98(2): 404⁃409. [10]MYERS C R. Software systems as complex networks: struc⁃ ture, function, and evolvability of software collaboration graphs [ J ]. Physical Review E, 2003, 68 ( 4Pt2 ): 046116. [11]JEONG H, MASON S P, BARABASI A L, et al. Lethality and centrality in protein networks[ J]. Nature, 2001, 411 (6833): 41⁃42. [12]王亚奇, 王静, 杨海滨. 基于复杂网络理论的微博用户 关系网络演化模型研究[J]. 物理学报, 2014, 63(20): 208902. WANG Yaqi, WANG Jing, YANG Haibin. An evolution model of microblog user relationship networks based on complex network theory [ J]. Acta Physica Sinica, 2014, 63(20): 208902. [13]刘浩然, 尹文晓, 董明如, 等. 一种强容侵能力的无线 传感器网络无标度拓扑模型研究[J]. 物理学报, 2014, 63(9): 090503. LIU Haoran, YIN Wenxiao, DONG Mingru, et al. Study on the scale⁃free topology model with strong intrusion⁃toler⁃ ance ability in wireless sensor networks[ J]. Acta Physica Sinica, 2014, 63(9): 090503. [14]SOLE R V, PASTOR⁃SATORRAS R, SMITH E, et al. A model of large⁃scale proteome evolution[ J]. Advances in Complex Systems, 2002, 5(1): 43⁃54. [15] 维基 选 举 社 交 网 络 [ OL/ EB]. [ 2014⁃12⁃21]. http: / / www.linkprediction.org / index.php / link / resource / data. [16]汪培庄. 因素空间与因素库[ J]. 辽宁工程技术大学学 报: 自然科学版, 2013, 32(10): 1297⁃1304. WANG Peizhuang. Factor spaces and factor data⁃bases[J]. Journal of Liaoning Technical University: Natural Science, 2013, 32(10): 1297⁃1304. [17]汪培庄. 因素空间与数据科学[ J]. 辽宁工程技术大学 学报: 自然科学版, 2015, 34(2): 273⁃280. WANG Peizhuang. Factor spaces and data science [ J]. Journal of Liaoning Technical University: Natural Science, 2015, 34(2): 273⁃280. 作者简介: 王景丽,女,1981 年生,讲师。 主要 研究方向为复杂网络。 许立波,男,1976 年生,讲师,博士。 主要研究方向为复杂网络、 overlay 网 络。 第 6 期 王景丽,等:复杂网络中的在线社交网络演化模型 ·953·