正在加载图片...
.346. 智能系统学报 第11卷 (6 图G\上计算最大流: 7 对每个节点v∈V,对节点v添加通过其的 流f()。 2 (8 9 3)选择O(k)个具有最大f值的节点作为候选 ③ 者D。 4)对p∈D,即第h层网络的结构洞占据者候 4 2 10 选节点,计算:P%=arg min,enMC(G\(aU{p}), ⑩ C)。 ③ 14 5)更新H=U{P%}。 6)重复2)~5),直到11=k。 7)重复2)~6),直到求出前x层的结构洞占 图3细粒度下的社团结构 据者集合VH。 Fig.3 Community structure in fine granularity 社团结构是复杂网络最重要和最普遍的拓扑性 2 多粒度结构洞发现方法 质之一。在信息传播网中,同一社团内的信息传播 较为迅速,而社团间的信息传播较为缓慢。在分层 本文算法基于社团结构,主要思想为将多粒 网络中,社团划分粒度的变化将改变整个网络的社 度[5与社团划分结合,得到不同粒度下的社团结 团结构,跨越社团的结构洞占据者属性也会随之变 构,最后再根据不同粒度下的社团结构求出网络中 化。对分层网络中的结构洞占据者进行发现及分析 的结构洞占据者。为有效挖掘层次网络中的结构 可以帮助揭露多粒度网络中节点跨越结构洞程度, 洞,我们将MaxD模型[20]中的最小割思想引入到层 即不同粒度下结构洞节点在社团间信息传播和异质 次网络中,作为分层网络结构洞挖掘的理论依据。 性资源获取方面优势的变化,以及结构洞位置的变 在不同粒度的社团结构中,使用最大流算法,分析节 化情况。 点的最大流变化情况并根据最小割求出结构洞占据 在MG_MaxD方法中,使用EAGLE算法首先获 者。多粒度结构洞发现方法MG_MaxD的主要步 得最优模块度下的社团结构,然后在此社团结构下, 骤:1)使用分层社团发现算法对网络进行多粒度划 将网络细化得到较细粒度下的社团结构,重复此步 分,并得到不同粒度的社团划分结果:2)根据当前 骤直到获得前τ层的社团结构。根据获得的多粒度 层网络的社团结构,使用MaxD算法中的最大流和 社团结构,使用MG_MaxD算法获得网络G在不同 最小割求出结构洞占据者:3)重复第2)步,直到求 粒度下的前k个结构洞占据者。社团划分粒度越 出前r层的结构洞占据者集合。实验最后将分 细,则网络中的社团个数越多,且社团规模可能减 析不同粒度下结构洞占据者的结构洞程度变化。 小,即粗粒度下的社团在细粒度下可能被划分为多 MG_MaxD算法的输入为网络G、结构洞个数k、分层 个社团,使社团结构产生很大变化。 数r;输出为前r层结构洞占据者集合V出。 MG_MaxD算法具体步骤如下。 3实验设置与结果分析 算法2层次结构网络结构洞发现方法MG_ 3.1数据及衡量指标 MaxD 本文所使用的数据包括公用数据和实例数据。 输入网络G=(V,E),结构洞个数k,分层数r 公用数据为在清华大学ArnetMiner(研究者社会网 输出前r层结构洞占据者集合V' 络分析与挖掘系统)系统下载的数据Topic 131和 1)使用分层社团发现算法将网络G分层,并获 Topic145,是公用的合著网络数据集。以论文中的 得前r层的网络社团结构C={C}(1≤h≤r,1≤i≤ 作者作为网络的节点,作者间的合著关系作为边。 nw},式中C表示第h层的第i个社团,n4表示第h 实例数据为CCF推荐国际学术会议A类的ICML 层的社团个数,h越大,表示社团划分粒度越细。 会议从2005年到2014年共10年出版的论文,统计 2)对C(1≤h≤r)层网络 论文标题和文章作者信息,对数据进行处理,若两个 给每个节点v∈V初始化流量f()=0; 作者出现在同一个文章里,则这两个作者之间有一 对每个非空SC{1,2,…,},1为当前层网络 条边,依据这些信息最后构建为一个合著网络,将数 社团个数: 据集表示为ICML_10。 利用源点Es=U:e4C和汇点Er=U:.4C,在 实验数据具体信息如表1所示。图 3 细粒度下的社团结构 Fig.3 Community structure in fine granularity 2 多粒度结构洞发现方法 本文算法基于社团结构,主要思想为将多粒 度[25⁃26]与社团划分结合,得到不同粒度下的社团结 构,最后再根据不同粒度下的社团结构求出网络中 的结构洞占据者。 为有效挖掘层次网络中的结构 洞,我们将 MaxD 模型[20] 中的最小割思想引入到层 次网络中,作为分层网络结构洞挖掘的理论依据。 在不同粒度的社团结构中,使用最大流算法,分析节 点的最大流变化情况并根据最小割求出结构洞占据 者。 多粒度结构洞发现方法 MG_MaxD 的主要步 骤:1)使用分层社团发现算法对网络进行多粒度划 分,并得到不同粒度的社团划分结果;2) 根据当前 层网络的社团结构,使用 MaxD 算法中的最大流和 最小割求出结构洞占据者;3)重复第 2)步,直到求 出前 r 层的结构洞占据者集合 V r SH 。 实验最后将分 析不同粒度下结构洞占据者的结构洞程度变化。 MG_MaxD 算法的输入为网络 G、结构洞个数 k、分层 数 r; 输 出 为 前 r 层 结 构 洞 占 据 者 集 合 V r SH 。 MG_MaxD算法具体步骤如下。 算法 2 层次结构网络结构洞发现方法 MG_ MaxD 输入 网络 G = (V,E),结构洞个数 k,分层数 r 输出 前 r 层结构洞占据者集合 V r SH 1)使用分层社团发现算法将网络 G 分层,并获 得前 r 层的网络社团结构 C = {C h i }(1≤h≤r,1≤i≤ nh },式中 C h i 表示第 h 层的第 i 个社团,nh 表示第 h 层的社团个数,h 越大,表示社团划分粒度越细。 2) 对 C h (1≤h≤r)层网络 给每个节点 v∈V 初始化流量 f(v)= 0; 对每个非空 S h⊂{1,2,…,l},l 为当前层网络 社团个数; 利用源点 ES =∪i∈S hC h i 和汇点 ET = ∪i∉S hC h i ,在 图 G \V h SH上计算最大流; 对每个节点 v ∈ V, 对节点 v 添加通过其的 流 f(v)。 3) 选择 O(k)个具有最大 f 值的节点作为候选 者 D。 4) 对 p h∈D,即第 h 层网络的结构洞占据者候 选节点,计算:p ∗ h = arg minp h∈DMC(G \ (V h SH∪{p h }), C h )。 5) 更新 V h SH = V h SH∪{p ∗ h }。 6) 重复 2) ~ 5),直到| V h SH | = k。 7) 重复 2) ~ 6),直到求出前 r 层的结构洞占 据者集合 V r SH 。 社团结构是复杂网络最重要和最普遍的拓扑性 质之一。 在信息传播网中,同一社团内的信息传播 较为迅速,而社团间的信息传播较为缓慢。 在分层 网络中,社团划分粒度的变化将改变整个网络的社 团结构,跨越社团的结构洞占据者属性也会随之变 化。 对分层网络中的结构洞占据者进行发现及分析 可以帮助揭露多粒度网络中节点跨越结构洞程度, 即不同粒度下结构洞节点在社团间信息传播和异质 性资源获取方面优势的变化,以及结构洞位置的变 化情况。 在 MG_MaxD 方法中,使用 EAGLE 算法首先获 得最优模块度下的社团结构,然后在此社团结构下, 将网络细化得到较细粒度下的社团结构,重复此步 骤直到获得前 r 层的社团结构。 根据获得的多粒度 社团结构,使用 MG_MaxD 算法获得网络 G 在不同 粒度下的前 k 个结构洞占据者。 社团划分粒度越 细,则网络中的社团个数越多,且社团规模可能减 小,即粗粒度下的社团在细粒度下可能被划分为多 个社团,使社团结构产生很大变化。 3 实验设置与结果分析 3.1 数据及衡量指标 本文所使用的数据包括公用数据和实例数据。 公用数据为在清华大学 ArnetMiner(研究者社会网 络分析与挖掘系统) 系统下载的数据 Topic 131 和 Topic 145,是公用的合著网络数据集。 以论文中的 作者作为网络的节点,作者间的合著关系作为边。 实例数据为 CCF 推荐国际学术会议 A 类的 ICML 会议从 2005 年到 2014 年共 10 年出版的论文,统计 论文标题和文章作者信息,对数据进行处理,若两个 作者出现在同一个文章里,则这两个作者之间有一 条边,依据这些信息最后构建为一个合著网络,将数 据集表示为 ICML_10。 实验数据具体信息如表 1 所示。 ·346· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有