正在加载图片...
第4期 杨宇迪,等:异质信息网络中基于网络嵌入的影响力最大化 ·763· Yelp数据集上的计算时间最少,4-area数据集上 的计算时间最多。 表1不同算法的计算时间比较 Table 1 Comparison of computation time of different algorithm s 数据集 DC PageRank Entropy-based MPIE IMNE 4-area 3.6055 11.2153 652.6717 10194.2154 6560.0586 Amazon 2.0362 9.7238 329.6371 9652.9749 1149.1622 Yelp 0.7461 4.8529 283.2934 750.2954 340.1706 其次,IMNE算法花费的计算时间高于同质 网络中的方法(DC、PageRank和Entropy-based), 75 这是因为IMNE算法既考虑了HN中节点的异质 性又度量了节点的直接影响力和间接影响力,而 70 DC、PageRank和Entropy-based忽略了HN中节 =+-a=0.6,=0.4 点类型和边类型,仅做简单的计算;MNE算法的 65 ◆-a=0.3,=0.7 -●-a=0.7,=03 计算时间少于MPIE算法,这是因为MPIE算法需 a=0.4,P=0.6 -◆a-0.8B=0.2 -4-a=0.5=0.5 -◆-a=0.9,-0.1 要迭代计算不同元路径下节点的社会影响力进行 60 20 40 60 80100 融合,而MNE算法通过网络嵌人已将HN映射 top-k 于同一向量空间,节省了社会影响力的计算时间。 (b)4-area 通过分析IMNE算法的计算效率和有效性可 50 -◆-a=0.6,=0.4 以发现,IMNE算法不仅相较于其他基准算法能 -◆-=0.3,-0.7 -◆-=0.7,-0.3 -+-a=0.4,-0.6 45 在更短的时间内实现影响力最大化,而且在社会 -◆-=0.8,=0.2 -g-=0.5,=0.5 -。-a=0.9,=0.1 影响力的计算效率上,也具有一定的优势。 40 3.5参数分析 1)权重的影响。 35 图7展示了MNE算法中直接影响力和间接 20 影响力的各种线性组合对影响力最大化的影响。 40 60 80100 top-k 从图T(a)、(b)可以看出直接影响力和间接影响力 (c)Amazon 的权重分别为0.6和0.4时,感染率优于其他组 图7不同的权重对IMNE算法的影响 合。这表明区分直接影响力和间接影响力对影响 Fig.7 Comparison of IMNE with different weight of dir- 力最大化具有重要意义。此外,在Amazon数据 ect and indirect influence on three datasets. 集下,不同直接影响力和间接影响力权重组合, 2)感染概率y的影响。 其感染率变化不明显,这是因为Amazon是一个 SIR模型主要包含感染概率y和恢复概率O 密集数据集,在密集数据集中,具有较高直接影 两个参数,本节实验测试了感染概率y=(0.4,0.5,0.6, 响力的节点其也具有较高的间接影响力。因此, 0.7,0.8,0.9)对MNE算法的影响,测试结果如图8 本文将直接影响力和间接影响力的权重分别设置 为0.6和0.4。 所示。 90 70 75 65 5 60 =◆-a=0.6,=0.4 -◆-a=0.3,=0.7 -。-a=0.7,=0.3 30 -0-=0.4 ==-1=0.7 --a=0.4,=0.6 -◆-a=0.8.=02 -◆-7=0.5 --=0.8 a=0.5,=0.5 -◆-=0.9,=0.1 -◆-=0.6 -。-=0.9 50 20 40 60 80 100 20 0 60 80 100 top-k top-k (a)Yelp (a)YelpYelp 数据集上的计算时间最少,4-area 数据集上 的计算时间最多。 表 1 不同算法的计算时间比较 Table 1 Comparison of computation time of different algorithm s 数据集 DC PageRank Entropy-based MPIE IMNE 4-area 3.605 5 11.2153 652.671 7 10 194.2154 6 560.0586 Amazon 2.036 2 9.7238 329.637 1 9 652.9749 1 149.1622 Yelp 0.746 1 4.8529 283.293 4 750.2954 340.170 6 其次,IMNE 算法花费的计算时间高于同质 网络中的方法 (DC、PageRank 和 Entropy-based), 这是因为 IMNE 算法既考虑了 HIN 中节点的异质 性又度量了节点的直接影响力和间接影响力,而 DC、PageRank 和 Entropy-based 忽略了 HIN 中节 点类型和边类型,仅做简单的计算;IMNE 算法的 计算时间少于 MPIE 算法,这是因为 MPIE 算法需 要迭代计算不同元路径下节点的社会影响力进行 融合,而 IMNE 算法通过网络嵌入已将 HIN 映射 于同一向量空间,节省了社会影响力的计算时间。 通过分析 IMNE 算法的计算效率和有效性可 以发现,IMNE 算法不仅相较于其他基准算法能 在更短的时间内实现影响力最大化,而且在社会 影响力的计算效率上,也具有一定的优势。 3.5 参数分析 1) 权重的影响。 图 7 展示了 IMNE 算法中直接影响力和间接 影响力的各种线性组合对影响力最大化的影响。 从图 7(a)、(b) 可以看出直接影响力和间接影响力 的权重分别为 0.6 和 0.4 时,感染率优于其他组 合。这表明区分直接影响力和间接影响力对影响 力最大化具有重要意义。此外,在 Amazon 数据 集下,不同直接影响力和间接影响力权重组合, 其感染率变化不明显,这是因为 Amazon 是一个 密集数据集,在密集数据集中,具有较高直接影 响力的节点其也具有较高的间接影响力。因此, 本文将直接影响力和间接影响力的权重分别设置 为 0.6 和 0.4。 2) 感染概率 γ 的影响。 γ θ γ = (0.4,0.5,0.6, 0.7,0.8,0.9) SIR 模型主要包含感染概率 和恢复概率 两个参数,本节实验测试了感染概率 对 IMNE 算法的影响,测试结果如图 8 所示。 75 70 65 60 1 20 1 40 60 80 100 top-k (b) 4-area 感染率/% α=0.3, β=0.7 α=0.4, β=0.6 α=0.5, β=0.5 α=0.6, β=0.4 α=0.7, β=0.3 α=0.8, β=0.2 α=0.9, β=0.1 50 45 35 40 30 20 40 60 80 100 top-k (c) Amazon 感染率/% α=0.6, β=0.4 α=0.7, β=0.3 α=0.8, β=0.2 α=0.3, β=0.7 α=0.4, β=0.6 α=0.5, β=0.5 α=0.9, β=0.1 图 7 不同的权重对 IMNE 算法的影响 Fig. 7 Comparison of IMNE with different weight of dir￾ect and indirect influence on three datasets. 75 70 65 60 50 55 1 40 60 80 100 20 top-k (a) Yelp 感染率/% α=0.3, β=0.7 α=0.4, β=0.6 α=0.5, β=0.5 α=0.6, β=0.4 α=0.7, β=0.3 α=0.8, β=0.2 α=0.9, β=0.1 90 75 60 45 30 1 15 20 40 60 80 100 top-k (a) Yelp 感染率/% γ=0.4 γ=0.5 γ=0.6 γ=0.7 γ=0.8 γ=0.9 第 4 期 杨宇迪,等:异质信息网络中基于网络嵌入的影响力最大化 ·763·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有