正在加载图片...
·553· 常新功,等:基于图卷积集成的网络表示学习 第3期 实验结果显示,在各数据集上stacking集成 0.35 DeepWalk Node2Vec 后的效果明显优于各初级学习器,仅使用网络结 0.30 Line 构的GCN集成与使用网络结构和属性特征的GCN GCN(异质) 0.25 GCN(同质DeepWalk】 效果相当。这一方面归功于初级学习器的“好而 GCN(同质Node2Vec 0.20 GCN(同质Line) 不同”,即初级学习器有一定的网络表示学习能 0.15 力,并且学习器之间具有差异性,会有互补作用: 另一方面归功于GCN作为stacking集成次级学习 器的有效性,GCN根据对称归一化拉普拉斯矩阵 的性质为邻居分配权重,然后聚合邻居信息。 MRR Hit@1 Hit@3 Hit@10 3.3损失函数有效性验证 评价指标名称 本文根据网络的一阶邻近性设计了损失函 (a)Cora数据集指标结果 数,通过设计使用损失函数和未使用损失函数的 0.70 1DeepWalk 实验来验证损失函数的有效性。表3展示了各数 0.60 Node2 Vec 据集评价指标的比较,图中数据集名称的表示未 LLine 0.50 GCN(异质) 使用损失函数,数据集名称中的“-0ss”表示使用 GCN(DeepWalk同质) 0.40 GCN(同质Node2Vec) 了损失函数。实验结果表明,使用损失函数的评 GCN(同质Line) 价指标与未使用损失函数的相比平均提升了0.44 0.30 1.79倍,验证了本文损失函数的有效性。 表3损失函数有效性验证指标结果 Table 3 Results of validation index of loss function 数据集 MRR Hit@1 Hit@3 Hit@10 MRR Hits@l Hits@3 Hits@10 评价指标名称 Cora 0.084 0.021 0.057 0.181 (b)Citeseer数据集指标结果 Cora-loss 0.142 0.068 0.149 0.278 0.28 Citeseer 0.140 0.045 0.127 0.248 DeepWalk 0.24 Node2Vec Citeseer-loss 0.195 0.09 0.247 0.346 Line Pubmed 0.114 0.035 0.091 0.259 0.20 GCN GCN(DeepWalk同质) 解 Pubmed-loss 0.220 0.108 0.264 0.407 GCN (Node Vec同质) GCN (Line同质) Wiki 0.095 0.024 0.071 0.183 70.12 Wiki-loss 0.124 0.049 0.098 0.221 0.08 P2P 0.076 0.022 0.059 0.154 P2P-loss 0.119 0.064 0.121 0.188 0.0 Email 0.102 0.025 0.074 0.245 MRR Email-loss 0.255 Hit@1 Hit@3 Hit@10 0.213 0.089 0.424 评价指标名称 3.4同质集成实验对比 (c)P2P-Gnutella05数据集指标结果 本节对比算法分别进行同质stacking,对比设 图7各数据集同质/异质集成对比 计如表4所示,第1~3行是同质集成,第4行是 Fig.7 Comparison of homogeneous heterogeneous integ- ration among datasets 3.2节的实验设定。图7展示了Cora、Citeseer 和P2P-Gnutella(05数据集同质、异质集成及3个 实验结果表明,在不同数据集上不同的同质 初级学习器对比的实验结果。 集成各评价指标的表现不同。但是同质集成效果 均明显优于初级学习器的效果,平均提升了1.46 表4对比算法设计 Table 4 Design of contrast algorithms 1.91倍,所以异质集成的效果平均优于同质集 初级学习器1初级学习器2初级学习器3次级学习器 成。在Cora数据集上,DeepWalk和Node2Vec同 质集成的效果略差于异质集成,Line同质集成略 DeepWalk DeepWalk DeepWalk GCN 好于异质集成;在Citeseer数据集上,DeepWalk同 Node2Vec Node2Vec Node2Vec GCN 质集成效果与异质集成相当,Line和Node2Vec Line Line Line GCN 同质集成略好于异质集成;在P2P-Gnutella05数 DeepWalk Node2Vec Line GCN 据集上,Line同质集成效果与异质集成相当,Node实验结果显示,在各数据集上 stacking 集成 后的效果明显优于各初级学习器,仅使用网络结 构的 GCN 集成与使用网络结构和属性特征的 GCN 效果相当。这一方面归功于初级学习器的“好而 不同”,即初级学习器有一定的网络表示学习能 力,并且学习器之间具有差异性,会有互补作用; 另一方面归功于 GCN 作为 stacking 集成次级学习 器的有效性,GCN 根据对称归一化拉普拉斯矩阵 的性质为邻居分配权重,然后聚合邻居信息。 3.3 损失函数有效性验证 本文根据网络的一阶邻近性设计了损失函 数,通过设计使用损失函数和未使用损失函数的 实验来验证损失函数的有效性。表 3 展示了各数 据集评价指标的比较,图中数据集名称的表示未 使用损失函数,数据集名称中的“-loss”表示使用 了损失函数。实验结果表明,使用损失函数的评 价指标与未使用损失函数的相比平均提升了 0.44~ 1.79 倍,验证了本文损失函数的有效性。 表 3 损失函数有效性验证指标结果 Table 3 Results of validation index of loss function 数据集 MRR Hits@1 Hits@3 Hits@10 Cora 0.084 0.021 0.057 0.181 Cora-loss 0.142 0.068 0.149 0.278 Citeseer 0.140 0.045 0.127 0.248 Citeseer-loss 0.195 0.09 0.247 0.346 Pubmed 0.114 0.035 0.091 0.259 Pubmed-loss 0.220 0.108 0.264 0.407 Wiki 0.095 0.024 0.071 0.183 Wiki-loss 0.124 0.049 0.098 0.221 P2P 0.076 0.022 0.059 0.154 P2P-loss 0.119 0.064 0.121 0.188 Email 0.102 0.025 0.074 0.245 Email-loss 0.213 0.089 0.255 0.424 3.4 同质集成实验对比 本节对比算法分别进行同质 stacking,对比设 计如表 4 所示,第 1~3 行是同质集成,第 4 行是 3.2 节的实验设定。图 7 展示了 Cora、Citeseer 和 P2P-Gnutella05 数据集同质、异质集成及 3 个 初级学习器对比的实验结果。 表 4 对比算法设计 Table 4 Design of contrast algorithms 初级学习器1 初级学习器2 初级学习器3 次级学习器 DeepWalk DeepWalk DeepWalk GCN Node2Vec Node2Vec Node2Vec GCN Line Line Line GCN DeepWalk Node2Vec Line GCN 0 0.05 0.15 0.25 0.35 0.10 0.20 0.30 MRR Hit@1 Hit@3 Hit@10 评价指标名称 DeepWalk Node2Vec Line GCN (异质) GCN (同质 DeepWalk) GCN (同质 Node2Vec) GCN (同质 Line) 0 0.10 0.20 0.30 0.60 0.70 0.40 0.50 MRR Hit@1 Hit@3 Hit@10 评价指标名称 DeepWalk Node2Vec Line GCN (异质) GCN (DeepWalk 同质) GCN (同质 Node2Vec) GCN (同质 Line) 0 0.04 0.24 0.28 0.20 0.16 0.12 0.08 MRR Hit@1 Hit@3 Hit@10 评价指标名称 (a) Cora 数据集指标结果 (b) Citeseer 数据集指标结果 (c) P2P-Gnutella05 数据集指标结果 DeepWalk Node2Vec Line GCN GCN (DeepWalk 同质) GCN (NodeVec 同质) GCN (Line 同质) 排名正确率 排名正确率 排名正确率 图 7 各数据集同质/异质集成对比 Fig. 7 Comparison of homogeneous / heterogeneous integ￾ration among datasets 实验结果表明,在不同数据集上不同的同质 集成各评价指标的表现不同。但是同质集成效果 均明显优于初级学习器的效果,平均提升了 1.46~ 1.91 倍,所以异质集成的效果平均优于同质集 成。在 Cora 数据集上,DeepWalk 和 Node2Vec 同 质集成的效果略差于异质集成,Line 同质集成略 好于异质集成;在 Citeseer 数据集上,DeepWalk 同 质集成效果与异质集成相当,Line 和 Node2Vec 同质集成略好于异质集成;在 P2P-Gnutella05 数 据集上,Line 同质集成效果与异质集成相当,Node- ·553· 常新功,等:基于图卷积集成的网络表示学习 第 3 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有