正在加载图片...
·60 智能系统学报 第6卷 表1南方女士数据集DGG Table 1 Participants-events of DGG 参与事件 参与者 El E2 E3 E4 E5 E6 E7 E8 E9 E10 E11 E12 E13E14 PI X F F 下 子 P2 X X P3 X X X X X X X P4 X X P5 1 会 P10 P11 X P12 X P13 X X X P14 X P15 中 P16 P17 P18 X 空手道俱乐部数据集是Zachary在20世纪70 析的结果,见表2.表2中数字1(2)表示参与者被划 年代初,用了2年来观察美国某大学的空手道俱乐 分到第1(2)社团中;数字1/2表示算法判断某个参 部成员间的人际关系,并依据这些成员平时的交往, 与者分到第1或第2个社团均可;NA表示算法对某 建立的一个1-mode网络,它反应了成员之间的社交 个参与者的社团归属未能做出确切判断.本文结果 状况2],见图2(a).空手道俱乐部网有34个点,代 在表2最后一行L&Y10给出. 表俱乐部成员;78条边,代表成员间的人际关系.在 考察表2,讨论以下3点. Zachary调查过程中,由于针对是否提高收费这一问 1)绝大多数算法将参与者P1~P7划到一个社 题,俱乐部管理者(1号顶点)与俱乐部教师(33号 团,本文方法得到相同结果。 顶点)之间产生了分歧并引发激烈的争论,最终导 2)在表2中,一个值得注意的地方是,部分算 致俱乐部网络分裂成2个部分:其中方形顶点代表 法认为P16、P17和P18的社团不可确定,理由是这 支持俱乐部管理者的成员,圆形顶点代表支持俱乐 3个参与者参加活动少,因而仅仅由可知的信息量 部教师的成员, 不能得到一个确定的判断.本文方法是一个强算法, 3.2实验结果及讨论 对每个参与者都会给出一个硬性划分.而且我们认 DCG和Zachary数据是具有代表性的社团结 为根据P16、P17、P18已有的活动信息,将她们划入 构,常常被使用作为示例来测试算法的效果,本文也 到社团二是合理的, 在这2个数据集上作算法测试: 3)DGG数据社团划分的难点在于判断参与者 1)计算各个网络节点的网络影响力,再根据节 P8的归属,各种方法给出了不同的结论.表1中,P8 点的影响力度量,将节点投影成高维空间点; 记录的社会活动有E6、E8和E9,其中E8是大多数 2)使用主分量分析PCA对生成的高维点降 人都会参与的大众活动,因而由活动E8不能推断 维,在具体实验中,保留前2维结构信息; 参与者P8的偏好,首先将E8排除不考虑.活动E6 3)计算点点间的距离(余弦),作K-means聚 和E9则是具有代表性的社团活动,其特征为绝大 类,根据聚类结果来决定网络的社团结构。 多数参与者是同一个社团内成员,很少有另一个社 3.2.1DGG数据实验结果 团成员参加.表2中部分算法认为P8具有更强的社 在Freeman的综述性文章23]中,列出了自1940 团一倾向,解释如下:比较E6和9,参与E6仅有一 年以来,超过20种方法在数据集DGG上作社团分 个社团外部成员P14,而参与E9的有3个非社团成
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有