正在加载图片...
第3期 韩忠明,等:基于内容的热点话题传播模型 ·235· 节点状态为R时算法结束,在循环体中,对网络中 直观分析式(1),用户标签和话题标签的相似 的每个节点进行状态判断,并进行相应的操作」 度越高,用户对话题的敏感度越高,也就越容易传播 表1传播过程算法 话题,这与现实一致。 Table 1 Propagation process algorithm 2.2仿真实验结果与分析 序号 伪代码 实验采用3种网络形态对CSRS模型的传播效 1) 初始化 果进行仿真分析,3种网络形态分别是: 2) 初始化参数 l)无标度网络(scale--free network,FS).无标度 网络具有很强的异质性,少量的节点占据了大量的 3) 随机产生初始的话题发起者 边,因此这些少数节点对于网络的性质会有很大的 4) hile:循环 影响 5) For i in Networks:对网络的每个节点 2)小世界网络(small--world network,WS).小世 6) Ifi==“”:如果节点状态为I 界网络具有小世界特性(较小的平均最短路径)及 1 fi在保持时间范围内: 聚类特性(较大的聚类系数).采用WS模型生成小 8) 保持 世界网络,其中重连概率p设为0.2 3)随机网络(Erdos-Renyi network,ER).随机网 9) Else:以概率8进行重入 络的结构具有很大的变化,通过Erdos-Renyi模型生 10) Eifi==“S”:如果节点状态为S 成随机网络,其中连接概率设为0.02. 11) 获取相邻节点 为了比较CSRS模型在3种网络上的不同传播效 12) 计算参与概率P 应,对3种网络都采用相同的参数设置,如表2所示其 13) 以概率P,感染 中,话题保持时间长度π是一个随机变量,假设每个用 户对话题的保持时间长度是一个正态分布,为了简单 2 实验结果与分析 起见,设分布的均值为7. 为了分析CSIRS模型的传播模式,采用Python 表2参数设置 语言实现了一个仿真系统,Python中包含一个 Table 2 Parameter settings SimPy(simulation in Python)包,基于SimPy验证 参数 值 CSRS模型的效果.实验分为2个部分:1)仿真实 节点个数N 200 验,用来分析和考察CSRS模型在不同类型复杂网 话题吸引力指数0 0.5 络下的传播模式:2)真实社会网络实验,用来分析 话题保持时间长度π N(7.1) 和考察CSRS模型在一个真实社会网络下的传播 用户重入概率8 0.5 模式. 所有的实验都运行在一个平台下,平台实验环 用户对话题的敏感度B 2xITenU B.=7+ 境为ntel I5M5402.53 GHz CPU、4GB内存、300GB 3种不同的网络在相同的参数配置下各执行3 硬盘,操作系统为Windows7,Python版本为2.7. 次仿真实验,并将3次结果进行综合比较.图2~4分 2.1实验设置 别是无标度网络、小世界网络和随机网络上的实验 在仿真环境中,用户对不同话题的敏感程度难 结果综合分析图2~4的传播模式,可以得出如下 以界定,为了真实地仿真用户受话题吸引的程度,采 结论 用模拟标签的方式模拟用户对不同话题的敏感度. 1)CSIRS模型在不同的网络上,话题传播呈现 对话题随机设定3~8个标签,类似地,对用户也 不同的模式.CSRS模型在小世界网络上感染的用 随机设定3~8个标签,然后计算用户标签和话题标 户最多,速度也快,但消息的消退速度也最快:而在 签的相似度作为用户对话题的敏感度.设话题标签为 无标度网络上传播的速度最慢,消退的速度也最慢. T={tag(1),tag(2),…,tag(n)},用户标签为Ua= 2)从图2可以看出,CSRS模型在无标度网络 {tag(1),tag(2),…,tag(n)},则用户i对话题的敏感 上的传播能够呈现出多个波动.由于无标度网络中 度定义为 度很高的节点很少,多数节点的度都很小,因此如果 2×lTae∩UaeI 消息无法传播到度高的节点上,那么话题的传播范 B.=Tp+l Ue (1) 围会很小,如图2(c)所示.如果话题传播过程中传节点状态为 R 时算法结束,在循环体中,对网络中 的每个节点进行状态判断,并进行相应的操作. 表 1 传播过程算法 Table 1 Propagation process algorithm 序 号 伪代码 1) 初始化 2) 初始化参数 3) 随机产生初始的话题发起者 4) While: 循环 5) For i in Networks: 对网络的每个节点 6) If i = = “I”:如果节点状态为 I 7) If i 在保持时间范围内: 8) 保持 9) Else:以概率 δ 进行重入 10) Elif i = = “S”:如果节点状态为 S 11) 获取相邻节点 12) 计算参与概率 pi 13) 以概率 pi 感染 2 实验结果与分析 为了分析 CSIRS 模型的传播模式,采用 Python 语言实 现 了 一 个 仿 真 系 统, Python 中 包 含 一 个 SimPy ( simulation in Python) 包, 基于 SimPy 验证 CSIRS 模型的效果.实验分为 2 个部分:1) 仿真实 验,用来分析和考察 CSIRS 模型在不同类型复杂网 络下的传播模式;2) 真实社会网络实验,用来分析 和考察 CSIRS 模型在一个真实社会网络下的传播 模式. 所有的实验都运行在一个平台下,平台实验环 境为 Intel I5 M540 2.53 GHz CPU、4GB 内存、300GB 硬盘,操作系统为 Windows7,Python 版本为 2.7. 2.1 实验设置 在仿真环境中,用户对不同话题的敏感程度难 以界定,为了真实地仿真用户受话题吸引的程度,采 用模拟标签的方式模拟用户对不同话题的敏感度. 对话题随机设定 3~8 个标签,类似地,对用户也 随机设定 3 ~ 8 个标签,然后计算用户标签和话题标 签的相似度作为用户对话题的敏感度.设话题标签为 Ttags ={tag(1),tag(2),…,tag(n)},用户标签为Utags = {tag(1),tag(2),…,tag(n)},则用户 i 对话题的敏感 度定义为 βi = 2 ×| Ttags ∩ Utags | | Ttags | +| Utags | . (1) 直观分析式(1),用户标签和话题标签的相似 度越高,用户对话题的敏感度越高,也就越容易传播 话题,这与现实一致. 2.2 仿真实验结果与分析 实验采用 3 种网络形态对 CSIRS 模型的传播效 果进行仿真分析,3 种网络形态分别是: 1)无标度网络( scale⁃free network, FS).无标度 网络具有很强的异质性,少量的节点占据了大量的 边,因此这些少数节点对于网络的性质会有很大的 影响. 2)小世界网络(small⁃world network, WS).小世 界网络具有小世界特性(较小的平均最短路径) 及 聚类特性(较大的聚类系数).采用 WS 模型生成小 世界网络,其中重连概率 p 设为 0.2. 3)随机网络(Erdos⁃Renyi network, ER).随机网 络的结构具有很大的变化,通过 Erdos⁃Renyi 模型生 成随机网络,其中连接概率设为 0.02. 为了比较 CSIRS 模型在 3 种网络上的不同传播效 应,对 3 种网络都采用相同的参数设置,如表 2 所示.其 中,话题保持时间长度 π 是一个随机变量,假设每个用 户对话题的保持时间长度是一个正态分布,为了简单 起见,设分布的均值为 7. 表 2 参数设置 Table 2 Parameter settings 参 数 值 节点个数 N 200 话题吸引力指数 θ 0.5 话题保持时间长度 π N(7,1) 用户重入概率 δ 0.5 用户对话题的敏感度 βi βi = 2× | Ttags∩Utags | | Ttags | + |Utags | 3 种不同的网络在相同的参数配置下各执行 3 次仿真实验,并将 3 次结果进行综合比较.图 2~4 分 别是无标度网络、小世界网络和随机网络上的实验 结果.综合分析图 2 ~ 4 的传播模式,可以得出如下 结论. 1)CSIRS 模型在不同的网络上,话题传播呈现 不同的模式.CSIRS 模型在小世界网络上感染的用 户最多,速度也快,但消息的消退速度也最快;而在 无标度网络上传播的速度最慢,消退的速度也最慢. 2)从图 2 可以看出,CSIRS 模型在无标度网络 上的传播能够呈现出多个波动.由于无标度网络中 度很高的节点很少,多数节点的度都很小,因此如果 消息无法传播到度高的节点上,那么话题的传播范 围会很小,如图 2( c)所示.如果话题传播过程中传 第 3 期 韩忠明,等:基于内容的热点话题传播模型 ·235·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有