正在加载图片...
·234· 智能系统学报 第8卷 理论构建动力学演化方程组[]等。 基于话题内容的传播模型 在传染病动力学中,仓室模型是最常用的模式, 可根据不同的种群设置形成不同的模型,例如SR 为了克服传染病感染模型的缺点,假设影响话 SIS和SIRS等,这些模型假设种群中个体被感染者 题在社会网络上传播的因素有: 感染的概率相等随着小世界网络、无标度网络为代 1)话题吸引力指数:用来表达话题的内容特 表的复杂网络研究的兴起,将传染病疾病传播与社 性,用0表示.不同类型话题吸引用户参与的强度不 会结构相结合,使传染病传播模型深入到个人层 同,则0值不同. 面3).文献[6]用模拟方法证实了小世界网络能加 2)网络结构:由用户构成的社会网络 快疾病传播进程.文献[5,7-9]是无标度网络上传染 3)话题保持时间长度:一个节点能感知到话题的 病模型的代表,用平均场方法研究了节点无限的无 时间长度,如同疾病的携带期,用π表示.感染用户在 标度网上的SIS和SR模型.文献[9]说明无标度网 话题保持时间长度内,其状态一直为感染状态 络抵抗传染病的能力很弱,可以在任意小的有效传 4)节点对话题的敏感度:每个用户对话题的敏 播率下维持传播.文献[5]发现无标度网络条件下 感程度都不同,设用户i对话题T的敏感度为B SR模型的传播率阈值与节点度的指数截止值相 5)用户重入概率,用8表示,用户可以多次参与 关,随着指数截止值的增加而增大.SpikeM模型[o 话题,也就是可以多次感染.为了简单起见,设用户 解决了SI模型的缺点,即模型服从幂律下降规律的 重新进入易感群的概率为固定值」 同时保证待感染的节点数有限 采用SRS模型作为基础模型,提出一个基于内 除采用传染病传播动力模型外,自激霍克斯过 容的话题传播模型(content based SIRS model, 程(self-excited Hawkes process)[]等随机过程理论 CSIRS),其基本模型中的种群迁移如图1所示. 建模话题也是一个研究思路.Crane用带参数的自激 霍克斯泊松过程对YouTube视频评论进行建模[2]」 文献[13]假设一个暴力事件服从一个自激霍克斯 过程,并实现了复杂事件的自激霍克斯过程参数估 图1CSRS模型种群迁移示意 Fig.I Population migration in CSIRS 计以及事件预测.信息级联模型(information casca- ding model)采用了网络上的级联事件机制建 从图1可以看出,热点话题中涉及到的用户分 模复杂网络上的消息传播,它将网络中的事件看成 为3类种群:潜在参与用户(易感者$)、参与用户 由一系列的级联活动组成,一个参与者独立观察他 (已感染者I)和免疫用户(恢复者R).一个用户在 人的行为并做出自己的决策,这些决策依赖于用户 易感状态($)下,以不同的概率进行传播(感染).一 的偏好 个用户在感染状态(I)下,以特定的概率转化为免 无论是传统的仓室模式,还是基于复杂网络的 疫用户(R)或者重新进入易感状态(S). 传染病模型,都假设个体感染不同疾病的感染概率 在CSRS模型中,假设每个用户传播话题的概 相同,不同类型的疾病对易感人群的效应也是相同 率不同,下面给出CSIRS的传播概率.设在一个社会 的.然而,这2个假设在社会网络中都不太合理,网 网络中的用户总数为N,一个用户i的相邻用户个 络用户对不同类型的热点话题的敏感程度不同,如 数为N,该用户对话题的敏感度为B,则该用户在 对于一些负面的、批判性的热点话题,用户的参与性 传染时刻成为感染者的概率,也就是用户传播话题 较强:对于明星类热点话题参与性较低.同理,具有 的概率为 不同特征的用户对话题的敏感程度也不同,即个体 p,=1-(1-B,)29 感染疾病的概率不同 式中:δ为用户i的相邻用户中为感染者的符号函 针对上述不足,本文提出基于内容的网络热点 数,也就是 话题传播模型,该模型改进了传统传染病动力模型 (0, 用户j不是感染者: 的缺点,考虑了不同节点对不同话题的敏感度在小 6:= 世界、无标度、随机网络与真实社会网络上进行了不 1,用户j为感染者 根据CSIRS模型的假设条件和传播概率,设计 同的试验,实验结果表明了考虑用户和话题之间的 关系能够呈现出多个波动、小范围长时间传播、快速 传播过程算法,步骤如表1所示.传播过程算法分为 2个部分:1)初始化参数,随机产生初始话题的发起 上升缓慢下降等传播模式,验证了模型的有效性。 者:2)进入迭代循环,达到迭代次数上限或者所有理论构建动力学演化方程组[2]等. 在传染病动力学中,仓室模型是最常用的模式, 可根据不同的种群设置形成不同的模型,例如 SIR、 SIS 和 SIRS 等,这些模型假设种群中个体被感染者 感染的概率相等.随着小世界网络、无标度网络为代 表的复杂网络研究的兴起,将传染病疾病传播与社 会结构相结合,使传染病传播模型深入到个人层 面[3⁃5] .文献[6]用模拟方法证实了小世界网络能加 快疾病传播进程.文献[5,7⁃9]是无标度网络上传染 病模型的代表,用平均场方法研究了节点无限的无 标度网上的 SIS 和 SIR 模型.文献[9]说明无标度网 络抵抗传染病的能力很弱,可以在任意小的有效传 播率下维持传播.文献[5] 发现无标度网络条件下 SIR 模型的传播率阈值与节点度的指数截止值相 关,随着指数截止值的增加而增大. SpikeM 模型[10] 解决了 SI 模型的缺点,即模型服从幂律下降规律的 同时保证待感染的节点数有限. 除采用传染病传播动力模型外,自激霍克斯过 程(self⁃excited Hawkes process) [11] 等随机过程理论 建模话题也是一个研究思路.Crane 用带参数的自激 霍克斯泊松过程对 YouTube 视频评论进行建模[12] . 文献[13]假设一个暴力事件服从一个自激霍克斯 过程,并实现了复杂事件的自激霍克斯过程参数估 计以及事件预测.信息级联模型( information casca⁃ ding model) [14⁃18] 采用了网络上的级联事件机制建 模复杂网络上的消息传播,它将网络中的事件看成 由一系列的级联活动组成,一个参与者独立观察他 人的行为并做出自己的决策,这些决策依赖于用户 的偏好. 无论是传统的仓室模式,还是基于复杂网络的 传染病模型,都假设个体感染不同疾病的感染概率 相同,不同类型的疾病对易感人群的效应也是相同 的.然而,这 2 个假设在社会网络中都不太合理,网 络用户对不同类型的热点话题的敏感程度不同,如 对于一些负面的、批判性的热点话题,用户的参与性 较强;对于明星类热点话题参与性较低.同理,具有 不同特征的用户对话题的敏感程度也不同,即个体 感染疾病的概率不同. 针对上述不足,本文提出基于内容的网络热点 话题传播模型,该模型改进了传统传染病动力模型 的缺点,考虑了不同节点对不同话题的敏感度.在小 世界、无标度、随机网络与真实社会网络上进行了不 同的试验,实验结果表明了考虑用户和话题之间的 关系能够呈现出多个波动、小范围长时间传播、快速 上升缓慢下降等传播模式,验证了模型的有效性. 1 基于话题内容的传播模型 为了克服传染病感染模型的缺点,假设影响话 题在社会网络上传播的因素有: 1)话题吸引力指数:用来表达话题的内容特 性,用 θ 表示.不同类型话题吸引用户参与的强度不 同,则 θ 值不同. 2)网络结构:由用户构成的社会网络. 3)话题保持时间长度:一个节点能感知到话题的 时间长度,如同疾病的携带期,用 π 表示.感染用户在 话题保持时间长度内,其状态一直为感染状态. 4)节点对话题的敏感度:每个用户对话题的敏 感程度都不同,设用户 i 对话题 T 的敏感度为 βi . 5)用户重入概率,用 δ 表示,用户可以多次参与 话题,也就是可以多次感染.为了简单起见,设用户 重新进入易感群的概率为固定值. 采用 SIRS 模型作为基础模型,提出一个基于内 容 的 话 题 传 播 模 型 ( content based SIRS model, CSIRS),其基本模型中的种群迁移如图 1 所示. 图 1 CSIRS 模型种群迁移示意 Fig.1 Population migration in CSIRS 从图 1 可以看出,热点话题中涉及到的用户分 为 3 类种群:潜在参与用户(易感者 S)、参与用户 (已感染者 I) 和免疫用户(恢复者 R).一个用户在 易感状态(S)下,以不同的概率进行传播(感染).一 个用户在感染状态( I) 下,以特定的概率转化为免 疫用户(R)或者重新进入易感状态(S). 在 CSIRS 模型中,假设每个用户传播话题的概 率不同,下面给出 CSIRS 的传播概率.设在一个社会 网络中的用户总数为 N,一个用户 i 的相邻用户个 数为 Ni,该用户对话题的敏感度为 βi,则该用户在 传染时刻成为感染者的概率,也就是用户传播话题 的概率为 pi = 1 - (1 - βi) ∑ Ni j = 1 δj . 式中:δi 为用户 i 的相邻用户中为感染者的符号函 数,也就是 δi = 0, 用户 j 不是感染者; 1, 用户 j 为感染者. { 根据 CSIRS 模型的假设条件和传播概率,设计 传播过程算法,步骤如表 1 所示.传播过程算法分为 2 个部分:1)初始化参数,随机产生初始话题的发起 者;2)进入迭代循环,达到迭代次数上限或者所有 ·234· 智 能 系 统 学 报 第 8 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有