正在加载图片...
第2期 郭新明,等:混合模型的用户兴趣漂移算法 ·183· 发生了改变.跟踪用户长期兴趣模型的算法如下: 遗忘算法对用户的长期兴趣模型进行更新,直到用 1)每隔一定的时间间隔,计算用户的长期兴趣 户的长期兴趣模型与短期兴趣模型的相似性大于等 模型与短期兴趣模型的相似性,如式(4): 于相似性的下限为止: 5)返回1). sim(V,W) (4) 3实验分析 台 表1模拟了一个用户的兴趣变化序列,可以看 式中:V和W分别是用向量空间模型表示的长期兴 出用户对兴趣1的关注度逐渐降低,对兴趣2的关 趣模型和短期兴趣模型, 注度逐渐升高,对兴趣3始终保持一定的关注度.如 2)若用户的长期兴趣模型与短期兴趣模型的 果用户兴趣模型只能容纳2个兴趣,那么表1中描 相似性没有突破相似性下限(在本算法中下限统一 述的用户兴趣变化过程应该是从(兴趣1,兴趣3) 定为0.3),则什么也不做 变为(兴趣2,兴趣3),转折点是序列9.对表中的数 3)若用户的长期兴趣模型与短期兴趣模型的 据分别按照线性遗忘函数式(1)和正态遗忘函数式 相似性突破了相似性下限,但没有迅速降低,表明这 (3)进行计算,得到2个用户兴趣权重变化图 是一次突发性的兴趣震荡,也不进行长期兴趣模型 如图2~3所示.从图2可以看出采用线性遗忘函数 的更新. 在序列16处兴趣发生漂移,而在采用正态遗忘函数 4)若用户的长期兴趣模型与短期兴趣模型的 的图3中在序列14处兴趣发生了漂移,可见正态遗 相似性突破了相似性下限,并且迅速降低,表明用户 忘函数更接近实际情况. 的长期兴趣模型已经发生了明显的改变,按照正态 表1各兴趣在用户兴趣序列(1-20)中出现的概率 Table 1 Probability of each interest in user's interest sequence 兴趣 编号12 34567891011121314151617181920 1 0.70.70.70.60.50.40.40.40.20.00.00.00.00.00.00.00.00.00.00.0 2 0.00.00.00.00.10.10.10.20.40.40.50.60.50.60.60.50.70.60.60.5 30.30.30.30.40.40.50.50.40.40.60.50.40.50.40.40.50.30.40.40.5 ◆一兴趣1 和单纯使用正态渐进模型对用户浏览页面的兴趣进 > 一兴趣2 行追踪.图4是2种模型的精确度对比图,可以明显 6 士兴趣3 看出采用混合模型比单纯采用正态渐进模型的精确 度高 3 「◆兴趣1 > 兴超2 6 5793i517 5 ·一兴趣3 川户兴趣序列 4 3 图2线性遗忘函数 Fig.2 Linear forgetting function 0 使用网络爬虫Heritrix从Internet上收集到主 57911131517 巾户兴趣序列 题蕴含“搜索引擎”、“计算机网络”和“网络游戏 图3正态遗忘函数 的500个页面作为测试数据,采用上述的混合模型 Fig.3 Normal forgetting function
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有