·182 智能系统学报 第5卷 该函数表示兴趣的权重随其出现的时间次序而 2 混合模型 变化,参数n为特征序列的长度;ie{1,2,…,n}是 计数器,按照从最近选择的特征到第一次选择的特 心理学研究认为,人的记忆分为长期记忆和短 征的顺序,依次取i=1,i=2,…,i=n,k∈[0,1],表 期记忆,对于短期记忆,由于容量非常有限,因此当 示遗忘的快慢.在某一时刻,有新的特征值出现时, 信息不能很快重现时,会被很快遗忘;对于长期记 重新计算所有特征的重要性.对每一个特征j,用户 忆,当环境或场合的改变使得长期记忆中某些信息 对其感兴趣的程度可以通过观测序列中其出现的情 长期不用时,这些信息才会逐渐被遗忘.只有把 况计算得到,可以采用式(2)来计算, 与目前真正无关的信息别除出去,才能快速准确地 9=名4 (2) 提取与当前环境有关的信息。 本文采用混合模型,将用户的兴趣模型看作由 式中:i为计数器,n为用户的行为数,:为遗忘函数 长期模型和短期模型共同组成,短期模型代表用户 计算的权重.在确定问题上,考虑概念之间的相 的近期兴趣,由用户的短期行为观察得到:长期模型 关性,令∈[0,1],表示某次观测对此特征的影响 表示用户的长期偏好,由长时间发展积累得到.当一 程度,若观测值就是特征j,则d=1,若观测值不是 种短期兴趣的出现次数积累到一定程度时,则将此 特征j,则d=0. 兴趣交给长期模型处理.根据2种模型的特点,对于 1.2非线性遗忘函数 长期模型和短期模型采用不同的遗忘方法[56. 根据心理学的知识,人的遗忘规律不是完全线 性变化的,对刚出现的兴趣在最近一段时间内关注 2.1短期兴趣模型漂移算法 短期兴遐模型代表用户近期的兴趣偏好,由于 度很高,立即遗忘的可能性极小,即使再有新的兴趣 出现,该兴趣的关注度也不会马上降低.但当用户较 其容量小,所以变化较快.对于该模型将最近最 长时间不再使用某兴趣时,该兴趣的关注度会随时 久未使用的方法与滑动窗口方法相结合,来实现对 间迅速降低,当一个兴趣的关注度降低到一定程度 用户短期兴趣漂移的跟踪.具体算法是: 时,即它能被用户回忆起来的可能性很小时,那么它 当有新兴趣出现时: 的遗忘速度应该迅速减小[31,本文提出了一个基于 1)若兴趣窗口未满,则将新兴趣加入到窗口的 正态分布密度函数的非线性遗忘函数,如式(3)所 前端; 示(以下称正态遗忘函数): 2)若兴趣窗口已满,则将兴趣窗口中最近最久 c)3 (3) 未使用的兴趣滑出窗口,然后将新兴趣加入到兴趣 Cw√/2T 窗口的前端。 式中:aB为调节因子,a=0.52,B=2,i∈{1,2,…,n 2.2长期兴趣模型漂移算法 是计数器,按照从最近选择的特征到第一次选择的特 长期模型对应用户的长期记忆,是用户比较固 征的顺序,依次取i=1,i=2,…,i=n(n为序列的长 定的偏好,相对稳定.因此当有新的兴趣发现时,需 度).图1是线性遗忘函数与正态遗忘函数的对比图, 要采用一定的方法,将新加入的兴趣和以前的兴趣 容易看出正态遗忘函数对刚出现的新兴趣的遗忘速度 进行合并,得到当前的用户兴趣信息. 要比线性遗忘函数慢,对于出现时间较长的兴趣正态 由于人对事物的遗忘是一个渐进的过程,相同 遗忘函数要比线性遗忘函数遗忘得快 的兴趣在不同阶段对人的重要性是一个逐渐变化的 1.8 +一线性遗忘 1.6 过程,因此,兴趣的权重可以通过遗忘函数来计算. ·一正态遗总 对用户来说,兴趣出现时重要性最高,随着时间的推 1.0 移,重要性逐渐下降,采用正态遗忘函数的方法来跟 踪用户的长期兴趣漂移.若用户兴趣模型没有发生 0.6 0.44 明显变化时,那么用户的长期兴趣模型与短期兴趣 0.2 0 十35791113151719 模型的相似性保持在一个固定的范围内(比如:相 兴趣文档的时间序列 似性大于或等于0.3);当用户的长期兴趣模型发生 图1线性遗忘函数与正态遗忘函数的对比图 改变时,那么用户的长期兴趣模型与短期兴趣模型 Fig.1 Comparison chart of linear forgetting function and 的相似性会突破相似性的下限,而且会随着时间的 normal forgetting function 推移不断降低,这就表明用户的长期兴趣模型已经