正在加载图片...
·334· 智能系统学报 第11卷 5.4实验结果与分析 户推荐其喜欢的物品,从而有助于提升算法的效果。 图3~7中的黑色代表各图中相应指标值较大 另外,还可以发现MD和BHC算法的排序得分在所 的区域,白色代表各图中相应指标值较小的区域,图 有情形下都比HC算法要好,这与文献[5]中的结论 中颜色越黑表示相应指标值越大。由图3可以看 一致:WHC算法在所有条件下都比HC算法的排序 出,当入取值小于0.5,B取值也小于0.5时,此时推 得分好,这与文献[19]中的结论一致。 荐出来的度数大的用户喜欢的度数大的物品较多。 6结束语 图4中相应区域的排序得分较低,这说明度数大的 用户喜欢的度数大的物品一般是大家所喜欢的物 由于HC算法减弱了度数大的用户喜欢的度数 品,与文中开始提出的假设一致:由于此时推荐出来 大的物品对目标用户的影响,本文提出了基于影响 的度数大的物品较多,所以推荐的物品的新颖性较 力控制的热传导算法THC。THC引入2个参数来 低即新颖性值较大,这与图5中相应区域的指标数 控制度数大的用户喜欢的度数大的物品被优先推荐 据是一致的:另外,度数大的用户喜欢的度数大的物 的程度。为了检验提出的想法是否达到预期效果, 品在整个系统的所有物品中占的比例是比较小的, 在电影评分数据集和旅游评价数据集上进行了多项 因为大多数物品都不是流行物品,所以此时多样性 对比实验。本文还提出了旅游评价中的用户态度判 和覆盖率都较低,这与图6和图7中相应区域的指 断算法及一个新指标buir。实验结果表明,当THC 标数据一致。对于图4,数据表明:当入与B分别取 中的2个参数入和B较小时,度数大的用户喜欢的 0.05、0.55时,排序得分取得最优值0.0298,但此时 度数大的物品能被更多的推荐,但这种推荐要有控 buir并不是最大。可以得出这样的结论:虽然目标 制,否则会降低排序得分。实验结果还表明THC算 用户会喜欢度数大的用户喜欢的度数大的物品,但 法在排序得分指标上比BHC、MD、WHC及HC算法 是推荐的量要适度。还可以发现:此时的排序得分 表现更好。未来可考虑结合用户间的朋友关系与信 要比当A=B=1.0时的HC算法的排序得分要好,而 任关系进一步调控度数大的用户喜欢的度数大的物 此时的buir指标也比HC的要高。 品对目标用户推荐的影响。 通过分析各个评价指标变化图,可以得出如下 参考文献: 结论:1)如果要向用户推荐较多度数大的用户喜欢 的度数大的物品,则应该将入与B的取值范围都限 [1]文益民,史一帆,蔡国永,等.个性化旅游推荐研究综 制在0~0.5,因为在此范围中buir的值均较大。2) 述[EB/0L].北京:中国科技论文在线,2014.[2014- 如果要使算法的排序得分取得最大值,2个参数入 07-03 ]http://www.paper.edu.cn/releasepaper/content/ 201407.56. 与B的最优值应该从0~1之间寻找。虽然入与B 2]RESNICK P,VARIAN H R.Recommender systems J] 在0~0.5取值时,度数大的用户喜欢的度数大的物 Communications of the ACM,1997,40(3):56-58. 品更可能被推荐,但是并不一定是推荐得越多,排序 [3]ADOMAVICIUS G,TUZHILIN A.Toward the next genera- 得分越好。3)如果要向用户推荐较多的新颖物品, tion of recommender systems:a survey of the state-of-the-art 则不该将入与B的取值范围都限制在0~0.5,因为 and possible extensions[J].IEEE transactions on knowledge 当buir较大时,推荐出来的度数大的用户喜欢的度 and data engineering,2005,17(6):734-749. 数大的物品较多,此时推荐出来的物品必然不新颖。 [4]FELFERNIG A.GORDEA S,JANNACH D,et al.A short 图8和图9是BHC、MD、WHC、HC及THC在 survey of recommendation technologies in travel and tourism 两个数据集上推荐列表的长度分别为5、8、10、12时 [J].0 EGAI journal,2007,25(7):17-22. 排序得分的对比结果。其中BHC、WHC及THC是 [5]LIU Jianguo,ZHOU Tao,GUO Qiang.Information filtering 取所有不同参数结果中的最优值。通过观察可以发 via biased heat conductionJ.Physical review E,2011, 84(3):037101. 现,本文提出的THC算法,与基本的HC算法相比, [6]LINDEN G,SMITH B,YORK J.Amazon.com recommen- 在所有的情况下排序得分都要好;与MD、WHC、 dations:item-to-item collaborative filtering[J].IEEE inter- BHC算法相比,排序得分也都要好,虽然提升程度 net computing,2003,7(1):76-80. 较小。 [7]DAS A S,DATAR M,GARG A,et al.Google news per- 通过上面的分析可以知道:通过适度的优先推 sonalization:scalable online collaborative filtering [C]// 荐度数大的用户喜欢的度数大的物品,有助于向用 Proceedings of the 16th International Conference on World5.4 实验结果与分析 图 3 ~ 7 中的黑色代表各图中相应指标值较大 的区域,白色代表各图中相应指标值较小的区域,图 中颜色越黑表示相应指标值越大。 由图 3 可以看 出,当 λ 取值小于 0.5,β 取值也小于 0.5 时,此时推 荐出来的度数大的用户喜欢的度数大的物品较多。 图 4 中相应区域的排序得分较低,这说明度数大的 用户喜欢的度数大的物品一般是大家所喜欢的物 品,与文中开始提出的假设一致;由于此时推荐出来 的度数大的物品较多,所以推荐的物品的新颖性较 低即新颖性值较大,这与图 5 中相应区域的指标数 据是一致的;另外,度数大的用户喜欢的度数大的物 品在整个系统的所有物品中占的比例是比较小的, 因为大多数物品都不是流行物品,所以此时多样性 和覆盖率都较低,这与图 6 和图 7 中相应区域的指 标数据一致。 对于图 4,数据表明:当 λ 与 β 分别取 0.05、0.55 时,排序得分取得最优值 0.029 8,但此时 buir 并不是最大。 可以得出这样的结论:虽然目标 用户会喜欢度数大的用户喜欢的度数大的物品,但 是推荐的量要适度。 还可以发现:此时的排序得分 要比当 λ = β = 1.0 时的 HC 算法的排序得分要好,而 此时的 buir 指标也比 HC 的要高。 通过分析各个评价指标变化图,可以得出如下 结论:1)如果要向用户推荐较多度数大的用户喜欢 的度数大的物品,则应该将 λ 与 β 的取值范围都限 制在 0~0.5,因为在此范围中 buir 的值均较大。 2) 如果要使算法的排序得分取得最大值,2 个参数 λ 与 β 的最优值应该从 0 ~ 1 之间寻找。 虽然 λ 与 β 在 0~ 0.5 取值时,度数大的用户喜欢的度数大的物 品更可能被推荐,但是并不一定是推荐得越多,排序 得分越好。 3)如果要向用户推荐较多的新颖物品, 则不该将 λ 与 β 的取值范围都限制在 0 ~ 0.5,因为 当 buir 较大时,推荐出来的度数大的用户喜欢的度 数大的物品较多,此时推荐出来的物品必然不新颖。 图 8 和图 9 是 BHC、MD、WHC、HC 及 THC 在 两个数据集上推荐列表的长度分别为 5、8、10、12 时 排序得分的对比结果。 其中 BHC、WHC 及 THC 是 取所有不同参数结果中的最优值。 通过观察可以发 现,本文提出的 THC 算法,与基本的 HC 算法相比, 在所有的情况下排序得分都要好;与 MD、 WHC、 BHC 算法相比,排序得分也都要好,虽然提升程度 较小。 通过上面的分析可以知道:通过适度的优先推 荐度数大的用户喜欢的度数大的物品,有助于向用 户推荐其喜欢的物品,从而有助于提升算法的效果。 另外,还可以发现 MD 和 BHC 算法的排序得分在所 有情形下都比 HC 算法要好,这与文献[5]中的结论 一致;WHC 算法在所有条件下都比 HC 算法的排序 得分好,这与文献[19]中的结论一致。 6 结束语 由于 HC 算法减弱了度数大的用户喜欢的度数 大的物品对目标用户的影响,本文提出了基于影响 力控制的热传导算法 THC。 THC 引入 2 个参数来 控制度数大的用户喜欢的度数大的物品被优先推荐 的程度。 为了检验提出的想法是否达到预期效果, 在电影评分数据集和旅游评价数据集上进行了多项 对比实验。 本文还提出了旅游评价中的用户态度判 断算法及一个新指标 buir。 实验结果表明,当 THC 中的 2 个参数 λ 和 β 较小时,度数大的用户喜欢的 度数大的物品能被更多的推荐,但这种推荐要有控 制,否则会降低排序得分。 实验结果还表明 THC 算 法在排序得分指标上比 BHC、MD、WHC 及 HC 算法 表现更好。 未来可考虑结合用户间的朋友关系与信 任关系进一步调控度数大的用户喜欢的度数大的物 品对目标用户推荐的影响。 参考文献: [1]文益民, 史一帆, 蔡国永, 等. 个性化旅游推荐研究综 述[EB/ OL]. 北京: 中国科技论文在线, 2014. [ 2014⁃ 07⁃03]. http: / / www. paper. edu. cn / releasepaper/ content / 201407⁃56. [2] RESNICK P, VARIAN H R. Recommender systems [ J]. Communications of the ACM, 1997, 40(3): 56⁃58. [3]ADOMAVICIUS G, TUZHILIN A. Toward the next genera⁃ tion of recommender systems: a survey of the state⁃of⁃the⁃art and possible extensions[J]. IEEE transactions on knowledge and data engineering, 2005, 17(6): 734⁃749. [4]FELFERNIG A, GORDEA S, JANNACH D, et al. A short survey of recommendation technologies in travel and tourism [J]. OEGAI journal, 2007, 25(7): 17⁃22. [5]LIU Jianguo, ZHOU Tao, GUO Qiang. Information filtering via biased heat conduction [ J]. Physical review E, 2011, 84(3): 037101. [6]LINDEN G, SMITH B, YORK J. Amazon. com recommen⁃ dations: item⁃to⁃item collaborative filtering[J]. IEEE inter⁃ net computing, 2003, 7(1): 76⁃80. [7]DAS A S, DATAR M, GARG A, et al. Google news per⁃ sonalization: scalable online collaborative filtering [ C] / / Proceedings of the 16th International Conference on World ·334· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有