【自然语言处理与理解】基于影响力控制的热传导算法编辑部

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：4.35MB

第11卷第3期智能系统学报 Vol.11 No.3 2016年6月 CAAI Transactions on Intelligent Systems Jun.2016 D0I:10.11992/is.201603042 网络出版地址：http://www.enki..net/kcms/detail/23.1538.TP.20160513.0920.016.html 基于影响力控制的热传导算法雷震，文益民2，王志强，缪裕青2 (1.桂林电子科技大学计算机与信息安全学院，广西桂林541004；2.桂林电子科技大学广西可信软件重点实验室，广西桂林541004) 摘要：因特网上信息严重过载，使得用户不容易从纷繁的信息中找到适合自己的内容。如何准确地向用户推荐他们想要的信息成为急待解决的问题。热传导算法(HC)被广泛地应用于个性化推荐领域，但是它的热量传播机制不利于经历丰富的用户喜欢的流行物品得到更多的热量。因此，本文提出了基于影响力控制的热传导算法(THC)。 THC引入两个参数控制度数大的用户喜欢的度数大的物品对目标用户推荐的影响。另外，本文提出利用用户对景点的各项评分及评论的情感极性来判断用户是否喜欢一个景点，还提出了一个新的指标bui以度量度数大的用户喜欢的度数大的物品出现在推荐列表中的比例。实验结果表明：适度增大的度数大的用户喜欢的度数大的物品的影响，有助于推荐出目标用户喜欢的物品，从而有助于提升推荐效果。关键词：热传导：个性化推荐：用户偏好：情感极性：二部网络：信息过载：物品流行度；用户影响力中图分类号：TP391文献标志码：A文章编号：1673-4785(2016)03-0328-08 中文引用格式：雷震，文益民，王志强，等.基于影响力控制的热传导算法[J].智能系统学报，2016,11(3)：328335. 英文引用格式：LEI Zhen,WEN Yimin,WANG Zhiqiang,etal.Heat conduction controlled by the influence of users and items[J]. CAAI transactions on intelligent systems,2016,11(3):328-335. Heat conduction controlled by the influence of users and items LEI Zhen',WEN Yimin'2,WANG Zhiqiang',MIAO Yuqing'.2 (1.School of Computer Science and Information Security,Guilin 541004,China;2.Guangxi Key Laboratory of Trusted Software,Guil- in University of Electronic Technology,Guilin 541004,China) Abstract:The overload of information on the Internet can lead to users feeling hopeless about finding the informa- tion they are seeking.Making accurate recommendations to users about the information they truly need is an urgent problem that must be addressed.The heat conduction (HC)algorithm has recently been applied in personalized recommendation technology,but its mechanism weakens the heat generated from the larger-degree itemsliked by the larger-degree users.To solve this problem,we propose an improved HC algorithm that is based on user influence control (THC).THC introduces two tunable parameters to better control the influence of larger-degree users'pref- erences for larger-degree items on target users.We also consider a user's comment scores and the sentiment polarity of a comment in a given scenario to accurately judge whether the user truly likes the given scenario.We also pro- pose a new index,called a buir,which measures the ratio of the larger-degree items that are liked by larger-degree users on the recommendation list.Experimental results show that appropriately promoting the influence of larger-de- gree items that are liked by larger-degree users helps in making recommendations to target users regarding items in which they are truly interested,thereby improving the performance of the recommendation. Keywords:heat conduction;personalized recommendation;user's preference;sentiment polarity;bipartite net- work;information overload;item popularity;user's influence 收稿日期：2016-03-19.网络出版日期：2016-05-13. 随着互联网的迅速发展，用户越来越喜欢到相基金项目：国家自然科学基金项目(61363029)：广西省科学研究与技术开发关网站上寻找自己想要的信息。以旅游领域为例，项目（桂科攻14124005-2-1）：湖南省博土后科研专项计划项目 (2011RS4073):广西信息科学中心项目(YB408). 有机构预计2016年中国在线旅游市场规模将达到通信作者：文益民.E-mail:ymwen2004@aliyun.com

第１１卷第３期智能系统学报Ｖｏｌ．１１ №．３２０１６年６月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＪｕｎ．２０１６ＤＯＩ：１０．１１９９２／ｔｉｓ．２０１６０３０４２网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１６０５１３．０９２０．０１６．ｈｔｍｌ基于影响力控制的热传导算法雷震１，文益民１，２，王志强１，缪裕青１，２（１．桂林电子科技大学计算机与信息安全学院，广西桂林５４１００４；２．桂林电子科技大学广西可信软件重点实验室，广西桂林５４１００４）摘要：因特网上信息严重过载，使得用户不容易从纷繁的信息中找到适合自己的内容。如何准确地向用户推荐他们想要的信息成为急待解决的问题。热传导算法（ＨＣ）被广泛地应用于个性化推荐领域，但是它的热量传播机制不利于经历丰富的用户喜欢的流行物品得到更多的热量。因此，本文提出了基于影响力控制的热传导算法（ＴＨＣ）。ＴＨＣ引入两个参数控制度数大的用户喜欢的度数大的物品对目标用户推荐的影响。另外，本文提出利用用户对景点的各项评分及评论的情感极性来判断用户是否喜欢一个景点，还提出了一个新的指标ｂｕｉｒ以度量度数大的用户喜欢的度数大的物品出现在推荐列表中的比例。实验结果表明：适度增大的度数大的用户喜欢的度数大的物品的影响，有助于推荐出目标用户喜欢的物品，从而有助于提升推荐效果。关键词：热传导；个性化推荐；用户偏好；情感极性；二部网络；信息过载；物品流行度；用户影响力中图分类号：ＴＰ３９１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１６）０３⁃０３２８⁃０８中文引用格式：雷震，文益民，王志强，等．基于影响力控制的热传导算法［Ｊ］．智能系统学报，２０１６，１１（３）：３２８⁃３３５．英文引用格式：ＬＥＩＺｈｅｎ，ＷＥＮＹｉｍｉｎ，ＷＡＮＧＺｈｉｑｉａｎｇ，ｅｔａｌ．Ｈｅａｔｃｏｎｄｕｃｔｉｏｎｃｏｎｔｒｏｌｌｅｄｂｙｔｈｅｉｎｆｌｕｅｎｃｅｏｆｕｓｅｒｓａｎｄｉｔｅｍｓ［Ｊ］．ＣＡＡＩｔｒａｎｓａｃｔｉｏｎｓｏｎｉｎｔｅｌｌｉｇｅｎｔｓｙｓｔｅｍｓ，２０１６，１１（３）：３２８⁃３３５．ＨｅａｔｃｏｎｄｕｃｔｉｏｎｃｏｎｔｒｏｌｌｅｄｂｙｔｈｅｉｎｆｌｕｅｎｃｅｏｆｕｓｅｒｓａｎｄｉｔｅｍｓＬＥＩＺｈｅｎ１，ＷＥＮＹｉｍｉｎ１，２，ＷＡＮＧＺｈｉｑｉａｎｇ１，ＭＩＡＯＹｕｑｉｎｇ１，２（１．ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＩｎｆｏｒｍａｔｉｏｎＳｅｃｕｒｉｔｙ，Ｇｕｉｌｉｎ５４１００４，Ｃｈｉｎａ；２．ＧｕａｎｇｘｉＫｅｙＬａｂｏｒａｔｏｒｙｏｆＴｒｕｓｔｅｄＳｏｆｔｗａｒｅ，Ｇｕｉｌ⁃ ｉｎＵｎｉｖｅｒｓｉｔｙｏｆＥｌｅｃｔｒｏｎｉｃＴｅｃｈｎｏｌｏｇｙ，Ｇｕｉｌｉｎ５４１００４，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：ＴｈｅｏｖｅｒｌｏａｄｏｆｉｎｆｏｒｍａｔｉｏｎｏｎｔｈｅＩｎｔｅｒｎｅｔｃａｎｌｅａｄｔｏｕｓｅｒｓｆｅｅｌｉｎｇｈｏｐｅｌｅｓｓａｂｏｕｔｆｉｎｄｉｎｇｔｈｅｉｎｆｏｒｍａ⁃ ｔｉｏｎｔｈｅｙａｒｅｓｅｅｋｉｎｇ．Ｍａｋｉｎｇａｃｃｕｒａｔｅｒｅｃｏｍｍｅｎｄａｔｉｏｎｓｔｏｕｓｅｒｓａｂｏｕｔｔｈｅｉｎｆｏｒｍａｔｉｏｎｔｈｅｙｔｒｕｌｙｎｅｅｄｉｓａｎｕｒｇｅｎｔｐｒｏｂｌｅｍｔｈａｔｍｕｓｔｂｅａｄｄｒｅｓｓｅｄ．Ｔｈｅｈｅａｔｃｏｎｄｕｃｔｉｏｎ（ＨＣ）ａｌｇｏｒｉｔｈｍｈａｓｒｅｃｅｎｔｌｙｂｅｅｎａｐｐｌｉｅｄｉｎｐｅｒｓｏｎａｌｉｚｅｄｒｅｃｏｍｍｅｎｄａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ，ｂｕｔｉｔｓｍｅｃｈａｎｉｓｍｗｅａｋｅｎｓｔｈｅｈｅａｔｇｅｎｅｒａｔｅｄｆｒｏｍｔｈｅｌａｒｇｅｒ⁃ｄｅｇｒｅｅｉｔｅｍｓｌｉｋｅｄｂｙｔｈｅｌａｒｇｅｒ⁃ｄｅｇｒｅｅｕｓｅｒｓ．Ｔｏｓｏｌｖｅｔｈｉｓｐｒｏｂｌｅｍ，ｗｅｐｒｏｐｏｓｅａｎｉｍｐｒｏｖｅｄＨＣａｌｇｏｒｉｔｈｍｔｈａｔｉｓｂａｓｅｄｏｎｕｓｅｒｉｎｆｌｕｅｎｃｅｃｏｎｔｒｏｌ（ＴＨＣ）．ＴＨＣｉｎｔｒｏｄｕｃｅｓｔｗｏｔｕｎａｂｌｅｐａｒａｍｅｔｅｒｓｔｏｂｅｔｔｅｒｃｏｎｔｒｏｌｔｈｅｉｎｆｌｕｅｎｃｅｏｆｌａｒｇｅｒ⁃ｄｅｇｒｅｅｕｓｅｒｓ′ ｐｒｅｆ⁃ ｅｒｅｎｃｅｓｆｏｒｌａｒｇｅｒ⁃ｄｅｇｒｅｅｉｔｅｍｓｏｎｔａｒｇｅｔｕｓｅｒｓ．Ｗｅａｌｓｏｃｏｎｓｉｄｅｒａｕｓｅｒ′ｓｃｏｍｍｅｎｔｓｃｏｒｅｓａｎｄｔｈｅｓｅｎｔｉｍｅｎｔｐｏｌａｒｉｔｙｏｆａｃｏｍｍｅｎｔｉｎａｇｉｖｅｎｓｃｅｎａｒｉｏｔｏａｃｃｕｒａｔｅｌｙｊｕｄｇｅｗｈｅｔｈｅｒｔｈｅｕｓｅｒｔｒｕｌｙｌｉｋｅｓｔｈｅｇｉｖｅｎｓｃｅｎａｒｉｏ．Ｗｅａｌｓｏｐｒｏ⁃ ｐｏｓｅａｎｅｗｉｎｄｅｘ，ｃａｌｌｅｄａｂｕｉｒ，ｗｈｉｃｈｍｅａｓｕｒｅｓｔｈｅｒａｔｉｏｏｆｔｈｅｌａｒｇｅｒ⁃ｄｅｇｒｅｅｉｔｅｍｓｔｈａｔａｒｅｌｉｋｅｄｂｙｌａｒｇｅｒ⁃ｄｅｇｒｅｅｕｓｅｒｓｏｎｔｈｅｒｅｃｏｍｍｅｎｄａｔｉｏｎｌｉｓｔ．Ｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔａｐｐｒｏｐｒｉａｔｅｌｙｐｒｏｍｏｔｉｎｇｔｈｅｉｎｆｌｕｅｎｃｅｏｆｌａｒｇｅｒ⁃ｄｅ⁃ ｇｒｅｅｉｔｅｍｓｔｈａｔａｒｅｌｉｋｅｄｂｙｌａｒｇｅｒ⁃ｄｅｇｒｅｅｕｓｅｒｓｈｅｌｐｓｉｎｍａｋｉｎｇｒｅｃｏｍｍｅｎｄａｔｉｏｎｓｔｏｔａｒｇｅｔｕｓｅｒｓｒｅｇａｒｄｉｎｇｉｔｅｍｓｉｎｗｈｉｃｈｔｈｅｙａｒｅｔｒｕｌｙｉｎｔｅｒｅｓｔｅｄ，ｔｈｅｒｅｂｙｉｍｐｒｏｖｉｎｇｔｈｅｐｅｒｆｏｒｍａｎｃｅｏｆｔｈｅｒｅｃｏｍｍｅｎｄａｔｉｏｎ．Ｋｅｙｗｏｒｄｓ：ｈｅａｔｃｏｎｄｕｃｔｉｏｎ；ｐｅｒｓｏｎａｌｉｚｅｄｒｅｃｏｍｍｅｎｄａｔｉｏｎ；ｕｓｅｒ′ｓｐｒｅｆｅｒｅｎｃｅ；ｓｅｎｔｉｍｅｎｔｐｏｌａｒｉｔｙ；ｂｉｐａｒｔｉｔｅｎｅｔ⁃ ｗｏｒｋ；ｉｎｆｏｒｍａｔｉｏｎｏｖｅｒｌｏａｄ；ｉｔｅｍｐｏｐｕｌａｒｉｔｙ；ｕｓｅｒ＇ｓｉｎｆｌｕｅｎｃｅ收稿日期：２０１６⁃０３⁃１９．网络出版日期：２０１６⁃０５⁃１３．基金项目：国家自然科学基金项目（６１３６３０２９）；广西省科学研究与技术开发项目（桂科攻１４１２４００５－２－１）；湖南省博士后科研专项计划项目（２０１１ＲＳ４０７３）；广西信息科学中心项目（ＹＢ４０８）．通信作者：文益民．Ｅ⁃ｍａｉｌ：ｙｍｗｅｎ２００４＠ａｌｉｙｕｎ．ｃｏｍ．随着互联网的迅速发展，用户越来越喜欢到相关网站上寻找自己想要的信息。以旅游领域为例，有机构预计２０１６年中国在线旅游市场规模将达到

第3期雷震，等：基于影响力控制的热传导算法 ·329· 4440亿元。游客访问旅游网站，寻找他们感兴趣的散(MD)算法，是一种类似于HC的推荐算法，它能旅游信息，确定他们想去游玩的景点山。但是，旅带来较高的准确率。文献[17]认为MD算法与HC 游网站上信息过载严重，游客不容易从纷繁的旅游算法分别在准确率和多样性上有优势，他们分析了信息中选择合适自己需求的信息。进入Web2.0时不同度的物品在传播过程中的影响并引入一个参数代，搜索和推荐为减轻用户寻找符合自己需要信息控制影响程度，提出了一种混合算法。文献[18]认的困难提供了可能，其中利用用户的历史信息来预为用户从不同流行度的物品上获得的热量应该不测用户选择的个性化推荐系统成为一种解决信息过同，它们利用一个参数来调控物品流行度对用户获载问题的有效工具2。现今，商家广泛使用个性得热量的影响并提出了非平衡热传导推荐算法。文化推荐系统来对潜在的消费者进行物品、服务或信献[19]发现，HC算法中所有不同度的物品和用户息的推荐。例如，亚马逊使用基于物品的协同过滤都被同等看待。因此，他们利用边连接的用户与物系统[6进行个性化书本推荐：Google利用用户的点品的度来衡量边的权重，并提出了基于权重的HC 击行为数据建立了新闻推荐系统[]：百度开发了算法(WHC):但是该算法将用户和物品的度对权重 Q&A社区的推荐系统[劉等。的影响程度视为相同。文献[5]认为HC算法的准近些年，根据物理动力学原理设计的HC算法，确率较低是由于它倾向于推荐度数小的物品。为降已经被成功地应用到了推荐领域。HC算法将用户低度数小的物品对目标用户推荐的影响，他们提出与物品的关系用一个二部网络来表示。但是，HC 了基于偏向的热传导算法(BHC)。BHC算法通过算法也存在一些不足。在HC算法中，目标用户喜降低度数小的物品的影响，来优先推荐度数大的物欢的物品产生的热量在两步传播过程中被分别除以品，但是削弱了度数大的用户对目标用户的影响。了用户的度和物品的度，所以它削弱了度数大的用相对于WHC算法而言，THC算法将用户与物品的户喜欢的度数大的物品对目标用户选择物品时的影度对目标用户选择物品的影响区别对待：相对于响。事实上，目标用户对物品的选择往往受到与他 BHC算法而言，THC算法不仅考虑到了物品的度对关联的经历丰富的用户（度数大的用户）喜欢的流目标用户选择物品的影响，还考虑到了用户的度对行物品（度数大的物品）较大的影响。以旅游推荐目标用户的影响。为例，如果某用户不是很清楚什么样的旅游产品适合自己，他会愿意听取旅游经历丰富的游客的意见， 2热传导算法而旅游经历丰富的游客一般会推荐该用户自己喜欢假设一个推荐系统中包含m个物品和n个用的而且比较流行的景点（度数大的景点）。户，物品集合0={01,02，…，0m},用户集合U= 本文主要做了如下研究：一是增大与目标用户 {41,42,…,4n},那么一个推荐系统中用户与物品的关联的经历丰富的用户以及这些用户喜欢的流行物关系就可以用一个包含m+n个节点的二部网络表品对目标用户选择物品的影响，从而提出了HC的示，如图1(a)。其中，当且仅当一个用户喜欢一个改进算法THC:二是在旅游领域为了更准确地判断物品时，这个物品与这个用户间才有边。任意两个用户是否喜欢一个景点，采用了综合评价的方法。物品间的边和任意两个用户间的边都是不允许存在本文根据用户对景点的整体评分、风景评分、趣味评的。这个结构也能用一个A={aam}m,m的矩阵表示，分、性价比评分以及用户对景点评论的情感极性来其中当且仅当用户山，喜欢物品0。时am=1,反之判断用户是否真的喜欢该景点，从而提出了旅游推 aw=0。荐领域的用户态度判断算法。 HC算法中，物品与物品间的热量是按如下方 1相关工作式传导的：用向量∫代表网络中的以各用户作为目标用户时的初始热量赋值向量构成的矩阵，通过迄今为止，众多的推荐系统研究者已经提出很多算法，如基于协同过滤的方法[6、基于内容分析了=W来重新分配网络中的热量，其中W是一个代的方法[o、链接预测方法2]及混合方法[)。文表热量传播过程的m×m概率矩阵；w,。代表热量从献[14]发现协同过滤算法(CF)推荐的TOP-n个物物品0。到物品0，的传导率；k:是用户i的度，k,是品更倾向于流行的物品，但是较少关注用户可能潜物品Y的度：∫：是∫的第i列，表示重新分配热量后在感兴趣的物品)。为了克服CF的弱点，文献对应于目标用户i的热量向量。将目标用户i没有 [13]提出了热传导(HC)算法来解决推荐系统中的表达喜欢意向的物品根据热量向量了，中各元素的准确性-多样性两难问题。文献[16]提出的物质扩值进行降序排序。最终获得热量最多的TOP-n个

４４４０亿元。游客访问旅游网站，寻找他们感兴趣的旅游信息，确定他们想去游玩的景点［１］。但是，旅游网站上信息过载严重，游客不容易从纷繁的旅游信息中选择合适自己需求的信息。进入Ｗｅｂ２．０时代，搜索和推荐为减轻用户寻找符合自己需要信息的困难提供了可能，其中利用用户的历史信息来预测用户选择的个性化推荐系统成为一种解决信息过载问题的有效工具［２⁃５］。现今，商家广泛使用个性化推荐系统来对潜在的消费者进行物品、服务或信息的推荐。例如，亚马逊使用基于物品的协同过滤系统［６］进行个性化书本推荐；Ｇｏｏｇｌｅ利用用户的点击行为数据建立了新闻推荐系统［７］；百度开发了Ｑ＆Ａ社区的推荐系统［８］等。近些年，根据物理动力学原理设计的ＨＣ算法，已经被成功地应用到了推荐领域。ＨＣ算法将用户与物品的关系用一个二部网络来表示。但是，ＨＣ算法也存在一些不足。在ＨＣ算法中，目标用户喜欢的物品产生的热量在两步传播过程中被分别除以了用户的度和物品的度，所以它削弱了度数大的用户喜欢的度数大的物品对目标用户选择物品时的影响。事实上，目标用户对物品的选择往往受到与他关联的经历丰富的用户（度数大的用户）喜欢的流行物品（度数大的物品）较大的影响。以旅游推荐为例，如果某用户不是很清楚什么样的旅游产品适合自己，他会愿意听取旅游经历丰富的游客的意见，而旅游经历丰富的游客一般会推荐该用户自己喜欢的而且比较流行的景点（度数大的景点）。本文主要做了如下研究：一是增大与目标用户关联的经历丰富的用户以及这些用户喜欢的流行物品对目标用户选择物品的影响，从而提出了ＨＣ的改进算法ＴＨＣ；二是在旅游领域为了更准确地判断用户是否喜欢一个景点，采用了综合评价的方法。本文根据用户对景点的整体评分、风景评分、趣味评分、性价比评分以及用户对景点评论的情感极性来判断用户是否真的喜欢该景点，从而提出了旅游推荐领域的用户态度判断算法。１相关工作迄今为止，众多的推荐系统研究者已经提出很多算法，如基于协同过滤的方法［６⁃９］、基于内容分析的方法［１０］、链接预测方法［１１⁃１２］及混合方法［１３］。文献［１４］发现协同过滤算法（ＣＦ）推荐的ＴＯＰ⁃ｎ个物品更倾向于流行的物品，但是较少关注用户可能潜在感兴趣的物品［１５］。为了克服ＣＦ的弱点，文献［１３］提出了热传导（ＨＣ）算法来解决推荐系统中的准确性－多样性两难问题。文献［１６］提出的物质扩散（ＭＤ）算法，是一种类似于ＨＣ的推荐算法，它能带来较高的准确率。文献［１７］认为ＭＤ算法与ＨＣ算法分别在准确率和多样性上有优势，他们分析了不同度的物品在传播过程中的影响并引入一个参数控制影响程度，提出了一种混合算法。文献［１８］认为用户从不同流行度的物品上获得的热量应该不同，它们利用一个参数来调控物品流行度对用户获得热量的影响并提出了非平衡热传导推荐算法。文献［１９］发现，ＨＣ算法中所有不同度的物品和用户都被同等看待。因此，他们利用边连接的用户与物品的度来衡量边的权重，并提出了基于权重的ＨＣ算法（ＷＨＣ）；但是该算法将用户和物品的度对权重的影响程度视为相同。文献［５］认为ＨＣ算法的准确率较低是由于它倾向于推荐度数小的物品。为降低度数小的物品对目标用户推荐的影响，他们提出了基于偏向的热传导算法（ＢＨＣ）。ＢＨＣ算法通过降低度数小的物品的影响，来优先推荐度数大的物品，但是削弱了度数大的用户对目标用户的影响。相对于ＷＨＣ算法而言，ＴＨＣ算法将用户与物品的度对目标用户选择物品的影响区别对待；相对于ＢＨＣ算法而言，ＴＨＣ算法不仅考虑到了物品的度对目标用户选择物品的影响，还考虑到了用户的度对目标用户的影响。２热传导算法假设一个推荐系统中包含ｍ个物品和ｎ个用户，物品集合Ｏ＝ｏ１，ｏ２，…，ｏｍ { } ，用户集合Ｕ＝ｕ１，ｕ２，…，ｕｎ { } ，那么一个推荐系统中用户与物品的关系就可以用一个包含ｍ＋ｎ个节点的二部网络表示，如图１（ａ）。其中，当且仅当一个用户喜欢一个物品时，这个物品与这个用户间才有边。任意两个物品间的边和任意两个用户间的边都是不允许存在的。这个结构也能用一个Ａ＝ａθｌ { } ｍ，ｎ的矩阵表示，其中当且仅当用户ｕｌ喜欢物品ｏθ 时ａθｌ＝１，反之ａθｌ＝０。ＨＣ算法中，物品与物品间的热量是按如下方式传导的：用向量ｆ代表网络中的以各用户作为目标用户时的初始热量赋值向量构成的矩阵，通过＾ｆ＝Ｗｆ来重新分配网络中的热量，其中Ｗ是一个代表热量传播过程的ｍ×ｍ概率矩阵；ｗγθ代表热量从物品ｏθ 到物品ｏγ 的传导率；ｋｉ是用户ｉ的度，ｋγ 是物品 γ 的度；＾ｆｉ是＾ｆ的第ｉ列，表示重新分配热量后对应于目标用户ｉ的热量向量。将目标用户ｉ没有表达喜欢意向的物品根据热量向量＾ｆｉ中各元素的值进行降序排序。最终获得热量最多的ＴＯＰ⁃ｎ个第３期雷震，等：基于影响力控制的热传导算法 ·３２９·

·330· 智能系统学报第11卷物品被推荐给目标用户i。用户喜欢的物品被激活，被赋值热量1，其余的物品被赋值热量0：图1(b)每个用户得到的热量是他喜 (1) 欢的所有物品的热量均值：图1(c)每个物品得到的图1中给出了HC算法的示例。图1(a)目标热量是所有喜欢该物品的用户的热量均值。 (a)用户喜欢的物品被激活 (b)热量从物品到用户 (©)热量从用户到物品图1用户-物品二部网络中的热传导 Fig.1 Heat conduction in user-item bipartite network 3基于影响力控制的热传导算法导算法中的传导率。当入和B从1到0变化时，度数大的用户喜欢的度数大的物品对目标用户的推荐在推荐领域，目标用户对物品的选择与其相关的影响程度会越来越大。联的经历丰富的用户有关。以旅游领域为例，比如：从用户角度来分析，假设度为k:的用户i与度一个游客近期想准备一次旅游，由于他掌握的旅游为k的用户j(k:≥k)均接收到1个单位的热量。信息有限，所以他很可能不太清楚去哪里游玩比较在引入参数入之前，用户i得到热量为1/k:,用户j 合适。他一般会咨询旅游经历丰富的朋友，了解他得到的热量为此时用户i与用户j得到的热量们曾经玩过的哪些景点比较好。这些旅游经历丰富的用户一般会建议他去游玩自己去过并且喜欢的一些流行的景点，该游客然后会综合他们的意见，从中比就为。引入参数A后，他们得到的热量比就变选择自己想要去的景点。受到以上的启发，本文试图优先推荐与目标用户有关联的经历丰富的用户喜经过简单的分析可知：这说欢的度数大的物品。明引入参数入后，用户i与用户j得到热量的比增大基于上述考虑，本文提出了THC算法。与HC 了。而又由式(2)可知：引入参数入后，所有用户接算法不同的是：用户i接收到热量后不除以他自己收到的热量都会增加。因此，度数大的用户得到的的度k而是除以：物品y接收到热量后不除以它热量的增加程度更大。由指数函数的性质可知，当自己的度k,而是除以。因此，物品0。到物品0，底数为0~1时，函数单调递减。因此当入从1到0 的传导率就变成：变化时，这种增加程度会越来越大。同样可以知道， (2)》引入参数B后所有物品接收到的热量都会增加，但是度数大的物品得到的热量的增加程度会更大。当式中入和B分别用来控制度数大的用户喜欢的度 B从1到0变化时，这种增加程度会越来越大。由数大的物品对目标用户影响的程度，它们的取值范以上分析可知：利用入和B可以控制热传导过程中围都是0~1。当入=B=1时，w就变成了基本热传的传导率和热量的分配，也就是说：入和B的引入可

物品被推荐给目标用户ｉ。ｗγθ ＝１ｋγ ∑ ｎｉ＝１ａγｉａθｉｋｉ（１）图１中给出了ＨＣ算法的示例。图１（ａ）目标用户喜欢的物品被激活，被赋值热量１，其余的物品被赋值热量０；图１（ｂ）每个用户得到的热量是他喜欢的所有物品的热量均值；图１（ｃ）每个物品得到的热量是所有喜欢该物品的用户的热量均值。图１用户－物品二部网络中的热传导Ｆｉｇ．１Ｈｅａｔｃｏｎｄｕｃｔｉｏｎｉｎｕｓｅｒ⁃ｉｔｅｍｂｉｐａｒｔｉｔｅｎｅｔｗｏｒｋ３基于影响力控制的热传导算法在推荐领域，目标用户对物品的选择与其相关联的经历丰富的用户有关。以旅游领域为例，比如：一个游客近期想准备一次旅游，由于他掌握的旅游信息有限，所以他很可能不太清楚去哪里游玩比较合适。他一般会咨询旅游经历丰富的朋友，了解他们曾经玩过的哪些景点比较好。这些旅游经历丰富的用户一般会建议他去游玩自己去过并且喜欢的一些流行的景点，该游客然后会综合他们的意见，从中选择自己想要去的景点。受到以上的启发，本文试图优先推荐与目标用户有关联的经历丰富的用户喜欢的度数大的物品。基于上述考虑，本文提出了ＴＨＣ算法。与ＨＣ算法不同的是：用户ｉ接收到热量后不除以他自己的度ｋｉ而是除以ｋ λ ｉ；物品 γ 接收到热量后不除以它自己的度ｋγ ，而是除以ｋ β γ 。因此，物品ｏθ 到物品ｏγ 的传导率就变成：ｗγθ ＝１ｋ β γ ∑ ｎｉ＝１ａγｉａθｉｋ λ ｉ（２）式中 λ 和 β 分别用来控制度数大的用户喜欢的度数大的物品对目标用户影响的程度，它们的取值范围都是０～１。当 λ ＝ β ＝１时，ｗγθ就变成了基本热传导算法中的传导率。当 λ 和 β 从１到０变化时，度数大的用户喜欢的度数大的物品对目标用户的推荐的影响程度会越来越大。从用户角度来分析，假设度为ｋｉ的用户ｉ与度为ｋｊ的用户ｊ（ｋｉ ≥ｋｊ）均接收到１个单位的热量。在引入参数 λ 之前，用户ｉ得到热量为１／ｋｉ，用户ｊ得到的热量为１ｋｊ。此时用户ｉ与用户ｊ得到的热量比就为ｋｊｋｉ。引入参数 λ 后，他们得到的热量比就变为ｋｊｋｉ æ è ç ö ø ÷ λ 。经过简单的分析可知：ｋｊｋｉ æ è ç ö ø ÷ λ ≥ ｋｊｋｉ。这说明引入参数 λ 后，用户ｉ与用户ｊ得到热量的比增大了。而又由式（２）可知：引入参数 λ 后，所有用户接收到的热量都会增加。因此，度数大的用户得到的热量的增加程度更大。由指数函数的性质可知，当底数为０～１时，函数单调递减。因此当 λ 从１到０变化时，这种增加程度会越来越大。同样可以知道，引入参数 β 后所有物品接收到的热量都会增加，但是度数大的物品得到的热量的增加程度会更大。当 β 从１到０变化时，这种增加程度会越来越大。由以上分析可知：利用 λ 和 β 可以控制热传导过程中的传导率和热量的分配，也就是说：λ 和 β 的引入可 ·３３０· 智能系统学报第１１卷

第3期雷震，等：基于影响力控制的热传导算法 ·331· 以控制度数大的用户喜欢的度数大的物品对目标用输入用户对该景点的整体评分，；用户对该户推荐的影响。THC算法如下：景点的风景评分s;用户对该景点的趣味评分s:用输入用户-物品对数据集T,推荐物品个数户对该景点的性价比评分s。;用户对该景点的评论 L,目标用户u: 信息C; 输出top-L个物品。输出tue,用户喜爱该景点：false,用户不喜欢 1)目标用户喜欢的物品被激活，被赋值热该景点。量1： 1)利用ICTCLAS对C进行分词，去掉停用词， 2)热量按式(2)的传播方式从物品传到用户：利用词性标注来去掉中性词： 3)热量按式(2)的传播方式从用户传到物品： 2)对C中的其余词，判断其是否是情感词： 4)物品按照其上面的热量按降序排序后，推荐 3)对每一个否定词0：，找出与其最近的情感词给目标用户utop-L个物品。并且将其情感值从s变成-5： 4旅游评价中的用户态度判断算法 4)对每一个程度副词，找出与其最近的情感词并且用程度副词对应的系数α乘以情感词的情在推荐领域，有时仅凭一个单独的评分并不足感值；以确定用户是否真的喜欢当前物品。以旅游领域为 5)利用如下公式计算评论C的情感极性值：例，如图2所示，某用户对某景点的整体评分为3，可以认为该用户喜欢该景点。但是，进一步观察发 s.-axs. i=1 现：用户对当前景点的景色评分为4，对景点的趣味式中，S。与S.分别代表评论C与情感词w:的情感性、性价比的评分均为1。这说明用户对这个景点值；m是评论中的词语个数；也有不满意的地方。用户对景点的态度也会体现在 6)计算所有评分的均值S。: 其对该景点的评论中。图2给出的评论中出现了 (s:+5g+s:+sn) ‘马达声吵死了’，‘大杀（煞）风景'及·没有想象中 S。= 4 的轻舟已过万重山的感觉'等文字。从评论中可以 7)如果S,≥3且S。≥0，返回true;否则返回看出用户对这次旅游的体验并不满意。 falseo 感色：4愿：1信价批：1 258出n日 5实验与结果在兴H情同头上相的，冠果发玩系肌的的是汽的，马达声珍死了，限个物垃机的，大风显未来姓往几十两，阻家也修完成任野一样，定行时指上挡下，京日一个件左右收钱走人，德吃了个快餐一样.设有想像中轻马已过万重山的画 5.1数据集桂林是全国乃至世界知名的旅游目的地。本文从http://www.ctrip.com上抓取了关于桂林市旅游的数据来验证提出的算法。数据包含了用户对景点图2用户对景点评价和评论实例的评分和评论，评分包含了4个方面：用户对景点的 Fig.2 An example of a user's evaluation and comment 整体评分、用户对景点的景色评分、用户对景点的趣 on a scenery spot 味性评分以及用户对景点的性价比评分（如图2）。因此本文设计了确定用户是否喜欢某景点的算本文采集了包含18151个用户对143个景点的18 法，即旅游评价中的用户态度判断算法。设计理由 304条评分及评论记录。为了有效验证算法，对数如下：如果用户真的喜欢当前景点，那么该用户对当据集进行了预处理。删除评价景点数量少于2条的前景点的各项评分应该都比较高，则所有评分的均用户，删除没有用户评分的景点，再利用旅游评价中值也应该比较大。因此，计算各项评分的均值s。,让的用户态度判断算法计算用户是否喜欢某景点。数均值大小作为判断用户是否喜欢该景点的依据之据集包含1164个用户对143个景点的5672条评一。另外，如果用户真的喜欢当前景点，该用户对当分及评论信息。前景点评论的情感一定会是非负向的。算法中，评为了对提出算法的有效性进行更可靠的验证，论的情感极性计算方法采用文献[20]中的情感提本文还使用了电影评分的数据集[2进行对比实验。取算法。以图2为例，通过分析可知，根据整体评分删除对电影评分数目少于2条的用户，删除没有用会认为用户喜欢该景点，但用态度判断算法可以确户评分的电影，最终得到370个用户对578部电影定该用户对该景点并不是很满意，因为s。<3且评论的9331条评分记录。的情感极性为负。使用旅游评价中的用户态度判断每组实验中，数据集被分为2部分，其中随机挑算法能较为准确地判断用户是否喜欢某景点。用户选出用户-物品二部网络中20%的边作为测试集，态度判断算法如下。其余80%的边为训练集[。每组实验都重复50

以控制度数大的用户喜欢的度数大的物品对目标用户推荐的影响。ＴＨＣ算法如下：输入用户－物品对数据集Ｔ，推荐物品个数Ｌ，目标用户ｕ；输出ｔｏｐ⁃Ｌ个物品。１）目标用户ｕ喜欢的物品被激活，被赋值热量１；２）热量按式（２）的传播方式从物品传到用户；３）热量按式（２）的传播方式从用户传到物品；４）物品按照其上面的热量按降序排序后，推荐给目标用户ｕｔｏｐ⁃Ｌ个物品。４旅游评价中的用户态度判断算法在推荐领域，有时仅凭一个单独的评分并不足以确定用户是否真的喜欢当前物品。以旅游领域为例，如图２所示，某用户对某景点的整体评分为３，可以认为该用户喜欢该景点。但是，进一步观察发现：用户对当前景点的景色评分为４，对景点的趣味性、性价比的评分均为１。这说明用户对这个景点也有不满意的地方。用户对景点的态度也会体现在其对该景点的评论中。图２给出的评论中出现了 ‘马达声吵死了’，‘大杀（煞）风景’及‘没有想象中的轻舟已过万重山的感觉’等文字。从评论中可以看出用户对这次旅游的体验并不满意。图２用户对景点评价和评论实例Ｆｉｇ．２Ａｎｅｘａｍｐｌｅｏｆａｕｓｅｒ􀆳ｓｅｖａｌｕａｔｉｏｎａｎｄｃｏｍｍｅｎｔｏｎａｓｃｅｎｅｒｙｓｐｏｔ因此本文设计了确定用户是否喜欢某景点的算法，即旅游评价中的用户态度判断算法。设计理由如下：如果用户真的喜欢当前景点，那么该用户对当前景点的各项评分应该都比较高，则所有评分的均值也应该比较大。因此，计算各项评分的均值ｓａ，让均值大小作为判断用户是否喜欢该景点的依据之一。另外，如果用户真的喜欢当前景点，该用户对当前景点评论的情感一定会是非负向的。算法中，评论的情感极性计算方法采用文献［２０］中的情感提取算法。以图２为例，通过分析可知，根据整体评分会认为用户喜欢该景点，但用态度判断算法可以确定该用户对该景点并不是很满意，因为ｓａ＜３且评论的情感极性为负。使用旅游评价中的用户态度判断算法能较为准确地判断用户是否喜欢某景点。用户态度判断算法如下。输入用户对该景点的整体评分ｓｔ；用户对该景点的风景评分ｓｇ；用户对该景点的趣味评分ｓｉ；用户对该景点的性价比评分ｓｐ；用户对该景点的评论信息Ｃ；输出ｔｒｕｅ，用户喜爱该景点；ｆａｌｓｅ，用户不喜欢该景点。１）利用ＩＣＴＣＬＡＳ对Ｃ进行分词，去掉停用词，利用词性标注来去掉中性词；２）对Ｃ中的其余词，判断其是否是情感词；３）对每一个否定词ｗｉ，找出与其最近的情感词并且将其情感值从ｓｗｉ＋１变成－ｓｗｉ＋１；４）对每一个程度副词，找出与其最近的情感词并且用程度副词对应的系数 α 乘以情感词的情感值；５）利用如下公式计算评论Ｃ的情感极性值；Ｓｃ＝ ∑ ｍｉ＝１ α × Ｓｗｉ式中，Ｓｃ与Ｓｗｉ分别代表评论Ｃ与情感词ｗｉ的情感值；ｍ是评论中的词语个数；６）计算所有评分的均值Ｓａ：Ｓａ＝ｓｔ＋ｓｇ＋ｓｉ＋ｓｐ ( ) ４７）如果Ｓａ ≥３且Ｓｃ ≥０，返回ｔｒｕｅ；否则返回ｆａｌｓｅ。５实验与结果５．１数据集桂林是全国乃至世界知名的旅游目的地。本文从ｈｔｔｐ：／／ｗｗｗ．ｃｔｒｉｐ．ｃｏｍ上抓取了关于桂林市旅游的数据来验证提出的算法。数据包含了用户对景点的评分和评论，评分包含了４个方面：用户对景点的整体评分、用户对景点的景色评分、用户对景点的趣味性评分以及用户对景点的性价比评分（如图２）。本文采集了包含１８１５１个用户对１４３个景点的１８３０４条评分及评论记录。为了有效验证算法，对数据集进行了预处理。删除评价景点数量少于２条的用户，删除没有用户评分的景点，再利用旅游评价中的用户态度判断算法计算用户是否喜欢某景点。数据集包含１１６４个用户对１４３个景点的５６７２条评分及评论信息。为了对提出算法的有效性进行更可靠的验证，本文还使用了电影评分的数据集［２１］进行对比实验。删除对电影评分数目少于２条的用户，删除没有用户评分的电影，最终得到３７０个用户对５７８部电影的９３３１条评分记录。每组实验中，数据集被分为２部分，其中随机挑选出用户－物品二部网络中２０％的边作为测试集，其余８０％的边为训练集［５］。每组实验都重复５０第３期雷震，等：基于影响力控制的热传导算法 ·３３１·

·332· 智能系统学报第11卷次，最终的实验结果是这50次实验结果的平均值。 diversity:一个推荐算法应该给不同的用户推荐 5.2评价指标不同的物品。式(6)给出了多样性的计算方法：为了评判提出的想法是否达到了预期效果，即 Q(L) 度数大的用户喜欢的度数大的物品是否被推荐出 Ha=1- (6) L 来。本文提出了一个大度用户大度物品率指标式中：L是推荐列表长度，Q(L)是用户山，、山推荐列 (buir),用来衡量推荐出的度数大的用户喜欢的度表中相同物品的个数，H表示推荐算法给用户“：、山数大的物品出现在推荐列表中的比例。式(3)给出两者推荐结果间的多样性。求出测试集中任意两个了目标用户i的该指标计算方法。用户的推荐结果间的多样性值的平均值，就可以得 ROT 到一个推荐算法的多样性值。多样性值越大意味着 buir;= (3) L 一个推荐算法给不同的人推荐结果越不一样。式中：T是用户i的推荐列表中物品构成的集合，L coverage:推荐算法的覆盖率是指算法能推荐的是推荐列表长度。R是与目标用户i关联的度数大物品种类占所有物品种类的比例。式(7)给出了覆的用户喜欢的度数大的物品集合。任意一个用户，盖率的计算方法：如果他与用户i有共同喜欢的物品，则将该用户称为与用户i有关联的用户，所有这样的用户构成的 Cov=n (7) 集合称为与用户i关联的用户集合AU。将AU中式中：n是算法给全体用户推荐的不同物品的的所有用户按照其度进行降序排序，并取排在前1/ 数量，V是物品总数。覆盖率越大意味着算法能推 3的用户，将这些用户构成的集合称为与用户i关联荐出的不同物品的数量越多。的度数大的用户集合BU。对BU中的每一个用户 5.3实验方案 j,将用户j喜欢的物品按其度进行降序排序，并取排为了观察buir指标随参数入和B的变化情况在前1/3的物品，将这些物品称为用户j喜欢的度以及它对其他指标的影响，实验提供了THC算法分数大的物品。将与用户i关联的度数大的用户集合别在旅游数据集和电影数据集上推荐列表长度分别 BU中的所有用户喜欢的度数大的物品构成集合，为5、8、10、12时，各指标随参数变化的情况图。图称之为与用户i关联的大度用户喜欢的大度物品集分为8组，每组5张，共计40张。由于每组图的变合，即R:。对测试集中的所有用户的大度用户大度化情况类似，本文只提供了推荐列表L=10时THC 物品率取平均就可以得到该算法的大度用户大度物算法在旅游数据集上的结果，以分析buir与其他指品率。标的关系。各指标的变化分别如图3~7所示。为为了分析提出算法的效果，本文采用了以下4 了进一步分析THC方法的有效性，分别使用旅游数据个指标[)：排序得分(ranking score)、新颖性(novel- 集和电影评分数据集对BHC[)、WHC18],、MD6],HC) ty)、多样性(diversity)及覆盖率(coverage)。及THC在推荐列表的长度分别为5、8、10、12时的排序 ranking score(RS):一个好的推荐算法应该将得分进行比较。实验结果如图8、9所示。需要说明的用户喜欢的物品排在前面。测试集中，如果物品α 是：某用户对某电影喜爱的条件是该用户对该电影的被目标用户i喜欢，物品α位于用户i的推荐列表评分大于或等于3。某用户对某景点是否喜爱的判断中排序为r的位置，那么物品α的排序得分为是利用旅游评价中的用户态度判断算法计算得出。 15."m (4) BHC和WHC中的参数变化范围为0~1。式中：m是训练集中物品总数，k:是训练集中用户i 1.0 喜欢的物品总数。每个用户的排序得分，是所有推 0.8 荐给他并且他的确喜欢的物品的排序得分均值。对 06言测试集中所有用户的排序得分求平均值，就可以得 0.4 02 到算法的排序得分。 novelty:新颖性被定义为所有被推荐物品度的平均值。一个推荐算法的新颖性计算如式(5)： ao6o0 Novelty = ∑4 (5) 0020.40.60.81.0 n 式中：k:是物品i的度，n是算法给所有用户推荐的图3L=10时，THC算法在旅游评价数据集上buir指物品总数。推荐算法的新颖性值越小，推荐出来的标随参数变化图物品越新颖。 Fig.3 The variation of THC's buir index on the travel data set when L=10

次，最终的实验结果是这５０次实验结果的平均值。５．２评价指标为了评判提出的想法是否达到了预期效果，即度数大的用户喜欢的度数大的物品是否被推荐出来。本文提出了一个大度用户大度物品率指标（ｂｕｉｒ），用来衡量推荐出的度数大的用户喜欢的度数大的物品出现在推荐列表中的比例。式（３）给出了目标用户ｉ的该指标计算方法。ｂｕｉｒｉ＝Ｒｉ ∩ ＴｉＬ（３）式中：Ｔｉ是用户ｉ的推荐列表中物品构成的集合，Ｌ是推荐列表长度。Ｒｉ是与目标用户ｉ关联的度数大的用户喜欢的度数大的物品集合。任意一个用户，如果他与用户ｉ有共同喜欢的物品，则将该用户称为与用户ｉ有关联的用户，所有这样的用户构成的集合称为与用户ｉ关联的用户集合ＡＵ。将ＡＵ中的所有用户按照其度进行降序排序，并取排在前１／３的用户，将这些用户构成的集合称为与用户ｉ关联的度数大的用户集合ＢＵ。对ＢＵ中的每一个用户ｊ，将用户ｊ喜欢的物品按其度进行降序排序，并取排在前１／３的物品，将这些物品称为用户ｊ喜欢的度数大的物品。将与用户ｉ关联的度数大的用户集合ＢＵ中的所有用户喜欢的度数大的物品构成集合，称之为与用户ｉ关联的大度用户喜欢的大度物品集合，即Ｒｉ。对测试集中的所有用户的大度用户大度物品率取平均就可以得到该算法的大度用户大度物品率。为了分析提出算法的效果，本文采用了以下４个指标［５］：排序得分（ｒａｎｋｉｎｇｓｃｏｒｅ）、新颖性（ｎｏｖｅｌ⁃ ｔｙ）、多样性（ｄｉｖｅｒｓｉｔｙ）及覆盖率（ｃｏｖｅｒａｇｅ）。ｒａｎｋｉｎｇｓｃｏｒｅ（ＲＳ）：一个好的推荐算法应该将用户喜欢的物品排在前面。测试集中，如果物品 α 被目标用户ｉ喜欢，物品 α 位于用户ｉ的推荐列表中排序为ｒ的位置，那么物品 α 的排序得分为ＲＳｉα ＝ｒｍ－ｋｉ（４）式中：ｍ是训练集中物品总数，ｋｉ是训练集中用户ｉ喜欢的物品总数。每个用户的排序得分，是所有推荐给他并且他的确喜欢的物品的排序得分均值。对测试集中所有用户的排序得分求平均值，就可以得到算法的排序得分。ｎｏｖｅｌｔｙ：新颖性被定义为所有被推荐物品度的平均值。一个推荐算法的新颖性计算如式（５）：Ｎｏｖｅｌｔｙ＝ ∑ ｎｉ＝１ｋｉｎ（５）式中：ｋｉ是物品ｉ的度，ｎ是算法给所有用户推荐的物品总数。推荐算法的新颖性值越小，推荐出来的物品越新颖。ｄｉｖｅｒｓｉｔｙ：一个推荐算法应该给不同的用户推荐不同的物品。式（６）给出了多样性的计算方法：Ｈｉｊ＝１－Ｑｉｊ（Ｌ）Ｌ（６）式中：Ｌ是推荐列表长度，Ｑｉｊ（Ｌ）是用户ｕｉ、ｕｊ推荐列表中相同物品的个数，Ｈｉｊ表示推荐算法给用户ｕｉ、ｕｊ两者推荐结果间的多样性。求出测试集中任意两个用户的推荐结果间的多样性值的平均值，就可以得到一个推荐算法的多样性值。多样性值越大意味着一个推荐算法给不同的人推荐结果越不一样。ｃｏｖｅｒａｇｅ：推荐算法的覆盖率是指算法能推荐的物品种类占所有物品种类的比例。式（７）给出了覆盖率的计算方法：Ｃｏｖ＝ｎＮ（７）式中：ｎ是算法给全体用户推荐的不同物品的数量，Ｎ是物品总数。覆盖率越大意味着算法能推荐出的不同物品的数量越多。５．３实验方案为了观察ｂｕｉｒ指标随参数 λ 和 β 的变化情况以及它对其他指标的影响，实验提供了ＴＨＣ算法分别在旅游数据集和电影数据集上推荐列表长度分别为５、８、１０、１２时，各指标随参数变化的情况图。图分为８组，每组５张，共计４０张。由于每组图的变化情况类似，本文只提供了推荐列表Ｌ＝１０时ＴＨＣ算法在旅游数据集上的结果，以分析ｂｕｉｒ与其他指标的关系。各指标的变化分别如图３～７所示。为了进一步分析ＴＨＣ方法的有效性，分别使用旅游数据集和电影评分数据集对ＢＨＣ［５］、ＷＨＣ［１８］、ＭＤ［１６］、ＨＣ［５］及ＴＨＣ在推荐列表的长度分别为５、８、１０、１２时的排序得分进行比较。实验结果如图８、９所示。需要说明的是：某用户对某电影喜爱的条件是该用户对该电影的评分大于或等于３。某用户对某景点是否喜爱的判断是利用旅游评价中的用户态度判断算法计算得出。ＢＨＣ和ＷＨＣ中的参数变化范围为０～１。图３Ｌ＝１０时，ＴＨＣ算法在旅游评价数据集上ｂｕｉｒ指标随参数变化图Ｆｉｇ．３ＴｈｅｖａｒｉａｔｉｏｎｏｆＴＨＣ’ｓｂｕｉｒｉｎｄｅｘｏｎｔｈｅｔｒａｖｅｌｄａｔａｓｅｔｗｈｅｎＬ＝１０ ·３３２· 智能系统学报第１１卷

·334· 智能系统学报第11卷 5.4实验结果与分析户推荐其喜欢的物品，从而有助于提升算法的效果。图3~7中的黑色代表各图中相应指标值较大另外，还可以发现MD和BHC算法的排序得分在所的区域，白色代表各图中相应指标值较小的区域，图有情形下都比HC算法要好，这与文献[5]中的结论中颜色越黑表示相应指标值越大。由图3可以看一致：WHC算法在所有条件下都比HC算法的排序出，当入取值小于0.5，B取值也小于0.5时，此时推得分好，这与文献[19]中的结论一致。荐出来的度数大的用户喜欢的度数大的物品较多。 6结束语图4中相应区域的排序得分较低，这说明度数大的用户喜欢的度数大的物品一般是大家所喜欢的物由于HC算法减弱了度数大的用户喜欢的度数品，与文中开始提出的假设一致：由于此时推荐出来大的物品对目标用户的影响，本文提出了基于影响的度数大的物品较多，所以推荐的物品的新颖性较力控制的热传导算法THC。THC引入2个参数来低即新颖性值较大，这与图5中相应区域的指标数控制度数大的用户喜欢的度数大的物品被优先推荐据是一致的：另外，度数大的用户喜欢的度数大的物的程度。为了检验提出的想法是否达到预期效果，品在整个系统的所有物品中占的比例是比较小的，在电影评分数据集和旅游评价数据集上进行了多项因为大多数物品都不是流行物品，所以此时多样性对比实验。本文还提出了旅游评价中的用户态度判和覆盖率都较低，这与图6和图7中相应区域的指断算法及一个新指标buir。实验结果表明，当THC 标数据一致。对于图4，数据表明：当入与B分别取中的2个参数入和B较小时，度数大的用户喜欢的 0.05、0.55时，排序得分取得最优值0.0298，但此时度数大的物品能被更多的推荐，但这种推荐要有控 buir并不是最大。可以得出这样的结论：虽然目标制，否则会降低排序得分。实验结果还表明THC算用户会喜欢度数大的用户喜欢的度数大的物品，但法在排序得分指标上比BHC、MD、WHC及HC算法是推荐的量要适度。还可以发现：此时的排序得分表现更好。未来可考虑结合用户间的朋友关系与信要比当A=B=1.0时的HC算法的排序得分要好，而任关系进一步调控度数大的用户喜欢的度数大的物此时的buir指标也比HC的要高。品对目标用户推荐的影响。通过分析各个评价指标变化图，可以得出如下参考文献：结论：1)如果要向用户推荐较多度数大的用户喜欢的度数大的物品，则应该将入与B的取值范围都限 [1]文益民，史一帆，蔡国永，等.个性化旅游推荐研究综制在0~0.5，因为在此范围中buir的值均较大。2) 述[EB/0L].北京：中国科技论文在线，2014.[2014- 如果要使算法的排序得分取得最大值，2个参数入 07-03 ]http://www.paper.edu.cn/releasepaper/content/ 201407.56. 与B的最优值应该从0~1之间寻找。虽然入与B 2]RESNICK P,VARIAN H R.Recommender systems J] 在0~0.5取值时，度数大的用户喜欢的度数大的物 Communications of the ACM,1997,40(3):56-58. 品更可能被推荐，但是并不一定是推荐得越多，排序 [3]ADOMAVICIUS G,TUZHILIN A.Toward the next genera- 得分越好。3)如果要向用户推荐较多的新颖物品， tion of recommender systems:a survey of the state-of-the-art 则不该将入与B的取值范围都限制在0~0.5，因为 and possible extensions[J].IEEE transactions on knowledge 当buir较大时，推荐出来的度数大的用户喜欢的度 and data engineering,2005,17(6):734-749. 数大的物品较多，此时推荐出来的物品必然不新颖。 [4]FELFERNIG A.GORDEA S,JANNACH D,et al.A short 图8和图9是BHC、MD、WHC、HC及THC在 survey of recommendation technologies in travel and tourism 两个数据集上推荐列表的长度分别为5、8、10、12时 [J].0 EGAI journal,2007,25(7):17-22. 排序得分的对比结果。其中BHC、WHC及THC是 [5]LIU Jianguo,ZHOU Tao,GUO Qiang.Information filtering 取所有不同参数结果中的最优值。通过观察可以发 via biased heat conductionJ.Physical review E,2011, 84(3):037101. 现，本文提出的THC算法，与基本的HC算法相比， [6]LINDEN G,SMITH B,YORK J.Amazon.com recommen- 在所有的情况下排序得分都要好；与MD、WHC、 dations:item-to-item collaborative filtering[J].IEEE inter- BHC算法相比，排序得分也都要好，虽然提升程度 net computing,2003,7(1):76-80. 较小。 [7]DAS A S,DATAR M,GARG A,et al.Google news per- 通过上面的分析可以知道：通过适度的优先推 sonalization:scalable online collaborative filtering [C]// 荐度数大的用户喜欢的度数大的物品，有助于向用 Proceedings of the 16th International Conference on World

５．４实验结果与分析图３～７中的黑色代表各图中相应指标值较大的区域，白色代表各图中相应指标值较小的区域，图中颜色越黑表示相应指标值越大。由图３可以看出，当 λ 取值小于０．５，β 取值也小于０．５时，此时推荐出来的度数大的用户喜欢的度数大的物品较多。图４中相应区域的排序得分较低，这说明度数大的用户喜欢的度数大的物品一般是大家所喜欢的物品，与文中开始提出的假设一致；由于此时推荐出来的度数大的物品较多，所以推荐的物品的新颖性较低即新颖性值较大，这与图５中相应区域的指标数据是一致的；另外，度数大的用户喜欢的度数大的物品在整个系统的所有物品中占的比例是比较小的，因为大多数物品都不是流行物品，所以此时多样性和覆盖率都较低，这与图６和图７中相应区域的指标数据一致。对于图４，数据表明：当 λ 与 β 分别取０．０５、０．５５时，排序得分取得最优值０．０２９８，但此时ｂｕｉｒ并不是最大。可以得出这样的结论：虽然目标用户会喜欢度数大的用户喜欢的度数大的物品，但是推荐的量要适度。还可以发现：此时的排序得分要比当 λ ＝ β ＝１．０时的ＨＣ算法的排序得分要好，而此时的ｂｕｉｒ指标也比ＨＣ的要高。通过分析各个评价指标变化图，可以得出如下结论：１）如果要向用户推荐较多度数大的用户喜欢的度数大的物品，则应该将 λ 与 β 的取值范围都限制在０～０．５，因为在此范围中ｂｕｉｒ的值均较大。２）如果要使算法的排序得分取得最大值，２个参数 λ 与 β 的最优值应该从０～１之间寻找。虽然 λ 与 β 在０～０．５取值时，度数大的用户喜欢的度数大的物品更可能被推荐，但是并不一定是推荐得越多，排序得分越好。３）如果要向用户推荐较多的新颖物品，则不该将 λ 与 β 的取值范围都限制在０～０．５，因为当ｂｕｉｒ较大时，推荐出来的度数大的用户喜欢的度数大的物品较多，此时推荐出来的物品必然不新颖。图８和图９是ＢＨＣ、ＭＤ、ＷＨＣ、ＨＣ及ＴＨＣ在两个数据集上推荐列表的长度分别为５、８、１０、１２时排序得分的对比结果。其中ＢＨＣ、ＷＨＣ及ＴＨＣ是取所有不同参数结果中的最优值。通过观察可以发现，本文提出的ＴＨＣ算法，与基本的ＨＣ算法相比，在所有的情况下排序得分都要好；与ＭＤ、ＷＨＣ、ＢＨＣ算法相比，排序得分也都要好，虽然提升程度较小。通过上面的分析可以知道：通过适度的优先推荐度数大的用户喜欢的度数大的物品，有助于向用户推荐其喜欢的物品，从而有助于提升算法的效果。另外，还可以发现ＭＤ和ＢＨＣ算法的排序得分在所有情形下都比ＨＣ算法要好，这与文献［５］中的结论一致；ＷＨＣ算法在所有条件下都比ＨＣ算法的排序得分好，这与文献［１９］中的结论一致。６结束语由于ＨＣ算法减弱了度数大的用户喜欢的度数大的物品对目标用户的影响，本文提出了基于影响力控制的热传导算法ＴＨＣ。ＴＨＣ引入２个参数来控制度数大的用户喜欢的度数大的物品被优先推荐的程度。为了检验提出的想法是否达到预期效果，在电影评分数据集和旅游评价数据集上进行了多项对比实验。本文还提出了旅游评价中的用户态度判断算法及一个新指标ｂｕｉｒ。实验结果表明，当ＴＨＣ中的２个参数 λ 和 β 较小时，度数大的用户喜欢的度数大的物品能被更多的推荐，但这种推荐要有控制，否则会降低排序得分。实验结果还表明ＴＨＣ算法在排序得分指标上比ＢＨＣ、ＭＤ、ＷＨＣ及ＨＣ算法表现更好。未来可考虑结合用户间的朋友关系与信任关系进一步调控度数大的用户喜欢的度数大的物品对目标用户推荐的影响。参考文献：［１］文益民，史一帆，蔡国永，等．个性化旅游推荐研究综述［ＥＢ／ＯＬ］．北京：中国科技论文在线，２０１４．［２０１４⁃ ０７⁃０３］．ｈｔｔｐ：／／ｗｗｗ．ｐａｐｅｒ．ｅｄｕ．ｃｎ／ｒｅｌｅａｓｅｐａｐｅｒ／ｃｏｎｔｅｎｔ／２０１４０７⁃５６．［２］ＲＥＳＮＩＣＫＰ，ＶＡＲＩＡＮＨＲ．Ｒｅｃｏｍｍｅｎｄｅｒｓｙｓｔｅｍｓ［Ｊ］．ＣｏｍｍｕｎｉｃａｔｉｏｎｓｏｆｔｈｅＡＣＭ，１９９７，４０（３）：５６⁃５８．［３］ＡＤＯＭＡＶＩＣＩＵＳＧ，ＴＵＺＨＩＬＩＮＡ．Ｔｏｗａｒｄｔｈｅｎｅｘｔｇｅｎｅｒａ⁃ ｔｉｏｎｏｆｒｅｃｏｍｍｅｎｄｅｒｓｙｓｔｅｍｓ：ａｓｕｒｖｅｙｏｆｔｈｅｓｔａｔｅ⁃ｏｆ⁃ｔｈｅ⁃ａｒｔａｎｄｐｏｓｓｉｂｌｅｅｘｔｅｎｓｉｏｎｓ［Ｊ］．ＩＥＥＥｔｒａｎｓａｃｔｉｏｎｓｏｎｋｎｏｗｌｅｄｇｅａｎｄｄａｔａｅｎｇｉｎｅｅｒｉｎｇ，２００５，１７（６）：７３４⁃７４９．［４］ＦＥＬＦＥＲＮＩＧＡ，ＧＯＲＤＥＡＳ，ＪＡＮＮＡＣＨＤ，ｅｔａｌ．Ａｓｈｏｒｔｓｕｒｖｅｙｏｆｒｅｃｏｍｍｅｎｄａｔｉｏｎｔｅｃｈｎｏｌｏｇｉｅｓｉｎｔｒａｖｅｌａｎｄｔｏｕｒｉｓｍ［Ｊ］．ＯＥＧＡＩｊｏｕｒｎａｌ，２００７，２５（７）：１７⁃２２．［５］ＬＩＵＪｉａｎｇｕｏ，ＺＨＯＵＴａｏ，ＧＵＯＱｉａｎｇ．Ｉｎｆｏｒｍａｔｉｏｎｆｉｌｔｅｒｉｎｇｖｉａｂｉａｓｅｄｈｅａｔｃｏｎｄｕｃｔｉｏｎ［Ｊ］．ＰｈｙｓｉｃａｌｒｅｖｉｅｗＥ，２０１１，８４（３）：０３７１０１．［６］ＬＩＮＤＥＮＧ，ＳＭＩＴＨＢ，ＹＯＲＫＪ．Ａｍａｚｏｎ．ｃｏｍｒｅｃｏｍｍｅｎ⁃ ｄａｔｉｏｎｓ：ｉｔｅｍ⁃ｔｏ⁃ｉｔｅｍｃｏｌｌａｂｏｒａｔｉｖｅｆｉｌｔｅｒｉｎｇ［Ｊ］．ＩＥＥＥｉｎｔｅｒ⁃ ｎｅｔｃｏｍｐｕｔｉｎｇ，２００３，７（１）：７６⁃８０．［７］ＤＡＳＡＳ，ＤＡＴＡＲＭ，ＧＡＲＧＡ，ｅｔａｌ．Ｇｏｏｇｌｅｎｅｗｓｐｅｒ⁃ ｓｏｎａｌｉｚａｔｉｏｎ：ｓｃａｌａｂｌｅｏｎｌｉｎｅｃｏｌｌａｂｏｒａｔｉｖｅｆｉｌｔｅｒｉｎｇ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１６ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＷｏｒｌｄ ·３３４· 智能系统学报第１１卷

第3期雷震，等：基于影响力控制的热传导算法 .335. wide Web.New York,USA,2007:271-280. 推荐算法研究[J].计算机应用研究，2015,32(11)： [8]LIU Qiwen,CHEN Tianjian,CAI Jing,et al.Enlister: 3235-3237. baidu's recommender system for the biggest chinese Q&A HOU Lei,HU Zhaolong,ZHANG Bo,et al.Information website[C]//Proceedings of the Sixth ACM Conference on filtering via non-equilibrium heat conduction with consider- Recommender Systems.New York,USA,2012:285-288. ation of popularity[].Application research of computers, [9]HERLOCKER J L,KONSTAN J A,RIEDL J.Explaining 2015,32(11):3235-3237. collaborative filtering recommendations[C]//Proceedings of [19]LIU Jianguo,GUO Qiang,ZHANG Yicheng.Information the 2000 ACM Conference on Computer Supported Coopera- filtering via weighted heat conduction algorithm[J].Physi- tive Work.New York.USA,2000:241-250. ca A:statistical mechanics and its applications,2011, [10]PAZZANI M J.A framework for collaborative,content- 390(12):2414-2420. based and demographic filtering[J].Artificial intelligence [20]SHI Shaoliang,LI Yunpeng,WEN Yimin,et al.Adding review,1999,13(5-6):393-408. the sentiment attribute of nodes to improve link prediction [11 ZHOU Tao,Lu Linyuan,ZHANG Yicheng.Predicting in social network [C]//Proceedings of the 12th Interna- missing links via local information [J].The european tional Conference on Fuzzy Systems and Knowledge Discov- physical journal B,2009,71(4):623-630. ery.Zhangjiajie,China,2015:1263-1269. [12]Lu Linyuan,ZHOU Tao.Link prediction in weighted net- [20]LIU Jinhu,ZHANG Zike,CHEN Lingjiao,et al.Gravity works:the role of weak ties[J].EOL europhysics let- effects on information filtering and network evolving[J]. tes),2010,89(1):18001. PLoS one,2014,9(3):e91070. [13]ZHOU Tao,KUSCSIK Z,LIU Jianguo,et al.Solving the 作者简介： apparent diversity-accuracy dilemma of recommender sys- 雷震，男，1991年生，硕士研究生 tems[]].Proceedings of the national academy of sciences 主要研究方向为推荐系统与数据挖掘。 of the United States of America,2010,107(10):4511- 4515. [14 ZENG Wei,SHANG Mingsheng,ZHANG Qianming,et al.Can dissimilar users contribute to accuracy and diversi- ty of personalized recommendation[J].International jour- nal of modern physics C,2010,21(10):1217-1227. 文益民，男，1969年生，博士，教授， [15]ZHANG Zike,YU Lu,FANG Kuan,et al.Website-orien- 中国计算机学会高级会员。主要研究 ted recommendation based on heat spreading and tag-aware 方向为机器学习与数据挖掘、极化SAR collaborative filtering[J].Physica A:statistical mechanics 图像处理、社会计算。主持省部级科研 and its applications,2014,399:82-88. 项目8项，获得省部级教学、科研奖励5 [16]ZHOU Tao,REN Jie,MEDO M,et al.Bipartite network 项，发表学术论文30余篇，其中被$C、 projection and personal recommendation[J].Physical re- EI收录18篇，翻译译著1部。 view E,2007,76(4):046115. [17]NIE Dacheng,AN Yahui,DONG Qiang,et al.Information 王志强，男，1991年生，硕士研究 filtering via balanced diffusion on bipartite networks[J]. 生，主要研究方向为数据挖掘、旅游 Physica A:statistical mechanics and its applications, 推荐。 2015,421:44-53. [18]侯磊，胡兆龙，张博，等.基于流行度的非平衡热传导

ｗｉｄｅＷｅｂ．ＮｅｗＹｏｒｋ，ＵＳＡ，２００７：２７１⁃２８０．［８］ＬＩＵＱｉｗｅｎ，ＣＨＥＮＴｉａｎｊｉａｎ，ＣＡＩＪｉｎｇ，ｅｔａｌ．Ｅｎｌｉｓｔｅｒ：ｂａｉｄｕ＇ｓｒｅｃｏｍｍｅｎｄｅｒｓｙｓｔｅｍｆｏｒｔｈｅｂｉｇｇｅｓｔｃｈｉｎｅｓｅＱ＆Ａｗｅｂｓｉｔｅ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＳｉｘｔｈＡＣＭＣｏｎｆｅｒｅｎｃｅｏｎＲｅｃｏｍｍｅｎｄｅｒＳｙｓｔｅｍｓ．ＮｅｗＹｏｒｋ，ＵＳＡ，２０１２：２８５⁃２８８．［９］ＨＥＲＬＯＣＫＥＲＪＬ，ＫＯＮＳＴＡＮＪＡ，ＲＩＥＤＬＪ．Ｅｘｐｌａｉｎｉｎｇｃｏｌｌａｂｏｒａｔｉｖｅｆｉｌｔｅｒｉｎｇｒｅｃｏｍｍｅｎｄａｔｉｏｎｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２０００ＡＣＭＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＳｕｐｐｏｒｔｅｄＣｏｏｐｅｒａ⁃ ｔｉｖｅＷｏｒｋ．ＮｅｗＹｏｒｋ，ＵＳＡ，２０００：２４１⁃２５０．［１０］ＰＡＺＺＡＮＩＭＪ．Ａｆｒａｍｅｗｏｒｋｆｏｒｃｏｌｌａｂｏｒａｔｉｖｅ，ｃｏｎｔｅｎｔ⁃ ｂａｓｅｄａｎｄｄｅｍｏｇｒａｐｈｉｃｆｉｌｔｅｒｉｎｇ［Ｊ］．Ａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅｒｅｖｉｅｗ，１９９９，１３（５⁃６）：３９３⁃４０８．［１１］ＺＨＯＵＴａｏ，Ｌü Ｌｉｎｙｕａｎ，ＺＨＡＮＧＹｉｃｈｅｎｇ．Ｐｒｅｄｉｃｔｉｎｇｍｉｓｓｉｎｇｌｉｎｋｓｖｉａｌｏｃａｌｉｎｆｏｒｍａｔｉｏｎ［Ｊ］．ＴｈｅｅｕｒｏｐｅａｎｐｈｙｓｉｃａｌｊｏｕｒｎａｌＢ，２００９，７１（４）：６２３⁃６３０．［１２］Ｌü Ｌｉｎｙｕａｎ，ＺＨＯＵＴａｏ．Ｌｉｎｋｐｒｅｄｉｃｔｉｏｎｉｎｗｅｉｇｈｔｅｄｎｅｔ⁃ ｗｏｒｋｓ：ｔｈｅｒｏｌｅｏｆｗｅａｋｔｉｅｓ［Ｊ］．ＥＯＬ（ｅｕｒｏｐｈｙｓｉｃｓｌｅｔ⁃ ｔｅｒｓ），２０１０，８９（１）：１８００１．［１３］ＺＨＯＵＴａｏ，ＫＵＳＣＳＩＫＺ，ＬＩＵＪｉａｎｇｕｏ，ｅｔａｌ．Ｓｏｌｖｉｎｇｔｈｅａｐｐａｒｅｎｔｄｉｖｅｒｓｉｔｙ⁃ａｃｃｕｒａｃｙｄｉｌｅｍｍａｏｆｒｅｃｏｍｍｅｎｄｅｒｓｙｓ⁃ ｔｅｍｓ［Ｊ］．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅｎａｔｉｏｎａｌａｃａｄｅｍｙｏｆｓｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ，２０１０，１０７（１０）：４５１１⁃ ４５１５．［１４］ＺＥＮＧＷｅｉ，ＳＨＡＮＧＭｉｎｇｓｈｅｎｇ，ＺＨＡＮＧＱｉａｎｍｉｎｇ，ｅｔａｌ．Ｃａｎｄｉｓｓｉｍｉｌａｒｕｓｅｒｓｃｏｎｔｒｉｂｕｔｅｔｏａｃｃｕｒａｃｙａｎｄｄｉｖｅｒｓｉ⁃ ｔｙｏｆｐｅｒｓｏｎａｌｉｚｅｄｒｅｃｏｍｍｅｎｄａｔｉｏｎ［Ｊ］．Ｉｎｔｅｒｎａｔｉｏｎａｌｊｏｕｒ⁃ ｎａｌｏｆｍｏｄｅｒｎｐｈｙｓｉｃｓＣ，２０１０，２１（１０）：１２１７⁃１２２７．［１５］ＺＨＡＮＧＺｉｋｅ，ＹＵＬｕ，ＦＡＮＧＫｕａｎ，ｅｔａｌ．Ｗｅｂｓｉｔｅ⁃ｏｒｉｅｎ⁃ ｔｅｄｒｅｃｏｍｍｅｎｄａｔｉｏｎｂａｓｅｄｏｎｈｅａｔｓｐｒｅａｄｉｎｇａｎｄｔａｇ⁃ａｗａｒｅｃｏｌｌａｂｏｒａｔｉｖｅｆｉｌｔｅｒｉｎｇ［Ｊ］．ＰｈｙｓｉｃａＡ：ｓｔａｔｉｓｔｉｃａｌｍｅｃｈａｎｉｃｓａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｓ，２０１４，３９９：８２⁃８８．［１６］ＺＨＯＵＴａｏ，ＲＥＮＪｉｅ，ＭＥＤＯＭ，ｅｔａｌ．Ｂｉｐａｒｔｉｔｅｎｅｔｗｏｒｋｐｒｏｊｅｃｔｉｏｎａｎｄｐｅｒｓｏｎａｌｒｅｃｏｍｍｅｎｄａｔｉｏｎ［Ｊ］．Ｐｈｙｓｉｃａｌｒｅ⁃ ｖｉｅｗＥ，２００７，７６（４）：０４６１１５．［１７］ＮＩＥＤａｃｈｅｎｇ，ＡＮＹａｈｕｉ，ＤＯＮＧＱｉａｎｇ，ｅｔａｌ．Ｉｎｆｏｒｍａｔｉｏｎｆｉｌｔｅｒｉｎｇｖｉａｂａｌａｎｃｅｄｄｉｆｆｕｓｉｏｎｏｎｂｉｐａｒｔｉｔｅｎｅｔｗｏｒｋｓ［Ｊ］．ＰｈｙｓｉｃａＡ：ｓｔａｔｉｓｔｉｃａｌｍｅｃｈａｎｉｃｓａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｓ，２０１５，４２１：４４⁃５３．［１８］侯磊，胡兆龙，张博，等．基于流行度的非平衡热传导推荐算法研究［Ｊ］．计算机应用研究，２０１５，３２（１１）：３２３５⁃３２３７．ＨＯＵＬｅｉ，ＨＵＺｈａｏｌｏｎｇ，ＺＨＡＮＧＢｏ，ｅｔａｌ．Ｉｎｆｏｒｍａｔｉｏｎｆｉｌｔｅｒｉｎｇｖｉａｎｏｎ⁃ｅｑｕｉｌｉｂｒｉｕｍｈｅａｔｃｏｎｄｕｃｔｉｏｎｗｉｔｈｃｏｎｓｉｄｅｒ⁃ ａｔｉｏｎｏｆｐｏｐｕｌａｒｉｔｙ［Ｊ］．Ａｐｐｌｉｃａｔｉｏｎｒｅｓｅａｒｃｈｏｆｃｏｍｐｕｔｅｒｓ，２０１５，３２（１１）：３２３５⁃３２３７．［１９］ＬＩＵＪｉａｎｇｕｏ，ＧＵＯＱｉａｎｇ，ＺＨＡＮＧＹｉｃｈｅｎｇ．Ｉｎｆｏｒｍａｔｉｏｎｆｉｌｔｅｒｉｎｇｖｉａｗｅｉｇｈｔｅｄｈｅａｔｃｏｎｄｕｃｔｉｏｎａｌｇｏｒｉｔｈｍ［Ｊ］．Ｐｈｙｓｉ⁃ ｃａＡ：ｓｔａｔｉｓｔｉｃａｌｍｅｃｈａｎｉｃｓａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｓ，２０１１，３９０（１２）：２４１４⁃２４２０．［２０］ＳＨＩＳｈａｏｌｉａｎｇ，ＬＩＹｕｎｐｅｎｇ，ＷＥＮＹｉｍｉｎ，ｅｔａｌ．Ａｄｄｉｎｇｔｈｅｓｅｎｔｉｍｅｎｔａｔｔｒｉｂｕｔｅｏｆｎｏｄｅｓｔｏｉｍｐｒｏｖｅｌｉｎｋｐｒｅｄｉｃｔｉｏｎｉｎｓｏｃｉａｌｎｅｔｗｏｒｋ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１２ｔｈＩｎｔｅｒｎａ⁃ ｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＦｕｚｚｙＳｙｓｔｅｍｓａｎｄＫｎｏｗｌｅｄｇｅＤｉｓｃｏｖ⁃ ｅｒｙ．Ｚｈａｎｇｊｉａｊｉｅ，Ｃｈｉｎａ，２０１５：１２６３⁃１２６９．［２０］ＬＩＵＪｉｎｈｕ，ＺＨＡＮＧＺｉｋｅ，ＣＨＥＮＬｉｎｇｊｉａｏ，ｅｔａｌ．Ｇｒａｖｉｔｙｅｆｆｅｃｔｓｏｎｉｎｆｏｒｍａｔｉｏｎｆｉｌｔｅｒｉｎｇａｎｄｎｅｔｗｏｒｋｅｖｏｌｖｉｎｇ［Ｊ］．ＰＬｏＳｏｎｅ，２０１４，９（３）：ｅ９１０７０．作者简介：雷震，男，１９９１年生，硕士研究生，主要研究方向为推荐系统与数据挖掘。文益民，男，１９６９年生，博士，教授，中国计算机学会高级会员。主要研究方向为机器学习与数据挖掘、极化ＳＡＲ图像处理、社会计算。主持省部级科研项目８项，获得省部级教学、科研奖励５项，发表学术论文３０余篇，其中被ＳＣＩ、ＥＩ收录１８篇，翻译译著１部。王志强，男，１９９１年生，硕士研究生，主要研究方向为数据挖掘、旅游推荐。第３期雷震，等：基于影响力控制的热传导算法 ·３３５·

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录