方案[4]。首先，和电影的数据相比，旅游评分的数据难以获得；其次，用户的

正在加载图片...

·1000· 智能系统学报第13卷方案。首先，和电影的数据相比，旅游评分的数策略以及痛苦避免均值策略较好。文献[7]通过据难以获得：其次，用户的评分矩阵比较稀疏：最对组推荐系统的文献研究分析，发现使用最普遍后，旅游通常是多个用户以群组的形式参与的，的策略有均值策略、痛苦避免均值策略及最小痛因此，结合所有成员偏好的组推荐系统将成为旅苦策略，但这些策略对于不同特征的群组适用性游推荐领域的一个研究热点可。基于协同过滤的也不尽相同。组推荐系统中，在对单个用户的预测阶段，使用传统的协同过滤算法计算用户（项目）之间的相 2基于协同过滤的组推荐似度时，没有考虑用户共同评分的项目数和评分关联程度对相似性造成的影响，例如，两个兴趣协同过滤算法作为一种基本的方法常常被应差别较大的游客，可能同时感兴趣的景点比较用于组推荐系统中。基于协同过滤的组推荐包少，当用户的共同评分比较少时，传统的协同过括4个阶段：相似性度量、选择邻居、预测评分、滤算法便无法准确地度量用户之间相似性：在确定推荐项目。群组成员预测结果的融合阶段，效果比较好的偏首先通过评分矩阵中用户的评分计算两两用好融合策略中有均值策略和最小痛苦策略m,均户（项目）的相似度，然后根据K近邻的方法预测值策略把成员对项目的平均评分作为群组的得当前用户对未知项目的评分，最后通过融合策略分，然而没有考虑少数成员的不满意度，最小痛结合所有组内成员的偏好生成组推荐列表。苦策略选择成员对项目最小的评分作为群组的得图1为本文中用到的基于协同过滤的组推荐整体分，却忽略了多数成员的偏好。框架。本文在组推荐过程中，首先改进了协同过滤算法，它结合相似性影响因子和关联性因子，以解决旅游推荐中面临的数据稀疏性问题；其次在组偏好建模阶段，提出了一种新的融合策略相似度一满意度平衡策略，它同时考虑了组内成员的局部满意度和整体满意度；最后，通过在旅游数协据集上的实验分析，验证了所改进的方法能够有效地提高推荐的质量。融合策略组推荐 1相关工作似度 1.1协同过滤算法协同过滤算法是电子商务推荐领域中一种最为成功的推荐算法。它不需要用户主动提供个人需求信息，而是根据他们已有的评分记录，获度得用户的潜在偏好。这种推荐算法能否取得良好相似度度量选择邻居预测评分确定推荐项目的效果，很大程度上取决于用户的评分数据。图1基于协同过滤的组推荐整体框架 1.2组推荐关键技术 Fig.1 The whole framework of group recommendation 组推荐关键技术包括融合方法和融合策略。 based on collaborative filtering 融合方法分为模型融合和推荐融合。模型融合根其中，协同过滤算法可以分为基于用户的最据群组成员的用户偏好模型融合成群组偏好模近邻推荐(user-based nearest neighbor recommenda- 型，然后基于群组偏好模型生成组推荐；推荐融 tion)和基于项目的最近邻推荐(item-based nearest 合先根据传统算法获得每个用户的预测评分后， neighbor recommendation). 再根据预测评分进行融合，也可以融合推荐项目 2.1基于用户的最近邻推荐列表得到群组的推荐列表6，刀。两种融合方法各有基于用户的最近邻推荐假设当前用户会喜欢自己的不足：模型融合易受到评分稀疏性的影与之有相似偏好的用户喜欢的项目。目前比较常响，推荐融合忽略了群组成员之间的交互。用的相似度计算方法有余弦相似度(cosine simil-- 组推荐系统中常用的融合策略有均值策略、 arity)、皮尔森相关相似度(Pearson correlation coef- 最小痛苦策略、最开心策略。文献[10]通过一系 ficient))等2l1。本文主要选用相似度定义如式列实验评估，指出乘法策略、均值策略、最小痛苦 (1)所示。方案[4]。首先，和电影的数据相比，旅游评分的数据难以获得；其次，用户的评分矩阵比较稀疏；最后，旅游通常是多个用户以群组的形式参与的，因此，结合所有成员偏好的组推荐系统将成为旅游推荐领域的一个研究热点[5]。基于协同过滤的组推荐系统中，在对单个用户的预测阶段，使用传统的协同过滤算法计算用户 (项目) 之间的相似度时，没有考虑用户共同评分的项目数和评分关联程度对相似性造成的影响，例如，两个兴趣差别较大的游客，可能同时感兴趣的景点比较少，当用户的共同评分比较少时，传统的协同过滤算法便无法准确地度量用户之间相似性[6] ；在群组成员预测结果的融合阶段，效果比较好的偏好融合策略中有均值策略和最小痛苦策略[7] ，均值策略把成员对项目的平均评分作为群组的得分，然而没有考虑少数成员的不满意度，最小痛苦策略选择成员对项目最小的评分作为群组的得分，却忽略了多数成员的偏好。本文在组推荐过程中，首先改进了协同过滤算法，它结合相似性影响因子和关联性因子，以解决旅游推荐中面临的数据稀疏性问题；其次在组偏好建模阶段，提出了一种新的融合策略 ——满意度平衡策略，它同时考虑了组内成员的局部满意度和整体满意度；最后，通过在旅游数据集上的实验分析，验证了所改进的方法能够有效地提高推荐的质量。 1 相关工作 1.1 协同过滤算法协同过滤算法是电子商务推荐领域中一种最为成功的推荐算法[8]。它不需要用户主动提供个人需求信息，而是根据他们已有的评分记录，获得用户的潜在偏好。这种推荐算法能否取得良好的效果，很大程度上取决于用户的评分数据。 1.2 组推荐关键技术组推荐关键技术包括融合方法和融合策略。融合方法分为模型融合和推荐融合。模型融合根据群组成员的用户偏好模型融合成群组偏好模型，然后基于群组偏好模型生成组推荐；推荐融合先根据传统算法获得每个用户的预测评分后，再根据预测评分进行融合，也可以融合推荐项目列表得到群组的推荐列表[5,7]。两种融合方法各有自己的不足：模型融合易受到评分稀疏性的影响，推荐融合忽略了群组成员之间的交互[5]。组推荐系统中常用的融合策略有均值策略、最小痛苦策略、最开心策略[9]。文献[10]通过一系列实验评估，指出乘法策略、均值策略、最小痛苦策略以及痛苦避免均值策略较好。文献[7]通过对组推荐系统的文献研究分析，发现使用最普遍的策略有均值策略、痛苦避免均值策略及最小痛苦策略，但这些策略对于不同特征的群组适用性也不尽相同。 2 基于协同过滤的组推荐协同过滤算法作为一种基本的方法常常被应用于组推荐系统中。基于协同过滤的组推荐包括 4 个阶段：相似性度量、选择邻居、预测评分、确定推荐项目[11]。首先通过评分矩阵中用户的评分计算两两用户 (项目) 的相似度，然后根据 K 近邻的方法预测当前用户对未知项目的评分，最后通过融合策略结合所有组内成员的偏好生成组推荐列表。图 1 为本文中用到的基于协同过滤的组推荐整体框架。协同过滤相似度 K 近邻融合策略个人预测组推荐用户评分矩阵相似度度量选择邻居预测评分确定推荐项目协同过滤相似度协同过滤相似度 K 近邻 K 近邻个人预测个人预测图 1 基于协同过滤的组推荐整体框架 Fig. 1 The whole framework of group recommendation based on collaborative filtering 其中，协同过滤算法可以分为基于用户的最近邻推荐 (user-based nearest neighbor recommendation) 和基于项目的最近邻推荐 (item-based nearest neighbor recommendation)。 2.1 基于用户的最近邻推荐基于用户的最近邻推荐假设当前用户会喜欢与之有相似偏好的用户喜欢的项目。目前比较常用的相似度计算方法有余弦相似度 (cosine similarity)、皮尔森相关相似度 (Pearson correlation coefficient) 等 [12-13]。本文主要选用相似度定义如式 (1) 所示。 ·1000· 智能系统学报第 13 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】融合协同过滤与用户偏好的旅游组推荐方法