正在加载图片...
·1000· 智能系统学报 第13卷 方案。首先,和电影的数据相比,旅游评分的数 策略以及痛苦避免均值策略较好。文献[7]通过 据难以获得:其次,用户的评分矩阵比较稀疏:最 对组推荐系统的文献研究分析,发现使用最普遍 后,旅游通常是多个用户以群组的形式参与的, 的策略有均值策略、痛苦避免均值策略及最小痛 因此,结合所有成员偏好的组推荐系统将成为旅 苦策略,但这些策略对于不同特征的群组适用性 游推荐领域的一个研究热点可。基于协同过滤的 也不尽相同。 组推荐系统中,在对单个用户的预测阶段,使用 传统的协同过滤算法计算用户(项目)之间的相 2基于协同过滤的组推荐 似度时,没有考虑用户共同评分的项目数和评分 关联程度对相似性造成的影响,例如,两个兴趣 协同过滤算法作为一种基本的方法常常被应 差别较大的游客,可能同时感兴趣的景点比较 用于组推荐系统中。基于协同过滤的组推荐包 少,当用户的共同评分比较少时,传统的协同过 括4个阶段:相似性度量、选择邻居、预测评分、 滤算法便无法准确地度量用户之间相似性:在 确定推荐项目。 群组成员预测结果的融合阶段,效果比较好的偏 首先通过评分矩阵中用户的评分计算两两用 好融合策略中有均值策略和最小痛苦策略m,均 户(项目)的相似度,然后根据K近邻的方法预测 值策略把成员对项目的平均评分作为群组的得 当前用户对未知项目的评分,最后通过融合策略 分,然而没有考虑少数成员的不满意度,最小痛 结合所有组内成员的偏好生成组推荐列表。 苦策略选择成员对项目最小的评分作为群组的得 图1为本文中用到的基于协同过滤的组推荐整体 分,却忽略了多数成员的偏好。 框架。 本文在组推荐过程中,首先改进了协同过滤 算法,它结合相似性影响因子和关联性因子,以 解决旅游推荐中面临的数据稀疏性问题;其次在 组偏好建模阶段,提出了一种新的融合策略 相似度 一满意度平衡策略,它同时考虑了组内成员的 局部满意度和整体满意度;最后,通过在旅游数 协 据集上的实验分析,验证了所改进的方法能够有 效地提高推荐的质量。 融合策略 组推荐 1相关工作 似度 1.1协同过滤算法 协同过滤算法是电子商务推荐领域中一种最 为成功的推荐算法。它不需要用户主动提供个 人需求信息,而是根据他们已有的评分记录,获 度 得用户的潜在偏好。这种推荐算法能否取得良好 相似度度量选择邻居预测评分确定推荐项目 的效果,很大程度上取决于用户的评分数据。 图1基于协同过滤的组推荐整体框架 1.2组推荐关键技术 Fig.1 The whole framework of group recommendation 组推荐关键技术包括融合方法和融合策略。 based on collaborative filtering 融合方法分为模型融合和推荐融合。模型融合根 其中,协同过滤算法可以分为基于用户的最 据群组成员的用户偏好模型融合成群组偏好模 近邻推荐(user-based nearest neighbor recommenda- 型,然后基于群组偏好模型生成组推荐;推荐融 tion)和基于项目的最近邻推荐(item-based nearest 合先根据传统算法获得每个用户的预测评分后, neighbor recommendation). 再根据预测评分进行融合,也可以融合推荐项目 2.1基于用户的最近邻推荐 列表得到群组的推荐列表6,刀。两种融合方法各有 基于用户的最近邻推荐假设当前用户会喜欢 自己的不足:模型融合易受到评分稀疏性的影 与之有相似偏好的用户喜欢的项目。目前比较常 响,推荐融合忽略了群组成员之间的交互。 用的相似度计算方法有余弦相似度(cosine simil-- 组推荐系统中常用的融合策略有均值策略、 arity)、皮尔森相关相似度(Pearson correlation coef- 最小痛苦策略、最开心策略。文献[10]通过一系 ficient))等2l1。本文主要选用相似度定义如式 列实验评估,指出乘法策略、均值策略、最小痛苦 (1)所示。方案[4]。首先,和电影的数据相比,旅游评分的数 据难以获得;其次,用户的评分矩阵比较稀疏;最 后,旅游通常是多个用户以群组的形式参与的, 因此,结合所有成员偏好的组推荐系统将成为旅 游推荐领域的一个研究热点[5]。基于协同过滤的 组推荐系统中,在对单个用户的预测阶段,使用 传统的协同过滤算法计算用户 (项目) 之间的相 似度时,没有考虑用户共同评分的项目数和评分 关联程度对相似性造成的影响,例如,两个兴趣 差别较大的游客,可能同时感兴趣的景点比较 少,当用户的共同评分比较少时,传统的协同过 滤算法便无法准确地度量用户之间相似性[6] ;在 群组成员预测结果的融合阶段,效果比较好的偏 好融合策略中有均值策略和最小痛苦策略[7] ,均 值策略把成员对项目的平均评分作为群组的得 分,然而没有考虑少数成员的不满意度,最小痛 苦策略选择成员对项目最小的评分作为群组的得 分,却忽略了多数成员的偏好。 本文在组推荐过程中,首先改进了协同过滤 算法,它结合相似性影响因子和关联性因子,以 解决旅游推荐中面临的数据稀疏性问题;其次在 组偏好建模阶段,提出了一种新的融合策略 ——满意度平衡策略,它同时考虑了组内成员的 局部满意度和整体满意度;最后,通过在旅游数 据集上的实验分析,验证了所改进的方法能够有 效地提高推荐的质量。 1 相关工作 1.1 协同过滤算法 协同过滤算法是电子商务推荐领域中一种最 为成功的推荐算法[8]。它不需要用户主动提供个 人需求信息,而是根据他们已有的评分记录,获 得用户的潜在偏好。这种推荐算法能否取得良好 的效果,很大程度上取决于用户的评分数据。 1.2 组推荐关键技术 组推荐关键技术包括融合方法和融合策略。 融合方法分为模型融合和推荐融合。模型融合根 据群组成员的用户偏好模型融合成群组偏好模 型,然后基于群组偏好模型生成组推荐;推荐融 合先根据传统算法获得每个用户的预测评分后, 再根据预测评分进行融合,也可以融合推荐项目 列表得到群组的推荐列表[5,7]。两种融合方法各有 自己的不足:模型融合易受到评分稀疏性的影 响,推荐融合忽略了群组成员之间的交互[5]。 组推荐系统中常用的融合策略有均值策略、 最小痛苦策略、最开心策略[9]。文献[10]通过一系 列实验评估,指出乘法策略、均值策略、最小痛苦 策略以及痛苦避免均值策略较好。文献[7]通过 对组推荐系统的文献研究分析,发现使用最普遍 的策略有均值策略、痛苦避免均值策略及最小痛 苦策略,但这些策略对于不同特征的群组适用性 也不尽相同。 2 基于协同过滤的组推荐 协同过滤算法作为一种基本的方法常常被应 用于组推荐系统中。基于协同过滤的组推荐包 括 4 个阶段:相似性度量、选择邻居、预测评分、 确定推荐项目[11]。 首先通过评分矩阵中用户的评分计算两两用 户 (项目) 的相似度,然后根据 K 近邻的方法预测 当前用户对未知项目的评分,最后通过融合策略 结合所有组内成员的偏好生成组推荐列表。 图 1 为本文中用到的基于协同过滤的组推荐整体 框架。 协同过滤相似度 K 近 邻 融合策略 个人预测 组推荐 用户评分矩阵 相似度度量 选择邻居 预测评分 确定推荐项目 协同过滤相似度协同过滤相似度 K 近 邻 K 近 邻 个人预测个人预测 图 1 基于协同过滤的组推荐整体框架 Fig. 1 The whole framework of group recommendation based on collaborative filtering 其中,协同过滤算法可以分为基于用户的最 近邻推荐 (user-based nearest neighbor recommenda￾tion) 和基于项目的最近邻推荐 (item-based nearest neighbor recommendation)。 2.1 基于用户的最近邻推荐 基于用户的最近邻推荐假设当前用户会喜欢 与之有相似偏好的用户喜欢的项目。目前比较常 用的相似度计算方法有余弦相似度 (cosine simil￾arity)、皮尔森相关相似度 (Pearson correlation coef￾ficient) 等 [12-13]。本文主要选用相似度定义如式 (1) 所示。 ·1000· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有