正在加载图片...
·1094· 智能系统学报 第15卷 最低分为1,评分的高低代表用户的喜欢程度。 所以参数λ取0.9时PCEDS模型产生的推荐质量 在对用户进行聚类和CEDS模型计算相似度时采 最好。 用的都是用户属性特征数据集,属性特征信息包 1.0 括4个组:用户ID、年龄、性别、职业,其中职业 包括21种职业类型。PCC模型计算相似度时采 用的是Rating数据集,其信息包括用户ID、项目 D、评分。 0.4 在计算用户偏好相似度时,将用户-项目评分 0 02 0.40.60.81.0 数据集分为训练集和测试集,其中80%为训练 集,20%为测试集。衡量协同过滤推荐质量的指 图31变化对PCEDS模型的RMSE影响 标有均方根误差(mean absolute error,.RMSE)、准 Fig.3 Effect of change on RMSE of PCEDS model 确率、召回率等。 3.3相融合的加权相似度模型(PCEDS)与PCC 均方根误差(RMSE)为 模型的precision/recall的比较 用户一物品评分记录在最终的推荐列表中出 N ∑p-g 现的比例用准确率表示,最终的推荐列表中包含 RMSE= i=l 用户-物品评分记录的比例用召回率描述。实验 通过准确率/召回率评测推荐算法的精度: 式中:P,表示预测的用户评分集合,q,表示用户评 分集合。本文实验将PCEDS模型与传统的Pear- ∑R(T(ul son模型、Tanimoto模型以及Euclide模型进行了 Precision ∑R RMSE比较。4种模型在RMSE评价标准上的效 果如图2所示。 ∑R)nTol Recall= 1.0 +PCEDS Pearson ∑rol 0.8 ◆Euclide -女Tanimoto 式中:Precision表示准确率;Recall表示召回率。 对用户u推荐N个物品(记为R(w),T(m)表示用 0.61 户u在测试集上喜欢的物品集合。PCEDS模型 与Pearson模型准确率/召回率的比较如图4、5所示。 0.15 0.2 +-Pe 解 20 30 0.10 邻居数 图2 PCEDS模型与Pearson、Euclide模型以及Tan- imoto模型的RMSE 0.05 15 20 2530 4045 Fig.2 RMSE comparison between PCEDS,Pearson,Euc- 推荐列表长度 lide and Tanimoto model 图4准确率比较 从图2分析得出,本文提出的PCEDS模型比 Fig.4 Comparison of precision 传统的Pearson、Euclide以及Tanimoto模型的 0.25 +Pearson RMSE都要低,所以本文提出的PCEDS模型不仅 PCEDS 缓解了用户冷启动问题,对用户产生的推荐质量 0.20 也有所提高。 ▣0.15 3.2参数1对PCEDS模型的影响 0.10 为了检验权重参数对PCEDS模型的影响,选 取1的最佳值,将50作为本实验用户的邻居数 0.0 15 20 253035 4045 量,观察随着λ的增长,融合后的相似度模型的均 推荐列表长度 方根误差的变化,如图3所示。 图5召回率比较 由图3可知,当均方根误差最小时,1取0.9, Fig.5 Comparison of recall最低分为 1,评分的高低代表用户的喜欢程度。 在对用户进行聚类和 CEDS 模型计算相似度时采 用的都是用户属性特征数据集,属性特征信息包 括 4 个组:用户 ID、年龄、性别、职业,其中职业 包括 21 种职业类型。PCC 模型计算相似度时采 用的是 Rating 数据集,其信息包括用户 ID、项目 ID、评分。 在计算用户偏好相似度时,将用户−项目评分 数据集分为训练集和测试集,其中 80% 为训练 集,20% 为测试集。衡量协同过滤推荐质量的指 标有均方根误差 (mean absolute error,RMSE)、准 确率、召回率等。 均方根误差 (RMSE) 为 RMSE= vuuuuut∑N i=1 (pi −qi) 2 N 式中:pi 表示预测的用户评分集合,qi 表示用户评 分集合。本文实验将 PCEDS 模型与传统的 Pear￾son 模型、Tanimoto 模型以及 Euclide 模型进行了 RMSE 比较。4 种模型在 RMSE 评价标准上的效 果如图 2 所示。 10 20 30 40 50 PCEDS Pearson Euclide Tanimoto 邻居数 0 0.2 0.4 0.6 0.8 1.0 RMSE 图 2 PCEDS 模型与 Pearson、Euclide 模型以及 Tan￾imoto 模型的 RMSE Fig. 2 RMSE comparison between PCEDS、Pearson、Euc￾lide and Tanimoto model 从图 2 分析得出,本文提出的 PCEDS 模型比 传统的 Pearson、Euclide 以及 Tanimoto 模型的 RMSE 都要低,所以本文提出的 PCEDS 模型不仅 缓解了用户冷启动问题,对用户产生的推荐质量 也有所提高。 3.2 参数 λ 对 PCEDS 模型的影响 为了检验权重参数对 PCEDS 模型的影响,选 取 λ 的最佳值,将 50 作为本实验用户的邻居数 量,观察随着 λ 的增长,融合后的相似度模型的均 方根误差的变化,如图 3 所示。 由图 3 可知,当均方根误差最小时,λ 取 0.9, 所以参数 λ 取 0.9 时 PCEDS 模型产生的推荐质量 最好。 0 0.2 0.4 0.6 0.8 1.0 RMSE λ 0.4 0.6 0.8 1.0 图 3 λ 变化对 PCEDS 模型的 RMSE 影响 Fig. 3 Effect of change on RMSE of PCEDS model 3.3 相融合的加权相似度模型 (PCEDS) 与 PCC 模型的 precision/recall 的比较 用户−物品评分记录在最终的推荐列表中出 现的比例用准确率表示,最终的推荐列表中包含 用户−物品评分记录的比例用召回率描述。实验 通过准确率/召回率评测推荐算法的精度: Precision = ∑ u |R(u)∩T(u)| ∑ u |R(u)| Recall = ∑ u |R(u)∩T(u)| ∑ u |T(u)| 式中:Precision 表示准确率;Recall 表示召回率。 对用户 u 推荐 N 个物品 (记为 R(u)),T(u) 表示用 户 u 在测试集上喜欢的物品集合。PCEDS 模型 与 Pearson 模型准确率/召回率的比较如图 4、5 所示。 15 20 25 30 35 40 45 推荐列表长度 准确率 Pearson PCEDS 0.05 0.10 0.15 图 4 准确率比较 Fig. 4 Comparison of precision 15 20 25 30 35 40 45 推荐列表长度 召回率 Pearson PCEDS 0.05 0.10 0.15 0.20 0.25 图 5 召回率比较 Fig. 5 Comparison of recall ·1094· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有