最低分为 1，评分的高低代表用户的喜欢程度。在对用户进行聚类和 CEDS

点击下载：人工智能基础融合用户特征优化聚类的协同过滤算法（山东理工大学：梁丽君、李业刚、张娜娜、张晓、王栋）

正在加载图片...

·1094· 智能系统学报第15卷最低分为1，评分的高低代表用户的喜欢程度。所以参数λ取0.9时PCEDS模型产生的推荐质量在对用户进行聚类和CEDS模型计算相似度时采最好。用的都是用户属性特征数据集，属性特征信息包 1.0 括4个组：用户ID、年龄、性别、职业，其中职业包括21种职业类型。PCC模型计算相似度时采用的是Rating数据集，其信息包括用户ID、项目 D、评分。 0.4 在计算用户偏好相似度时，将用户-项目评分 0 02 0.40.60.81.0 数据集分为训练集和测试集，其中80%为训练集，20%为测试集。衡量协同过滤推荐质量的指图31变化对PCEDS模型的RMSE影响标有均方根误差(mean absolute error,.RMSE)、准 Fig.3 Effect of change on RMSE of PCEDS model 确率、召回率等。 3.3相融合的加权相似度模型(PCEDS)与PCC 均方根误差(RMSE)为模型的precision/recall的比较用户一物品评分记录在最终的推荐列表中出 N ∑p-g 现的比例用准确率表示，最终的推荐列表中包含 RMSE= i=l 用户-物品评分记录的比例用召回率描述。实验通过准确率/召回率评测推荐算法的精度：式中：P,表示预测的用户评分集合，q,表示用户评分集合。本文实验将PCEDS模型与传统的Pear- ∑R(T(ul son模型、Tanimoto模型以及Euclide模型进行了 Precision ∑R RMSE比较。4种模型在RMSE评价标准上的效果如图2所示。 ∑R)nTol Recall= 1.0 +PCEDS Pearson ∑rol 0.8 ◆Euclide -女Tanimoto 式中：Precision表示准确率；Recall表示召回率。对用户u推荐N个物品（记为R(w),T(m)表示用 0.61 户u在测试集上喜欢的物品集合。PCEDS模型与Pearson模型准确率/召回率的比较如图4、5所示。 0.15 0.2 +-Pe 解 20 30 0.10 邻居数图2 PCEDS模型与Pearson、Euclide模型以及Tan- imoto模型的RMSE 0.05 15 20 2530 4045 Fig.2 RMSE comparison between PCEDS,Pearson,Euc- 推荐列表长度 lide and Tanimoto model 图4准确率比较从图2分析得出，本文提出的PCEDS模型比 Fig.4 Comparison of precision 传统的Pearson、Euclide以及Tanimoto模型的 0.25 +Pearson RMSE都要低，所以本文提出的PCEDS模型不仅 PCEDS 缓解了用户冷启动问题，对用户产生的推荐质量 0.20 也有所提高。 ▣0.15 3.2参数1对PCEDS模型的影响 0.10 为了检验权重参数对PCEDS模型的影响，选取1的最佳值，将50作为本实验用户的邻居数 0.0 15 20 253035 4045 量，观察随着λ的增长，融合后的相似度模型的均推荐列表长度方根误差的变化，如图3所示。图5召回率比较由图3可知，当均方根误差最小时，1取0.9， Fig.5 Comparison of recall最低分为 1，评分的高低代表用户的喜欢程度。在对用户进行聚类和 CEDS 模型计算相似度时采用的都是用户属性特征数据集，属性特征信息包括 4 个组：用户 ID、年龄、性别、职业，其中职业包括 21 种职业类型。PCC 模型计算相似度时采用的是 Rating 数据集，其信息包括用户 ID、项目 ID、评分。在计算用户偏好相似度时，将用户−项目评分数据集分为训练集和测试集，其中 80% 为训练集，20% 为测试集。衡量协同过滤推荐质量的指标有均方根误差 (mean absolute error，RMSE)、准确率、召回率等。均方根误差 (RMSE) 为 RMSE= vuuuuut∑N i=1 (pi −qi) 2 N 式中：pi 表示预测的用户评分集合，qi 表示用户评分集合。本文实验将 PCEDS 模型与传统的 Pearson 模型、Tanimoto 模型以及 Euclide 模型进行了 RMSE 比较。4 种模型在 RMSE 评价标准上的效果如图 2 所示。 10 20 30 40 50 PCEDS Pearson Euclide Tanimoto 邻居数 0 0.2 0.4 0.6 0.8 1.0 RMSE 图 2 PCEDS 模型与 Pearson、Euclide 模型以及 Tanimoto 模型的 RMSE Fig. 2 RMSE comparison between PCEDS、Pearson、Euclide and Tanimoto model 从图 2 分析得出，本文提出的 PCEDS 模型比传统的 Pearson、Euclide 以及 Tanimoto 模型的 RMSE 都要低，所以本文提出的 PCEDS 模型不仅缓解了用户冷启动问题，对用户产生的推荐质量也有所提高。 3.2 参数 λ 对 PCEDS 模型的影响为了检验权重参数对 PCEDS 模型的影响，选取 λ 的最佳值，将 50 作为本实验用户的邻居数量，观察随着 λ 的增长，融合后的相似度模型的均方根误差的变化，如图 3 所示。由图 3 可知，当均方根误差最小时，λ 取 0.9，所以参数 λ 取 0.9 时 PCEDS 模型产生的推荐质量最好。 0 0.2 0.4 0.6 0.8 1.0 RMSE λ 0.4 0.6 0.8 1.0 图 3 λ 变化对 PCEDS 模型的 RMSE 影响 Fig. 3 Effect of change on RMSE of PCEDS model 3.3 相融合的加权相似度模型 (PCEDS) 与 PCC 模型的 precision/recall 的比较用户−物品评分记录在最终的推荐列表中出现的比例用准确率表示，最终的推荐列表中包含用户−物品评分记录的比例用召回率描述。实验通过准确率/召回率评测推荐算法的精度： Precision = ∑ u |R(u)∩T(u)| ∑ u |R(u)| Recall = ∑ u |R(u)∩T(u)| ∑ u |T(u)| 式中：Precision 表示准确率；Recall 表示召回率。对用户 u 推荐 N 个物品 (记为 R(u))，T(u) 表示用户 u 在测试集上喜欢的物品集合。PCEDS 模型与 Pearson 模型准确率/召回率的比较如图 4、5 所示。 15 20 25 30 35 40 45 推荐列表长度准确率 Pearson PCEDS 0.05 0.10 0.15 图 4 准确率比较 Fig. 4 Comparison of precision 15 20 25 30 35 40 45 推荐列表长度召回率 Pearson PCEDS 0.05 0.10 0.15 0.20 0.25 图 5 召回率比较 Fig. 5 Comparison of recall ·1094· 智能系统学报第 15 卷

<<向上翻页向下翻页>>

点击下载：人工智能基础融合用户特征优化聚类的协同过滤算法（山东理工大学：梁丽君、李业刚、张娜娜、张晓、王栋）