正在加载图片...
第4期 顾军华,等:基于图游走的并行协同过滤推荐算法 ·749· CC曲线明显低于PCC曲线,尤其Top-K在[40, 0.88 60]时差距最明显。实验结果表明,无论近邻用 0.86 --GW CF -+-K-means CF 户个数如何选取,在皮尔逊相关相似度上加入交 0.84 -BSCF 占比系数均可以有效地减小评分预测误差。 5.2基于图游走方法的有效性验证实验 0 0.80 5.2.1 Movielens数据集实验 0.78 --¥---子 为了验证基于图游走方法在降低评分预测误 0.76 差和提高推荐准确率上的有效性,本次实验使用 020406080100120140160180 Movielens-100k数据集,训练集和测试集按8:2分 Top-K 割。先通过实验确定用户直接近邻个数T的最优 图6图游走效果图 取值,然后比较在不同的推荐近邻个数Top-K Fig.6 Random walk effect graph 下,本文方法和基于用户的协同过滤推荐算法 (BSCF)与基于聚类的协同过滤推荐算法(k- 0.090 ◆-GWCF 0.088 means CF)的MAE和precision。 -BSCF 0.086 图5为选取不同直接近邻个数时的评分预测 怒0.084 误差曲线,T表示直接近邻用户选取的个数。图5 是0.082 表明,当T>60时,MAE趋于稳定。 0.080 0.86 0.078 0.076 0.84 20304050607080 0.82 Top-K 20.80 图7准确率对比图 0.78 Fig.7 Accuracy comparison chart 0.76 5.2.2IPTV隐式评分数据集实验 010203040506070 为了验证基于图游走方法在降低评分预测误 差和提高推荐准确率上的有效性,本次实验使用 图5参数T测试图 PTV数据集,训练集和测试集按8:2分割。先通 Fig.5 Parameter T test chart 过实验确定用户直接近邻个数T的最优取值,然 图6的实验中T=60。推荐时近邻用户个数 后比较在不同的推荐近邻个数Top-K下,基于图 Top-K作为单一变量,对基于图游走的协同过滤 游走的协同过滤推荐算法(GWC℉)和基于用户 推荐算法(GWCF)、基于用户的协同过滤推荐算 法(BSCF)、基于聚类的协同过滤推荐算法(k- 的协同过滤推荐算法(BSCF)的MAE和precision。 means CF)进行对比实验。图6Top-K表示推荐 图8为选取不同直接近邻个数时的评分预测 时近邻用户选取的个数,MAE表示评分预测的平 误差曲线。图8表明,当T>20时,MAE趋于稳定。 均绝对误差。从图中可以看出,随着近邻用户个 0.315 数ToP-K的增加,3条曲线均呈下降趋势, 0.310 0.305 BSCF曲线和k-means CF曲线比较接近, 0.300 GWCF曲线明显低于另两条曲线,当Top-K 里0.295 大于80时更加明显。实验结果表明:GWCF算 三0.290 法在降低评分预测误差方面是有效的。 0.285 0.280 图7中虚线反映了使用GWCF推荐的准确 0.275 度,实线反映了使用BSCF推荐的准确度。生成 51015202530 推荐列表时推荐项目数为10,从图中可以看出, 随着近邻用户个数Top-K的增加,两条曲线呈上 图8参数T测试图 升趋势,GWCF准确率曲线高于BSCF曲线。实 Fig.8 Parameter T test chart 验结果表明,基于图游走的协同过滤推荐算法 图9的实验中T=20,推荐近邻用户Top-K GWCF可以有效地提高推荐准确率。 作为单一变量,对基于图游走的协同过滤推荐算CC 曲线明显低于 PCC 曲线,尤其 Top-K 在 [40, 60] 时差距最明显。实验结果表明,无论近邻用 户个数如何选取,在皮尔逊相关相似度上加入交 占比系数均可以有效地减小评分预测误差。 5.2 基于图游走方法的有效性验证实验 5.2.1 Movielens 数据集实验 MAE precision 为了验证基于图游走方法在降低评分预测误 差和提高推荐准确率上的有效性,本次实验使用 Movielens-100k 数据集,训练集和测试集按 8:2 分 割。先通过实验确定用户直接近邻个数 T 的最优 取值,然后比较在不同的推荐近邻个数 Top-K 下,本文方法和基于用户的协同过滤推荐算法 (BSCF) 与基于聚类的协同过滤推荐算法 (k￾means_CF) 的 和 。 MAE 图 5 为选取不同直接近邻个数时的评分预测 误差曲线,T 表示直接近邻用户选取的个数。图 5 表明,当 T>60 时, 趋于稳定。 0.86 0.84 0.82 MAE 0.80 0.78 0.76 T 0 10 20 30 40 50 60 70 图 5 参数 T 测试图 Fig. 5 Parameter T test chart MAE 图 6 的实验中 T=60。推荐时近邻用户个数 Top-K 作为单一变量,对基于图游走的协同过滤 推荐算法 (GW_CF)、基于用户的协同过滤推荐算 法 (BSCF)、基于聚类的协同过滤推荐算法 (k￾means_CF) 进行对比实验。图 6Top-K 表示推荐 时近邻用户选取的个数, 表示评分预测的平 均绝对误差。从图中可以看出,随着近邻用户个 数 Top- K 的增加, 3 条曲线均呈下降趋势, BSC F 曲 线 和 k-means_C F 曲线比较接近, GW_CF 曲线明显低于另两条曲线,当 Top-K 大于 80 时更加明显。实验结果表明:GW_CF 算 法在降低评分预测误差方面是有效的。 图 7 中虚线反映了使用 GW_CF 推荐的准确 度,实线反映了使用 BSCF 推荐的准确度。生成 推荐列表时推荐项目数为 10,从图中可以看出, 随着近邻用户个数 Top-K 的增加,两条曲线呈上 升趋势,GW_CF 准确率曲线高于 BSCF 曲线。实 验结果表明,基于图游走的协同过滤推荐算法 GW_CF 可以有效地提高推荐准确率。 0.86 0.88 0.84 0.82 0.80 0.78 0.76 MAE 0 40 60 80 100 120 140 160 180 20 Top−K GW_CF K−means_CF BSCF 图 6 图游走效果图 Fig. 6 Random walk effect graph 0.090 0.088 0.086 0.084 0.082 0.080 0.078 0.076 准确率 20 30 40 50 60 70 80 Top−K GW_CF BSCF 图 7 准确率对比图 Fig. 7 Accuracy comparison chart 5.2.2 IPTV 隐式评分数据集实验 MAE precision 为了验证基于图游走方法在降低评分预测误 差和提高推荐准确率上的有效性,本次实验使用 IPTV 数据集,训练集和测试集按 8:2 分割。先通 过实验确定用户直接近邻个数 T 的最优取值,然 后比较在不同的推荐近邻个数 Top-K 下,基于图 游走的协同过滤推荐算法 (GW_CF) 和基于用户 的协同过滤推荐算法 (BSCF) 的 和 。 MAE 图 8 为选取不同直接近邻个数时的评分预测 误差曲线。 图 8 表明,当 T>20 时, 趋于稳定。 0.315 0.310 0.305 0.300 0.295 0.290 0.285 0.275 0.280 MAE 5 10 15 20 25 30 T 图 8 参数 T 测试图 Fig. 8 Parameter T test chart 图 9 的实验中 T=20,推荐近邻用户 Top-K 作为单一变量,对基于图游走的协同过滤推荐算 第 4 期 顾军华,等:基于图游走的并行协同过滤推荐算法 ·749·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有