正在加载图片...
第1期 王健宗,等:联邦推荐系统的协同过滤冷启动解决方法 ·183· 对于A机构的冷启动推荐效果都更好,这与直观 B的占比上升,总体趋势也为上升。阈值c为 相符合,当外部提供的信息越多,对自身的帮助 4时召回率均大于阈值为3,这说明本文的方法对 会越大。对于HR及NDCG,也可以看到随着 于高评分物品推荐的效果较好。 表1取不同P的实验结果 Table 1 Results change population distribution c=3 (=4 命中率 归一化折现累计增益 精确率 查全率 F-score 精确率 查全率 F-score 0.1 0.9529 0.0906 0.1655 0.8029 0.1032 0.1830 0.3313 0.1580 0.2 0.9628 0.1136 0.2032 0.8295 0.1321 0.2279 0.3657 0.1742 0.3 0.9674 0.1387 0.2426 0.8463 0.1637 0.2744 0.3882 0.1838 0.4 0.9720 0.1691 0.2880 0.8510 0.2004 0.3244 0.4300 0.2106 0.5 0.9728 0.2032 0.3361 0.8534 0.2396 0.3742 0.4237 0.2084 0.6 0.9721 0.2532 0.4018 0.8464 0.2959 0.4385 0.4264 0.2074 0.7 0.9701 0.3202 0.4815 0.8374 0.3719 0.5151 0.4599 0.2208 0.8 0.9657 0.4563 0.6197 0.8232 0.5178 0.6357 0.4505 0.2181 0.9 0.9429 0.7716 0.8487 0.7585 0.8300 0.8214 0.4934 0.2532 2)基准算法与本文算法的结果对比 升,约12.5%,但NDCG的提升效果较小,约 为验证方法可行性,采用一个基准算法来作 9.6%。说明该算法对于推荐的击中效果有较大的 对比。采用的基准算法为只取A方的数据对各 提升,而对于击中的位置提升的效果较小。 个物品评分取平均,并将其平均分排序最高的前 5结束语 N个对新用户进行无偏差的推荐。本文以A、B 机构均占50%,即P=0.5为例,实验结果如表2、3。 本文首先介绍了基于物品的协同过滤算法以 表2阈值击中评价 及安全内积算法,并针对新用户的冷启动问题, Table 2 Hit rate with different threshold 提出了一种基于联邦学习的协同过滤冷启动解决 方法 精确率 查全率 F-score 算法。该算法针对某一方的新用户冷启动问题, 本文算法 0.9728 0.2032 0.3361 通过与其他方数据进行联合,在不泄露信息的情 基准算法 0.9645 况下进行相似矩阵的计算,最终解决冷启动问 0.1870 0.3132 题。实验结果表明,本文提出的联邦学习冷启动 本文算法 0.8534 0.2396 0.3742 方法在准确度均有一定的提升,同时实验证明当 基准算法 0.8546 0.2228 0.3534 联合规模较大的数据进行联合训练时,对于本地 从表2结果可以发现,当阈值取3以及取 的推荐效果会有较大的提升。该方法不仅提供了 4时,本文算法均比基准算法有一定的提高。当 一种解决协同过滤冷启动的方法,也在运用联邦 阈值取3,可以看到无论是精确度还是查全率都 学习解决冷启动的方向带来了一定的启发。 有一定的提升,其中F,值较基准算法提升了约%。 参考文献: 当阈值取4时,F,值较基准算法提升了约6%。 表3留一法评价 [1]ALBRECHT J P.How the GDPR will change the world[J]. Table 3 Leave-one-out evaluation European data protection law review,2016.2(3):287-289. [2]SHI E,CHAN T HH,RIEFFEL E,et al.Distributed 方法 命中率 归一化折现累计增益 private data analysis:lower bounds and practical construc- 本文算法 0.4237 0.2084 tions[J].ACM transactions on algorithms,2017.13(4):50. 基准算法 0.3765 0.1900 [3]KIM S,KIM J,KOO D,et al.Efficient privacy-preserving matrix factorization via fully homomorphic encryption:ex- 从表3中可以看到留一法的评估结果,相较 tended Abstract[C]//Proceedings of the 11th ACM on Asia 基准算法,本文算法的击中率(HR)有较大的提 Conference on Computer and Communications Security对于 A 机构的冷启动推荐效果都更好,这与直观 相符合,当外部提供的信息越多,对自身的帮助 会越大。对于 HR 及 NDCG,也可以看到随着 B 的占比上升,总体趋势也为上升。阈值 c 为 4 时召回率均大于阈值为 3,这说明本文的方法对 于高评分物品推荐的效果较好。 表 1 取不同 P 的实验结果 Table 1 Results change population distribution P c=3 c=4 命中率 归一化折现累计增益 精确率 查全率 F1 -score 精确率 查全率 F1 -score 0.1 0.952 9 0.090 6 0.165 5 0.802 9 0.103 2 0.183 0 0.331 3 0.158 0 0.2 0.962 8 0.113 6 0.203 2 0.829 5 0.132 1 0.227 9 0.365 7 0.174 2 0.3 0.967 4 0.138 7 0.242 6 0.846 3 0.163 7 0.274 4 0.388 2 0.183 8 0.4 0.972 0 0.169 1 0.288 0 0.851 0 0.200 4 0.324 4 0.430 0 0.210 6 0.5 0.972 8 0.203 2 0.336 1 0.853 4 0.239 6 0.374 2 0.423 7 0.208 4 0.6 0.972 1 0.253 2 0.401 8 0.846 4 0.295 9 0.438 5 0.426 4 0.207 4 0.7 0.970 1 0.320 2 0.481 5 0.837 4 0.371 9 0.515 1 0.459 9 0.220 8 0.8 0.965 7 0.456 3 0.619 7 0.823 2 0.517 8 0.635 7 0.450 5 0.218 1 0.9 0.942 9 0.771 6 0.848 7 0.758 5 0.830 0 0.821 4 0.493 4 0.253 2 2) 基准算法与本文算法的结果对比 P = 0.5 为验证方法可行性,采用一个基准算法来作 对比。采用的基准算法为只取 A 方的数据对各 个物品评分取平均,并将其平均分排序最高的前 N 个对新用户进行无偏差的推荐。本文以 A、B 机构均占 50%,即 为例,实验结果如表 2、3。 表 2 阈值击中评价 Table 2 Hit rate with different threshold c 方法 精确率 查全率 F1 -score 3 本文算法 0.972 8 0.203 2 0.336 1 基准算法 0.964 5 0.187 0 0.313 2 4 本文算法 0.853 4 0.239 6 0.374 2 基准算法 0.854 6 0.222 8 0.353 4 从表 2 结果可以发现,当阈值取 3 以及取 4 时,本文算法均比基准算法有一定的提高。当 阈值取 3,可以看到无论是精确度还是查全率都 有一定的提升,其中 F1 值较基准算法提升了约 7%。 当阈值取 4 时,F1 值较基准算法提升了约 6%。 表 3 留一法评价 Table 3 Leave-one-out evaluation 方法 命中率 归一化折现累计增益 本文算法 0.423 7 0.208 4 基准算法 0.376 5 0.190 0 从表 3 中可以看到留一法的评估结果,相较 基准算法,本文算法的击中率 (HR) 有较大的提 升 , 约 12.5%,但 NDCG 的提升效果较小, 约 9.6%。说明该算法对于推荐的击中效果有较大的 提升,而对于击中的位置提升的效果较小。 5 结束语 本文首先介绍了基于物品的协同过滤算法以 及安全内积算法,并针对新用户的冷启动问题, 提出了一种基于联邦学习的协同过滤冷启动解决 算法。该算法针对某一方的新用户冷启动问题, 通过与其他方数据进行联合,在不泄露信息的情 况下进行相似矩阵的计算,最终解决冷启动问 题。实验结果表明,本文提出的联邦学习冷启动 方法在准确度均有一定的提升,同时实验证明当 联合规模较大的数据进行联合训练时,对于本地 的推荐效果会有较大的提升。该方法不仅提供了 一种解决协同过滤冷启动的方法,也在运用联邦 学习解决冷启动的方向带来了一定的启发。 参考文献: ALBRECHT J P. How the GDPR will change the world[J]. European data protection law review, 2016, 2(3): 287–289. [1] SHI E, CHAN T H H, RIEFFEL E, et al. Distributed private data analysis: lower bounds and practical construc￾tions[J]. ACM transactions on algorithms, 2017, 13(4): 50. [2] KIM S, KIM J, KOO D, et al. Efficient privacy-preserving matrix factorization via fully homomorphic encryption: ex￾tended Abstract[C]//Proceedings of the 11th ACM on Asia Conference on Computer and Communications Security. [3] 第 1 期 王健宗,等:联邦推荐系统的协同过滤冷启动解决方法 ·183·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有