正在加载图片...
第2期 鲍维克,等:面向推荐系统的分期序列自注意力网络 ·359· 分别提升了1.48%,而在Tmall数据集上指标召回 表1消融实验对照表 率(N为20)落后于SHAN模型14.6%。其原因是 Table 1 Results table of ablation study Gowalla数据集用户反馈数据之间的相互依赖和 数据集 方法 AUC 召回率 顺序相关性比Tmal数据集严格,本文模型相比 LSSSAN 0.797 0.126 SHAN模型利用自注意力机制和GRU着重捕捉 Tmall LSSSANI 0.619 0.092 了用户反馈数据之间的相互依赖和序列性,因此 LSSSAN2 0.790 0.130 在Gowalla上LSSSAN的表现整体优于SHAN模 型,而在Tmall数据集上的表现的稳定性不如 LSSSAN 0.982 0.461 SHAN模型。同时文献[22]也表明,对于相互依 Gowalla LSSSANI 0.811 0.282 赖和序列性强的签到类型数据集,结合GU的模 LSSSAN2 0.979 0.457 型有较好的效果。综上所述,相比SHAN对长期 数据的相互依赖分析不足、忽视序列性偏好, LSSSAN1为LSSSAN消去自注意力层后的 LSSSAN的Self-Attenion层分析了长期数据的相 模型,在两个数据集上表现不佳。相比LSSSAN、 互依赖、GRU层提取了序列性偏好,在推荐结果 LSSSAN1在两个数据集上指标召回率(N为20) 上具有更好的表现。 分别降低了26.98%和38.83%,其原因主要是消 3.3消融实验 去自注意力层后模型缺乏对长期/一般偏好的表 图6和表1展示了消融实验在Tmall和Gowalla 达,也降低了相对重要的短期反馈数据在模型中 数据集上的对照数据。 的权重。 0.20 LSSSAN2为LSSSAN消去GRU层后的模 -LSSSAN LSSSANI 型,LSSSAN2在Gowalla上的两个指标相比LSS- 0.18 LSSSAN2 SAN分别降低了0.87%、0.31%,LSSSAN2在 0.16 Tmall上的AUC相比LSSSAN降低了0.89%,虽 解0.14 然LSSSAN2在Tmall数据集上指标召回率(N为 00.12 20)相比LSSSAN提升了3.17%,但由图6可以观 察到LSSSAN2在Tmall数据集上的整体表现稍 0.10 劣于LSSSAN。以LSSSAN为基准,消去GRU层 0.08 的LSSSAN2在Tmall数据集上的表现优于其在 Gowalla的表现,其原因是Tmall数据集的顺序相 0.06 10 20 30 4050 60 关性和相互依赖性不如Gowalla数据集严格。而 (a)Tmall上的召回率 LSSSAN与LSSSAN2相比,N参数较大时指标召 0.7 回率较稳定,此时对推荐结果而言,GRU层提取 -LSSSAN LSSSANI 序列性偏好的优势会大于GU层受非严格顺序 0.6 ·LSSSAN2 相关性和弱相互依赖性的影响而不稳定的劣势。 当数据集表现出明显的非严格顺序相关性和弱相 0.5 互依赖性时,可以考虑以消去GRU层后的LSS 0.4 SAN作为推荐模型的候选。 至此,消融实验验证了模型的GU层和自注 0.3 意力层发挥的重要作用。 0.2 3.4超参数分析 全局维度参数d反映了模型embedding和表 0.14 10 2030405060 示层的维度,图7反映了在Tmall和Gowalla数据 N (b)Gowalla上的召回率 集上维度参数d对模型效果的影响。可以观察 到,高维度的表示可以更精确地表达用户和item, 图6 LSSSAN在Tmall和Gowalla数据集上的消融实验 对照 并有助于和模型之间的信息交互。在实验中,本 Fig.6 Ablation study of LSSSAN on Tmall and Gowalla 模型权衡计算成本和模型精度,设置维度参数 Datasets d=80。分别提升了 1.48%,而在 Tmall 数据集上指标召回 率 (N 为 20) 落后于 SHAN 模型 14.6%。其原因是 Gowalla 数据集用户反馈数据之间的相互依赖和 顺序相关性比 Tmall 数据集严格,本文模型相比 SHAN 模型利用自注意力机制和 GRU 着重捕捉 了用户反馈数据之间的相互依赖和序列性,因此 在 Gowalla 上 LSSSAN 的表现整体优于 SHAN 模 型,而在 Tmall 数据集上的表现的稳定性不如 SHAN 模型。同时文献 [22] 也表明,对于相互依 赖和序列性强的签到类型数据集,结合 GRU 的模 型有较好的效果。综上所述,相比 SHAN 对长期 数据的相互依赖分析不足、忽视序列性偏好, LSSSAN 的 Self-Attenion 层分析了长期数据的相 互依赖、GRU 层提取了序列性偏好,在推荐结果 上具有更好的表现。 3.3 消融实验 图 6 和表 1 展示了消融实验在 Tmall 和 Gowalla 数据集上的对照数据。 LSSSAN LSSSAN1 LSSSAN2 LSSSAN LSSSAN1 LSSSAN2 0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 10 20 30 40 50 60 N 10 20 30 40 50 60 N 召回率 召回率 0.7 0.6 0.5 0.4 0.3 0.2 0.1 (b) Gowalla 上的召回率 (a) Tmall 上的召回率 图 6 LSSSAN 在 Tmall 和 Gowalla 数据集上的消融实验 对照 Fig. 6 Ablation study of LSSSAN on Tmall and Gowalla Datasets 表 1 消融实验对照表 Table 1 Results table of ablation study 数据集 方法 AUC 召回率 Tmall LSSSAN 0.797 0.126 LSSSAN1 0.619 0.092 LSSSAN2 0.790 0.130 Gowalla LSSSAN 0.982 0.461 LSSSAN1 0.811 0.282 LSSSAN2 0.979 0.457 LSSSAN1 为 LSSSAN 消去自注意力层后的 模型,在两个数据集上表现不佳。相比 LSSSAN、 LSSSAN1 在两个数据集上指标召回率 (N 为 20) 分别降低了 26.98% 和 38.83%,其原因主要是消 去自注意力层后模型缺乏对长期/一般偏好的表 达,也降低了相对重要的短期反馈数据在模型中 的权重。 LSSSAN2 为 LSSSAN 消去 GRU 层后的模 型,LSSSAN2 在 Gowalla 上的两个指标相比 LSS￾SAN 分别降低了 0.87%、0.31%,LSSSAN2 在 Tmall 上的 AUC 相比 LSSSAN 降低了 0.89%,虽 然 LSSSAN2 在 Tmall 数据集上指标召回率 (N 为 20) 相比 LSSSAN 提升了 3.17%,但由图 6 可以观 察到 LSSSAN2 在 Tmall 数据集上的整体表现稍 劣于 LSSSAN。以 LSSSAN 为基准,消去 GRU 层 的 LSSSAN2 在 Tmall 数据集上的表现优于其在 Gowalla 的表现,其原因是 Tmall 数据集的顺序相 关性和相互依赖性不如 Gowalla 数据集严格。而 LSSSAN 与 LSSSAN2 相比,N 参数较大时指标召 回率较稳定,此时对推荐结果而言,GRU 层提取 序列性偏好的优势会大于 GRU 层受非严格顺序 相关性和弱相互依赖性的影响而不稳定的劣势。 当数据集表现出明显的非严格顺序相关性和弱相 互依赖性时,可以考虑以消去 GRU 层后的 LSS￾SAN 作为推荐模型的候选。 至此,消融实验验证了模型的 GRU 层和自注 意力层发挥的重要作用。 3.4 超参数分析 d d d = 80 全局维度参数 反映了模型 embedding 和表 示层的维度,图 7 反映了在 Tmall 和 Gowalla 数据 集上维度参数 对模型效果的影响。可以观察 到,高维度的表示可以更精确地表达用户和 item, 并有助于和模型之间的信息交互。在实验中,本 模型权衡计算成本和模型精度,设置维度参数 。 第 2 期 鲍维克,等:面向推荐系统的分期序列自注意力网络 ·359·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有