正在加载图片...
·20· 智能系统学报 第15卷 P P MMM L L. E 100 E 0300 0.1 0 0 E 0 1 E 001 0 0 05 E 0 0 E 00 0108 0 0 0 0 E 0 00 E 000.0000.6 E AExP AExM 图4病患、医疗科室、药方以及医疗测试结果关系矩阵 Fig.4 Relation matrix between patients encounters medications and laboratory test data 在式(20)中,、分别表示两种激活函数, 有商家提供的商品描述与分类信息,消费者与系 N表示v节点的所有邻居,k表示第k轮运算。 统交互的点击、浏览、收藏、交易信息,消费者的 H+()="(H(m,f"时({Hw)w∈N( 评分及评论信息等;数据形式有文本信息,图像 (20) 信息、数值评分与标签信息等,甚至还有语音及 Mao对激活函数使用了最简单的求和函数 视频信息等。现有推荐模型对于这些多源多模 如式(21)所示,对节点类型为i的节点的第k轮 态数据很难同时进行有效处理,导致数据利用不 计算,其中表示他的连接节点。 充分或数据对象之间的关系表示不明显。同样 的,现有GNN推荐模型,对节点向量化的方式比 = 21) 较单一,如一般只能对用户留下的评论数据或者 评分加以处理,难以将多源多模态信息进行融合 经过k轮计算之后,将计算的节点结果输入 表示以达到最佳效果。如何充分集成使用多源 两种神经网络,分别进行药方和医疗测试结果的 多模态数据信息是GNN推荐有待解决的一个 推荐。 问题。 在式(22)中,损失函数表示为两项之和,第 5.2GNN的有向图推荐问题 1项Lm为药方预测的误差,见式(23),第2项 目前GNN推荐模型主要是无向图GNN推 L,表示使用交叉熵的方式表示医疗测试结果的 荐,其中无向图的边用来反映节点之间的互动关 预测误差,见式(24),1是系数通过这种引入的混 系。但是有向图比无向图可以反映更多的信息, 合误差,很有效地避免了过拟合问题。 比如某种次序或者逻辑关系,有向图的推荐结果 L=L (P,AExM)+ALL (V,AExL) (22) 往往可以取得更好的效果。推荐系统中也存在着 Lw(P.A)=- -aijlogpij+(1-a)log(1-Pi) 对应的有向关系,如信任关系、关注关系等。与 NEZN 无向图GNN推荐相比,基于有向图GNN的推荐 (23) 更具有挑战性,也更为复杂。 L(V.A)=- 1 N ZZ m(y-a)》 (24) 5.3GNN的动态推荐问题 对于数据规模往往很大的图形结构,很难进 该模型较单元图与二元图神经网络,结构更 行实时的图模型更新,而且图神经网络GNN迭 加复杂,但能更有效地对不同类型的数据信息 代过程中往往需要根据整个图的信息向量化才能 进行充分使用。同时,通过将模型中的对象进 完成计算,对于不断更新的数据每次进行重新计 行节点再划分,成功处理了一些实验过程中的 算,需要花费很高的成本,如何在较低成本下完 数据缺失值问题:使用新的正则化规则,避免了 成动态的GNN更新,现有GNN推荐研究并没有 过拟合情况,取得了不错效果。不足之处在于 考虑。如文献30]中,用户的社交情况可能会实 实验相关数据仅采用一家医院,对于规模更大 时发生变化,新朋友可能会对用户的兴趣造成很 的数据集,GNN图形结构将更复杂,实际应用有 大影响,如果可以实时更新用户的社交图谱,就 一定困难。 可以完成对GNN动态推荐。 5现有GNN推荐研究难点 5.4GNN网络更新层数问题 标准的深度神经网络推荐研究中,网络层数 5.1多源多模态信息的GNN推荐问题 可以达到成百上千层,由于更深的结构,可以显 在一个系统中,数据来源与数据结构往往呈 著提高网络的表达能力。在GNN推荐过程中, 现多源异构性。以电子商务系统为例,数据来源 般层数仅仅为个位数。因为堆叠多个GNN层1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 0 1 1 0 0 0.3 0.0 0.1 0.1 0 0 0 0 0.1 0.0 0 0 0 0 0 0 0 0.8 0 0 0.5 0.6 0 0 1 0 0 0 0 0 0 0 1 0 0 1 AE×P AE×M AE×L ME×L E1 E2 E3 E4 E1 E2 E3 E4 E1 E2 E3 E4 E1 E2 E3 E4 P1 P2 P3 M1 M2 M3 L1 L2 L3 L1 L2 L3 L1 L2 L3 L1 L2 L3 图 4 病患、医疗科室、药方以及医疗测试结果关系矩阵 Fig. 4 Relation matrix between patients encounters medications and laboratory test data 在式 (20) 中,f1、f2 分别表示两种激活函数, N(v) 表示 v 节点的所有邻居,k 表示第 k 轮运算。 H (k+1) (v) = f W (k) 1 1 ( H (k) (v), f W (k) 2 2 ({ H (k) (w)|w ∈ N (v) }) ) (20) Mao 对激活函数 ϕ 使用了最简单的求和函数[36] , 如式 (21) 所示,对节点类型为 i 的节点的第 k 轮 计算,其中 hj 表示他的连接节点。 H (k+1) i = ϕ   ∑n j=0 Ai j · H (k) j ·W (k) j   (21) 经过 k 轮计算之后,将计算的节点结果输入 两种神经网络,分别进行药方和医疗测试结果的 推荐。 在式 (22) 中,损失函数表示为两项之和,第 1 项 L m 为药方预测的误差,见式 (23),第 2 项 LL 表示使用交叉熵的方式表示医疗测试结果的 预测误差,见式 (24),λ 是系数通过这种引入的混 合误差,很有效地避免了过拟合问题。 L = Lm (P, AE×M)+λLL (V, AE×L) (22) LM (P,A) = − 1 NE ∑NE i ∑NM j Nn Np ai j log pi j + ( 1−ai j) log( 1− pi j) (23) LL (V,A) = − 1 NE ∑NE i ∑NL j mi j( vi j −ai j)2 (24) 该模型较单元图与二元图神经网络,结构更 加复杂,但能更有效地对不同类型的数据信息 进行充分使用。同时,通过将模型中的对象进 行节点再划分,成功处理了一些实验过程中的 数据缺失值问题;使用新的正则化规则,避免了 过拟合情况,取得了不错效果。不足之处在于 实验相关数据仅采用一家医院,对于规模更大 的数据集,GNN 图形结构将更复杂,实际应用有 一定困难。 5 现有 GNN 推荐研究难点 5.1 多源多模态信息的 GNN 推荐问题 在一个系统中,数据来源与数据结构往往呈 现多源异构性。以电子商务系统为例,数据来源 有商家提供的商品描述与分类信息,消费者与系 统交互的点击、浏览、收藏、交易信息,消费者的 评分及评论信息等;数据形式有文本信息,图像 信息、数值评分与标签信息等,甚至还有语音及 视频信息等。现有推荐模型对于这些多源多模 态数据很难同时进行有效处理,导致数据利用不 充分或数据对象之间的关系表示不明显。同样 的,现有 GNN 推荐模型,对节点向量化的方式比 较单一,如一般只能对用户留下的评论数据或者 评分加以处理,难以将多源多模态信息进行融合 表示以达到最佳效果。如何充分集成使用多源 多模态数据信息是 GNN 推荐有待解决的一个 问题。 5.2 GNN 的有向图推荐问题 目前 GNN 推荐模型主要是无向图 GNN 推 荐,其中无向图的边用来反映节点之间的互动关 系。但是有向图比无向图可以反映更多的信息, 比如某种次序或者逻辑关系,有向图的推荐结果 往往可以取得更好的效果。推荐系统中也存在着 对应的有向关系,如信任关系、关注关系等。与 无向图 GNN 推荐相比,基于有向图 GNN 的推荐 更具有挑战性,也更为复杂。 5.3 GNN 的动态推荐问题 对于数据规模往往很大的图形结构,很难进 行实时的图模型更新,而且图神经网络 GNN 迭 代过程中往往需要根据整个图的信息向量化才能 完成计算,对于不断更新的数据每次进行重新计 算,需要花费很高的成本,如何在较低成本下完 成动态的 GNN 更新,现有 GNN 推荐研究并没有 考虑。如文献 [30] 中,用户的社交情况可能会实 时发生变化,新朋友可能会对用户的兴趣造成很 大影响,如果可以实时更新用户的社交图谱,就 可以完成对 GNN 动态推荐。 5.4 GNN 网络更新层数问题 标准的深度神经网络推荐研究中,网络层数 可以达到成百上千层,由于更深的结构,可以显 著提高网络的表达能力。在 GNN 推荐过程中, 一般层数仅仅为个位数。因为堆叠多个 GNN 层 ·20· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有