正在加载图片...
·900· 智能系统学报 第13卷 化时很难化简为不含有自身变量的等式,这会使 同样,固定其他参数,分别求解D、X、Y,有: 得在迭代的过程中无法取得最优解,我们引入了 D=(MM+(o+)-1l4+2YY) 辅助矩阵X和Y来进行优化,式(4)可以变形为 (M.R+AY.DS+uY) min:MX-MSM+ X=(O·MMr+4l)'(dM·MS+4M0 (9) (5) DTY-DS+lD-YI Y=(d2·DDT+l)(2·DDS+D) 经验性地,我们对需要约束的M、D加人二 33关联关系预测 范数的约束,以防止模型陷入过拟合。最终的损 利用得到的M和D,用其内积得到新的关联 失函数如式(6)所示: 关系矩阵R'=MD,其i行j列即为第i个miRNA L=IIMD-Rl+o(lIMI+lDIF)+ 和第j个疾病的被预测的关联关系。事实上,它 MX-MS+M- (6) 的值只有在和矩阵中其他值进行比较时才具有相 DTY-DS+D-YI 对的意义,值越大表示关联关系出现的概率越 3.2优化 大,但其与关联关系出现的概率并不完全等价。 我们采用迭代最小二乘的方式来优化这个问 3.4算法框架 题,先固定D、X、Y,求解M。对M求导,有 具体算法步骤如下: 80-2nD+2M 1)初始化miRNAs和疾病的向量矩阵M、D, 2·1·X·(MrX-MS)+2·4(M-X)= (7) 以及辅助向量X、Y,并构建损失函数; 2.DDM-2.DRT+2·oM+2·1·XXrM- 2)用迭代最小二乘法求解M和D: 2·X.MS+241M-24X A 3)根据M和D预测miRNAs-疾病的关联 aM0,有: 关系。 M=(DDr+(o+4)14+·XX) R=MD (DRr+1·X.MS+41X) (8) 算法框架如图3所示。 IMISIM L=IIMD-RIE(MI+DIEMX-MSI+ MlM-XIE+IIDTY-DSIIEUIID-YE 初始化M、D、X、y miRNAs 功能相似性网络 miRNAsf的k维向量,MIM-(DDE,4+,XXTy(DR+iXMS+u,X ID-(MM+(tu)IYY(MRi:Y-DStu:Y) (MeSH X-(MMT+UJ(M-MS+UM) Y=(DDT+uI(D-DS+uD) 收敛 疾病 疾病的维向量,D 语义相似性网络 R=MTD 图3 LMFMDA算法模型框图 Fig.3 The flow chat of LMFMDA algorithm model 3.5复杂度分析 Ok);DRr的时间复杂度为O(kdm),1·X·MS的时 时间复杂度上,对于每次迭代,我们以M的 间复杂度为Okm),山X时间复杂度为O(m2),这 求解为例,DD的时间复杂度为OK2d),(+4)I 3项加法时间复杂度为Okm);最后的乘法时 的时间复杂度为Ok2),XXT时间复杂度为Ok2m), 间复杂度为Okm);综上,求解M的时间复 这3项加法时间复杂度为O2),求逆复杂度为 杂度为O(max(k2m,k2d,kdm,km2),事实上,通常有化时很难化简为不含有自身变量的等式,这会使 得在迭代的过程中无法取得最优解,我们引入了 辅助矩阵 X 和 Y 来进行优化,式 (4) 可以变形为 minλ1 MTX−MS 2 F +µ1 ∥M − X∥ 2 F + λ2 D TY −DS 2 F +µ2 ∥D−Y∥ 2 F (5) 经验性地,我们对需要约束的 M、D 加入二 范数的约束,以防止模型陷入过拟合。最终的损 失函数如式 (6) 所示: L = MT D− R 2 F +λ0 ( ∥M∥ 2 F +∥D∥ 2 F ) + λ1 MTX−MS 2 F +µ1 ∥M − X∥ 2 F + λ2 D TY −DS 2 F +µ2 ∥D−Y∥ 2 F (6) 3.2 优化 我们采用迭代最小二乘的方式来优化这个问 题,先固定 D、X、Y,求解 M。对 M 求导,有 ∂L ∂M = 2 · D· ( MT D− R )T +2 · λ0 · M+ 2 · λ1 · X· ( MTX−MS)T +2 · µ1 (M − X) = 2 · DDTM −2 · DRT +2 · λ0 · M +2 · λ1 · XXTM− 2 · λ1 · X·MST +2 · µ1 · M −2 · µ1 · X (7) ∂L ∂M 令 =0 ,有: M = ( DDT +(λ0 +µ1)·Ik +λ1 · XXT )−1 · ( D· R T +λ1 · X·MS+µ1 · X ) (8) 同样,固定其他参数,分别求解 D、X、Y,有: D = ( MMT +(λ0 +µ2)·Ik +λ2 ·YYT )−1 (M · R+λ2 ·Y ·DS+µ2 ·Y) X = ( λ1 · MMT +µ1 Ik )−1 (λ1 · M ·MS+µ1M) Y = ( λ2 · DDT +µ2 Ik )−1 (λ2 · D·DS+µ2 D) (9) 3.3 关联关系预测 R ′ = MT D 利用得到的 M 和 D,用其内积得到新的关联 关系矩阵 ,其 i 行 j 列即为第 i 个 miRNA 和第 j 个疾病的被预测的关联关系。事实上,它 的值只有在和矩阵中其他值进行比较时才具有相 对的意义,值越大表示关联关系出现的概率越 大,但其与关联关系出现的概率并不完全等价。 3.4 算法框架 具体算法步骤如下: 1) 初始化 miRNAs 和疾病的向量矩阵 M、D, 以及辅助向量 X、Y,并构建损失函数; 2) 用迭代最小二乘法求解 M 和 D; 3) 根据 M 和 D 预测 miRNAs-疾病的关联 关系。 R ′ = MT D 算法框架如图 3 所示。 3.5 复杂度分析 DDT O(k 2d) (λ0 +µ1)·Ik O(k 2 ) XXT O(k 2m) O(k 2 ) 时间复杂度上,对于每次迭代,我们以 M 的 求解为例, 的时间复杂度为 , 的时间复杂度为 , 时间复杂度为 , 这 3 项加法时间复杂度为 ,求逆复杂度为 O(k 3 ) DRT O(kdm) λ1 · X· MS O(km2 ) µ1 · X O(m 2 ) O(km) O(k 2m) O(max(k 2m, k 2d, kdm, km2 )) ; 的时间复杂度为 , 的时 间复杂度为 , 时间复杂度为 ,这 3 项加法时间复杂度为 ;最后的乘法时 间复杂度为 ;综上,求 解 M 的时间复 杂度为 ,事实上,通常有 MISIM miRNAs 功能相似性网络 MeSH 疾病 语义相似性网络 初始化 M、D 、X、 Y miRNAs的k维向量,M 疾病的k维向量,D 收敛 R′=MTD Y N M=(DDT+(λ0+μ1 )·Ik+λ1 ·XX T ) −1(D·RT+λ1 ·X·MS+μ1 ·X) D=(MMT+(λ0+μ2 )·Ik+λ2 ·YYT ) −1(M·R+λ2 ·Y·DS+μ2 ·Y) X=(λ1 ·MMT+μ1 Ik ) −1(λ1 ·M·MS+μ1M) Y=(λ2 ·DDT+μ2 Ik ) −1(λ2 ·D·DS+μ2D) L=||MTD−R| |F 2+λ0 (||M||F 2+||D||F 2 )+λ1 ||MTX−MS||F 2+ μ1 ||M−X||F 2+λ2 ||DTY−DS||F 2+μ2 ||D−Y||F 2 图 3 LMFMDA 算法模型框图 Fig. 3 The flow chat of LMFMDA algorithm model ·900· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有