正在加载图片...
第5期 刘光明,等:融合蛋白质复合体的人类蛋白互作网络功能模块发现 .707· 验表明,融合了蛋白质复合体后划分得到的模块在 3个方面罗列了实验结果,可以看到融合了蛋白质 GO术语上的富集程度要比直接使用原始PPI网络 复合体之后的PPI网络得到的模块,在富集程度上 的模块富集程度有显著的提升。 比原始模块的p-value值要低,这说明模块的富集程 表2列举了4种方法对应的前20个最小的模 度更好,融合蛋白质复合体的模块更具有显著生物 块富集结果,分别从生物过程、细胞组件和生物功能 功能上的意义。 表2融合蛋白质复合体的模块与原始PPI模块的G0富集(p-value) Table 2 GO enrichment of topological modules comparing mixed protein complex with the original PPI network K-Means IncreK-Means NMF IncreNMF BP cC MF BP CC MF BP CC MF BP CC MF 0.0x10°9.4x1050.0x10°0.0x10°2.3x1060.0x100.0x103.4×1090.0x10 0.0x10P1.9x10am0.00x10 5.5×1001.79x1085.33×1054.9×1001.20x1023.9x101.12×108.49x1054.85×10512.73×1091.00x1005.86x108 2.79x1062.13x1081.45×10686.03×1091.94x10s3.87×1022.44x1063.05x1021.25×1014.64×1092.00x1041.28×102 1.53x1063.75x1065.63x1081.24×1086.97×1041.54×1089.89x1081.55×1063.19x1081.93x10$8.43×10m3.66x102 3.49x1003.80x1065.95x10482.37×1016.99x104.27×103g3.11x10%1.02x1035.47×102.35x10s9.42×1084.10x105 1.50x1019.70x10-319.20x1072.39x1011.55x1091.45×1061.12x1043.30x105.46×1033.23×1062.20x10-21.61×1024 6.73×1011.27×1051.54×10317.20×1015.13×1031.12×10381.39×1042.23×101.79×10241.25×1081.27×101.76×1024 3.43x1095.71×1052.60x1098.23×1011.12x10”2.26×101.48x1015.26×10244.14×1033.02×108135×102.45×104 7.94×1081.02x1042.94×1024.44×1004.89x102.77×10”2.01×10311.55×1032.99×1027.83×1021.38×1034.95×102 2.17×1051.05×1045.71×101.71×1056.19x101.25×1021.38×1003.29x1021.38×1097.97×1018.45×101.05×102 3.22×1051.67×1044.51×1082.94×1057.81×106.73×1042.52x1032.78x1022.07×1081.68×1025.48×103.18×102 1.97×10302.54x10246.86×10281.34×1042.42x10249.83x102298x1022.97×1022.10x10181.04×1027.57×1032.21×100 1.76×10282.79x102.26×1021.85×10312.69x10243.77×1024.38x1023.30x1024.18x1081.34×1041.20x10242.50×10m 1.17×102”3.16x1024.85×10-14.43×1012.05x1034.76×1024.71×1023.80x1021.02x10n1.46x10242.04×1031.59x109 5.06×1076.54×1023.03×10201.15×102.76×1021.84×1016.08×1026.65×10211.20×1071.94×10242.90×10-31.17×1018 1.80x10256.00x10212.98×1081.83×10”4.14x10212.35×1017.70x10211.02×10194.7×1074.55×1025.77×1081.92×1018 2.75×109.72×1022.31×10162.69×1025.63×1023.44×10211.17×1001.12×1091.26×10169.95×1025.57×1021.16×10n 1.47×1051.15x1084.27×1064.64×1021.63x1093.87×1091.54×10201.42×10193.92×1061.14×10-217.88×1021.76x10-7 2.46×101.92x106.56×1069.92×1024.42×1091.08×10183.36x1002.06x10196.25×10161.99x10213.93×1025.89x10n 1.19x1021.94×1086.63x10168.00x106.78×1095.57×10~183.92×1001.02x10-186.69×1062.06x10-21.38×10D7.71×10 同G0的富集分析一样,我们也对模块中蛋白条来自Reactome数据库。表3列举了4种方法中 质在Pathway上进行了相应的富集分析,主要是统 对应的前20个最小的模块在Pathway上的富集结 计一个模块内的蛋白质参与同一条Pathway的程 果,从中可以看到融合了蛋白质复合体之后的PPI 度。Pathway数据主要使用PIDI(pathway interac- 网络的模块,在Pathway上的富集程度比原始的模 tion database),该数据库由NCl-Nature、BioCarta和块的p-value值要低,这说明模块内的蛋白质更多地 Reactome.3个数据库整合而成。在本文中只使用分参与了同一条Pathway,从而可以证明融合了蛋白质 子类型为“蛋白质”和“蛋白质复合体”的数据。最 复合体的模块更倾向于在同样的Pathway中发挥生 终提取了1513条Pathway数据,其中223条来自 物作用,识别Pathway可以帮助人们进一步认识蛋 NCI-Nature数据库、254条来自BioCarta数据库、838 白分子之间相互作用的分子机理。验表明,融合了蛋白质复合体后划分得到的模块在 GO 术语上的富集程度要比直接使用原始 PPI 网络 的模块富集程度有显著的提升。 表 2 列举了 4 种方法对应的前 20 个最小的模 块富集结果,分别从生物过程、细胞组件和生物功能 3 个方面罗列了实验结果,可以看到融合了蛋白质 复合体之后的 PPI 网络得到的模块,在富集程度上 比原始模块的p⁃value值要低,这说明模块的富集程 度更好,融合蛋白质复合体的模块更具有显著生物 功能上的意义。 表 2 融合蛋白质复合体的模块与原始 PPI 模块的 GO 富集(p⁃value) Table 2 GO enrichment of topological modules comparing mixed protein complex with the original PPI network K⁃Means IncreK⁃Means NMF IncreNMF BP CC MF BP CC MF BP CC MF BP CC MF 0.0×10 0 9.4×10 -175 0.0×10 0 0.0×10 0 2.3×10 -176 0.0×10 0 0.0×10 0 3.4×10 -193 0.0×10 0 0.0×10 0 1.9×10 -207 0.00×10 0 5.5×10 -104 1.79×10 -78 5.33×10 -105 4.9×10 -104 1.20×10 -52 3.9×10 -106 1.12×10 -48 8.49×10 -55 4.85×10 -51 2.73×10 -49 1.00×10 -50 5.86×10 -43 2.79×10 -66 2.13×10 -48 1.45×10 -68 6.03×10 -59 1.94×10 -48 3.87×10 -52 2.44×10 -46 3.05×10 -52 1.25×10 -41 4.64×10 -39 2.00×10 -44 1.28×10 -42 1.53×10 -56 3.75×10 -46 5.63×10 -43 1.24×10 -48 6.97×10 -44 1.54×10 -48 9.89×10 -38 1.55×10 -43 3.19×10 -38 1.93×10 -38 8.43×10 -28 3.66×10 -32 3.49×10 -50 3.80×10 -46 5.95×10 -43 2.37×10 -41 6.99×10 -41 4.27×10 -38 3.11×10 -36 1.02×10 -28 5.47×10 -32 2.35×10 -38 9.42×10 -28 4.10×10 -25 1.50×10 -41 9.70×10 -31 9.20×10 -37 2.39×10 -41 1.55×10 -29 1.45×10 -36 1.12×10 -34 3.30×10 -28 5.46×10 -25 3.23×10 -36 2.20×10 -27 1.61×10 -24 6.73×10 -41 1.27×10 -25 1.54×10 -31 7.20×10 -41 5.13×10 -28 1.12×10 -33 1.39×10 -34 2.23×10 -26 1.79×10 -24 1.25×10 -33 1.27×10 -26 1.76×10 -24 3.43×10 -39 5.71×10 -25 2.60×10 -29 8.23×10 -41 1.12×10 -27 2.26×10 -33 1.48×10 -31 5.26×10 -24 4.14×10 -23 3.02×10 -33 1.35×10 -26 2.45×10 -24 7.94×10 -38 1.02×10 -24 2.94×10 -27 4.44×10 -40 4.89×10 -26 2.77×10 -27 2.01×10 -31 1.55×10 -23 2.99×10 -22 7.83×10 -32 1.38×10 -26 4.95×10 -23 2.17×10 -35 1.05×10 -24 5.71×10 -27 1.71×10 -35 6.19×10 -26 1.25×10 -26 1.38×10 -30 3.29×10 -23 1.38×10 -19 7.97×10 -31 8.45×10 -26 1.05×10 -22 3.22×10 -35 1.67×10 -24 4.51×10 -23 2.94×10 -35 7.81×10 -26 6.73×10 -24 2.52×10 -29 2.78×10 -22 2.07×10 -18 1.68×10 -29 5.48×10 -25 3.18×10 -22 1.97×10 -30 2.54×10 -24 6.86×10 -23 1.34×10 -34 2.42×10 -24 9.83×10 -23 2.98×10 -22 2.97×10 -22 2.10×10 -18 1.04×10 -25 7.57×10 -25 2.21×10 -20 1.76×10 -28 2.79×10 -23 2.26×10 -21 1.85×10 -31 2.69×10 -24 3.77×10 -22 4.38×10 -22 3.30×10 -21 4.18×10 -18 1.34×10 -24 1.20×10 -24 2.50×10 -20 1.17×10 -27 3.16×10 -23 4.85×10 -21 4.43×10 -31 2.05×10 -23 4.76×10 -22 4.71×10 -22 3.80×10 -21 1.02×10 -17 1.46×10 -24 2.04×10 -23 1.59×10 -19 5.06×10 -27 6.54×10 -22 3.03×10 -20 1.15×10 -27 2.76×10 -23 1.84×10 -21 6.08×10 -22 6.65×10 -21 1.20×10 -17 1.94×10 -24 2.90×10 -23 1.17×10 -18 1.80×10 -25 6.00×10 -21 2.98×10 -18 1.83×10 -27 4.14×10 -21 2.35×10 -21 7.70×10 -21 1.02×10 -19 4.77×10 -17 4.55×10 -22 5.77×10 -23 1.92×10 -18 2.75×10 -27 9.72×10 -21 2.31×10 -16 2.69×10 -27 5.63×10 -21 3.44×10 -21 1.17×10 -20 1.12×10 -19 1.26×10 -16 9.95×10 -22 5.57×10 -22 1.16×10 -17 1.47×10 -25 1.15×10 -18 4.27×10 -16 4.64×10 -27 1.63×10 -19 3.87×10 -19 1.54×10 -20 1.42×10 -19 3.92×10 -16 1.14×10 -21 7.88×10 -22 1.76×10 -17 2.46×10 -23 1.92×10 -18 6.56×10 -16 9.92×10 -27 4.42×10 -19 1.08×10 -18 3.36×10 -20 2.06×10 -19 6.25×10 -16 1.99×10 -21 3.93×10 -21 5.89×10 -17 1.19×10 -22 1.94×10 -18 6.63×10 -16 8.00×10 -25 6.78×10 -19 5.57×10 -18 3.92×10 -20 1.02×10 -18 6.69×10 -16 2.06×10 -21 1.38×10 -20 7.71×10 -17 同 GO 的富集分析一样,我们也对模块中蛋白 质在 Pathway 上进行了相应的富集分析,主要是统 计一个模块内的蛋白质参与同一条 Pathway 的程 度。 Pathway 数据主要使用 PID [13] ( pathway interac⁃ tion database),该数据库由 NCI⁃Nature、BioCarta 和 Reactome3 个数据库整合而成。 在本文中只使用分 子类型为“蛋白质”和“蛋白质复合体”的数据。 最 终提取了 1 513 条 Pathway 数据,其中 223 条来自 NCI⁃Nature 数据库、254 条来自 BioCarta 数据库、838 条来自 Reactome 数据库。 表 3 列举了 4 种方法中 对应的前 20 个最小的模块在 Pathway 上的富集结 果,从中可以看到融合了蛋白质复合体之后的 PPI 网络的模块,在 Pathway 上的富集程度比原始的模 块的 p⁃value 值要低,这说明模块内的蛋白质更多地 参与了同一条 Pathway,从而可以证明融合了蛋白质 复合体的模块更倾向于在同样的 Pathway 中发挥生 物作用,识别 Pathway 可以帮助人们进一步认识蛋 白分子之间相互作用的分子机理。 第 5 期 刘光明,等:融合蛋白质复合体的人类蛋白互作网络功能模块发现 ·707·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有