正在加载图片...
序列中后部息入 Local AAA+ cLI63 u ins de1c。 Alignment AA-+ LLL+ 003365000000.7 adjacent AAG+ 550003300001. residues CCs 0660 00.74 GVV+ 000330066000.48 Global Statistics Lent 效酸的百分壮 ≤60,≤120,≤240,>240 囗N-term Protein 0 C-term (≤40,≤30,≤20,≤10) 入 隐 20 第二尽网络 图75 PHDsec模型:(a)由蛋白质家族得到的序列信息:(b)对一个窗口序 进行多重比对得到的统计数据,作为神经网络的输入;(c)神经网络结构, 由于 PHDsec在进行二级结构预测时采用序列多重比对的统计结果,而序列多重比对反映 了蛋白质家族的共同特征,提取了结构保守的信息。序列多重比对结果也反映了在进化过程 中,哪些部分的结构容易发生变化,而哪些部分的结构对蛋白质的功能非常重要,不能随意 改变。这些信息对于蛋白质结构预测来说,是非常关键的。多重序列比对所携带的进化信息 也暗示了蛋白质中长程相互作用:假设蛋白质中氨基酸残基i与残基i100在三维空间中靠 在一起,那么,残基i可能的替换类型将受到残基ⅰ100理化特性的约束。这样的长程相互 约束关系会反映在多重序列比对中。总之,利用多重序列比对的信息,可以提高二级结构预 测的准确性。另外, PHDsec通过两层神经网络的体系,加强了预测结果的校正,由此提高 了对β折叠结构预测的准确性。正因为这样, PHDsec预测的准确率比较高,对二级结构预 测的准确率达到72%,而且还对序列上每个位点的预测可信度给予统计分析。 PHDsec是第 个预测准确率超过70%的二级结构预测方法,比基于单条序列的预测方法提高了近10个 百分点由于 PHDsec 在进行二级结构预测时采用序列多重比对的统计结果,而序列多重比对反映 了蛋白质家族的共同特征,提取了结构保守的信息。序列多重比对结果也反映了在进化过程 中,哪些部分的结构容易发生变化,而哪些部分的结构对蛋白质的功能非常重要,不能随意 改变。这些信息对于蛋白质结构预测来说,是非常关键的。多重序列比对所携带的进化信息 也暗示了蛋白质中长程相互作用:假设蛋白质中氨基酸残基 i 与残基 i+100 在三维空间中靠 在一起,那么,残基 i 可能的替换类型将受到残基 i+100 理化特性的约束。这样的长程相互 约束关系会反映在多重序列比对中。总之,利用多重序列比对的信息,可以提高二级结构预 测的准确性。另外,PHDsec 通过两层神经网络的体系,加强了预测结果的校正,由此提高 了对 β 折叠结构预测的准确性。正因为这样,PHDsec 预测的准确率比较高,对二级结构预 测的准确率达到 72%,而且还对序列上每个位点的预测可信度给予统计分析。PHDsec 是第 一个预测准确率超过 70%的二级结构预测方法,比基于单条序列的预测方法提高了近 10 个 百分点
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有