正在加载图片...
序列与结构的适应性。至于最后建立三维结构模型则是非常困难的,这是因为建立模型的过 程不能校正在序列比对阶段出现的错误。现在,线索技术已成为蛋白质结构预测领域中最活 跃的一块。在20世纪90年代发表的第一篇关于线索化方法的文章推动了线索化方法的深入 研究。线索化的主要思想是利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性 等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。不久提出另一种 不同的方法,即利用蛋白质数据库中丰富的信息,通过提取平均势场取出结构知识。由于 不同平均势场刻画蛋白质不同的结构特征,正确的远程同源蛋白质很可能是所得到的查找结 果之一。然而,目前还没有一个单独方法能够在一半以上的情况下检测到正确远程同源蛋白 质。凡是经过大量测试、严格评估的方法,得到正确的远程同源蛋白质的几率小于40% 即使这样,其性能也远远好于传统的序列比对方法(在序列等同部分小于25%的情况下)。 另外,各种结构预测实验的成功表明,在专家仔细筛选各种选择后,检测到远程同源蛋白质 的可能性将会得到进一步地提高。下面讨论从蛋白质序列到蛋白质结构的线索化方法。建立 序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。线索化或者折叠识别的 目标是为目标蛋白质U寻找合适的蛋白质模板T,这些模板蛋白质与U没有显著的序列相 似性,但却是远程同源的。如果找到这样的模板,则将U的序列与模板T的结构进行比对 ( sequence- structure alignment),即建立线索。在此基础上利用模板结构为蛋白质U建立结 构模型。线索化是一个比预测三维结构更复杂的问题,是NP完全问题,需要采用近似求解 方法或启发式求解方法。解决该问题的回报是非常高的,如果能够解决线索化问题,那么预 测更多的蛋白质结构将成为可能。对应于不同的序列-结构匹配程度度量方法,有不同的线 索化方法,但是线索化方法一般有5个基本组成部分:(1)已知三维折叠结构的数据库 (2)一种适合于进行序列结构比对的三维折叠信息的表示方法;(3)一个序列结构匹配 函数,该函数对匹配程度进行打分;(4)建立最优线索的策略,或者是进行序列-结构比对 的策略;(5)一种评价序列-结构比对显著性的方法。在线索技术中,假设存在有限数目的 核心折叠( core folds)。核心折叠实际上是构成蛋白质空间形状的基本模式。线索技术的首 要任务是建立核心折叠数据库,在预测蛋白质空间结构时将一个待预测结构的蛋白质序列与 数据库中核心折叠进行比对,找出比对结果最好的核心折叠,作为构造待预测蛋白质结构模 型的根据。 ∪序列 心折登比对 取量佳核→U结构模型序列与结构的适应性。至于最后建立三维结构模型则是非常困难的,这是因为建立模型的过 程不能校正在序列比对阶段出现的错误。现在,线索技术已成为蛋白质结构预测领域中最活 跃的一块。在 20 世纪 90 年代发表的第一篇关于线索化方法的文章推动了线索化方法的深入 研究。线索化的主要思想是利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性 等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。不久提出另一种 不同的方法,即利用蛋白质数据库中丰富的信息,通过提取平均势场取出结构知识。 由于 不同平均势场刻画蛋白质不同的结构特征,正确的远程同源蛋白质很可能是所得到的查找结 果之一。然而,目前还没有一个单独方法能够在一半以上的情况下检测到正确远程同源蛋白 质。凡是经过大量测试、严格评估的方法,得到正确的远程同源蛋白质的几率小于 40%。 即使这样,其性能也远远好于传统的序列比对方法(在序列等同部分小于 25%的情况下)。 另外,各种结构预测实验的成功表明,在专家仔细筛选各种选择后,检测到远程同源蛋白质 的可能性将会得到进一步地提高。下面讨论从蛋白质序列到蛋白质结构的线索化方法。建立 序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。线索化或者折叠识别的 目标是为目标蛋白质 U 寻找合适的蛋白质模板 T,这些模板蛋白质与 U 没有显著的序列相 似性,但却是远程同源的。如果找到这样的模板,则将 U 的序列与模板 T 的结构进行比对 (sequence-structure alignment),即建立线索。在此基础上利用模板结构为蛋白质 U 建立结 构模型。线索化是一个比预测三维结构更复杂的问题,是 NP 完全问题,需要采用近似求解 方法或启发式求解方法。解决该问题的回报是非常高的,如果能够解决线索化问题,那么预 测更多的蛋白质结构将成为可能。对应于不同的序列-结构匹配程度度量方法,有不同的线 索化方法,但是线索化方法一般有 5 个基本组成部分:(1)已知三维折叠结构的数据库; (2)一种适合于进行序列-结构比对的三维折叠信息的表示方法;(3)一个序列-结构匹配 函数,该函数对匹配程度进行打分;(4)建立最优线索的策略,或者是进行序列-结构比对 的策略;(5)一种评价序列-结构比对显著性的方法。在线索技术中,假设存在有限数目的 核心折叠(core folds)。核心折叠实际上是构成蛋白质空间形状的基本模式。线索技术的首 要任务是建立核心折叠数据库,在预测蛋白质空间结构时将一个待预测结构的蛋白质序列与 数据库中核心折叠进行比对,找出比对结果最好的核心折叠,作为构造待预测蛋白质结构模 型的根据
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有