正在加载图片...
生物信息学的一个基本观点是:分子的结构决定分子的性质和分子的功能。因此,生物 大分子蛋白质的空间结构决定蛋白质的生物学功能。但是,蛋白质的空间结构又是由什么决 定的呢?当一个蛋白质的空间结构被破坏以后,或者蛋白质解折叠后,可以恢复其自然的折 叠结构。大量的实验结果证明:蛋白质的结构由蛋白质序列所决定。虽然影响蛋白质空间结 构的另一个因素是蛋白质分子所处的溶液环境,但是,决定蛋白质结构的信息则是被编码于 氨基酸序列之中。然而,这种编码是否能被破译呢?或者说是否能够直接从氨基酸序列预测 出蛋白质的空间结构呢? 从数学上讲,蛋白质结构预测的问题是寻找一种从蛋白质的氨基酸线性序列到蛋白质所 有原子三维坐标的映射。典型的蛋白质含有几百个氨基酸、上千个原子,而大蛋白质(如载 脂蛋白)的氨基酸个数超过4500。所有可能的序列到结构的映射数随蛋白质氨基酸残基个 数呈指数增长,是天文数字。然而幸运的是,自然界实际存在的蛋白质是有限的,并且存在 着大量的同源序列,可能的结构类型也不多,序列到结构的关系有一定的规律可循。因此 蛋白质结构预测是可能的。 蛋白质结构预测主要有两大类方法。一类是理论分析方法或从头算方法( Ab initio 通过理论计算(如分子力学、分子动力学计算)进行结构预测。该类方法假设折叠后的蛋白 质取能量最低的构象。从原则上来说,我们可以根据物理、化学原理,通过计算来进行结构 预测。但是在实际中,这种方法往往不合适。主要有几个原因,一是自然的蛋白质结构和未 折叠的蛋白质结构,两者之间的能量差非常小(lkca/mol数量级),二是蛋白质可能的构 象空间庞大,针对蛋白质折叠的计算量非常大。另外,计算模型中力场参数的不准确性也是 个问题。 另一类蛋白质结构预测的方法是统计方法,该类方法对已知结构的蛋白质进行统计分 析,建立序列到结构的映射模型,进而根据映射模型对未知结构的蛋白质直接从氨基酸序列 预测结构。映射模型可以是定性的,也可以是定量的。这是进行蛋白质结构预测较为成功的 类方法。这一类方法包括经验性方法、结构规律提取方法、同源模型化方法等。 所谓经验性方法就是根据一定序列形成一定结构的倾向进行结构预测,例如,根据不同 氨基酸形成特定二级结构的倾向进行结构预测。通过对已知结构的蛋白质(如蛋白质结构数生物信息学的一个基本观点是:分子的结构决定分子的性质和分子的功能。因此,生物 大分子蛋白质的空间结构决定蛋白质的生物学功能。但是,蛋白质的空间结构又是由什么决 定的呢?当一个蛋白质的空间结构被破坏以后,或者蛋白质解折叠后,可以恢复其自然的折 叠结构。大量的实验结果证明:蛋白质的结构由蛋白质序列所决定。虽然影响蛋白质空间结 构的另一个因素是蛋白质分子所处的溶液环境,但是,决定蛋白质结构的信息则是被编码于 氨基酸序列之中。然而,这种编码是否能被破译呢?或者说是否能够直接从氨基酸序列预测 出蛋白质的空间结构呢? 从数学上讲,蛋白质结构预测的问题是寻找一种从蛋白质的氨基酸线性序列到蛋白质所 有原子三维坐标的映射。典型的蛋白质含有几百个氨基酸、上千个原子,而大蛋白质(如载 脂蛋白)的氨基酸个数超过 4500。所有可能的序列到结构的映射数随蛋白质氨基酸残基个 数呈指数增长,是天文数字。然而幸运的是,自然界实际存在的蛋白质是有限的,并且存在 着大量的同源序列,可能的结构类型也不多,序列到结构的关系有一定的规律可循。因此, 蛋白质结构预测是可能的。 蛋白质结构预测主要有两大类方法。一类是理论分析方法或从头算方法(Ab initio), 通过理论计算(如分子力学、分子动力学计算)进行结构预测。该类方法假设折叠后的蛋白 质取能量最低的构象。从原则上来说,我们可以根据物理、化学原理,通过计算来进行结构 预测。但是在实际中,这种方法往往不合适。主要有几个原因,一是自然的蛋白质结构和未 折叠的蛋白质结构,两者之间的能量差非常小(1kcal/mol 数量级),二是蛋白质可能的构 象空间庞大,针对蛋白质折叠的计算量非常大。另外,计算模型中力场参数的不准确性也是 一个问题。 另一类蛋白质结构预测的方法是统计方法,该类方法对已知结构的蛋白质进行统计分 析,建立序列到结构的映射模型,进而根据映射模型对未知结构的蛋白质直接从氨基酸序列 预测结构。映射模型可以是定性的,也可以是定量的。这是进行蛋白质结构预测较为成功的 一类方法。这一类方法包括经验性方法、结构规律提取方法、同源模型化方法等。 所谓经验性方法就是根据一定序列形成一定结构的倾向进行结构预测,例如,根据不同 氨基酸形成特定二级结构的倾向进行结构预测。通过对已知结构的蛋白质(如蛋白质结构数
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有