正在加载图片...
第九章蛋白质序列分析与结构预测 种生物体的基因组规定了所有构成该生物体的蛋白质,基因规定了组成蛋白质的氨基 酸序列。虽然蛋白质由氨基酸的线性序列组成,但是,它们只有折叠成特定的空间构象才能 具有相应的活性和相应的生物学功能。了解蛋白质的空间结构不仅有利于认识蛋白质的功 能,也有利于认识蛋白质是如何执行其功能的。确定蛋白质的结构对于生物学研究是非常重 要的。目前,蛋白质序列数据库的数据积累的速度非常快,但是,已知结构的蛋白质相对比 较少。尽管蛋白质结构测定技术有了较为显著的进展,但是,通过实验方法确定蛋白质结构 的过程仍然非常复杂,代价较高。因此,实验测定的蛋白质结构比已知的蛋白质序列要少得 多。另一方面,随着DNA测序技术的发展,人类基因组及更多的模式生物基因组已经或将 要被完全测序,DNA序列数量将会急增,而由于DNA序列分析技术和基因识别方法的进 步,我们可以从DNA推导出大量的蛋白质序列。这意味着已知序列的蛋白质数量和已测定 结构的蛋白质数量(如蛋白质结构数据库PDB中的数据)的差距将会越来越大。人们希望 产生蛋白质结构的速度能够跟上产生蛋白质序列的速度,或者减小两者的差距。那么如何缩 小这种差距呢?我们不能完全依赖现有的结构测定技术,需要发展理论分析方法,这对蛋白 质结构预测提出了极大的挑战。20世纪60年代后期, Anfinsen首先发现去折叠蛋白或者说 变性( denatured)蛋白质在允许重新折叠的实验条件下可以重新折叠到原来的结构,这种天然 结构( native structure)对于蛋白质行使生物功能具有重要作用,大多数蛋白质只有在折叠成其 天然结构的时候才能具有完全的生物活性。自从 Anfinsen提出蛋白质折叠的信息隐含在蛋 白质的一级结构中,科学家们对蛋白质结构的预测进行了大量的研究,分子生物学家将有可 能直接运用适当的算法,从氨基酸序列出发,预测蛋白质的结构。本章主要着重介绍蛋白质 二级结构及空间结构预测的方法。 91引言 基因是生命的蓝图,蛋白质是生命的机器。来自于四种字符字母表(A,T(U),C, G)的核酸序列中蕴藏着生命的信息,而蛋白质则执行着生物体内各种重要的工作,如生物 化学反应的催化、营养物质的输运、生长和分化控制、生物信号的识别和传递等。蛋白质序 列由相应的核酸序列所决定,通过对基因的转录和翻译,将原来四字符的DNA序列,根据 三联密码规则翻译成20字符的蛋白质氨基酸序列。第九章 蛋白质序列分析与结构预测 一种生物体的基因组规定了所有构成该生物体的蛋白质,基因规定了组成蛋白质的氨基 酸序列。虽然蛋白质由氨基酸的线性序列组成,但是,它们只有折叠成特定的空间构象才能 具有相应的活性和相应的生物学功能。了解蛋白质的空间结构不仅有利于认识蛋白质的功 能,也有利于认识蛋白质是如何执行其功能的。确定蛋白质的结构对于生物学研究是非常重 要的。目前,蛋白质序列数据库的数据积累的速度非常快,但是,已知结构的蛋白质相对比 较少。尽管蛋白质结构测定技术有了较为显著的进展,但是,通过实验方法确定蛋白质结构 的过程仍然非常复杂,代价较高。因此,实验测定的蛋白质结构比已知的蛋白质序列要少得 多。另一方面,随着 DNA 测序技术的发展,人类基因组及更多的模式生物基因组已经或将 要被完全测序,DNA 序列数量将会急增,而由于 DNA 序列分析技术和基因识别方法的进 步,我们可以从 DNA 推导出大量的蛋白质序列。这意味着已知序列的蛋白质数量和已测定 结构的蛋白质数量(如蛋白质结构数据库 PDB 中的数据)的差距将会越来越大。人们希望 产生蛋白质结构的速度能够跟上产生蛋白质序列的速度,或者减小两者的差距。那么如何缩 小这种差距呢?我们不能完全依赖现有的结构测定技术,需要发展理论分析方法,这对蛋白 质结构预测提出了极大的挑战。20 世纪 60 年代后期,Anfinsen 首先发现去折叠蛋白或者说 变性(denatured)蛋白质在允许重新折叠的实验条件下可以重新折叠到原来的结构,这种天然 结构(native structure)对于蛋白质行使生物功能具有重要作用,大多数蛋白质只有在折叠成其 天然结构的时候才能具有完全的生物活性。自从 Anfinsen 提出蛋白质折叠的信息隐含在蛋 白质的一级结构中,科学家们对蛋白质结构的预测进行了大量的研究,分子生物学家将有可 能直接运用适当的算法,从氨基酸序列出发,预测蛋白质的结构。本章主要着重介绍蛋白质 二级结构及空间结构预测的方法。 9.1 引言 基因是生命的蓝图,蛋白质是生命的机器。来自于四种字符字母表(A,T(U),C, G)的核酸序列中蕴藏着生命的信息,而蛋白质则执行着生物体内各种重要的工作,如生物 化学反应的催化、营养物质的输运、生长和分化控制、生物信号的识别和传递等。蛋白质序 列由相应的核酸序列所决定,通过对基因的转录和翻译,将原来四字符的 DNA 序列,根据 三联密码规则翻译成 20 字符的蛋白质氨基酸序列
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有