第十一章蛋白质的生物合成 蛋白质是生命活动的重要物质基础,要不断地进行代谢和更新,因此,细胞内利用20 种基本氨基酸进行蛋白质合成便成了生命现象的主要内容。以大肠杆菌为例,蛋白质占细 胞的干重50%左右,每个细胞约有3000种不同的蛋白质分子,每种蛋白质又有无数分子。 而大肠杆菌细胞的分裂周期不过20mi,可见蛋白质生物合成的速度之快。 目前已经完全清楚,细胞内每个蛋白质分子的生物合成都受到细胞内DW的指导,但 是贮存遗传信总的DNA并非蛋白质合成的直接模板(template)。它是经转录作用把遗传信 息传递到信使核糖核酸(messenger ribonucleic acid.mRNA)的结构中,所以mRNA才是 蛋白质合成的直接模板。mRNA是由4种核苷酸构成的多核苷酸,而蛋白质是由20种左 右的氨基酸构成的多肽,它们之间遗传信息的传递并不像转录那么简单。从多核苷酸上所 携带的遗传信息,到多肽链上所携带的遗传信息的传递,与从一种语言翻译成另一种语言 时的情形相似。所以人们称以mRNA为模板的蛋白质合成过程为翻译或转译(translation)。 可以将生物遗传信息的传递归纳为以下图解(图1山1): 转录 DNA RNA译、蛋白质 反转录 复制(病毒) 图11!生物遗传信息的传递方向 翻译的过程十分复杂,几乎涉及到细胞内所有种类的NA和几十种蛋白质因子,其中 包括有核糖体RNA(ribosomal ribonucleic acid,rRNA)、信使RNA、转移RNA(transfer ,RNA)、氨酰-tRNA合成酶(aminoacyl-iRNA synthetase)以及一些辅助因 子,即起始因子(initiation factor.F)、延伸因子(elongation factor.EF)、释放因子(终l 因子)(release factor,RF)等参加的协同作用。 在蛋白质合成中,RNA按mRNA模板的要求将相应的氨基酸搬运到蛋白质合成的场 所 核糖体(ribosome)上,所以把核糖体称作蛋白质合成的工厂,氨基酸之间以肽键连 接,生成具有一定排列顺序的蛋白质。蛋白质合成的原料是氨基酸,反应所需能量由ATP 和GTP提供。 蛋白质生物合成的早期研究工作都是用原核生物(prokarvotes)大肠杆菌的无细胞体系 327
327 第十一章 蛋白质的生物合成 蛋白质是生命活动的重要物质基础,要不断地进行代谢和更新,因此,细胞内利用 20 种基本氨基酸进行蛋白质合成便成了生命现象的主要内容。以大肠杆菌为例,蛋白质占细 胞的干重 50%左右,每个细胞约有 3 000 种不同的蛋白质分子,每种蛋白质又有无数分子。 而大肠杆菌细胞的分裂周期不过 20min,可见蛋白质生物合成的速度之快。 目前已经完全清楚,细胞内每个蛋白质分子的生物合成都受到细胞内 DNA的指导,但 是贮存遗传信息的 DNA 并非蛋白质合成的直接模板(template)。它是经转录作用把遗传信 息传递到信使核糖核酸(messenger ribonucleic acid, mRNA)的结构中,所以 mRNA 才是 蛋白质合成的直接模板。mRNA 是由 4 种核苷酸构成的多核苷酸,而蛋白质是由 20 种左 右的氨基酸构成的多肽,它们之间遗传信息的传递并不像转录那么简单。从多核苷酸上所 携带的遗传信息,到多肽链上所携带的遗传信息的传递,与从一种语言翻译成另一种语言 时的情形相似。所以人们称以 mRNA 为模板的蛋白质合成过程为翻译或转译(translation)。 可以将生物遗传信息的传递归纳为以下图解(图 11-1): 图 11-1 生物遗传信息的传递方向 翻译的过程十分复杂,几乎涉及到细胞内所有种类的 RNA和几十种蛋白质因子,其中 包括有核糖体 RNA(ribosomal ribonucleic acid, rRNA)、信使 RNA、转移 RNA(transfer ribonucleic acid, tRNA)、氨酰-tRNA合成酶(aminoacyl-tRNA synthetase)以及一些辅助因 子,即起始因子(initiation factor, IF)、延伸因子(elongation factor, EF)、释放因子(终止 因子)(release factor, RF)等参加的协同作用。 在蛋白质合成中,tRNA 按 mRNA 模板的要求将相应的氨基酸搬运到蛋白质合成的场 所 核糖体(ribosome)上,所以把核糖体称作蛋白质合成的工厂,氨基酸之间以肽键连 接,生成具有一定排列顺序的蛋白质。蛋白质合成的原料是氨基酸,反应所需能量由 ATP 和 GTP 提供。 蛋白质生物合成的早期研究工作都是用原核生物(prokaryotes)大肠杆菌的无细胞体系 蛋白质 翻 译 复 制 D N A 复制(病毒) 转 录 反转录 R N A
(ce-free system)进行的。所以,对大肠杆菌的蛋白质合成机理了解最多,真核生物 (cukaryotes).的蛋白质合成的机理与大肠杆菌的有许多相似之处,但也有不少差异,下面即 详细讨论原核生物与真核生物的蛋白质的生物合成过程。 第一节蛋白质合成体系的重要组分 一、mRNA与遗传密码 (一)信使RNA概念的提出 信使RNA(messenger RNA,mRNA)的发现在分子生物学的发展中是一重大事件。由于 其在细胞,总RNA中所占比例很小,很难把它分离出来。mRNA的概念首先是从理论上提 出来的,然后再用实验得到证实。F.Jacob和J.Monod早在1961年就提出mRNA的概念。 他们认为,既然蛋白质是在胞质中合成的,而编码蛋白质的信息载体DNA却在胞核内 那么必定有一种中间物质用来传递DNA上的信总。他们在研究大肠杆菌中与乳糖代谢有 关醇类的生物合成时发现,诱导物如异丙基硫代半乳糖苷(B., PTG)的加入, 可以立刻使酶蛋白的合成速度增加上千倍。而诱导物 旦消失,又可使酶 蛋白的合成立刻停止。这个实验结果给人的启示是:蛋白质合成的模板是一种不稳定的物 质,其半衰期很短。他们对这种信使物质的性质作了如下的预言: 1.信使是一种多核苷酸: 2.信使的碱基组成应与相应的DNA的碱基组成相一致: 3.信使的长度应是不同的,因为由它们所编码的多肽链的长度是不同的 4.在多肽合成时信使应与核糖体作短暂的结合: 5信使的半期很短,所以信使的合成速度应该是很快的。 所以,这样的信使可能是一种RNA。但是当时已发现的两种RNA(RNA、RNA 都不具备这些特性。各种生物的核糖体RNA的大小差异不大,碱基组成的变化也不大。 RNA除了有与RNA相同的问题以外,它们的分子也太小。所以这两种RNA都不能胜任 信使的功能。可喜的是当时已有人提出过,细胞内有可能存在第三种RNA。在被噬菌 T,感染后的大肠杆菌中,有人发现有一种新的NA,它的代谢速度极快,分子大小也参 差不齐,碱基组成又与TDNA相一致。这些特征都符合信使分子的要求 (仁)信使RNA的实验证明 信使RNA的概念提出后,还必须要用实验来证明这种概念是否正确。为此,S.Brenner E.Jacob和4.Monocl等人设计了一组实验。用噬菌体T,感染大肠杆菌后,发现几乎所有 在细胞内合成的蛋白质都不再是细胞本身的蛋白质,而是噬菌体所编码的蛋白质:这些蛋 328
328 (cell-free system)进行的。所以,对大肠杆菌的蛋白质合成机理了解最多,真核生物 (eukaryotes)的蛋白质合成的机理与大肠杆菌的有许多相似之处,但也有不少差异,下面即 详细讨论原核生物与真核生物的蛋白质的生物合成过程。 第一节 蛋白质合成体系的重要组分 一、mRNA 与遗传密码 (一)信使 RNA概念的提出 信使 RNA(messenger RNA, mRNA)的发现在分子生物学的发展中是一重大事件。由于 其在细胞总 RNA 中所占比例很小,很难把它分离出来。mRNA 的概念首先是从理论上提 出来的,然后再用实验得到证实。F. Jacob 和 J. Monod 早在 1961 年就提出 mRNA 的概念。 他们认为,既然蛋白质是在胞质中合成的,而编码蛋白质的信息载体 DNA 却在胞核内, 那么必定有一种中间物质用来传递 DNA 上的信息。他们在研究大肠杆菌中与乳糖代谢有 关酶类的生物合成时发现,诱导物如异丙基硫代半乳糖苷(β-isopropylthiogalaotoside, IPTG)的加入,可以立刻使酶蛋白的合成速度增加上千倍。而诱导物一旦消失,又可使酶 蛋白的合成立刻停止。这个实验结果给人的启示是:蛋白质合成的模板是一种不稳定的物 质,其半衰期很短。他们对这种信使物质的性质作了如下的预言: 1.信使是一种多核苷酸; 2.信使的碱基组成应与相应的 DNA 的碱基组成相一致; 3.信使的长度应是不同的,因为由它们所编码的多肽链的长度是不同的; 4.在多肽合成时信使应与核糖体作短暂的结合; 5.信使的半衰期很短,所以信使的合成速度应该是很快的。 所以,这样的信使可能是一种 RNA。但是当时已发现的两种 RNA(rRNA、tRNA) 都不具备这些特性。各种生物的核糖体 RNA 的大小差异不大,碱基组成的变化也不大。 tRNA 除了有与 rRNA 相同的问题以外,它们的分子也太小。所以这两种 RNA 都不能胜任 信使的功能。可喜的是当时已有人提出过,细胞内有可能存在第三种 RNA。在被噬菌体 T2 感染后的大肠杆菌中,有人发现有一种新的 RNA,它的代谢速度极快,分子大小也参 差不齐,碱基组成又与 T2DNA 相一致。这些特征都符合信使分子的要求。 (二)信使 RNA的实验证明 信使 RNA 的概念提出后,还必须要用实验来证明这种概念是否正确。为此,S.Brenner, F. Jacob 和 M. Monocl 等人设计了一组实验。用噬菌体 T2感染大肠杆菌后,发现几乎所有 在细胞内合成的蛋白质都不再是细胞本身的蛋白质,而是噬菌体所编码的蛋白质;这些蛋
白质的合成速度与细胞总RNA的合成速度无关:T2感染后不久,细胞中出现了少量半衰 期很短的RNA,它们的碱基组成与DNA是一致的。上述这些特性都与他们预言的信使分 子特性十分符合。 那么噬菌体的感染又是怎样将细胞内蛋白质合成的方向改变了呢?当时曾提出了两种 假设。一种认为T2的感染引起了一类新的核糖体的合成,不同的核糖体控制不同的蛋白质 的合成:另一种假设认为核糖体并不具有这种特异性,它的功能只不过是从mRNA接受 遗传信息而己。Brenner,Jacob,Meselson等人支持后一种看法。于是他们又设计了一组 实验来解决这个问题。 他1将大肠杆南接种在含有重标记N和C)的培养基上,再用T,成染。感染后立刻 将细菌转移到含有轻同位素N和PC)的培养基上。再将感染前与感染后的细菌破碎 分离出核糖体,用密度梯度超离心技术将带有重同位素的核糖体与带有轻同位素的核糖体 分开。他们还用m4一“一一 一一一门新合成的蛋白质。 这些实验表明() 割 密度 图12正常的与经嘴菌体T,感染后的大肠杆菌 核糖体的密度梯度超离心图 1.工感染后并无轻标记核糖体出现,说明在T2感染后并未引起新核糖体的合成。 2.T,成染后,诱发了新的RNA的合成。大名数放射性标记的RNA出现在重标记核 糖体中。这种新合成的RNA代谢速度极快。 3.5、标记的蛋白质只暂时出现在重标记核糖体中,说明新合成的蛋白质是在早就存 在的核糖体中合成的。 以后,S.spiegelman又用分子杂交技术证明:经T2感染后的新合成的RNA可以与 T,DNA相杂交,但细胞内的其他RNA则不能与TDNA杂交。 329
329 白质的合成速度与细胞总 RNA 的合成速度无关;T2感染后不久,细胞中出现了少量半衰 期很短的 RNA,它们的碱基组成与 DNA 是一致的。上述这些特性都与他们预言的信使分 子特性十分符合。 那么噬菌体的感染又是怎样将细胞内蛋白质合成的方向改变了呢?当时曾提出了两种 假设。一种认为 T2的感染引起了一类新的核糖体的合成,不同的核糖体控制不同的蛋白质 的合成;另一种假设认为核糖体并不具有这种特异性,它的功能只不过是从 mRNA 接受 遗传信息而已。Brenner,Jacob,Meselson 等人支持后一种看法。于是他们又设计了一组 实验来解决这个问题。 他们将大肠杆菌接种在含有重标记( 15N 和 13C)的培养基上,再用 T2 感染。感染后立刻 将细菌转移到含有轻同位素( 14N 和 12 C)的培养基上。再将 T2 感染前与感染后的细菌破碎, 分离出核糖体,用密度梯度超离心技术将带有重同位素的核糖体与带有轻同位素的核糖体 分开。他们还用 32 P 或用 14C-尿苷去标记 RNA,并用 35 S-甲硫氨酸去标记新合成的蛋白质。 这些实验表明(见图 11-2): 图 11-2 正常的与经噬菌体 T2感染后的大肠杆菌 核糖体的密度梯度超离心图 1.T2 感染后并无轻标记核糖体出现,说明在 T2 感染后并未引起新核糖体的合成。 2.T2 感染后,诱发了新的 RNA 的合成。大多数放射性标记的 RNA 出现在重标记核 糖体中。这种新合成的 RNA 代谢速度极快。 3.35 S 标记的蛋白质只暂时出现在重标记核糖体中,说明新合成的蛋白质是在早就存 在的核糖体中合成的。 以后,S. spiegelman 又用分子杂交技术证明:经 T2 感染后的新合成的 RNA 可以与 T2DNA 相杂交,但细胞内的其他 RNA 则不能与 T2DNA 杂交
(三)责传密码 1.遗传密码的发现 mRNA是蛋白质合成的直接模板,其核苷酸排列顺序取决于相应DNA的碱基排列顺 序,它又决定了所形成的蛋白质多肽链中的氨基酸的排列顺序。那么mRNA上的核苷酸 排列顺序是如何翻译成蛋白质中的氨基酸的排列顺序,即如何编码成遗传密码的呢? mRNA中有4种核苷酸,用数学方法推算,如果每一种核苷酸代表一种氨基酸,那么 只能代表4种氨基酸。如果每两个相邻的核苷酸代表一种氨基酸,可以有4-16种排列方 式,显然也不足以代表20种基本氨基酸。如果每三个相邻的核苷酸代表一种氨基酸,可 以有4-64种排列方式,这就足以满足为20种基本氨基酸编码的需要。所以这种编码方 式的可能性最大。应用生物化学和遗传学研究技术,已经证明是三个相邻的核苷酸编码 种氨基酸,这三个连续的核苷酸称为三联体密码((riplet code)或密码子(codon).。 如何证明密码子和氨基酸之间的对应关系?1961年,Nirenberg等用大肠杆菌无细胞体 系,外加20种标记氨基酸混合物及0vU,经保温反应后,发现在酸不溶性部分中(即多 肽中)只有苯丙氨酸的多聚体。所以UUU是编码苯丙氨酸的密码。同样,用polyA和pOlC 作为mRNA来合成蛋白质,结果分别只得到多聚赖氨酸和多聚脯氨酸,说明AAA是赖氨 酸的密码,CCC是脯氨酸的密码。 进一步,Nirenberg和Ochoa等用polyUG,polyAC重复上述类似实验,发现标记氨基 酸掺入新合成的肽链的频率与按统计学方法推算出的多核苷酸中三联体密码出现的频率 相符合。即 ol(UG):UGU GUG UGU GUG UGU GUG UGU GUG 翻译成:Cvs-Val-Cvs.Val-Cvs-Val poly(AC):ACACACACA CAC ACACACACACAC 翻译成:Thr-His-Thr-His-Thr-His 应用这种方法,仅用了四年时间,于1965年完全查清了20种基本氨基酸所对应的全 部61个密码子,其余三个密码子为终止密码子,编出了遗传密码字典(表111)。 330
330 (三)遗传密码 1.遗传密码的发现 mRNA 是蛋白质合成的直接模板,其核苷酸排列顺序取决于相应 DNA 的碱基排列顺 序,它又决定了所形成的蛋白质多肽链中的氨基酸的排列顺序。那么 mRNA 上的核苷酸 排列顺序是如何翻译成蛋白质中的氨基酸的排列顺序,即如何编码成遗传密码的呢? mRNA 中有 4 种核苷酸,用数学方法推算,如果每一种核苷酸代表一种氨基酸,那么 只能代表 4 种氨基酸。如果每两个相邻的核苷酸代表一种氨基酸,可以有 4 2 =16 种排列方 式,显然也不足以代表 20 种基本氨基酸。如果每三个相邻的核苷酸代表一种氨基酸,可 以有 4 3 =64 种排列方式,这就足以满足为 20 种基本氨基酸编码的需要。所以这种编码方 式的可能性最大。应用生物化学和遗传学研究技术,已经证明是三个相邻的核苷酸编码一 种氨基酸,这三个连续的核苷酸称为三联体密码(triplet code)或密码子(codon)。 如何证明密码子和氨基酸之间的对应关系?1961 年,Nirenberg 等用大肠杆菌无细胞体 系,外加 20 种标记氨基酸混合物及 polyU,经保温反应后,发现在酸不溶性部分中(即多 肽中)只有苯丙氨酸的多聚体。所以 UUU是编码苯丙氨酸的密码。同样,用 polyA 和 polyC 作为 mRNA 来合成蛋白质,结果分别只得到多聚赖氨酸和多聚脯氨酸,说明 AAA 是赖氨 酸的密码,CCC 是脯氨酸的密码。 进一步,Nirenberg 和 Ochoa 等用 polyUG,polyAC 重复上述类似实验,发现标记氨基 酸掺入新合成的肽链的频率与按统计学方法推算出的多核苷酸中三联体密码出现的频率 相符合。即 poly(UG): UGU GUG UGU GUG UGU GUG UGU GUG 翻译成: Cys-Val-Cys-Val-Cys-Val poly(AC): ACA CAC ACA CAC ACA CAC ACA CAC 翻译成: Thr-His-Thr-His-Thr-His 应用这种方法,仅用了四年时间,于 1965 年完全查清了 20 种基本氨基酸所对应的全 部 61 个密码子,其余三个密码子为终止密码子,编出了遗传密码字典(表 11-1)
表11-1遗传密码字典 5·-磷酸末 中间的碱 基 3'-OH末端 端的碱基 A 的碱基 苯丙氨酸 丝氨酸 酪氨酸 半胱氨酸 U U 苯丙氨酸 丝氨酸 酪氨酸 半胱氨酸 c 亮氨解 掉氨的 终止信号 终止信号 A 亮氨酯 丝氨酸 终止信号 色氨酸 G 亮氨酸 躺氨酸 组氨酸 精氨酸 亮氨酪 氨酸 组氨酸 精氨酶 c 亮氨酸 脂氨酸 谷酰胺 精氨酸 A 亮氨酸 氨酸 谷酰胺 精氨酸 G 异亮氨酸 苏氨酸 天冬酰胺 丝氨 U 异亮氨酸 苏氨酸 天冬酰酸 丝氨酾 异亮氨酸 苏氨酸 氨酸 精氨酸 甲硫氨酸和甲酰甲硫氨酸 苏氨酸 赖氨酸 精氨酸 G 缬氨酸 丙氨酸 天冬氨酸 甘氨酸 11 缬氨酸 丙氨剥 天冬氨酸 甘氨酸 C 缬氨酸 丙氨酸 谷氨酸 甘氨酸 A 数氨酸 丙氨酸谷氨酸 甘氨酸 G ‘密码子的阅读方向5'一3',如UUA-pUpUpAot=亮氨酸。AUG为起始密码子. 以上谈的都是应用无细胞体系所获得的资料。那么生物体内的情况是否也是如此呢? 回答是肯定的。 烟草坏死卫星病毒(tobacco necrosis satellite virus)的基因组中有一RNA,约由1200 个核苷酸所组成,外壳蛋白的亚基由此RNA分子编码。经分析,每个蛋白亚基约由 400个氨基酸组成,所以用于编码一个氨基酸的数目恰好为1200/400=3。 用遗传学方法也证明了遗传信息是三联体密码。用某些吖(读音yā)啶染料可以引起 T噬菌体DNA插入或去1、2或3个碱基。实验的原理可用假设的噬茵体DNA加以说 明。 331
331 表 11-1 遗传密码字典 * 5ˊ-磷酸末 中 间 的 碱 基 端的碱基 U C A G 3ˊ-OH 末端 的碱基 U 苯丙氨酸 苯丙氨酸 亮氨酸 亮氨酸 丝氨酸 丝氨酸 丝氨酸 丝氨酸 酪氨酸 酪氨酸 终止信号 终止信号 半胱氨酸 半胱氨酸 终止信号 色氨酸 U C A G C 亮氨酸 亮氨酸 亮氨酸 亮氨酸 脯氨酸 脯氨酸 脯氨酸 脯氨酸 组氨酸 组氨酸 谷酰胺 谷酰胺 精氨酸 精氨酸 精氨酸 精氨酸 U C A G A 异亮氨酸 异亮氨酸 异亮氨酸 甲硫氨酸和甲酰甲硫氨酸 苏氨酸 苏氨酸 苏氨酸 苏氨酸 天冬酰胺 天冬酰胺 赖氨酸 赖氨酸 丝氨酸 丝氨酸 精氨酸 精氨酸 U C A G G 缬氨酸 缬氨酸 缬氨酸 缬氨酸 丙氨酸 丙氨酸 丙氨酸 丙氨酸 天冬氨酸 天冬氨酸 谷氨酸 谷氨酸 甘氨酸 甘氨酸 甘氨酸 甘氨酸 U C A G *密码子的阅读方向 5ˊ→3ˊ,如 UUA=pUpUpAoH = 亮氨酸。AUG 为起始密码子。 以上谈的都是应用无细胞体系所获得的资料。那么生物体内的情况是否也是如此呢? 回答是肯定的。 烟草坏死卫星病毒(tobacco necrosis satellite virus)的基因组中有一 RNA,约由 1 200 个核苷酸所组成,外壳蛋白的亚基由此 RNA 分子编码。经分析,每个蛋白亚基约由 400 个氨基酸组成,所以用于编码一个氨基酸的数目恰好为 1 200/400=3。 用遗传学方法也证明了遗传信息是三联体密码。用某些吖(读音 yā)啶染料可以引起 T4 噬菌体 DNA 插入或删去 1、2 或 3 个碱基。实验的原理可用假设的噬菌体 DNA 加以说 明
别去碱基的数目 0 CATCATCAT CAT CAT CAT CAT 1 CAT CTC ATCATC ATC ATC ATC A 2 CAT CTC ACA TCA TCATCA TCA A T CAT CTC ACA TAT CATCAT CAT A T 当删去一个碱基A时,从这一点以后的密码就发生了差错。删去两个碱基时,情形 也如此。但是别去三个碱基时,情况就不同了。最先也形成几组错误的密码子,但以后又 恢复正常。前面两类突变往往使基因产物全部失去活力,而第三种突变类型使基因产物仍 具有一定活力。这只能用遗传密码是三联体这个事实来加以解释。 2.遗传密码的主要特征: (1)密码的无标点性即两个密码子之间没有任何起标点符号作用的密码子加以隔 开。因此要正确阅读密码必须按一定的读码框架((reading frame),从一个正确的起点开始, 一个不漏地挨若读下去,直至碰到终止信号为止。若插入(insertion)或刑去(deletion)一个 碱基,就会使这以后的读码发生错误,这称移码(rame-shif)。由于移码引起的突变称移 码突变(frame-shift mutation)。 (2)一般情形下遗传密码是不重叠(non-overlapping)的是指每三个碱基编码一个 氨基酸,碱基不重复使用。即 ABC DEF GHI JKL aa.aa an aa. 目前已经证明,在绝大多数生物中读码规则是不重叠的。但是在少数大肠杆菌噬菌体 (如R、QB等)的RNA基因组中,部分基因的遗传密码却是重叠的。 (3)密码的简并性(degeneracy)是指大多数氨基酸都可以具有几组不同的密码子 (见表-2)。如UUA、UUG、CUU、CUC、CUA、CUG六组密码子都编码亮氨酸。编 码同一个氨基酸的一组密码称为同义密码子。只有色氨酸和甲硫氨酸仅有一个密码子。 密码的简并性具有重要的生物学意义。它可以减少有害的突变。一方面,如果每个氨 基酸只有一个密码子,20组密码子就可以应付20种氨基酸的编码了,那么剩下的4组密 码子都将会导致肽链合成的终止。由于突变而引起的肽链合成终止的频率也会大大提高。 这样合成出来的残缺不全的多肽往往不具有生物活力。 332
332 删去碱基的数目 0 CAT CAT CAT CAT CAT CAT CAT 1 CAT CTC ATC ATC ATC ATC ATC ↓ A 2 CAT CTC ACA TCA TCA TCA TCA ↓ ↓ A T 3 CAT CTC ACA TAT CAT CAT CAT ↓ ↓ ↓ A T C 当删去一个碱基 A 时,从这一点以后的密码就发生了差错。删去两个碱基时,情形 也如此。但是删去三个碱基时,情况就不同了。最先也形成几组错误的密码子,但以后又 恢复正常。前面两类突变往往使基因产物全部失去活力,而第三种突变类型使基因产物仍 具有一定活力。这只能用遗传密码是三联体这个事实来加以解释。 2.遗传密码的主要特征: (1)密码的无标点性 即两个密码子之间没有任何起标点符号作用的密码子加以隔 开。因此要正确阅读密码必须按一定的读码框架(reading frame),从一个正确的起点开始, 一个不漏地挨着读下去,直至碰到终止信号为止。若插入(insertion)或删去(deletion)一个 碱基,就会使这以后的读码发生错误,这称移码(frame-shift)。由于移码引起的突变称移 码突变(frame-shift mutation)。 (2)一般情形下遗传密码是不重叠(non-overlapping)的 是指每三个碱基编码一个 氨基酸,碱基不重复使用。即 ABC DEF GHI JKL ↓ ↓ ↓ ↓ aa1 aa2 aa3 aa4 目前已经证明,在绝大多数生物中读码规则是不重叠的。但是在少数大肠杆菌噬菌体 (如 R17、Qβ等)的 RNA 基因组中,部分基因的遗传密码却是重叠的。 (3)密码的简并性(degeneracy) 是指大多数氨基酸都可以具有几组不同的密码子 (见表 11-2)。如 UUA、UUG、CUU、CUC、CUA、CUG 六组密码子都编码亮氨酸。编 码同一个氨基酸的一组密码称为同义密码子。只有色氨酸和甲硫氨酸仅有一个密码子。 密码的简并性具有重要的生物学意义。它可以减少有害的突变。一方面,如果每个氨 基酸只有一个密码子,20 组密码子就可以应付 20 种氨基酸的编码了,那么剩下的 44 组密 码子都将会导致肽链合成的终止。由于突变而引起的肽链合成终止的频率也会大大提高。 这样合成出来的残缺不全的多肽往往不具有生物活力
另一方面,密码简并使DNA的碱基组成有较大的变化余地,而仍保持多肽的氨基酸序 列不变。如亮氨酸的密码子CAU中C突变成U时,密码子UA决定的仍是亮氨酸,即这种 基因的突变并没有引起基因表达产物 蛋白质的变化。 表11-2氨基酸密码子的简并性 氨基酸 密码子数目 氨基酸 密码子数目 丙氨酸 4 亮氨酸 6 桔氨酸 6 赖氨酸 2 天冬酰脑 2 甲硫氨酸 天冬氨酸 苯丙氨酸 2 半胱氨酸 2 脯氨酸 4 谷酰胺 2 丝氨酸 6 谷氨酸 苏氨酸 甘氨酸 ¥ 色氨酸 1 组氨酸 2 酪氨酸 2 异亮氨酸 3 缬氨酸 4 (4)密码的摆动性(wobbIe) 是指密码子的专一性主要由头两位碱基决定,而第 位碱基有较大的灵活性。Cck对第三位碱基的这一特性给予一个专门的术语,称“摆动 性”(见表11-3)。当第三位碱基发生突变时,仍能翻译出正确的氨基酸来,从而使合成的 多肽仍具有生物学活力。 表11-3密码子识别的摆动现象 RNA反密码子第一位碱热 (3·→5·) mRNA密码子第三位碱基A或GG UC或UU或C或AAGU 5·3·) (5)密码的相对通用性所谓密码的通用性是指各种高等和低等的生物(包括病毒、 细胞及真核生物等)都共同使用同一套密码字典。较早时,曾认为密码是完全通用的。但 是1979年的发现对此提出了挑战。线粒体DNA中的编码情形显然违背了遗传密码的通用 性。如人线粒体中UG不再是终止密码子,而编码色氨酸。表114列出了人线粒体基因 组编码的特性。 333
333 另一方面,密码简并使 DNA的碱基组成有较大的变化余地,而仍保持多肽的氨基酸序 列不变。如亮氨酸的密码子 CAU中 C突变成 U时,密码子 UUA决定的仍是亮氨酸,即这种 基因的突变并没有引起基因表达产物 蛋白质的变化。 表 11-2 氨基酸密码子的简并性 氨基酸 密码子数目 氨基酸 密码子数目 丙氨酸 精氨酸 天冬酰胺 天冬氨酸 半胱氨酸 谷酰胺 谷氨酸 甘氨酸 组氨酸 异亮氨酸 4 6 2 2 2 2 2 4 2 3 亮氨酸 赖氨酸 甲硫氨酸 苯丙氨酸 脯氨酸 丝氨酸 苏氨酸 色氨酸 酪氨酸 缬氨酸 6 2 1 2 4 6 4 1 2 4 (4)密码的摆动性(wobble) 是指密码子的专一性主要由头两位碱基决定,而第三 位碱基有较大的灵活性。Crick 对第三位碱基的这一特性给予一个专门的术语,称“摆动 性”(见表 11-3)。当第三位碱基发生突变时,仍能翻译出正确的氨基酸来,从而使合成的 多肽仍具有生物学活力。 表 11-3 密码子识别的摆动现象 tRNA 反密码子第一位碱基 (3ˊ→5ˊ) U C A G I ψ mRNA 密码子第三位碱基 (5ˊ→3ˊ) A 或 G G U C 或 U U 或 C 或 A AG(U) (5)密码的相对通用性 所谓密码的通用性是指各种高等和低等的生物(包括病毒、 细胞及真核生物等)都共同使用同一套密码字典。较早时,曾认为密码是完全通用的。但 是 1979 年的发现对此提出了挑战。线粒体 DNA 中的编码情形显然违背了遗传密码的通用 性。如人线粒体中 UGA 不再是终止密码子,而编码色氨酸。表 11-4 列出了人线粒体基因 组编码的特性
表11-4人线粒体DW中密码编制特点 密码 “通用”密码 人线粒体密码 UGA 终止密码 Trp AGA Arg 终止密码 AGG g 终止密码 AUA lle 起始密码(Me或le) AUU Ile 起始密码(le) AUG 起始密码(Mct或fMct) 起始毫码(ct)】 酵母线粒体原生动物纤毛虫也有类似情形。 AGA, AGG不再是终止信号而编码精氨 酸。 所以,遗传密码具有相对的通用性。 (6)起始密码子和终止密码子在64种密码子中,AUG既是甲硫氨酸的密码子, 又是肽链合成的起始密码子。有三组密码子UAA,UAG,UGA不编码任何氨基酸而成为 肽链合成的终止密码子,又称无义密码子。 二、tRNA 在蛋白质合成中,tRNA是搬运活性氨基酸的工具。它将氨基酸按照mRNA链上的密 码子所决定的氨基酸顺序搬运到蛋白质合成的场所核糖体的特定部位。RNA是多肽 麟和mRNA之间的重要转换器(adaptor),每一种氨基酸可以有一种以上tRNA作为运载工 具,人们把携带相同氨基酸而反密码子不同的一组tRNA称为同功受体RNA((isoaccepting tRNAs))。RNA在识别密码子上的接头作用: RNA分子上与多肽合成有关的位点至少有四个: 1.3”端-CCA上的氨基酸接受位点 RNA分子的3·端的碱基顺序是-CCA,“活化的氨基酸的羧基连接到3·末端腺苷 的核糖3·OH上,形成氨酰RNA。 A 334
334 表 11-4 人线粒体 DNA中密码编制特点 密码 “通用” 密码 人线粒体密码 UGA AGA AGG AUA AUU AUG 终止密码 Arg Arg Ile Ile 起始密码(Met 或 fMet) Trp 终止密码 终止密码 起始密码(Met 或 Ile) 起始密码(Ile) 起始密码(Met) 酵母线粒体原生动物纤毛虫也有类似情形。AGA,AGG 不再是终止信号而编码精氨 酸。 所以,遗传密码具有相对的通用性。 (6)起始密码子和终止密码子 在 64 种密码子中,AUG 既是甲硫氨酸的密码子, 又是肽链合成的起始密码子。有三组密码子 UAA,UAG,UGA 不编码任何氨基酸而成为 肽链合成的终止密码子,又称无义密码子。 二、tRNA 在蛋白质合成中,tRNA 是搬运活性氨基酸的工具。它将氨基酸按照 mRNA 链上的密 码子所决定的氨基酸顺序搬运到蛋白质合成的场所 核糖体的特定部位。tRNA 是多肽 链和 mRNA 之间的重要转换器(adaptor),每一种氨基酸可以有一种以上 tRNA 作为运载工 具,人们把携带相同氨基酸而反密码子不同的一组 tRNA 称为同功受体 tRNA(isoaccepting tRNAs)。tRNA 在识别密码子上的接头作用: tRNA 分子上与多肽合成有关的位点至少有四个: 1. 3ˊ端-CCA 上的氨基酸接受位点 tRNA 分子的 3ˊ端的碱基顺序是-CCA,“活化¡±的氨基酸的羧基连接到 3ˊ末端腺苷 的核糖 3ˊ-OH 上,形成氨酰- tRNA
2.识别氨酰-RNA合成酶的位点 形成氨酰:RNA的反应是在氨酰RNA合成酶催化下完成的。这个反应需要三种底 物,即氨基酸、RNA和ATP。由ATP提供活化氨基酸所需要的能量。一种氨酰-RNA 合成班以识别一组同功受体RNA(最多达6个)。 3.核糖体识别位点 在核糖体内合成多肽链的过程中,多肽链通过tRNA暂时结合在核糖体的正确位置上, 直至合成终止后多肽链才从核糖体上脱下。RNA起着连接这条多肽链和核糖体的作用。 4.反密码子位点 在RNA链上有三个特定的碱基,组成一个反密码子,反码 子与密码子的方向相反。由这反密码子按碱基配对原则识别mRNA链上的密码子(见图 II3)。一种RNA分子常常能够识别一种以上的同义密码子,这是因为RNA分子上的反 密码子与密码子的配对具有摆动性,配对的摆动性是由RNA反密码子环的空间结构决定 的。反密码子5‘端的碱基处于L形tRNA的顶端,受到的碱基堆积力的束缚较小,因此 有较大的自由度。而且该位置的碱基常为修饰的碱基,如次黄票吟1,它可以和U、C、 A三种碱基配对,具有非凡的“阅读”能力。分析表明同义密码子的使用频率是不相同的, 它与细胞内RNA含量(即RNA的丰度)成正相关,含量高的同功受体RNA所对应的 密码子的使用频*总是最高 CC G 3 mRNA 图1-3密码子与反密码子之间的识别 三、rRNA与核糖体 核糖体是蛋白质合成的装配机,是由几十种蛋白质和几种RA组成的亚细胞颗粒,其 中蛋白质与RNA的重量比约为1:2,是tRNA、mRNA和蛋白质相互作用的场所。早在 1950年就有人将放射性同位素标记的氨基酸注射到小鼠体内,经短时间后,取出肝脏,制 335
335 2.识别氨酰-tRNA 合成酶的位点 形成氨酰-tRNA 的反应是在氨酰-tRNA 合成酶催化下完成的。这个反应需要三种底 物,即氨基酸、tRNA 和 ATP 。由 ATP 提供活化氨基酸所需要的能量。一种氨酰-tRNA 合成酶可以识别一组同功受体 tRNA(最多达 6 个)。 3.核糖体识别位点 在核糖体内合成多肽链的过程中,多肽链通过 tRNA 暂时结合在核糖体的正确位置上, 直至合成终止后多肽链才从核糖体上脱下。tRNA 起着连接这条多肽链和核糖体的作用。 4.反密码子位点 在 tRNA 链上有三个特定的碱基,组成一个反密码子,反密码 子与密码子的方向相反。由这反密码子按碱基配对原则识别 mRNA 链上的密码子(见图 11-3)。一种 tRNA 分子常常能够识别一种以上的同义密码子,这是因为 tRNA 分子上的反 密码子与密码子的配对具有摆动性,配对的摆动性是由 tRNA 反密码子环的空间结构决定 的。反密码子 5ˊ端的碱基处于 L 形 tRNA 的顶端,受到的碱基堆积力的束缚较小,因此 有较大的自由度。而且该位置的碱基常为修饰的碱基,如次黄嘌呤 I,它可以和 U、C 、 A 三种碱基配对,具有非凡的“阅读”能力。分析表明同义密码子的使用频率是不相同的, 它与细胞内 tRNA 含量(即 tRNA 的丰度)成正相关,含量高的同功受体 tRNA 所对应的 密码子的使用频率总是最高。 图 11-3 密码子与反密码子之间的识别 三、rRNA 与核糖体 核糖体是蛋白质合成的装配机,是由几十种蛋白质和几种 RNA组成的亚细胞颗粒,其 中蛋白质与 RNA 的重量比约为 1∶2,是 tRNA、mRNA 和蛋白质相互作用的场所。早在 1950 年就有人将放射性同位素标记的氨基酸注射到小鼠体内,经短时间后,取出肝脏,制
成匀浆,离心,分成核、线粒拉体、微粒体及上清等组分。发现微粒体中的放射性强度最高 再用去污剂(如脱氧胆酸)处理微粒体,将核糖体从内质网中分离出来,发现核糖体的放 射强度比微粒体的要高7倍。这就说明核糖体是合成蛋白质的部位。 核糖体是一个巨大的核糖体蛋白体。在原核细胞中,它可以游离形式存在,也可以与 mRNA结合形成串状的多核糖体。平均每个细胞约有2000个核糖体。真核细胞中的核糖 体既可游离存在,也可以与细胞内质树相结合,形成粗植内质网。每个真核细胞所含核糖 体的数目要多得多,为10-10个。线粒体、叶绿体及细胞核内也有自己的核糖体。表11-5 总结了不同生物核糖体的一些特性。 表11-5核糖体的某些特性 核糖体种类 亚基 RNA(分子量) 蛋白质分子数目 原核细胞核糖休 30s 16S(5.510 21 (以大肠杆茵为例 70s r5S(0.4103) 34 50s 235(11010) 40S 18S(7010) n30 真核细胞核糖体 -5s(0410) ∽50 60 128-295(140-180105) 核糖体含3种RNA和55种蛋白质,这些成分如何组装成具有活性的核糖体,是 个值得深入研究的问题。在1968年第一次完成了大肠杆菌核糖体小亚基由其RNA和蛋 白质在体外的重新组装。这个重组装的颗粒具有与30S亚基功能完全相同的蛋白质合成活 性。重组装只需16SNA和21种蛋白质,而不需要加入其它组分(如酶或特殊因子),表 明这是一个“自我组装”(self-assembly)的过程。所谓自我组装,是指进行组装所需要的 全部信息都在亚基结构里,其蛋白质和RNA都带有规定组装过程的信息。自我组装的驱 动力包括水性相互作用、氢键和离子相互作用,以及碱基堆叠之间的相互作用等。 讲一一步的研究发现,这个组装过程有一定顺序,即某种蛋白质的加入要先于其它蛋白 质的加入。而且各组分的加入是有协同作用的,即一种组分的加入加强了下一种组分的加 入。图11-4概略地表示出大肠杆菌核糖体的30S和50S亚基的组装过程。在30S亚基的 组装过程中,以16SRNA为骨架,先与15种蛋白质结合(实际上,这些蛋白质的结合也 有先后),形成21S颗粒。然后再加上其余6种蛋白质,最后组装成30S亚基。这个组装 过程,可能在16SRNA转录开始之后即行发生,因为在RNA链上结合最强的部位,都 集中在最先转录的5端。 大肠杆菌核糖体50S亚基的组装比较复杂,它包括两种(23S和5S)rRNA,而且蛋白 质数目也较多。先由23SRNA,5SRNA与约20种L蛋白结合,生成33S颗粒。然后再 加上其余蛋白质,组装成41S颗粒。最后在Mg2+(0C)和50℃下转变为50S亚基。 336
336 成匀浆,离心,分成核、线粒体、微粒体及上清等组分。发现微粒体中的放射性强度最高。 再用去污剂(如脱氧胆酸)处理微粒体,将核糖体从内质网中分离出来,发现核糖体的放 射强度比微粒体的要高 7 倍。这就说明核糖体是合成蛋白质的部位。 核糖体是一个巨大的核糖体蛋白体。在原核细胞中,它可以游离形式存在,也可以与 mRNA 结合形成串状的多核糖体。平均每个细胞约有 2 000 个核糖体。真核细胞中的核糖 体既可游离存在,也可以与细胞内质网相结合,形成粗糙内质网。每个真核细胞所含核糖 体的数目要多得多,为 10 6 ~10 7个。线粒体、叶绿体及细胞核内也有自己的核糖体。表 11-5 总结了不同生物核糖体的一些特性。 表 11-5 核糖体的某些特性 核糖体种类 亚基 rRNA(分子量) 蛋白质分子数目 原核细胞核糖体 (以大肠杆菌为例) 30S 70S 50S 16S(5.5 10 5) 5S(0.4 10 5) 23S(110 10 5) 21 34 真核细胞核糖体 40S 80S 60S 18S(∽70 10 5) 5S(0.4 10 5) 28-29S(140-180 10 5) ∽30 ∽50 核糖体含 3 种 rRNA 和 55 种蛋白质,这些成分如何组装成具有活性的核糖体,是一 个值得深入研究的问题。在 1968 年第一次完成了大肠杆菌核糖体小亚基由其 rRNA 和蛋 白质在体外的重新组装。这个重组装的颗粒具有与 30S 亚基功能完全相同的蛋白质合成活 性。重组装只需 16SrRNA 和 21 种蛋白质,而不需要加入其它组分(如酶或特殊因子),表 明这是一个“自我组装”(self-assembly)的过程。所谓自我组装,是指进行组装所需要的 全部信息都在亚基结构里,其蛋白质和 rRNA 都带有规定组装过程的信息。自我组装的驱 动力包括水性相互作用、氢键和离子相互作用,以及碱基堆叠之间的相互作用等。 进一步的研究发现,这个组装过程有一定顺序,即某种蛋白质的加入要先于其它蛋白 质的加入。而且各组分的加入是有协同作用的,即一种组分的加入加强了下一种组分的加 入。图 11-4 概略地表示出大肠杆菌核糖体的 30S 和 50S 亚基的组装过程。在 30S 亚基的 组装过程中,以 16SrRNA 为骨架,先与 15 种蛋白质结合(实际上,这些蛋白质的结合也 有先后),形成 21S 颗粒。然后再加上其余 6 种蛋白质,最后组装成 30S 亚基。这个组装 过程,可能在 16SrRNA 转录开始之后即行发生,因为在 rRNA 链上结合最强的部位,都 集中在最先转录的 5ˊ端。 大肠杆菌核糖体 50S 亚基的组装比较复杂,它包括两种(23S 和 5S)rRNA,而且蛋白 质数目也较多。先由 23SrRNA,5SrRNA 与约 20 种 L 蛋白结合,生成 33S 颗粒。然后再 加上其余蛋白质,组装成 41S 颗粒。最后在 Mg 2+(0℃)和 50℃下转变为 50S 亚基