第十二章蛋白质的生物合成及转运 蛋白质的生物合成在细胞代谢中占有十分重要的地位。目前己经完全清楚,贮存遗传 信息的DNA并不是蛋白质合成的直接模板,DNA上的遗传信息需要通过转录传递给 mRNA。mRNA才是蛋白质合成的直接模板。mRNA是由4种核苷酸构成的多核苷酸,而 蛋白质是由20种左右的氨基酸构成的多肽,它们之间遗传信息的传递与从一种语言翻译成 另一种语言时的情形相似。所以人们称以mRNA为模板合成蛋白质的过程为翻译或转译 (translation) 翻译的过程十分复杂,几乎涉及到细胞内所有种类的RNA和几十种蛋白质因子。蛋 白质合成的场所是核糖体,合成的原料是氨基酸,反应所需能量由AP和GTP提供。蛋 白质合成的早期研究工作都是用大肠杆菌的无细胞体系进行的,所以对大肠杆菌的蛋白质 合成机理了解最多。真核细胞蛋白质合成的机理与大肠杆菌的有许多相似之处。 第一节遗传密码 任何一种天然多肽都有其特定的严格的氨基酸序列。有机界拥有1010~10种不同的 蛋白质,构成数目这么庞大的不同的多肽的单体却只有20种氨基酸。氨基酸在多肽中的不 同排列次序是蛋白质多样性的基础。目前已经清楚,多肽上氨基酸的排列次序最终是由 DNA上核苷酸的排列次序决定的,而直接决定多肽上氨基酸次序的却是mRNA。不论是 DNA还是mRNA,基本上都由4种核苷酸构成。这4种核苷酸如何编制成遗传密码,遗 传密码又如何被翻译成20种氨基酸组成的多肽,这就是蛋白质生物合成中的遗传密码的翻 译问题 、密码单位 用数学方法推算,如果mRNA分子中的一种碱基编码一种氨基酸,那么4种碱基只能 决定4种氨基酸,而蛋白质分子中的氨基酸有20种,所以显然是不行的。如果由mRNA 分子中每2个相邻的碱基编码一种氨基酸,也只能编码43=-16种氨基酸,仍然不够。如果 采用每3个相邻的碱基为一个氨基酸编码,则4=64,可以满足20种氨基酸编码的需要 所以这种编码方式的可能性最大。应用生物化学和遗传学的研究技术,已经充分证明了是 mRNA上三个相邻的碱基编码一个氨基酸。所以叫三联体密码或密码子( codon) 首先介绍一下生物化学方面的证明。1961年 Nirenberg等用大肠杆菌无细胞体系,外 加20种标记氨基酸混合物及PoyU,经保温反应后,发现只有苯丙氨酸的多聚体。显然 Poly L起了信使RNA的作用。所以UUU是编码苯丙氨酸的密码子
289 第十二章 蛋白质的生物合成及转运 蛋白质的生物合成在细胞代谢中占有十分重要的地位。目前已经完全清楚,贮存遗传 信息的 DNA 并不是蛋白质合成的直接模板,DNA 上的遗传信息需要通过转录传递给 mRNA。mRNA 才是蛋白质合成的直接模板。mRNA 是由 4 种核苷酸构成的多核苷酸,而 蛋白质是由 20 种左右的氨基酸构成的多肽,它们之间遗传信息的传递与从一种语言翻译成 另一种语言时的情形相似。所以人们称以 mRNA 为模板合成蛋白质的过程为翻译或转译 (translation)。 翻译的过程十分复杂,几乎涉及到细胞内所有种类的 RNA 和几十种蛋白质因子。蛋 白质合成的场所是核糖体,合成的原料是氨基酸,反应所需能量由 ATP 和 GTP 提供。蛋 白质合成的早期研究工作都是用大肠杆菌的无细胞体系进行的,所以对大肠杆菌的蛋白质 合成机理了解最多。真核细胞蛋白质合成的机理与大肠杆菌的有许多相似之处。 第一节 遗传密码 任何一种天然多肽都有其特定的严格的氨基酸序列。有机界拥有 1010~1011 种不同的 蛋白质,构成数目这么庞大的不同的多肽的单体却只有 20种氨基酸。氨基酸在多肽中的不 同排列次序是蛋白质多样性的基础。目前已经清楚,多肽上氨基酸的排列次序最终是由 DNA 上核苷酸的排列次序决定的,而直接决定多肽上氨基酸次序的却是 mRNA。不论是 DNA 还是 mRNA,基本上都由 4 种核苷酸构成。这 4 种核苷酸如何编制成遗传密码,遗 传密码又如何被翻译成 20 种氨基酸组成的多肽,这就是蛋白质生物合成中的遗传密码的翻 译问题。 一、密码单位 用数学方法推算,如果 mRNA 分子中的一种碱基编码一种氨基酸,那么 4 种碱基只能 决定 4 种氨基酸,而蛋白质分子中的氨基酸有 20 种,所以显然是不行的。如果由 mRNA 分子中每 2 个相邻的碱基编码一种氨基酸,也只能编码 4 2=16 种氨基酸,仍然不够。如果 采用每 3 个相邻的碱基为一个氨基酸编码,则 4 3=64,可以满足 20种氨基酸编码的需要。 所以这种编码方式的可能性最大。应用生物化学和遗传学的研究技术,已经充分证明了是 mRNA 上三个相邻的碱基编码一个氨基酸。所以叫三联体密码或密码子(codon)。 首先介绍一下生物化学方面的证明。1961 年 Nirenberg 等用大肠杆菌无细胞体系,外 加 20 种标记氨基酸混合物及 Poly U,经保温反应后,发现只有苯丙氨酸的多聚体。显然 Poly U 起了信使 RNA 的作用。所以 UUU 是编码苯丙氨酸的密码子
进一步, Nirenberg和 Ochoa等用 Poly UG和 Poly AC重复上述类似实验,发现标记氨 基酸掺入新合成的肽链的频率与按统计学方法推算出的多核苷酸中三联体密码出现的频率 相符合(表12-1)。应用这种方法,很快确定了为20种氨基酸编码的全部密码子 表12-1无序Po1yUG对氨基酸的编码(U:G=5:1) 可能的密码子 按计算可能出现的频率 氨基酸掺入的相对量 UUU Phe(100) UUG Cys (20) GUU Val (20) Gly (4) GGU Trp (5) GGG 0.8 *以UUU的出现频率为100计 进一步要解决的问题是密码子中三个碱基的排列次序问题。1964年 Nirenberg等应用大 肠杆菌核糖体与人工合成的多聚核苷酸、Mg2及一种与人工模板上密码子相对应的氨酰 tRNA(只缺GTP)起保温。由于反应体系中无GTP,掺入的氨基酸不可能形成多肽。应用 这种方法,发现具有密码子功能的最短链为三核苷酸,最有效的是3′-OH和5′-磷酸基的 三核苷酸。3′磷酸基为末端的三核苷酸无模板功能。所以密码子的读法是有方向的。如 pGpUpU对缬氨酸专一,而 UpUpGp却对亮氨酸专 当应用合成的三核苷酸重复序列作模板时,得到很有意义的结果。如以 Poly UUC作 模板时,得到的产物是三种不同的多肽:多聚苯丙氨酸、多聚丝氨酸和多聚亮氨酸。这是 因为从不同的碱基开始阅读密码所引起的: UUC-UUC-UUC- UUC-UUC-编码苯丙氨酸 UCU-UCU- UCU-UCU-UCU-—编码丝氨酸 CUU-CUU- CUU-CUU-CUU—编码亮氨酸 表12-2列出了应用带有重复序列的人工合成的多核苷酸模板与掺入的氨基酸之间的关 系。 应用上述方法,仅用了4年时间,于1965年完全确定了编码20种天然氨基酸的60多组密 码子,编出了遗传密码字典(表12-3) 表12-2带重复系列的人工多核苷酸模板与掺入的氨基酸之间的关系
290 进一步,Nirenberg 和 Ochoa 等用Poly UG 和Poly AC 重复上述类似实验,发现标记氨 基酸掺入新合成的肽链的频率与按统计学方法推算出的多核苷酸中三联体密码出现的频率 相符合(表 12-1)。应用这种方法,很快确定了为 20 种氨基酸编码的全部密码子。 表12-1 无序Po1y UG对氨基酸的编码(U:G=5:1) 可能的密码子 按计算可能出现的频率* 氨基酸掺入的相对量 UUU 100 Phe (100) UUG UGU GUU 20 Cys (20) Val (20) UGG GUG GGU 4 G1y (4) Trp (5) GGG 0.8 — * 以UUU的出现频率为100计。 进一步要解决的问题是密码子中三个碱基的排列次序问题。1964年Nirenberg等应用大 肠杆菌核糖体与人工合成的多聚核苷酸、Mg2+及一种与人工模板上密码子相对应的氨酰 -tRNA(只缺GTP)一起保温。由于反应体系中无GTP,掺入的氨基酸不可能形成多肽。应用 这种方法,发现具有密码子功能的最短链为三核苷酸,最有效的是3′-OH和5′-磷酸基的 三核苷酸。3′-磷酸基为末端的三核苷酸无模板功能。所以密码子的读法是有方向的。如 pGpUpU对缬氨酸专一,而UpUpGp却对亮氨酸专一。 当应用合成的三核苷酸重复序列作模板时,得到很有意义的结果。如以Po1y UUC作 模板时,得到的产物是三种不同的多肽:多聚苯丙氨酸、多聚丝氨酸和多聚亮氨酸。这是 因为从不同的碱基开始阅读密码所引起的: UUC-UUC-UUC-UUC-UUC——编码苯丙氨酸 UCU-UCU-UCU-UCU-UCU——编码丝氨酸 CUU-CUU-CUU-CUU-CUU——编码亮氨酸 表12-2列出了应用带有重复序列的人工合成的多核苷酸模板与掺入的氨基酸之间的关 系。 应用上述方法,仅用了4年时间,于1965年完全确定了编码20种天然氨基酸的60多组密 码子,编出了遗传密码字典(表12-3)。 表12-2 带重复系列的人工多核苷酸模板与掺入的氨基酸之间的关系
重复序列 多核苷酸中的密码子 掺入的氨基酸 UCU. CUC Ser. Leu AGA GAG UGU GUG ACA. CAC Thr. His UUC UUC UCU CUL Phe. Ser. Leu AAG, AGA, GAA Lys, Arg, Glu GAU AUG. UGA UAC. ACU CUA Tyr, Thr, Leu GUA, UAG, AGU val. Ser UAUC UAU, CUA, UCU, AUC Tyr, Leu, Ser, Ile UUAC UUA CUU. ACU UAC 表12-3遗传密码字典 磷酸末端 3′-OH基末端 的碱基 C A 苯丙氨酸 丝氨酸 酪氨酸 半胱氨酸 苯丙氨酸 丝氨酸 酪氨酸 半胱氨酸 亮氨酸 丝氨酸 终止信号 终止信号 亮氨酸 丝氨酸 终止信号 色氨酸 U 脯氨酸 组氨酸 精氨酸 脯氨酸 组氨酸 精氨酸 亮氨酸 脯氨酸 谷酰胺 精氨酸 亮氨酸 精氨酸 异亮氨酸 天冬酰胺 丝氨酸 异亮氨酸 苏氨酸 天冬酰胺 丝氨酸 异亮氨酸 赖氨酸 精氨酸 甲硫氨酸和甲酰甲硫氨酸 苏氨酸 赖氨配 精氨酸 缬氨酸 丙氨酸 天冬氨酸 甘氨酸 C 缬氨酸 丙氨酸 天冬氨酸 甘氨酸 谷氨酸 丙氨酸谷氨酸 甘氨酸 码子的阅读方向5′→3′,AG为起始密码子 用遗传学方法也证明了遗传信息是三联体密码。用某些吖啶染料可以引起T;噬菌体 DNA插入或删去1、2或3个碱基。实验的原理可用假设的噬菌体DNA加以说明 删去碱基的数目: 0 CAT CAT CATCAT CAT CAT CAT
291 表 12-3 遗传密码字典* *密码子的阅读方向 5′→3′,AUG 为起始密码子。 用遗传学方法也证明了遗传信息是三联体密码。用某些吖啶染料可以引起 T4 噬菌体 DNA 插入或删去 1、2 或 3 个碱基。实验的原理可用假设的噬菌体 DNA 加以说明。 删去碱基的数目: 0 CAT CAT CAT CAT CAT CAT CAT 重复序列 多核苷酸中的密码子 掺入的氨基酸 UC AG UG AC UUC AAG GAU UAC GUA UAUC UUAC UCU, CUC AGA, GAG UGU, GUG ACA, CAC UUC, UCU, CUU AAG, AGA, GAA GAU, AUG, UGA UAC, ACU, CUA GUA, UAG, AGU UAU, CUA, UCU, AUC UUA, CUU, ACU, UAC Ser, Leu Arg, Glu Cys, Val Thr, His Phe, Ser, Leu Lys, Arg, Glu Asp, Met Tyr, Thr, Leu Val, Ser Tyr, Leu, Ser, Ile Leu, Thr, Tyr 5′-磷酸末端 中 间 的 碱 基 3′-OH 基末端 的碱基 的碱基 U C A G U U 苯丙氨酸 苯丙氨酸 亮氨酸 亮氨酸 丝氨酸 丝氨酸 丝氨酸 丝氨酸 酪氨酸 酪氨酸 终止信号 终止信号 半胱氨酸 半胱氨酸 终止信号 色氨酸 C A G U C 亮氨酸 亮氨酸 、 亮氨酸 亮氨酸 脯氨酸 脯氨酸 脯氨酸 脯氨酸 组氨酸 组氨酸 谷酰胺 谷酰胺 精氨酸 精氨酸 精氨酸 精氨酸 C A G U A 异亮氨酸 异亮氨酸 异亮氨酸 甲硫氨酸和甲酰甲硫氨酸 苏氨酸 苏氨酸 苏氨酸 苏氨酸 天冬酰胺 天冬酰胺 赖氨酸 赖氨酸 丝氨酸 丝氨酸 精氨酸 精氨酸 C A G U G 缬氨酸 缬氨酸 缬氨酸 缬氨酸 丙氨酸 丙氨酸 丙氨酸 丙氨酸 天冬氨酸 天冬氨酸 谷氨酸 谷氨酸 甘氨酸 甘氨酸 甘氨酸 甘氨酸 C A G
CAT CTC ATCATCATC ATCATC 2 CAT CTC ACA TCA TCA TCA TCA 3 CAT CTC ACA TAT CAT CATCAT T 当删去一个碱基A时,从这一点以后的密码就发生了差错。删去两个碱基时,情形也 如此。但是删去三个碱基时,情况就不同了。最先也形成几组错误的密码子,但以后又恢 复正常。前面两类突变往往使基因产物全部失去活力,而第三种突变类型使基因产物仍具 有一定活力。这只能用遗传密码是三联体这个事实来加以解释。 二、遗传密码的基本特性 1.密码无标点符号 即两个密码子之间没有任何起标点符号作用的密码子加以隔开,因此,要正确阅读密 码必须按一定的读码框架从一个正确的起点开始,一个不漏地挨着读下去,直至碰到终止 信号。若在遗传密码中插入或删去一个碱基,就会使这以后的读码发生错误,这称为移码。 由移码引起的突变称为移码突变 2.一般情形下遗传密码不重叠 假设mRNA上的核苷酸序列为 ABCDEFGHIKL……,按不重叠规则读码时应读为ABC DEF GHⅠJKL等,每三个碱基编码一个氨基酸,碱基的使用不发生重复: aa3... aa4 如果按完全重叠规则读码,则应该是ABC编码aa,BCD编码a,CDE编码a3, 3.密码的简并性( regeneracy"冬 目前已经证明,在绝大多数生物中,读码规则是不重叠的 大多数氨基酸都可以具有几组不同的密码子,如UUA、UUG,CUU、CUC、CUA及 CUG6组密码子都编码亮氨酸。这一现象称为密码的简并。可以编码相同氨基酸的密码子 称为同义密码子( synonymcodon)。只有色氨酸及甲硫氨酸只有一个密码子(表12-4)。密码的 简并性在生物物种的稳定性上具有一定意义 4.密码子中第三位碱基具有较小的专一性(遗传密码的“摆动性”) 密码的简并性往往只涉及第三位碱基。如丙氨酸有4组密码子:GCU、GCC、GCA、 CG,前两位碱基都相同,均为GC,只是第三位不相同。已经证明,密码子的专一性主 要由前两位碱基决定,第三位碱基的重要性不大。 Crick对第三位碱基的这一特性给予一个 专门的术语,称为“摆动性”。当第三位碱基发生突变时,仍能翻译出正确的氨基酸来
292 1 CAT CTC ATC ATC ATC ATC ATC ↓ A 2 CAT CTC ACA TCA TCA TCA TCA ↓ ↓ A T 3 CAT CTC ACA TAT CAT CAT CAT ↓ ↓ ↓ A T C 当删去一个碱基A时,从这一点以后的密码就发生了差错。删去两个碱基时,情形也 如此。但是删去三个碱基时,情况就不同了。最先也形成几组错误的密码子,但以后又恢 复正常。前面两类突变往往使基因产物全部失去活力,而第三种突变类型使基因产物仍具 有一定活力。这只能用遗传密码是三联体这个事实来加以解释。 二、遗传密码的基本特性 1.密码无标点符号 即两个密码子之间没有任何起标点符号作用的密码子加以隔开,因此,要正确阅读密 码必须按一定的读码框架从一个正确的起点开始,一个不漏地挨着读下去,直至碰到终止 信号。若在遗传密码中插入或删去一个碱基,就会使这以后的读码发生错误,这称为移码。 由移码引起的突变称为移码突变。 2.一般情形下遗传密码不重叠 假设mRNA上的核苷酸序列为ABCDEFGHIJKL……,按不重叠规则读码时应读为ABC DEF GHI JKL等,每三个碱基编码一个氨基酸,碱基的使用不发生重复: ABC DEF GHI JKL …aa1…. .aa2……aa3…..aa4…. 如果按完全重叠规则读码,则应该是ABC编码aa1,BCD编码aa2,CDE编码aa3,……。 目前已经证明,在绝大多数生物中,读码规则是不重叠的。 3.密码的简并性(Clegeneracy) 大多数氨基酸都可以具有几组不同的密码子,如UUA、UUG,CUU、CUC、CUA及 CUG6组密码子都编码亮氨酸。这一现象称为密码的简并。可以编码相同氨基酸的密码子 称为同义密码子(synonymcodon)。只有色氨酸及甲硫氨酸只有一个密码子(表12-4)。密码的 简并性在生物物种的稳定性上具有一定意义。 4.密码子中第三位碱基具有较小的专一性 ( 遗传密码的“摆动性”) 密码的简并性往往只涉及第三位碱基。如丙氨酸有4组密码子:GCU、GCC、GCA、 GCG,前两位碱基都相同,均为GC,只是第三位不相同。已经证明,密码子的专一性主 要由前两位碱基决定,第三位碱基的重要性不大。Crick对第三位碱基的这一特性给予一个 专门的术语,称为“摆动性”。当第三位碱基发生突变时,仍能翻译出正确的氨基酸来
从而使合成的多肽仍具有生物学活力。特别应该指出的是:tRNA的反密码子中,除A、U、 G、C4种碱基外,还经常出现次黄嘌呤l。次黄嘌呤的特点是,与U、A、C三者之间都可 以配对,这就使得凡带有I碱基的反密码子都具有阅读mRNA上密码子的非凡能力,从而 减少了由于遗传密码突变而引起的误差。 表12-4氨基酸密码子的简井 氨基酸 密码子数目 氨基酸 密码子数目 丙氨酸 亮氨酸 精氨酸 赖氨酸 天冬酰胺 甲硫氨酸 天冬氨酸 半胱氨酸 脯氨酸 谷酰胺 丝氨酸 谷氨酸 苏氨酸 2124641 甘氨酸 2423 色氨酸 酪氨酸 异亮氨酸 缬氨酸 这一点已经得到实验证明。酵母tRNA~的反密码子为IGC,可阅读GCU、GCC、GCA几组 密码子 反密码子:3′-C-GI5 3′-CG--5′3′-CG-I-5′ 密码子:5′G-CU-3′5′-GC-C-3′5′-G-CA-3′ tRNA反密码子上的G、U可分别与密码子上的U、C和G、A配对(表125) 5.64组密码子中有三组不编码任何氨基酸,而是多肽合成的终止密码子( termination codo 终止密码子为UAG、UAA、UGA。另外耒12-5码子与后码平少间的碱基 组密码子AUG既是甲硫氨酸的密码子,又 是肽链合成的起始密码子( initiation codon) 反密码子 密码子 6.密码近于完全通用 所谓密码的通用性是指各种高等和低等 的生物包括病毒、细菌及真核生物等)在多大 程度上可共用同一套密码。较早时,曾认为密 码是完全通用的。让兔网织红血球的核糖体与 大肠杆菌的氨酰-tRNA及其他蛋白质合成因 U G 子一起进行反应时,合成的是血红蛋白,说明 大肠杆菌tRNA上的反密码子可以正确阅读血
293 从而使合成的多肽仍具有生物学活力。特别应该指出的是:tRNA的反密码子中,除A、U、 G、C4种碱基外,还经常出现次黄嘌呤I。次黄嘌呤的特点是,与U、A、C三者之间都可 以配对,这就使得凡带有I 碱基的反密码子都具有阅读mRNA上密码子的非凡能力,从而 减少了由于遗传密码突变而引起的误差。 表12-4 氨基酸密码子的简并 这一点已经得到实验证明。酵母tRNAAla的反密码子为IGC,可阅读GCU、GCC、GCA几组 密码子: 反密码子:3′-C-G-I-5′ 3′-C-G-I-5′ 3′-C-G-I-5′ ::: ::: ::: 密码子: 5′-G-C-U-3′ 5′-G-C-C-3′ 5′-G-C-A-3′ tRNA反密码子上的G、U可分别与密码子上的U、C和G、A配对(表12-5)。 5.64组密码子中,有三组不编码任何氨基酸,而是多肽合成的终止密码子(termination codon) 终止密码子为UAG、UAA、UGA。另外 一组密码子AUG既是甲硫氨酸的密码子,又 是肽链合成的起始密码子(initiation codon)。 6.密码近于完全通用 所谓密码的通用性是指各种高等和低等 的生物(包括病毒、细菌及真核生物等)在多大 程度上可共用同一套密码。较早时,曾认为密 码是完全通用的。让兔网织红血球的核糖体与 大肠杆菌的氨酰-tRNA及其他蛋白质合成因 子一起进行反应时,合成的是血红蛋白,说明 大肠杆菌tRNA上的反密码子可以正确阅读血 氨 基 酸 密码子数目 氨 基 酸 密码子数目 丙氨酸 精氨酸 天冬酰胺 天冬氨酸 半胱氨酸 谷酰胺 谷氨酸 甘氨酸 组氨酸 异亮氨酸 4 6 2 2 2 2 2 4 2 3 亮氨酸 赖氨酸 甲硫氨酸 苯丙氨酸 脯氨酸 丝氨酸 苏氨酸 色氨酸 酪氨酸 缬氨酸 6 2 1 2 4 6 4 1 2 4 反密码子 密码子 A U C G G U C I U C A U G A 表 12-5 密 码子 与反密 码子 之间 的碱 基 对
红蛋白mRNA上的信息。这样的交叉试验也在豚鼠和南非爪蛙等其他生物中进行过,都证 明了密码的通用性。 但是最近的一些发现对密码的通用性提出了质疑。线粒体DNA中的编码情形显然违背 了遗传密码的通用性。如人线粒体中UGA不再是终止密码子,而编码色氨酸。表12-6列出 了人线粒体基因组编码的特点。 酵母线粒体、原生动物纤毛虫也有类似情形。所以结论应该是:遗传密码并非是绝对 通用的,而是近于完全通用的 表12-6人线粒体DNA中密码编制特点 通常情况下可编码的 线粒体DNA所编码的 UGA 色氨酸 UGG 色氨酸 AUA 异亮氨酸 甲硫氨酸 甲硫氨酸 甲硫氨酸 AGA 精氨酸 终止信号 第二节蛋白质合成的分子基础 氨基酸是在核糖体上加入到多肽链中的。在与mRNA作用之前,氨基酸先共价地与转 运 RNA(transfer RNA,tRNA)形成氨酰tRNA。氨酰RNA结合到mRNA的特殊位点上。 mRNA含有遗传密码的信息,用于指导特定氨基酸序列多肽链的合成。一个核糖体结合到 个mRNA分子合成起始序列上,并由此开始读码,沿着密码序列合成一条多肽链。读码 的方向是从mRNA的5′到3′,而合成出来的多肽则是从氨基端到羧基端。通常,一个 mRNA分子上可结合有多个不同时间开始翻译的核糖体,这样的结构称为多聚核糖体 ( polysome)。在原核细胞中,mRNA的转录与多肽的翻译是同时进行的,如图12-1所示,可 见在染色体DNA分子上,有多条正在转录的mRNA分子,每个分子上都结合有多个正在进 行翻译的核糖体。真核生物的转录与翻译是在不同的地方进行的,核糖体可以自由地存在 于细胞质中,或者与内质网膜结合。RNA分子在蛋白质的合成中起着举足轻重的作用,除 了mRNA和tRNA,核糖体还含有核糖体RNA( ribosome rna,rRNA)。 一、mRNA是蛋白质合成的模板 Jacob F和 Monod j早在1961年就己提出mRNA的概念。他们认为,既然蛋白质是在细 胞质中合成的,而编码蛋白质的信息载体DNA却在细胞核内,所以必定有一种中间物质用 来传递DNA上的信息。他们研究大肠杆菌中与乳糖代谢有关酶类的生物合成时发现诱导 物,如异丙基硫代半乳糖苷(β- isopropylthiogalactoside)的加入,可以立刻使酶蛋白的合成 速度增加上千倍。而诱导物一旦消失,又可使酶蛋白的合成立刻停止。这个实验结果给人
294 红蛋白mRNA上的信息。这样的交叉试验也在豚鼠和南非爪蛙等其他生物中进行过,都证 明了密码的通用性。 但是最近的一些发现对密码的通用性提出了质疑。线粒体DNA中的编码情形显然违背 了遗传密码的通用性。如人线粒体中UGA不再是终止密码子,而编码色氨酸。表12-6列出 了人线粒体基因组编码的特点。 酵母线粒体、原生动物纤毛虫也有类似情形。所以结论应该是:遗传密码并非是绝对 通用的,而是近于完全通用的。 第二节 蛋白质合成的分子基础 氨基酸是在核糖体上加入到多肽链中的。在与mRNA作用之前,氨基酸先共价地与转 运RNA(transfer RNA,tRNA)形成氨酰-tRNA。氨酰-tRNA结合到mRNA的特殊位点上。 mRNA含有遗传密码的信息,用于指导特定氨基酸序列多肽链的合成。一个核糖体结合到 一个mRNA分子合成起始序列上,并由此开始读码,沿着密码序列合成一条多肽链。读码 的方向是从mRNA的5′到3′,而合成出来的多肽则是从氨基端到羧基端。通常,一个 mRNA分子上可结合有多个不同时间开始翻译的核糖体,这样的结构称为多聚核糖体 (polysome)。在原核细胞中,mRNA的转录与多肽的翻译是同时进行的,如图12-1所示,可 见在染色体DNA分子上,有多条正在转录的mRNA分子,每个分子上都结合有多个正在进 行翻译的核糖体。真核生物的转录与翻译是在不同的地方进行的,核糖体可以自由地存在 于细胞质中,或者与内质网膜结合。RNA分子在蛋白质的合成中起着举足轻重的作用,除 了mRNA和tRNA,核糖体还含有核糖体RNA(ribosome RNA, rRNA)。 一、mRNA是蛋白质合成的模板 Jacob F.和Monod J.早在1961年就已提出mRNA的概念。他们认为,既然蛋白质是在细 胞质中合成的,而编码蛋白质的信息载体DNA却在细胞核内,所以必定有一种中间物质用 来传递DNA上的信息。他们研究大肠杆菌中与乳糖代谢有关酶类的生物合成时发现诱导 物,如异丙基硫代半乳糖苷(β-isopropylthiogalactoside)的加入,可以立刻使酶蛋白的合成 速度增加上千倍。而诱导物一旦消失,又可使酶蛋白的合成立刻停止。这个实验结果给人 密码子 通常情况下可编码的 线粒体DNA所编码的 UGA UGG AUA AUG AGA AGG 终止信号 色氨酸 异亮氨酸 甲硫氨酸 精氨酸 精氨酸 色氨酸 色氨酸 甲硫氨酸 甲硫氨酸 终止信号 终止信号 表 12-6 人线粒体 DNA 中密码编制特点
的启示是:蛋白质合成的模板是一种不稳定的物质,其半寿期很短。他们对这种信使物质 的性质作了如下的预言 ①信使是一种多核苷酸。 ②信使的碱基组成应与相应的DNA的碱基组成相一致。 ③信使的长度应是不同的,因为由它们所编码的多肽链的长度是不同的。 ④在多肽合成时信使应与核糖体作短暂的结合 连有多个核糖体的mRNA d翻译的方向d DNA 转录的方向 图12-1大肠杆菌中mRNA的转录与多肽的翻译是同时进行的 A为多聚核糖体的电镜照片 ⑤信使的半寿期很短,所以信使的合成速度应该是很快的。 所以,这样的信使可能是一种RNA。但是当时已发现的两种RNA都不具备这些特性 各种生物的RNA的大小差异不大,碱基组成的变化也不大。tRNA除了有与RNA相同的问 题以外,它们的分子也太小,所以这两种RNA都不能胜任信使的功能。可喜的是当时已有 人提出过,认为细胞中有可能存在第三种RNA。被噬菌体T感染后的大肠杆菌中,有人发 现有一种新的RNA,它的代谢速度极快,分子的大小也参差不齐,碱基组成又与TDNA相 致。这些特性都符合信使分子的要求 mRNA的概念提出后,还必须要用实验来证明这种概念是否正确。 Brenner s., Jacob f
295 的启示是:蛋白质合成的模板是一种不稳定的物质,其半寿期很短。他们对这种信使物质 的性质作了如下的预言: ①信使是一种多核苷酸。 ②信使的碱基组成应与相应的DNA的碱基组成相一致。 ③信使的长度应是不同的,因为由它们所编码的多肽链的长度是不同的。 ④在多肽合成时信使应与核糖体作短暂的结合。 图12-1 大肠杆菌中mRNA的转录与多肽的翻译是同时进行的 A为多聚核糖体的电镜照片 ⑤信使的半寿期很短,所以信使的合成速度应该是很快的。 所以,这样的信使可能是一种RNA。但是当时已发现的两种RNA都不具备这些特性。 各种生物的rRNA的大小差异不大,碱基组成的变化也不大。tRNA除了有与rRNA相同的问 题以外,它们的分子也太小,所以这两种RNA都不能胜任信使的功能。可喜的是当时已有 人提出过,认为细胞中有可能存在第三种RNA。被噬菌体T2感染后的大肠杆菌中,有人发 现有一种新的RNA,它的代谢速度极快,分子的大小也参差不齐,碱基组成又与T2DNA相 一致。这些特性都符合信使分子的要求。 mRNA的概念提出后,还必须要用实验来证明这种概念是否正确。Brenner S.,Jacob F
和 Monod m等人设计了一组实验:用噬菌体T2感染大肠杆菌后,发现几乎所有在细胞内合 成的蛋白质都不再是细胞本身的蛋白质,而是噬菌体所编码的蛋白质,这些蛋白质的合成 速度与细胞总RNA的合成速度无关;T2感染后不久,细胞中出现了少量半寿期很短的RNA 它们的碱基组成与TDNA是一致的。上述这些特性都与他们预言的信使分子特性十分符 合。他们将大肠杆菌接种在含有重标记(N和C)的培养基上,再用T2感染。感染后立刻将 细菌转移到含有轻同位素(N和O)的培养基上。再将T2感染前与感染后的细菌破碎,分离 出核糖体,用密度梯度超离心技术将带有重同位素的核糖体与带有轻冋位素的核糖体分开。 他们还用P或用1C尿苷去标记RNA,并用35S-甲 硫氨酸去标记新合成的蛋白质。这些实验结果(图 12-2)表明: 重核糖体 轻核糖体 (未发现) ①T2感染后并无轻标记核糖体出现,说明在强 T2感染后并未引起新核糖体的合成。 ②T2感染后,诱发了新的RNA的合成。大多 数放射性标记的RNA出现在重标记核糖体中。这 种新合成的RNA代谢速度极快 ③3S标记的蛋白质只暂时出现在重标记核糖 密度 体中,说明新合成的蛋白质是在早就存在的核糖图122正常的与噬菌体T2感染前后大肠杆菌 体中合成的 核糖体的密度梯度超离心分析 以后, Spiegelman又用分子杂交技术证明了 经T2感染后的新合成的RNA可以与T2DNA杂交,但细胞内的其他RNA则不能与T2DNA杂 交,从而证明新合成的RNA是由T2噬菌体DNA编码的。 对于mRNA的结构特征,我们已经有了较详尽的了解。mRNA以核苷酸序列的方式携 带遗传信息,通过这些信息来指导合成多肽链中的氨基酸的序列。每一个氨基酸可通过 mRNA上3个核苷酸序列组成的遗传密码来决定,这些密码以连续的方式连接,组成读码 框架( reading frame)。读码框架之外的序列称作非编码区,这些区域通常与遗传信息的表 达调控有关。在读码框架的5′端,是由起始密码( start codon)AUG开始的,它编码一个蛋 氨酸。在读码框架的3′端,含有一个或一个以上的终止密码( stop codon):UAA、UAG和 UGA,其功能是终止这一多肽链的合成。在真核生物mRNA的3′端,通常还含有转录后 加上去的多聚腺嘌呤核苷酸poA)序列作尾巴,其功能可能与增加mRNA分子的稳定性有 mRNA分子的5′端序列对于起始密码的选择有重要作用,这种作用对于原核生物和真 核生物还有所差别。原核生物中(图12-3),在mRNA分子起始密码子的上游含有一段特殊的 核糖体结合位点( ribosome- binding site)序列,这一结合位点使得核糖体能够识别正确的起始 密码AUG。原核生物的mRN通常是多基因的,分子内的核糖体结合位点使得多个基因可 独立地进行读码框架的翻译,得到不同的蛋白质。而对于真核生物而言,其mRNA通常只 为一条多肽链编码,核糖体与mRNA5′端的核糖体进入部位( (ribosome entry site结合之 后,通过一种扫描机制向3′端移动来寻找起始密码,mRNA5′末端的帽子结构可能对于 核糖体进入部位的识别起着一定作用。翻译的起始通常开始于从核糖体进入部位向下游扫
296 和Monod M.等人设计了一组实验:用噬菌体T2感染大肠杆菌后,发现几乎所有在细胞内合 成的蛋白质都不再是细胞本身的蛋白质,而是噬菌体所编码的蛋白质,这些蛋白质的合成 速度与细胞总RNA的合成速度无关;T2感染后不久,细胞中出现了少量半寿期很短的RNA, 它们的碱基组成与T2DNA是一致的。上述这些特性都与他们预言的信使分子特性十分符 合。他们将大肠杆菌接种在含有重标记( 15N和12C)的培养基上,再用T2感染。感染后立刻将 细菌转移到含有轻同位素( 14N和12C)的培养基上。再将T2感染前与感染后的细菌破碎,分离 出核糖体,用密度梯度超离心技术将带有重同位素的核糖体与带有轻同位素的核糖体分开。 他们还用32P或用14C尿苷去标记RNA,并用35S-甲 硫氨酸去标记新合成的蛋白质。这些实验结果(图 12-2)表明: ①T2感染后并无轻标记核糖体出现,说明在 T2感染后并未引起新核糖体的合成。 ②T2感染后,诱发了新的RNA的合成。大多 数放射性标记的RNA出现在重标记核糖体中。这 种新合成的RNA代谢速度极快。 ③35S标记的蛋白质只暂时出现在重标记核糖 体中,说明新合成的蛋白质是在早就存在的核糖 体中合成的。 以后,Spiegelman又用分子杂交技术证明了 经T2感染后的新合成的RNA可以与T2DNA杂交,但细胞内的其他RNA则不能与T2DNA杂 交,从而证明新合成的RNA是由T2噬菌体DNA编码的。 对于mRNA的结构特征,我们已经有了较详尽的了解。mRNA以核苷酸序列的方式携 带遗传信息,通过这些信息来指导合成多肽链中的氨基酸的序列。每一个氨基酸可通过 mRNA上3个核苷酸序列组成的遗传密码来决定,这些密码以连续的方式连接,组成读码 框架(reading frame)。读码框架之外的序列称作非编码区,这些区域通常与遗传信息的表 达调控有关。在读码框架的5′端,是由起始密码(start codon)AUG开始的,它编码一个蛋 氨酸。在读码框架的3′端,含有一个或一个以上的终止密码(stop codon):UAA、UAG和 UGA,其功能是终止这一多肽链的合成。在真核生物mRNA的3′端,通常还含有转录后 加上去的多聚腺嘌呤核苷酸(polyA)序列作尾巴,其功能可能与增加mRNA分子的稳定性有 关。 mRNA分子的5′端序列对于起始密码的选择有重要作用,这种作用对于原核生物和真 核生物还有所差别。原核生物中(图12-3),在mRNA分子起始密码子的上游含有一段特殊的 核糖体结合位点(ribosome-binding site)序列,这一结合位点使得核糖体能够识别正确的起始 密码AUG。原核生物的mRNA通常是多基因的,分子内的核糖体结合位点使得多个基因可 独立地进行读码框架的翻译,得到不同的蛋白质。而对于真核生物而言,其mRNA通常只 为一条多肽链编码,核糖体与mRNA 5′端的核糖体进入部位(ribosome entry site)结合之 后,通过一种扫描机制向3′端移动来寻找起始密码,mRNA 5′末端的帽子结构可能对于 核糖体进入部位的识别起着一定作用。翻译的起始通常开始于从核糖体进入部位向下游扫 图12-2 正常的与噬菌体T2感染前后大肠杆菌 核糖体的密度梯度超离心分析
描到的第一个AUG序列。 核糖体识别位点 读码框 E架 真核生物 UAA AAAAAAAAA mRNA5帽子山山 核糖体识别位点 读码框架 读码框架 原核生物 UAA AUG mRNA s山3 图12-3真核生物及原核生物mRNA结构简图 二、tRNA转运活化的氨基酸至mRNA模板上 RNA含有两个关键的部位:一个是氨基酸结合部位,另一个是与mRNA的结合部位。 对于组成蛋白质的20种氨基酸来说,每一种至少有一种RNA来负责转运。为了准确地翻译, 每一种RNA必需能被很好地识别。在书写时,将所运氨基酸写在tRNA的右上角,如 tRNA Phe 及tRNA分别表示苯丙氨酸和丝氨酸转运的tRNA。大多数氨基酸具有几种用来转运的 tRNA,一个细胞中,通常含有50或更多的不同的RNA分子。 tRNA"c是第一个通过X射线晶体衍射技术测定了tRNA分子的空间结构,其他tRNA都 与它类似,可用一个如图12-4的结构来表征其一级、二级、三级结构。所有的tRNA都是有 由50-95?(70-90)个核苷酸组成的一条多聚核苷酸链,这条链经过折叠,呈现三叶草型 结构,含有4个双链的茎和4个单链的环。5′端和3′端的碱基通过形成7个 Waston- Crick碱 基配对将两端拉到一起,形成受体端,氨基酸通过与3′端的核糖连接而形成氨酰RNA分 子。tRNA的3′端通常是CCA的序列 未配对的环的命名由其特定的结构来定。环l的大小在7~11个核苷酸之间,常含有稀 有碱基 dihydrouracil,故命名为D环;环Ⅱ含有被称作反密码f( anticodon)的3个碱基序列, 被命名为反密码子环。tRNA的这一部分在蛋白质的合成中非常重要,它可与mRNA模板上 的密码子进行碱基配对的专一性的识别,并将所携带的氨基酸送入到合成的多肽链的指定 位置上:环Ⅲ是可变环,其组成可在3~21个碱基之间,是tRNA大小变化最大的区域:环 Ⅳ含有稀有的胸腺嘧啶核糖核苷( ribothymidine)和假尿嘧啶核苷( pseudouridine符号ψ表示) 碱基作为不变序列,故把它叫做TψC环。 tRNA三叶草型的二级结构可折叠成L型的三维结构,如图124所示,这一结构由两个 螺旋以直角的方位构成,结合氨基酸的一端称接受臂( acceptor am),另一端则含有反密码 子,被称作反密码子臂( anticodon arm)。RNA分子上与多肽合成有关的位点至少有4个,分 别为3′端CCA上的氨基酸接受位点、识别氨酰RNA合成酶的位点、核糖体识别位点及 反密码子位点
297 描到的第一个AUG序列。 图12-3 真核生物及原核生物mRNA结构简图 二、tRNA转运活化的氨基酸至mRNA模板上 tRNA含有两个关键的部位:一个是氨基酸结合部位,另一个是与mRNA的结合部位。 对于组成蛋白质的20种氨基酸来说,每一种至少有一种tRNA来负责转运。为了准确地翻译, 每一种tRNA必需能被很好地识别。在书写时,将所运氨基酸写在tRNA的右上角,如tRNAPhe 及tRNASer分别表示苯丙氨酸和丝氨酸转运的tRNA。大多数氨基酸具有几种用来转运的 tRNA,一个细胞中,通常含有50或更多的不同的tRNA分子。 tRNAPhe是第一个通过X射线晶体衍射技术测定了tRNA分子的空间结构,其他tRNA都 与它类似,可用一个如图12-4的结构来表征其一级、二级、三级结构。所有的tRNA都是有 由50-95 ?(70-90)个核苷酸组成的一条多聚核苷酸链,这条链经过折叠,呈现三叶草型 结构,含有4个双链的茎和4个单链的环。5′端和3′端的碱基通过形成7个Waston-Crick碱 基配对将两端拉到一起,形成受体端,氨基酸通过与3′端的核糖连接而形成氨酰-tRNA分 子。tRNA的3′端通常是CCA的序列。 未配对的环的命名由其特定的结构来定。环I的大小在7~11个核苷酸之间,常含有稀 有碱基dihydrouracil,故命名为D环;环Ⅱ含有被称作反密码子(anticodon)的3个碱基序列, 被命名为反密码子环。tRNA的这一部分在蛋白质的合成中非常重要,它可与mRNA模板上 的密码子进行碱基配对的专一性的识别,并将所携带的氨基酸送入到合成的多肽链的指定 位置上;环Ⅲ是可变环,其组成可在3~21个碱基之间,是tRNA大小变化最大的区域;环 Ⅳ含有稀有的胸腺嘧啶核糖核苷(ribothymidine)和假尿嘧啶核苷(pseudouridine)(符号ψ表示) 碱基作为不变序列,故把它叫做TψC环。 tRNA三叶草型的二级结构可折叠成L-型的三维结构,如图12-4所示,这一结构由两个 螺旋以直角的方位构成,结合氨基酸的一端称接受臂(acceptor arm),另一端则含有反密码 子,被称作反密码子臂(anticodon arm)。tRNA分子上与多肽合成有关的位点至少有4个,分 别为3′端CCA上的氨基酸接受位点、识别氨酰-tRNA合成酶的位点、核糖体识别位点及 反密码子位点
接受臂 反密码子环 反密码子 图124tRNA的结构简图 tRNA在识别mRNA分子上的密码子时,具有接头 ( adaptor)的作用。氨基酸一旦与tRNA形成氨酰tRNA后,进 步的去向就由tRNA来决定了。tRNA凭借自身的反密码子 与mRNA分子上的密码子相识别图12-5),而把所带的氨基 酸送到肽链的一定位置上。 Capeville及 Lipmann(1962)做了 巧妙的实验来证明这一点。将放射性同位素标记的半胱 氨酸在半胱氨酰-RNA合成酶催化下与tRNA形成半胱氨 酰-tRNA③,然后用活性镍作催化剂,使半胱氨酸转变成丙 CC G 氨酸,形成丙氨酰RNAs。然后将它放到网织红细胞无细 胞体系中进行蛋白质合成。分析后,发现丙氨酸插入了本应 由半胱氨酸所占的位置。 图12-5密码子与反密码子 前面在讨论遗传密码的性质时曾提到过密码的简并性问题。这里将进一步讨论与此有 关的RNA分子突变与校正基因( suppressor gene)的问题。遗传学家早就发现了回复突变 ( reverse mutation)现象。回复突变的原因很多,其中有一种回复突变是由于其在基因上发生 的一个突变引起的,这称为基因间校正突变。长期以来人们很难解释基因间校正突变。但 是现在由于对tRNA的结构功能有了较深入的了解,基因间校正突变的本质已经被揭露了 大多数校正突变是发生在tRNA基因的突变上,从而使tRNA的反密码子在阅读mRNA的信 息时发生了变化。下面举一个例子加以说明(图12-6) 从图126可以看出,某基因中部发生点突变而出现了一个额外的终止密码子UAG,于 是多肽的合成在中途终止,产物失去生物活性,所以这种突变称为无义突变( nonsense mutation),因为基因产物变得没有什么生物学意义了。对酪氨酸专一的tRNA上的反密码子
298 图12-4 tRNA的结构简图 tRNA在识别mRNA分子上的密码子时,具有接头 (adaptor)的作用。氨基酸一旦与tRNA形成氨酰-tRNA后,进 一步的去向就由tRNA来决定了。tRNA凭借自身的反密码子 与mRNA分子上的密码子相识别(图12-5),而把所带的氨基 酸送到肽链的一定位置上。Chapeville及Lipmann(1962)做了 一个巧妙的实验来证明这一点。将放射性同位素标记的半胱 氨酸在半胱氨酰-tRNA合成酶催化下与tRNACys形成半胱氨 酰-tRNACys,然后用活性镍作催化剂,使半胱氨酸转变成丙 氨酸,形成丙氨酰-tRNACys。然后将它放到网织红细胞无细 胞体系中进行蛋白质合成。分析后,发现丙氨酸插入了本应 由半胱氨酸所占的位置。 前面在讨论遗传密码的性质时曾提到过密码的简并性问题。这里将进一步讨论与此有 关的tRNA分子突变与校正基因(suppressor gene)的问题。遗传学家早就发现了回复突变 (reverse mutation)现象。回复突变的原因很多,其中有一种回复突变是由于其在基因上发生 的一个突变引起的,这称为基因间校正突变。长期以来人们很难解释基因间校正突变。但 是现在由于对tRNA的结构功能有了较深入的了解,基因间校正突变的本质已经被揭露了。 大多数校正突变是发生在tRNA基因的突变上,从而使tRNA的反密码子在阅读mRNA的信 息时发生了变化。下面举一个例子加以说明(图12-6) 从图12-6可以看出,某基因中部发生点突变而出现了一个额外的终止密码子UAG,于 是多肽的合成在中途终止,产物失去生物活性,所以这种突变称为无义突变(nonsense mutation),因为基因产物变得没有什么生物学意义了。对酪氨酸专一的tRNA上的反密码子 图 12-5 密码子与反密码子 的识别