第六章遗传的分子学基础 第一节DNA的结构与功能 DNA的结构 分子遗传学在研究表明,基因的化学本质是DNA,遗传信息贮存在DNA中,而在缺泛DNM 的病毒中,NA是遗传物质,作为遗传物质,应具备以下几个条件:连续性(复制并准确传 递);②稳定性(不易受影响):③多样性(结构、功能多样),具有强大的贮存信息能 力;④可变性:⑤自主调控的修复能力。DNA的结构能否满足上述条件? 1DNA的一级结构 DNA主要集中在细胞核内,同时线粒体、叶绿体中也含有少量的DNA,真核细胞内的DNA 主要存在于细胞染色体上,每条染色体包含一个DNA分子,即一个DNA分子从染色体的一端走 向另一端。DNA的基本结构单位是脱氧核苷酸,脱氧核苷酸可以进一步分解成脱氧核苷和磷 酸,而脱氧核苷是由碱基(Bse)和脱氧核糖组成的,碱基有四个,分别是:腺嘌呤 (A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)。四个碱基在DNA链中总是A和T,C和G 配对,因此形成了所谓的互补链。此外有的DNA分子中还存在有少量稀有碱基。DNA分子在一 级结构上有数量极其庞大的四种脱氧核苷酸(NTP)即:腺嘌吟脱氧核苷酸(A)、鸟嘌呤 脱氧核苷酸、胸腺嘧啶脱氧核苷酸、胞嘧啶脱氧核苷酸,其通过3’,5’-磷酸二酯键连接 起来,呈直线形或环形多聚体。DNA一级结构的重要意义不仅在于它蕴藏了遗传信息(以密 码子的方式),而且还决定了DNA的二级结构和空间结构。 2.DNA的二级结构 DNA的二级结构即Watson和Crick在1953年4月由X射线衍射结构分析提出的DNA右手双螺 旋结构。他们指出,组成DNA的两条脱氧核苷酸链反向平行并围绕同一中心轴形成右手螺旋 结构:嘌呤和嘧呤在双螺旋的内侧,磷酸与核糖在外侧,彼此通过3’,5’-磷酸二酯键相 连接,形成DNA分子的骨架,碱基环平面与中心轴垂直,脱氧核糖环的平面与中心轴平行: 两条核苷酸链依靠碱基之间形成的氢键相互结合在一起,碱基之间的匹配遵循碱基互补原 则,即一条链上的嘌呤碱必须与另一条链上的嘧啶碱相匹配,而且是A配T,G配C。我们可以 形象地把右手双螺旋模型理解为一架被扭曲的梯子,把由磷酸与核糖通过3',5’-磷酸二 酯键连接而成的DNA分子的骨架看作梯子的两边,而把由双链间匹配而形成的碱基对看作是 梯子的台阶。碱基互补原则具有极其重要的生物学意义,它是DNA复制、转录、反转录等遗 传过程的分子基础。由于双链一互补的,因此,一旦知道双链中的一条链的碱基组成,就可 推知另一条链的碱基组成。 3.DNA超螺旋结构(略) 二、DNA的生物学功能 1.DNA是遗传信息的携带者 除了少数的RNA病毒之外,DNA几乎是所有生物遗传信息的携带者。DNA分子携带着两类 不同的遗传信息,一类是负责蛋白质氨基酸组成的信息,这类遗传信息是以三联体密码子的 方式进行编码的。DA所携带的另一类遗传信息是关于基因选择性表达的信息。这种选择性 表达体现在:在细胞周期的不同时相中、个体发育的不同阶段中、不同器官和组织中、在不 同的外界环境下,各种基因是关闭还是表达,表达量是多少,都是各不相同的,在哺乳动物 中,基因组中大部分DNA序列是用来编码这一类遗传信息的。 2.DNA的自我复制功能 DA通过自我复制能将其储存的遗传信息稳定地、忠实地从亲代细胞遗传至子代细胞, 这是DNA的第二个功能。其中DNA的双螺旋结构和碱基互补原则是DNA复制、遗传信息从亲代
细胞传至子代细胞的基础。 3.DNA的变异突变功能 生物体的遗传性和变异性同时存在,以适应环境条件的变化,维持生物进化和产生生物 多样性。生物的遗传性是基因稳定性的表现,变异性是基因突变的表现,遗传和变异都是普 遍存在的自然现象。在一定范围内的突变是生物产生新的遗传性状和新的生物物种所必须 的,没有突变,就没有生物的进化,生物界就不能向前发展,所以变异突变也可以说是DA 的又一功能。 三、 DNA的复制 遗传实际上是染色体自我复制的结果。而染色体的自我复制主要通过DNA的半保留复制 来实现的,是一个以亲代DNA分子为模板合成子代DNA链的过程。 RNA L.DNAu体出久w Watson和Crick在提出DNA双螺旋结构模型时就对DNA的复制过程进行了探讨,并提出了 DNA半保留复制的机制。他们推测,DA在复制过程中碱基间的氢键首先断裂,双螺旋解旋和 分开,各自以自已作为模板合成新的互补链。这样新形成的两个DNA分子与原来的DA分子的 碱基顺序完全相同。 2.DNA的双向复制 在证明DA的半保留复制方式后,人们又利用放射性同位素标记的胸腺嘧啶追踪E.coli 细胞分裂时新合成的DNA,证实了复制是双向进行的,即从特定位点开始,向两个方向复 制,形成两个复制叉。 3.DNA的半不连续性复制 由于DNA聚合酶催化的DNA合成只能按'→3'进行,因此,只有3‘-5‘的母链能连续 合成一个从5’→3'方向的互补链,而另一条链的合成是不连续的。1968年,冈崎等人发 现,以5’→3’为母链合成新链时,在解旋部位,先合成的是许多5’→3’的小片断,这些 片断最后在DNA连接酶的作用下连接在一起,形成长的3‘-5‘链。这种小片断后来称岗崎片 断。根据冈崎实验,可以确定复制时,一条子链(前导链)是沿5’→3'方向连续合成的, 而另一子条(滞后链)是通过冈崎片段方式不连续合成的。复制即为DNA的半不连续性复 制。 4.DNA的其它复制方式 除了上述介绍的DNA复制方式外,在噬菌体和质粒中还存在着其它复制方式:滚环复制 和D-环复制
5.DNA的反转录 这是一种特殊的DNA复制方式,主要存在于反转录病毒中。反转录病毒的基因组是RNA分 子,在感染期间,RNA分子可以反转录为DNA分子,DNA再转录生产病毒RNA,或者与宿主DNA 分子整合,使病毒潜伏于宿主后代中。 第二节RNA的结构与功能 …、 RNA的结构 DNA是遗传信息的载体,遗传信息的作用通常由蛋白质的功能来实现,但DNA并非蛋白质 合成的直接模板,合成蛋白质的模板是RNA。与DNA相比,RNA所含的糖为核糖,分子量相对 较小,一般以单股链存在,但可以有局部二级结构,如tRNA还具有明确的二级结构(三叶 草),其碱基组成特点是含有尿嘧啶,而不含胸腺嘧啶,碱基配对发生于C和G与U和A之间, 且稀有碱基较多。 二、RNA的种类与生物学功能 RNA的种类通常包括mRNA、rRNA、tRNA及hnRNA(不均一核RNA)等,它们均与遗传信息 的表达有关。 1.信使RNA(mRNA)与核不均一RNA(hnRNA) 信使RNA是一种能转录DNA分子上遗传信息的中间物质,其核苷酸序列决定着合成蛋白质 的氨基酸序列。在真核生物中,最初转录生成的RNA称为核不均一RNA(hnRNA),hnRNA是 mRNA的未成熟前体。两者之间的差别主要有两点:一是hnRNA核苷酸链中的一些片段将不出 现于相应的mRNA中,这些片段称为内含子(Intron),而那些保留于nRNA中的片段称为外显 子(Exon)。即hnRNA在转变为mRNA的过程中经过剪接,被去掉了一些片段(内含子),余 下的片段(外显子)被重新连接在一起;二是mRNA的5'末端被加上一个m7Gppp(7甲基鸟苷 3磷酸)帽子,在mRNA3'末端多了一个多聚腺苷酸(polyA)尾巴。在原核生物中,mRNA没 有这种首、尾结构。帽子结构的主要作用是为核糖体识别mRNA提信号;增加mRNA的稳定性, 使其免受5-3外切酶的攻击。 2.转运RNA(tRNA) tRNA是蛋白质合成中的接合器分子。原核生物tRNA分子有100多种,真核40多种,均可 携带一种氨基酸,并将其转运到核糖体上,供蛋白质合成使用。 3.核糖体RNA(rRNA) rRNA是细胞内含量最多的RNM,约占RNA总量的8O%以上,是核糖体的组成成分。其通常 在nnRNA成熟转变为mRNA的过程中,参与RNA的剪接,并且在将mRNA从细胞核运到细胞浆的过 程中起着十分重要的作用。 原核生物和真核生物的核糖体均由易于解聚的大、小两个亚基组成。真核生物核糖体由 30S小亚基和50S大亚基组成,结合后成为70S,大亚基含专门供tRNA附着的P(肽酰基位点) 和A(氨酰基位点)两个位点。 第三节蛋白质的结构及合成 一、蛋白质的一级结构与遗传密码 蛋白质分子是由氨基酸首尾相连而成的共价多肽链,但是天然的蛋白质分子并不是走向 随机的松散多肽链。每一种天然蛋白质都有自己特有的空间结构,即蛋白质的构象。蛋白质 通常有四级结构,一级结构是指多肽链的氨基酸序列,是蛋白质作用的特异性、空间结构的 差异性及生物功能的多样性的基础。组成蛋白质的氨基酸共有20种,这20种氨基酸的顺序是 由RNA的碱基排列顺序决定的。把碱基排列顺序和蛋白质中氨基酸顺序之间的对相关系叫遗
传密码。碱基与氨基酸两者之间的密码关系是每三个碱基决定一种氨基酸,决定一种氨基酸 的三个碱基叫三联体密码子。理论上,四个碱基可形成43=64个密码子,但因一种氨基酸不 止由一种密码子决定(简并),有些密码子无对应的氨基酸(无义密码子),因此,生物界 只有20种氨基酸,由61个密码子编码,还有3个为肽链终止的密码子。而且密码子是通用 的。 二、蛋白质合成 蛋白质合成过程也就是遗传信息从DNA→mRNA→蛋白质的转录和翻译的过程,以及遗传 信息从DNA→DNA的复制过程,这就是分子生物学的中心法则。 蛋白质合成开始时,首先合成的是mRNA。由于mRNA的合成是依据DNA链上的碱基按照碱 基配对原则合成的,这个过程称转录,因此RNA本身的碱基与DNA母链是互补的。 把RNA上的信息翻译成蛋白质的氨基酸顺序的过程是在核糖体中完成的,mRNA所携带 的信息决定了构成特定蛋白质的20种氨基酸顺序,核糖体内合成蛋白质时还需要转运 RNA(tRNA)发挥功能。tRNA根据RNA上的信息转运相对应的氨基酸,tRNA转运来的氨基酸 将按照RNA上的密码连接合成蛋白质。与一种氨基酸可由不同的tRNA(反密码子不同)携 带,这样的一组tRNA称同功tRNA。 1.转录:DNA→RNA 在蛋白质合成开始之前,DNA双螺旋中的一条链作为模板在RNA聚合酶的作用下先合成 mRNA,同时mRNA从细胞核转移到细胞质中。在转录过程中,进行mRNA合成时,DNA双链中只 有一条链被用作合成的模板,将具有转录功能的一条DA链称为模板链,无义链(-),而没 有转录功能的另一条链称为编码链,有义链(+)。 2.翻译:RNA→蛋白质 1转录 蛋白质的合成是在核糖体中进 mRNA 行的。在蛋白质合成时,核糖体沿 mRNA链以5'→3'方向运行,在此 氨基 过程中,氨基酸相继被加到不断延 长的多肽链上。tRNA每辨认出一个 mRNA链上的遗传密码,就选择与之 反密码 对应的氨基酸,并加到肽链上。当 RNA 核糖体移动到基因的碱基序列的末 转移酶 多肽链 尾时,就完成多肽链的合成,核糖 2.翩译 体便从mRNA链上解离下来参加蛋白 质合成的下一轮循环。 通常核糖体通过tRNA在起始 密码子(AUG)处与mRNA结合, 蛋白质合成示意图出 然后其便进入蛋白质合成的延长阶 〔引自Access Excellence)P 段,最后,一个释放因子结合到终 止子处,终止翻译并从核糖体上释放完整的多肽。 第四节基因的概念及其发展 一、基因的概念 人们对基因的认识最早源自孟德尔的遗传因子,1909年,丹麦遗传学家 W.Johannsen(约翰逊)首先使用基因(Gene)一词,代替了当年孟德尔提出的“遗传因 子”。后来,摩尔根等人通过对果蝇基因连锁交换规律和伴性遗传的研究,指出基因是在染 色体上呈线性排列的。是染色体上的一个特定片断
此后遗传学家们一致在探寻基因的化学本质。1944年,0.T.Avery(艾弗里)等人通过 著名的肺炎球菌转化实验,首次证明了基因的化学本质是DNA,基因是DNA分子上的功能单 位。1955年,S.Benzer(本泽)研究了T4噬菌体rII区的精细结构,提出了顺反子 (Cistron)、突变子(Muton)和重组子(Recon)等概念,1970年后,又提出了断裂基因 和重叠基因的概念。 突变子:它是性状突变时,产生突变的最小单位,一个突变子可以小到只是一个核苷酸 对。 重组子:基因内也可以发生交换而重组,基因内出现重组的最小单位叫重组子。可以小 到一个核苷酸对。 顺反子:实际上它是基因的同义词,一个顺反子就是一个功能单位,即顺反子既具有功 能上的完整性,又具有结构上的可分割性,是顺反测验中,在反式结构中不能互补的各个突 变位点在染色体上所占的一个区域。 附:基因内部的精细结构 过去一直认为基因是一个功能单位,同时也是一个突变单位,交换单位,即所谓三位一体的概 念,认为:交换只能发生在基因之间,而不能在它们之中:突变只能从一个基因变成另一个基因,其内 部没有变化的更小单位。后来,精密的微生物遗传分析证明,基因并不是最小的不可分割的单位。 1.重组测验 1955年,美国的S.Benzer(本泽)用大肠杆菌T4噬菌体作为材料,研究快速溶菌突变型rⅡ的基因 精细结构,发现在一个基因内部的许多位点可以发生突变,并可以在这些位点之间发生交换,从而说 明一个基因是一个功能单位,但并不是一个突变单位和交换单位,因此,一个基因可以包括许多突变 单位和许多重组单位。 2.互补测验 Ben2er分析了rⅡ区域大约2000个(有些不能重组)突变型,知道这些突变分布在308个位点上。 那么,这308个位点是属于一个基因还是几个基因?为了划分这种功能单位界线,必须进行互补测验。 (1)互补作用:两个突变型细胞的两条同源染色体同处在一个杂合体细胞或局部合子时,野生型 基因补偿突变基因的缺陷而使细胞的表型恢复正常的作用。否则,两种突变型一定具有相同功能损 伤。 (2)反式构型:两个突变分别位于两条同源染色体上的基因组合。顺式构型:两个突变位于同一 个染色体上的基因组合。 (③)互补测验(complementation Test)(顺反位置效应测验):比较顺式和反式构型的细胞, 从而判断两个突变是否属于同一基因的测验一一测验基因间是否互补。 举例:假如一个DNA片断上有两个突变位点和b,其在杂合细胞中同源染色体上的排列有两种情况 (如下),在顺式排列中,有一个DA片断是未突变的,其所决定的性状为野生型,而在反式排列中, 每个DA片断都由一个正常位点和一个突变位点组成,如果这个个体的表现为野生型,则说明a.b两个 位点属于不同的基因,即不同顺反子,/+,b/+都有一个正常基因,其功能发生了互补。如果个体表现 为突变型,则说明和b是一个基因内的不同突变点,一个基因在任何一点发生突变都会影响基因正 常功能而表现为突变性状,这种试验就是互补试验或称顺反试验。在反式结构中不能互补的各个突变 位点在染色体上所占的一个区域就叫一个顺反子。 3.顺反子、突变子与重组子的概念 Benzer把在反式构型中不能互补的各个突变型在染色体上所占的一个区域称为一个顺反子。顺反 测验结果表明,顺反子是一个必须保存完整才具有正常生理功能的遗传物质最小单位。实际上它是基 因的同义词。是一个功能水平上的基因。每个顺反子在染色体(DA)上的区域称为基因座
(1ocas),而每个基因座上有许多突变位点(site),它是一个顺反子内部能发生突变的最小结构单 位,称为突变子:一个突变可以小到一对碱基,我们知道,DN中每一核苷酸对的改变都可引起肽链中 氨基酸的改变,从而影响顺反子的功能,但它本身没有独立的功能,它们之间可以重组,而重组的最 小结构单位称为重组子,重组子可以小到邻近碱基对间的重组。由此可见,顺反子既具有功能上的完 整性,又具有结构上的可分割性。 4.断裂基因 传统的观点认为每个结构基因是一段连续的DN顺序,到1977年法国的Chambom等和美国的Berget 等首次在猴类病毒Sv40和腺病毒中发现基因内部以及基因与基因之间存在有间隔顺序(spacer sequence),从而导致隔裂基因的概念。 ①断裂基因:基因的编码顺序由若干非编码区域(间隔序列)隔开,使阅读框不连续,这种基因 称为隔裂基因。 ②通读框(open reading frame),在一条DNA链上,从起始密码开始到终止密码为止的连续核苷 酸密码序列。 一个基因由几个互不相邻的段落组成,它们被长达数百乃至数千个核苷酸对的间隔序列所隔开。 在真核类中,几乎所有基因内部都含有不转译的部分。在转录为初级RNA时(或后),这一序列被 切除。 ③外显子(exon或extron):基因的转译部分。DNA序列中将被转录为mRNA、tRNA、rRNA的那些序 列。 ④内含子(intron):不转译的部分。在成就的mRNA、tRA、rRNA上未反应出来的DNA区段,即被 切 二、基因的类型及基本结构 根据基因功能,可将基因分为结构基因,调节基因和调控基因(操纵基因,启动基因) 及核糖体RNA基因与tRNA基因。 结构基因是一类编码蛋白质的基因,大多数真核生物的基因是不连续基因。所谓不连续 基因就是指基因的编码序列在DNA分子上是不连续的,被非编码序列所隔开。编码的序列称 为外显子(xO),是一个基因表达为多肽链的部分:非编码序列称为内含子,又称插入序 列。内含子只转录,在前mRNA时被剪切掉。内含子的核苷酸数量可比外显子多许多倍。每个 外显子和内含子接头区都有一段高度保守的一致序列,即内含子5'末端大多数是GT开始, 3'末端大多是AG结束,称为GT-AG法则,是普遍存在于真核基因中RNA剪接的识别信号。在 第一个外显子和最末一个外显子的外侧是一段不被翻译的非编码区,称为侧翼序列。侧翼序 列含有基因调控序列,对该基因的活性有重要影响。 调节基因,属结构基因的一部分,它编码的蛋白质是阻遏蛋白,可以与操作子结合,以 调节结构基因的活性。 调控基因,如启动子和操作子,无转录和翻译功能,其功能是通过自身的核苷酸序列来 实现的,能与特定的酶或蛋白质结合以调节结构基因的活性。如在原核生物结构基因的前 面,有一段序列,是NA聚合酶识别结合的部位,有激活转录的功能,叫启动子。在启动子 后,有一段序列,是阻遏蛋白结合的部位,其与阻遏蛋白的结合与分离控制着结构基因的关 闭状态(能否转录),因此叫操作子。在原核生物结构基因的末端往往有一段特定序列,它 具有转录终止的功能,这段终止信号的序列称为终止子(Terminator)。终止子的共同序列 特征是在转录终止点之前有一段回文序列,约7-20核苷酸对。在回文序列的下游有6一8个4T 对,因此,这段终止子转录后形成的RNA具有发夹结构,并具有与A互补的一串U,因为AU之 间氢健结合较弱,因而RNA/DNA杂交部分易于拆开,这样对转录物从DNA模板上释放出来是有 利的,也可使RNA聚合酶从DNA上解离下来,实现转录的终止。在原核生物中,很多功能上相
关的基因前后相连成串,形成基因表达和调控的完整单元,其中包括启动子,操作子,结构 基因和调节基因。这种结构叫操纵元(或操纵子)。 在真核基因转录起始点的上游或下游,一般都有增强子,它不能启动一个基因的转录, 但有增强转录的作用。 RNA基因只转录产生相应的RNA,而不翻译成多肽链。 一般来讲,基因控制蛋白质的合成,但是一些基因不但可以表达,还有调节其它基因的 功能。只要生物体所处环境发生细微变化,那么基因之间就会产生相互影响,可以讲任何一 个基因都有调节或影响其它基因的作用。因此,可以说,生物有机体基因组是一个相互作用 的网络,而不是独立的线性功能基因。基因本身的灵活性和动态性是我们以前所不曾认识到 的。 三、基因组 用于描述生物的全部基因和染色体组成的概念。一般将细胞内染色体所包含的DNA及遗 传信息的总体称为基因组(Genome),即某一物种的单倍体染色体所含的全部基因。一个单 倍体基因组中所含DNA的量总是恒定的,将其称为该物种DNA的C值。原核生物体内只有一条 染色体(一个链锁群),遗传信息全部在这条染色体上,因此其基因组即是一个连锁群所含 的全部遗传信息。但在真核生物中,情况比较复杂,细胞核中的全套染色体上存在着体现细 胞功能所有蛋白质遗传编码。 不同物种间基因组大小和复杂程度差异很大,一般讲,进化程度越高的生物体其基因组 构成越大、越复杂,基因组C值也较大,但是单纯依靠基因组C值大小判断生物遗传结构的复 杂性是不够的,例如,在生物界人类可以说是进化程度最高的,其遗传组成也是最复杂的, 人类基因组的C值是3×10bp,而肺鱼的进化程度最低,其C值却有1X1012bp。 四、基因文库 基因工程中,需要将某种生物的全部基因组的遗传信息贮存在可以长期保存的稳定的重 组体中,以备需要时随时能够应用,这种保存基因组遗传信息的体系,就称为基因文库。一 般是将某一生物体DNA片段用限制性切割酶切割,这些切割后的DNM片段与载体连接,再转 化(指一种生物接受另一种生物的遗传物质)到细菌中去,让宿言细胞长面一个克隆,这样 每个克隆的DNA片断都是相同的,一套包含许多克隆的克降中含有基因组的所有DNA片断,叫 DNA文库。在建立了成千上万个无性繁殖的大肠杆菌、酵母茵、哺乳动物或其他生物基因组 片段的“仓库”之后,研究者在寻找任何一种含目的基因(目标DNA)的细胞时,就可以从这 些文库中去筛选,可不必再重复地进行整个无性繁殖的操作。单独一个基因可以用基因探针 (Gene Probe)确认出来。探针一般是一条单链DNA,它是根据欲探寻DNM的序列合成的互 补链。探针可以用放射性磷元素标记,磷射线能在像纸上留下黑记。另外,也可以用荧光分 子标记,标记DNA在紫外光下可以被观察到。 基因信息库收集的材料是基因工程技术的原材料,它可以被用来进行基因的转移,以创 造新的类型的生物,也可用做基因片段分析和基因的测序分析等。另外,基因序列的比较分 析,可作为分类学的重要依据,根据基因序列的比较分析,可以推断出不同生物类群在进化 学上的关系。例如,水稻和小麦基因组的基因顺序是相同的。说明水稻和小麦来源于同一个 祖先。 基因测序是将某一生物的基因组的全部基因的核酸序列进行完整分析的过程。人类基因 组的测序已于2001年完成(2001年2月12日,中、美、日、德、法、英等6国科学家和美国 塞莱拉公司联合公布人类基因组图谱及初步分析结果)。其它主要农作物和家畜的基因测序 也在紧张地进行之中,大部分已经完成。目前,基因片段的分析又成了遗传学中的重点课 题。能够完全了解和掌握生物体基因的功能,有日的地操作基因、创造基因、改造基因是人 类最终追求的目标