I868年,瑞士的内科医生Friedrich Miescher,从外科医院包扎伤口的绷带上的脓细胞核中提取到一种富含磷元素的酸性化合物,将其称为核 质(nuclein):后来他又从鲭鱼精子中分离出类似的物质,并指出它是由一种碱性蛋白质与一种酸性物质组成的,此酸性物质即是现在所知的核 酸(ucleic acid)。I944年Oswald Avery,.Colin Macleod和Maclyn McCarty发现,一种有夹膜、具致病性的肺炎球菌中提取的核酸桪 NA(deoxyribonucleic acid,脱氧核糖核酸),可使另一种无夹膜,不具致病性的肺炎球菌的遗传性状发生改变,转变为有夹膜,具致病性的肺炎 球菌,且转化率与DNA纯度呈正相关,若将DNA预先用DNA酶降解,转化就不发生。该项实验彻底纠正了蛋白质携带遗传信息这一错误认 识,确立了核酸是遗传物质的重要地位;DNA遗传作用的进一步肯定来自Alfred Hershey和Martha Chase对一个感染大肠杆菌的病毒的研究。 即用放谢性同位素32P标记噬菌体DNA,35S标记其蛋白质外壳,再用标记的噬菌体去感染培养的大肠杆菌,结果发现进入细菌体内,使细菌 生长、繁殖发生变化的是32P标记的DNA,而不是35S标记的蛋白质,并且新繁殖生成的噬菌体不含?35S,只含32P。1953年Watsoni和Crick创 立的DNA双螺旋结构模型,不仅阐明了DNA分子的结构特征,而且提出了DNA作为执行生物遗传功能的分子,从亲代到子代的DNA复制 (replication)过程中,遗传信息的传递方式及高度保真性,为遗传学进入分子水平奠定了基础,成为现代分子生物学发展史上最为辉煌的里程 碑。后来的研究又发现了另一类核酸李NA(ribonucleic acid,核糖核酸),RNA在遗传信息的传递中起着重要的作用。从此,核酸研究的进展日 新月异,如今,由核酸研究而产生的分子生物学及其基因工程技术已渗透到医药学、农业、化工等领域的各个学科,人类对生命本质的认识进 入了一个薪新的天地。 第一节核酸的化学组成 核酸是生物体内的高分子化合物,包括DNA和RNA两大类。 一、元素组成 组成核酸的元素有C、H、O、N、P等,与蛋白质比较,其组成上有两个特点:一是核酸一般不含元素S,二是核酸中P元素的含量较多并 且恒定,约占9~10%。因此,核酸定量测定的经典方法,是以测定P含量来代表核酸量。 二、化学组成与基本单位 核酸经水解可得到很多核苷酸,因此核苷酸是核酸的基本单位。核酸就是由很多单核苷酸聚合形成的多聚核苷酸。核苷酸可被水解产生核 苷和磷酸,核苷还可再进一步水解,产生戊糖和含氨碱基(图15·1)。 「辟酸 核酸一→核苷酸一 ,龙精(pentose】 核苷一+ 藏基(bae) (nucleotide>(nucleoside) 图15·1核酸的组成 核苷酸中的碱基均为含氨杂环化合物,它们分别属于嘌呤衍生物和嘧啶衍生物。核苷酸中的嘌呤碱(purine)主要是鸟嘌呤(guanine,G)和腺 嘌呤(adenine,A),密啶碱(pyrimidine)主要是胞嘧啶(cytosine,C)、尿嘧啶(uracil,U)和胸腺嘧啶(thymine,T)。DNA和RNA都含有鸟嘌呤(G、腺 嘌呤(A)和胞嘧啶(C);胸腺嘧啶(T)一般而言只存在于DNA中,不存在于RNA中;而尿嘧啶(U)只存在于RNA中,不存在于DNA中。它们的化 学结构请参见图示。 啶 鸟暴吟 6一氯蓝原吟) 2-氢落6-氧第的) 胞啶 尿嘴啶 (亿一氧4一其基密呢) (24-二氧) (5-甲基尿嚯爽】 核酸中五种碱基中的酮基和氨基,均位于碱基环中氨原子的邻位,可以发生酮式一烯醇式或氨基?亚氨基之间的结构互变。这种互变异构 在基因的突变和生物的进化中具有重要作用
1868年,瑞士的内科医生Friedrich Miescher从外科医院包扎伤口的绷带上的脓细胞核中提取到一种富含磷元素的酸性化合物,将其称为核 质(nuclein);后来他又从鲭鱼精子中分离出类似的物质,并指出它是由一种碱性蛋白质与一种酸性物质组成的,此酸性物质即是现在所知的核 酸 (nucleic acid) 。 1944 年 Oswald Avery,Colin Macleod 和 Maclyn McCarty 发 现 , 一 种 有 夹 膜 、 具 致 病 性 的 肺 炎 球 菌 中 提 取 的 核 酸 桪 NA(deoxyribonucleic acid,脱氧核糖核酸),可使另一种无夹膜,不具致病性的肺炎球菌的遗传性状发生改变,转变为有夹膜,具致病性的肺炎 球菌,且转化率与DNA纯度呈正相关,若将DNA预先用DNA酶降解,转化就不发生。该项实验彻底纠正了蛋白质携带遗传信息这一错误认 识,确立了核酸是遗传物质的重要地位;DNA遗传作用的进一步肯定来自Alfred Hershey和Martha Chase对一个感染大肠杆菌的病毒的研究。 即用放谢性同位素32P标记噬菌体DNA,35S标记其蛋白质外壳,再用标记的噬菌体去感染培养的大肠杆菌,结果发现进入细菌体内,使细菌 生长、繁殖发生变化的是32P标记的DNA,而不是35S标记的蛋白质,并且新繁殖生成的噬菌体不含?35S,只含32P。1953年Watson和Crick创 立的DNA双螺旋结构模型,不仅阐明了DNA分子的结构特征,而且提出了DNA作为执行生物遗传功能的分子,从亲代到子代的DNA复制 (replication)过程中,遗传信息的传递方式及高度保真性,为遗传学进入分子水平奠定了基础,成为现代分子生物学发展史上最为辉煌的里程 碑。后来的研究又发现了另一类核酸桼NA(ribonucleic acid,核糖核酸),RNA在遗传信息的传递中起着重要的作用。从此,核酸研究的进展日 新月异,如今,由核酸研究而产生的分子生物学及其基因工程技术已渗透到医药学、农业、化工等领域的各个学科,人类对生命本质的认识进 入了一个崭新的天地。 第一节 核酸的化学组成 核酸是生物体内的高分子化合物,包括DNA和RNA两大类。 一、元素组成 组成核酸的元素有C、H、O、N、P等,与蛋白质比较,其组成上有两个特点:一是核酸一般不含元素S,二是核酸中P元素的含量较多并 且恒定,约占9~10%。因此,核酸定量测定的经典方法,是以测定P含量来代表核酸量。 二、化学组成与基本单位 核酸经水解可得到很多核苷酸,因此核苷酸是核酸的基本单位。核酸就是由很多单核苷酸聚合形成的多聚核苷酸。核苷酸可被水解产生核 苷和磷酸,核苷还可再进一步水解,产生戊糖和含氮碱基(图15-1)。 图15-1 核酸的组成 核苷酸中的碱基均为含氮杂环化合物,它们分别属于嘌呤衍生物和嘧啶衍生物。核苷酸中的嘌呤碱(purine)主要是鸟嘌呤(guanine,G)和腺 嘌呤(adenine,A),嘧啶碱(pyrimidine)主要是胞嘧啶(cytosine,C)、尿嘧啶(uracil,U)和胸腺嘧啶(thymine,T)。DNA和RNA都含有鸟嘌呤(G)、腺 嘌呤(A)和胞嘧啶(C);胸腺嘧啶(T)一般而言只存在于DNA中,不存在于RNA中;而尿嘧啶(U)只存在于RNA中,不存在于DNA中。它们的化 学结构请参见图示。 核酸中五种碱基中的酮基和氨基,均位于碱基环中氮原子的邻位,可以发生酮式一烯醇式或氨基?亚氨基之间的结构互变。这种互变异构 在基因的突变和生物的进化中具有重要作用
NH 重氨式 有些核酸中还含有修饰碱基(modifiedcomponent)),(或稀有碱基,unusual component),这些碱基大多是在上述嘌岭或嘧啶碱的不同部位 甲基化(methylation)或进行其它的化学修饰而形成的衍生物。一般这些碱基在核酸中的含量稀少,在各种类型核酸中的分布也不均一。DNA中 的修饰碱基主要见于噬菌体DNA,如5-甲基胞嘧啶(m5C),5-羟甲基胞嘧啶hm5C;RNA中以tRNA含修饰碱基最多,如1-甲基腺嘌呤(mlA), 2,2一二甲基鸟嘌呤(m22G)和5,6-二氢尿嘧啶(DHU)等. CH,OH 5-甲基胞毫晚m 5-羟甲丛胞密晚mC H,0 H.C 出 1-甲基腺哪岭m') 2,2-二甲嘉马第吟mG) 5.6-二氧尿密呢DHU) 嘌呤和嘧啶环中含有共轭双键,对260左右波长的紫外光有较强的吸收。碱基的这一特性常被用来对碱基、核苷、核苷酸和核酸进行定 性和定量分析。 核酸中的戊糖有核糖(ribose)和脱氧核糖(eoxyribose)两种,分别存在于核糖核苷酸和脱氧核糖核苷酸中。为了与碱基标号相区别,通常将 戊糖的C原子编号都加上“”,如C1'表示糖的第一位碳原子。 戊糖与嘧啶或嘌呤碱以糖苷键连接就称为核苷,通常是戊糖的C1'与嘧啶碱的N1或嘌呤碱的N9相连接。 核苷中戊糖的羟基与磷酸以磷酸酯键连接而成为核苷酸。生物体内的核苷酸大多数是核糖或脱氧核糖的C5'上羟基被磷酸酯化,形成5'核苷 酸。核苷酸在5'进一步磷酸化即生成二磷酸核苷和三磷酸核苷。以核糖腺苷酸为例,除AMP外,还有二磷酸腺苷(ADP,adenosine5'· diphosphate)和三磷酸腺苷(ATP,adenosine5'-triphosphate)两种形式。核苷酸的二磷酸酯和三磷酸酯多为核苷酸有关代谢的中间产物或者酶活 性和代谢的调节物质,以及作为核苷酸有关代谢的中间产物或者酶活性和代谢的调节物质,以及作为生理储能和供能的重要形式。 核苷酸还有环化的形式。它们主要是3',5',环化腺苷酸(cAMP,adenosine3,5'-cyclicmonophosphate)和3',5'·环化鸟苷酸 (cGMP,guanosine3',5',cyclic monophosphate),化学结构如下。环化核苷酸在细胞内代谢的调节和跨细胞膜信号中起若十分重要的作用。 OH HO 0- OHOH核 OH 脱氧校能 尿H越(UMP) 算音酸dAMP QH OH HO P-0-P-0-CH 0= H0-P-0 OHOH 二磷融藤青ADP] 3,-环化像苷酸(AMP) NH. OHOHOH HN -0-CH 0-dL0 HO一P=D OH OH O OH 兰纳酸黎背(ATP y,-乐化鸟破(GMP到 表15·1核苷酸及相应的核苷、碱基名称中英文对照表 核苷酸 核苷 碱基 腺苷酸(AMP) 腺苷 腺骠呤(A) adenosine monophosphate adenosine adenine 脱氧腺苷酸(dAMP) 脱氧腺苷
有些核酸中还含有修饰碱基(modifiedcomponent),(或稀有碱基,unusual component),这些碱基大多是在上述嘌呤或嘧啶碱的不同部位 甲基化(methylation)或进行其它的化学修饰而形成的衍生物。一般这些碱基在核酸中的含量稀少,在各种类型核酸中的分布也不均一。DNA中 的修饰碱基主要见于噬菌体DNA,如5-甲基胞嘧啶(m5C),5-羟甲基胞嘧啶hm5C;RNA中以tRNA含修饰碱基最多,如1-甲基腺嘌呤(m1A), 2,2一二甲基鸟嘌呤(m22G)和5,6-二氢尿嘧啶(DHU)等。 嘌呤和嘧啶环中含有共轭双键,对260nm左右波长的紫外光有较强的吸收。碱基的这一特性常被用来对碱基、核苷、核苷酸和核酸进行定 性和定量分析。 核酸中的戊糖有核糖(ribose)和脱氧核糖(deoxyribose)两种,分别存在于核糖核苷酸和脱氧核糖核苷酸中。为了与碱基标号相区别,通常将 戊糖的C原子编号都加上“′”,如C1′表示糖的第一位碳原子。 戊糖与嘧啶或嘌呤碱以糖苷键连接就称为核苷,通常是戊糖的C1′与嘧啶碱的N1或嘌呤碱的N9相连接。 核苷中戊糖的羟基与磷酸以磷酸酯键连接而成为核苷酸。生物体内的核苷酸大多数是核糖或脱氧核糖的C5′上羟基被磷酸酯化,形成5′核苷 酸。核苷酸在5′进一步磷酸化即生成二磷酸核苷和三磷酸核苷。以核糖腺苷酸为例,除AMP外,还有二磷酸腺苷(ADP,adenosine 5′- diphosphate)和三磷酸腺苷(ATP,adenosine 5′-triphosphate)两种形式。核苷酸的二磷酸酯和三磷酸酯多为核苷酸有关代谢的中间产物或者酶活 性和代谢的调节物质,以及作为核苷酸有关代谢的中间产物或者酶活性和代谢的调节物质,以及作为生理储能和供能的重要形式。 核 苷 酸 还 有 环 化 的 形 式 。 它 们 主 要 是 3′ , 5′- 环 化 腺 苷 酸 (cAMP,adenosine 3′,5′-cyclicmonophosphate) 和 3′ , 5′- 环 化 鸟 苷 酸 (cGMP,guanosine 3′,5′-cyclic monophosphate),化学结构如下。环化核苷酸在细胞内代谢的调节和跨细胞膜信号中起着十分重要的作用。 表15-1 核苷酸及相应的核苷、碱基名称中英文对照表 核苷酸 核苷 碱基 腺苷酸(AMP) 腺苷 腺嘌呤(A) adenosine monophosphate adenosine adenine 脱氧腺苷酸(dAMP) 脱氧腺苷
deoxydenosine monophosphate deoxyadenosine 鸟苷酸(GMP) 鸟苷 鸟嘌岭(G) guanosine monophosphate guanosine guanine 脱氧鸟苷酸(dGMP) 脱氧鸟苷 deoxyguanosine monophosphate deoxyguanosine 跑苷酸(CMP) 胞苷 胞嘧啶(C) cytidine monophosphate cytidine cytosine 胞氧跑苷酸(dCMP) 脱氧跑苷 deoxycytidine monophosphate deoxycytidine 胸苷酸(TMP/dTMP) 胸苷 胸腺嘧啶(T) thymidine monophate thymidine thymine 尿苷酸(UMP) 尿苷 尿密啶(U) uridine monophosphate uridine uracil 第二节 DNA的一级结构与功能 (一)DNA的一级结构 核酸是由很多单核苷酸聚合形成的多聚核苷酸(polynucleotide),DNA的一级结构即是指四种核苷酸(dAMP、dCMP、dGMP、dTMP)按照 一定的排列顺序,通过磷酸二酯键连接形成的多核苷酸,由于核苷酸之间的差异仅仅是碱基的不同,故又可称为碱基顺序。核苷酸之间的连接 方式是:一个核苷酸的5'位磷酸与下一位核苷酸的3'OH形成3',5'磷酸二酯键,构成不分支的线性大分子,其中磷酸基和戊糖基构成DNA链的 骨架,可变部分是碱基排列顺序。核酸是有方向性的分子,即核苷酸的戊糖基的5'位不再与其它核苷酸相连的5'未端,以及核苷酸的戊糖基3 位不再连有其它核苷酸的3末端,两个末端并不相同,生物学特性也有差异。 寡核苷酸(oligonucleotide)是指二至十个甚至更多个核苷酸残基以磷酸二酯键连接而成的线性多核苷酸片段。目前多由仪器自动合成而用 作DNA合成的引物(Primer)、基因探针(probe)等,在现代分子生物学研究中具有广泛的用途。 表示一个核酸分子结构的方法由繁至简有许多种(图15-2)。由于核酸分子结构除了两端和碱基排列顺序不同外,其它的均相同。因此,在 核酸分子结构的简式表示方法中,仅须注明一个核酸分子的哪一端是5末端,哪一端是3'末端,未端有无磷酸基,以及核酸分子中的碱基顺序 即可。如未特别注明5和3'末端,一般约定,碱基序列的书写是由左向右书写,左侧是5'未端,右侧为3'未端。 PipApAPTpTpC OH PGPAATTC-OH3 -GAATTC-3 GAATTC 图15·2核酸分子结构的表示方式 (二)基因组DNA 自然界绝大多数生物体的遗传信息贮存在DNA的核苷酸排列顺序中。DNA是巨大的生物高分子,一般将细胞内遗传信息的携带者枣染色 体所包含的DNA总体称为基因组(genome)。同一物种的基因组DNA含量总是恒定的,不同物种间基因组大小和复杂程度则差异极大,一般 讲,进化程度越高的生物体其基因组构成越大、越复杂,见(表15-2)。 表15-2某些有代表性的生物体内DNA大小 分子量 碱基对(bp) 干碱基对kb)】 最简单的微生物 SV40病毒 3×106 5×103 噬菌体 3.4×107 5×104 50 细菌 大肠杆菌 2.2×109 4.6×106 4600 哺乳动物 小鼠 1.5×1012 2.3×109 230万 1.8×1012 2.8×109 280万 DNA分子中不同排列顺序的DNA区段构成特定的功能单位,即基因(gene)。 基因的功能取决于DNA的一级结构。一个DNA分子能携带多 少基因呢?如果以1000~1500bp编码一个基因计算,猿猴病毒SV40基因组DNA有5000碱基对(base pair,,bp),可编码5种基因,人类基因组含 3×109 bp DNA,理论上可编码200万以上的基因,然而,由于哺乳动物的基因含有内含子(intorn),因而每个基因可长达5000~8000bp,少数 可达20,000p。按这样大小的基因进行推算,人类基因组相当于40~60万个基因。这可能吗?虽然现在还不知道确切数字,但利用核酸杂交 已测得哺乳类细胞含50,000~100,000种mRNA,由此推论整个基因组所含基因不会超过10万个,只占全部基因组的6%,另外5~10%为
deoxydenosine monophosphate deoxyadenosine 鸟苷酸(GMP) 鸟苷 鸟嘌呤(G) guanosine monophosphate guanosine guanine 脱氧鸟苷酸(dGMP) 脱氧鸟苷 deoxyguanosine monophosphate deoxyguanosine 胞苷酸(CMP) 胞苷 胞嘧啶(C) cytidine monophosphate cytidine cytosine 胞氧胞苷酸(dCMP) 脱氧胞苷 deoxycytidine monophosphate deoxycytidine 胸苷酸(TMP/dTMP) 胸苷 胸腺嘧啶(T) thymidine monophate thymidine thymine 尿苷酸(UMP) 尿苷 尿嘧啶(U) uridine monophosphate uridine uracil 第二节 DNA的一级结构与功能 (一)DNA的一级结构 核酸是由很多单核苷酸聚合形成的多聚核苷酸(polynucleotide),DNA的一级结构即是指四种核苷酸(dAMP、dCMP、dGMP、dTMP)按照 一定的排列顺序,通过磷酸二酯键连接形成的多核苷酸,由于核苷酸之间的差异仅仅是碱基的不同,故又可称为碱基顺序。核苷酸之间的连接 方式是:一个核苷酸的5′位磷酸与下一位核苷酸的3′-OH形成3′,5′磷酸二酯键,构成不分支的线性大分子,其中磷酸基和戊糖基构成DNA链的 骨架,可变部分是碱基排列顺序。核酸是有方向性的分子,即核苷酸的戊糖基的5′位不再与其它核苷酸相连的5′末端,以及核苷酸的戊糖基3′ 位不再连有其它核苷酸的3′末端,两个末端并不相同,生物学特性也有差异。 寡核苷酸(oligonucleotide)是指二至十个甚至更多个核苷酸残基以磷酸二酯键连接而成的线性多核苷酸片段。目前多由仪器自动合成而用 作DNA合成的引物(Primer)、基因探针(probe)等,在现代分子生物学研究中具有广泛的用途。 表示一个核酸分子结构的方法由繁至简有许多种(图15-2)。由于核酸分子结构除了两端和碱基排列顺序不同外,其它的均相同。因此,在 核酸分子结构的简式表示方法中,仅须注明一个核酸分子的哪一端是5′末端,哪一端是3′末端,末端有无磷酸基,以及核酸分子中的碱基顺序 即可。如未特别注明5′和3′末端,一般约定,碱基序列的书写是由左向右书写,左侧是5′末端,右侧为3′末端。 图15-2 核酸分子结构的表示方式 (二)基因组DNA 自然界绝大多数生物体的遗传信息贮存在DNA的核苷酸排列顺序中。DNA是巨大的生物高分子,一般将细胞内遗传信息的携带者枣染色 体所包含的DNA总体称为基因组(genome)。同一物种的基因组DNA含量总是恒定的,不同物种间基因组大小和复杂程度则差异极大,一般 讲,进化程度越高的生物体其基因组构成越大、越复杂,见(表15-2)。 表15-2 某些有代表性的生物体内DNA大小 分子量 碱基对(bp) 千碱基对(kb) 最简单的微生物 SV40病毒 3×106 5×103 5 λ噬菌体 3.4×107 5×104 50 细菌 大肠杆菌 2.2×109 4.6×106 4600 哺乳动物 小鼠 1.5×1012 2.3×109 230万 人 1.8×1012 2.8×109 280万 DNA分子中不同排列顺序的DNA区段构成特定的功能单位,即基因(gene)。基因的功能取决于DNA的一级结构。一个DNA分子能携带多 少基因呢?如果以1000~1500bp编码一个基因计算,猿猴病毒SV40基因组DNA有5000碱基对(base pair,bp),可编码5种基因,人类基因组含 3×109bp DNA,理论上可编码200万以上的基因,然而,由于哺乳动物的基因含有内含子(intorn),因而每个基因可长达5000~8000bp,少数 可达20,000bp。按这样大小的基因进行推算,人类基因组相当于40~60万个基因。这可能吗?虽然现在还不知道确切数字,但利用核酸杂交 已测得哺乳类细胞含50,000~100,000种mRNA,由此推论整个基因组所含基因不会超过10万个,只占全部基因组的6%,另外5~10%为
rRNA等重复基因,其余80~90%属于非编码区,没有直接的遗传学功能。DNA的复性动力学研究发现这些非编码区往往都是一些大量的重复 序列,这些重复序列或集中成簇,或分散在基因之间,可能在DNA复制、调控中具有重要意义,并与生物进化、种族特异性有关。可见原核细 胞由于DNA分子较小,必须充分利用有限的核苷酸序列,这是真核基因组与原核基因组显然不同之处。 真核基因组与原核基因组在结构上还有很多不同的特点,归纳如下: 1.真核生物基因组结构特点 @真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即双倍体,diploid),即 有两份同源的基因组。 ②真核细胞基因转录产物为单顺反子(monocistron),即一个结构基因转录、翻译成一个mRNA分子,一条多肽链。 ③存在大量重复序列,即在整个DNA中有许多重复出现的核苷酸顺序,重复序列长度可长可短,短的仅含两个核苷酸,长的多达数百、乃 至上干。重复频率也不尽相同;高度重复序列重复频率可达106次,包括卫星DNA、反向重复序列和较复杂的重复单位组成的重复序列;中度 重复序列可达I03~I04次,如为数众多的Alu家族序列,Kpnl家族,Hi家族序列,以及一些编码区序列如rRNA基因、tRNA基因、组蛋白基 因等;单拷贝或低度重复序列,指在整个基因组中只出现一次或很少几次的核苷酸序列,主要是编码蛋白质的结构基因,在人基因组中占约60 ~65%,因此所含信息量最大。 ④基因组中不编码的区域多于编码区域。 ⑤基因是不连续的,在真核生物结构基因的内部存在许多不编码蛋白质的间隔序列(interveningsequences),称为内含子(intron),编码区则 称为外显子(exon)。内含子与外显子相间排列,转录时一起被转录下来,然后RNA中的内含子被切掉,外显子连接在一起成为成熟的mRNA, 作为指导蛋白质合成的模板。 ⑥基因组远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。 2.原核生物基因组结构特点 ①基因组较小,没有核膜包裹,且形式多样,如病毒基因组可能是DNA,也可能是RNA,可能是单链的,也可能是双链的,可能是闭环分 子,也可能是线性分子;细菌染色体基因组则常为环状双链DNA分子,并与其中央的RNA和支架蛋白构成一致密的区域,称为类核 (nucleoid). ②功能相关的结构基因常常串连在一起,并转录在同一个mRNA分子中,称为多顺反子mRNA(polycistronic mRNA),然后再加工成各种 蛋白质的模板mRNA. ③DNA分子绝大部分用于编码蛋白质,不编码部分(又称间隔区)通常包含控制基因表达的顺序。例如,噬菌体Wx174中只有5%是非编码 区。 ④基因重叠是病毒基因组的结构特点,即同一段DNA片段能够编码两种甚至三种蛋白质分子。 ⑤除真核细胞病毒外,基因是连续的,即不含内含子序列。 (三)限制性片段长度多态性 随着对基因认识的不断深入,发现在同种生物的不同个体之间,尽管其蛋白质产物的结构和功能完全相同或仅存在着细微的差异,但在 DNA水平却存在着差异,尤其在不编码蛋白质的区域以及没设有重要调节功能的区域表现更为突出。这种不影响生物体表型的DNA突变被称为 中性突变。 分子生物学技术的不断发展已使得从DNA水平直接分析这类突变成为可能。 目前应用较多且成熟的方法是限制性片段长度多态性(Restriction fragment length polymorphism,RFLP)。即当DNA序列中某一个碱基发生 突变,使突变所在部位的DNA序列获得或丢失某种限制性核酸内切酶位点;或当DNA分子内部发生较大的顺序突变如缺失、重复、插入,或 DNA高变区内某串联重复顺序的拷贝数不同致使其两侧限制性核酸内切酶位点发生相对位移时,利用相应的限制性核酸内切酶消化此DNA, 便会产生与正常不同的限制性片段。这样,在同种生物的不同个体中就会出现不同长度的限制性片段类型。 因为DNA的中性突变常以孟德尔显性遗传方式遗传给下一代,所以对这类突变检测已广泛用于遗传病的诊断、产前诊断、亲子鉴定以及法 医学上对罪犯的确认等。 (四)DNA序列分析(DNa sequencing) DNA的一级结构决定了基因的功能,欲想解释基因的生物学含义,首先必须知道其DNA顺序。因此DNA序列分析是分子遗传学中一项既 重要又基本的课题。 1986年由美国学者提出的,目前正在实施的人类基因组计划(human genome project),则是要通过对人类基因组3×10bp全序列的序列分 析和人类基因的染色体图谱制定达到了解其结构,认识其功能,即从分子遗传学水平来认识人类自身的结构和功能特征的目的。 核酸的核苷酸序列测定方法已经过近20年的发展,因而测序的具体方法五花八门、种类繁多。但是究其所依据的基本原理,不外乎Sag®r 的核酸链合成终止法及Maxam和Gilbert的化学降解法两大类。虽然原理不同,但这两种方法都同样生成互相独立的若干组带放射性标记的寡核 苷酸,每组寡核苷酸都有固定的起点,但却随机终止于特定的一种或多种残基上。由于DNA链上每一个碱基出现在可变终止端的机会均等,因 而上述每一组产物都是一些寡核苷酸的混合物,这些寡核苷酸的长度由某一种特定碱基在原DNA片段上的位置所决定。然后在可以区分长度仅 相差一个核苷酸的不同DNA分子的条件下,对各组寡核苷酸进行电泳分析,只要把几组寡核苷酸加样于测序凝胶中若干个相邻的泳道之上,即 可从凝胶的放射自显影片上直接读出DNA上的核苷酸顺序。以下分别介绍。 1.Sanger双脱氧链终止法 DNA的合成总是从5端向3'端进行的。DNA的合成需要模板以及相应的引导核酸链。DNA的合成过程中,在合成的DNA链的3'末端,依据 碱基配对的原则,通过生成新的3',5'·磷酸二酯键,使DNA链合成终止,产生短的DNA链。具体测序工作中,平行进行四组反应,每组反应
rRNA等重复基因,其余80~90%属于非编码区,没有直接的遗传学功能。DNA的复性动力学研究发现这些非编码区往往都是一些大量的重复 序列,这些重复序列或集中成簇,或分散在基因之间,可能在DNA复制、调控中具有重要意义,并与生物进化、种族特异性有关。可见原核细 胞由于DNA分子较小,必须充分利用有限的核苷酸序列,这是真核基因组与原核基因组显然不同之处。 真核基因组与原核基因组在结构上还有很多不同的特点,归纳如下: 1.真核生物基因组结构特点 ①真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即双倍体,diploid),即 有两份同源的基因组。 ②真核细胞基因转录产物为单顺反子(monocistron),即一个结构基因转录、翻译成一个mRNA分子,一条多肽链。 ③存在大量重复序列,即在整个DNA中有许多重复出现的核苷酸顺序,重复序列长度可长可短,短的仅含两个核苷酸,长的多达数百、乃 至上千。重复频率也不尽相同;高度重复序列重复频率可达106次,包括卫星DNA、反向重复序列和较复杂的重复单位组成的重复序列;中度 重复序列可达103~104次,如为数众多的Alu家族序列,KpnI家族,Hinf家族序列,以及一些编码区序列如rRNA基因、tRNA基因、组蛋白基 因等;单拷贝或低度重复序列,指在整个基因组中只出现一次或很少几次的核苷酸序列,主要是编码蛋白质的结构基因,在人基因组中占约60 ~65%,因此所含信息量最大。 ④基因组中不编码的区域多于编码区域。 ⑤基因是不连续的,在真核生物结构基因的内部存在许多不编码蛋白质的间隔序列(interveningsequences),称为内含子(intron),编码区则 称为外显子(exon)。内含子与外显子相间排列,转录时一起被转录下来,然后RNA中的内含子被切掉,外显子连接在一起成为成熟的mRNA, 作为指导蛋白质合成的模板。 ⑥基因组远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。 2.原核生物基因组结构特点 ①基因组较小,没有核膜包裹,且形式多样,如病毒基因组可能是DNA,也可能是RNA,可能是单链的,也可能是双链的,可能是闭环分 子,也可能是线性分子;细菌染色体基因组则常为环状双链DNA分子,并与其中央的RNA和支架蛋白构成一致密的区域,称为类核 (nucleoid)。 ②功能相关的结构基因常常串连在一起,并转录在同一个mRNA分子中,称为多顺反子mRNA(polycistronic mRNA),然后再加工成各种 蛋白质的模板mRNA。 ③DNA分子绝大部分用于编码蛋白质,不编码部分(又称间隔区)通常包含控制基因表达的顺序。例如,噬菌体ψx 174中只有5%是非编码 区。 ④基因重叠是病毒基因组的结构特点,即同一段DNA片段能够编码两种甚至三种蛋白质分子。 ⑤除真核细胞病毒外,基因是连续的,即不含内含子序列。 (三)限制性片段长度多态性 随着对基因认识的不断深入,发现在同种生物的不同个体之间,尽管其蛋白质产物的结构和功能完全相同或仅存在着细微的差异,但在 DNA水平却存在着差异,尤其在不编码蛋白质的区域以及没有重要调节功能的区域表现更为突出。这种不影响生物体表型的DNA突变被称为 中性突变。 分子生物学技术的不断发展已使得从DNA水平直接分析这类突变成为可能。 目前应用较多且成熟的方法是限制性片段长度多态性(Restriction fragment length polymorphism,RFLP)。即当DNA序列中某一个碱基发生 突变,使突变所在部位的DNA序列获得或丢失某种限制性核酸内切酶位点;或当DNA分子内部发生较大的顺序突变如缺失、重复、插入,或 DNA高变区内某串联重复顺序的拷贝数不同致使其两侧限制性核酸内切酶位点发生相对位移时,利用相应的限制性核酸内切酶消化此DNA, 便会产生与正常不同的限制性片段。这样,在同种生物的不同个体中就会出现不同长度的限制性片段类型。 因为DNA的中性突变常以孟德尔显性遗传方式遗传给下一代,所以对这类突变检测已广泛用于遗传病的诊断、产前诊断、亲子鉴定以及法 医学上对罪犯的确认等。 (四)DNA序列分析(DNa sequencing) DNA的一级结构决定了基因的功能,欲想解释基因的生物学含义,首先必须知道其DNA顺序。因此DNA序列分析是分子遗传学中一项既 重要又基本的课题。 1986年由美国学者提出的,目前正在实施的人类基因组计划(human genome project),则是要通过对人类基因组3×109bp全序列的序列分 析和人类基因的染色体图谱制定达到了解其结构,认识其功能,即从分子遗传学水平来认识人类自身的结构和功能特征的目的。 核酸的核苷酸序列测定方法已经过近20年的发展,因而测序的具体方法五花八门、种类繁多。但是究其所依据的基本原理,不外乎Sanger 的核酸链合成终止法及Maxam和Gilbert的化学降解法两大类。虽然原理不同,但这两种方法都同样生成互相独立的若干组带放射性标记的寡核 苷酸,每组寡核苷酸都有固定的起点,但却随机终止于特定的一种或多种残基上。由于DNA链上每一个碱基出现在可变终止端的机会均等,因 而上述每一组产物都是一些寡核苷酸的混合物,这些寡核苷酸的长度由某一种特定碱基在原DNA片段上的位置所决定。然后在可以区分长度仅 相差一个核苷酸的不同DNA分子的条件下,对各组寡核苷酸进行电泳分析,只要把几组寡核苷酸加样于测序凝胶中若干个相邻的泳道之上,即 可从凝胶的放射自显影片上直接读出DNA上的核苷酸顺序。以下分别介绍。 1.Sanger双脱氧链终止法 DNA的合成总是从5′端向3′端进行的。DNA的合成需要模板以及相应的引导核酸链。DNA的合成过程中,在合成的DNA链的3′末端,依据 碱基配对的原则,通过生成新的3′,5′-磷酸二酯键,使DNA链合成终止,产生短的DNA链。具体测序工作中,平行进行四组反应,每组反应
均使用相同的模板,相同的引物以及四种脱氧核苷酸:并在四组反应中各加入适量的四种之一的双脱氧核苷酸,使其随机地接入DNA链中,使 链合成终止,产生相应的四组具有特定长度的、不同长短的DNA链。这四组DNA链再经过聚丙烯酸胺凝胶电泳按链的长短分离开,经过放射 自显影显示区带,就可以直接读出被测DNA的核苷酸序列(图15·3)。 999 0= 0= 00 3一松游冥核替能 2一脱名候查酸 JAdAUTdTdGdCdTaAdGdcdGdCdTaAdGdc? AdAdCiGrAdTdCHG入Tacan9 dATP dGTr 汽时 OGI 10T dCTP CTP dTIP 打TP eTTP m ddATp ddGTP ddTTP 3 -dAdAdTdTUGdCHTMGdCdGdCdTdAddG AdAdTaT&GdcTdAdGdCdGdrdT s-dAlATUTUGdCTd. s-dAdAdTd'rdGdCITdAdGdCddG -dadAdTdTGdCrdAdGddc s-oAdAd s-dAdAdTU IdGdCaTudA s-dAlAd'TuTuGdec s'-dAdAdTdTddG s-cAdAd rddT s-dAddA 5-ddA 所湖疗列 图15·3双脱氧链终止法测定DNA序列原理示意 2.Maxam?Gilbert DNA化学降解法 这一方法的基本步骤为(1)先将DNA的未端之一进行标记(通常为放射性同位素32P:(2)在多组互相独立的化学反应中分别进行特定碱基的 化学修饰;(3)在修饰碱基位置化学法断开DNA链;(4)聚丙烯酰胺凝胶电泳将DNA链按长短分开:(⑤)根据放射自显影显示区带,直接读出 DNA的核苷酸序列(图15-4). S'HO-GATCGGACCT 3 单端成射同位聚杯记 (此例为了一表殊标记) S HPGATOGGACCT 3 不完伞修饰 修饰G修饰G和A修悔T和C修修C 化学裂解 」电冰分离 GG+A T+CC 余长核酸 PGATOGGACC PGATOGGAC C] NPGATCGGAC 方 POATOGG☒四 PGATCG囹 PGATC G PGAT C] PGA O因 Ψ 口表示触锋饰碱基及断裂位置 图15·4化学裂解法测定DNA的核苷酸序列 第三节DNA的二级结构与功能 (一)DNA的二级结构?双螺旋结构模型(double helixmodel))
均使用相同的模板,相同的引物以及四种脱氧核苷酸;并在四组反应中各加入适量的四种之一的双脱氧核苷酸,使其随机地接入DNA链中,使 链合成终止,产生相应的四组具有特定长度的、不同长短的DNA链。这四组DNA链再经过聚丙烯酸胺凝胶电泳按链的长短分离开,经过放射 自显影显示区带,就可以直接读出被测DNA的核苷酸序列(图15-3)。 图15-3 双脱氧链终止法测定DNA序列原理示意 2.Maxam?Gilbert DNA化学降解法 这一方法的基本步骤为(1)先将DNA的末端之一进行标记(通常为放射性同位素32P;(2)在多组互相独立的化学反应中分别进行特定碱基的 化学修饰;(3)在修饰碱基位置化学法断开DNA链;(4)聚丙烯酰胺凝胶电泳将DNA链按长短分开;(5)根据放射自显影显示区带,直接读出 DNA的核苷酸序列(图15-4)。 图15-4 化学裂解法测定DNA的核苷酸序列 第三节 DNA的二级结构与功能 (一)DNA的二级结构?双螺旋结构模型(double helixmodel)
1953年,Watson和Crick提出了著名的DNA分子的双螺旋结构模型,揭示了遗传信息是如何储存在DNA分子中,以及遗传性状何以在世代 间得以保持。这是生物学发展的重大里程碑。 在DNA双螺旋结构模型建立之前,早在1868年,Miescher已经从脓细胞提取到核酸与蛋白质的复合物,当时称为核素(nuclein)。但核酸在 生命活动中的重要地位,却迟至本世纪50年代才被认识。 本世纪20年代,Levene研究了核酸的化学结构并提出四核苷酸假说;4O年代末,Avery,Hershey和Chase的实验严密地证实了DNA就是遗传 物质;50年代初,Chargaff应用紫外分光光度法结合纸层析等简单技术,对多种生物DNA作碱基定量分析,发现DNA碱基组成有如下规律(表 15·3). 表15-3不同生物来源的DNA四种碱基比例关系 DNA来源 腺嘌呤(A) 胸腺嘧啶(T) 鸟嘌呤(G) 胞嘧啶(C) (A+T)/(G+C) 大肠杆菌 25.4 24.8 24.1 25.7 1.01 小麦 26.8 28.0 23.2 22.7 1.21 鼠 29.7 25.6 21.9 22.8 1.21 猪:肝 29.4 29.7 20.5 20.5 胸腺 30.0 28.9 20.4 20.7 1.43 脾 29.6 29.2 20.4 20.8 酵母 31.3 32.9 18.7 17.5 1.079 (I)同一生物的不同组织的DNA碱基组成相同; (2)一种生物DNA碱基组成不随生物体的年龄、营养状态或者环境变化而改变: (3)几乎所有的DNA,无论种属来源如何,其腺嘌呤摩尔含量与胸腺嘧啶摩尔含量相同(A]=[T),鸟嘌呤摩尔含量与胞嘧啶摩尔含量相同 (G]=[C),总的原呤摩尔含量与总的嘧啶摩尔含量相同(【A+G】=[C]+[T)。 (4)不同生物来源的DNA碱基组成不同,表现在A+T/G+C比值的不同; 这些结果后来为DNA的双螺旋结构模型提供了一个有力的佐证。 Watson和Crick以立体化学原理为准则,对Wilkins和Franklin的DNaX?射线衍射分析结果加以研究,提出了DNA结构的双螺旋模式,其主 要内容如下: 5末端 子末端 了米划 A 图15·5DNA的双螺旋结构模式 A正面观:长方框内有详细说明,$代表脱氧核糖。 B俯视:涂黑的是碱基,此处全部碱基都是嘧啶,只看到糖的侧面略呈三角形,最外围是磷酸及其酯键。 (1)在DNA分子中,两股DNA链围绕一假想的共同轴心形成一右手螺旋结构,双螺旋的螺距为3.4nm,直径为2.0nm。(图15·5,?A,B). (2)链的骨架(backbone)由交替出现的、亲水的脱氧核糖基和磷酸基构成,位于双螺旋的外侧。 (3)碱基位于双螺旋的内侧,两股链中的嘌呤和嘧啶碱基以其疏水的、近于平面的环形结构彼此密切相近,平面与双螺旋的长轴相垂直。一 股链中的嘌呤碱基与另一股链中位于同一平面的嘧啶碱基之间以氢链相连,称为碱基互补配对或碱基配对(base pairing),碱基对层间的距离为 0.34m。碱基互补配对总是出现于腺嘌呤与胸腺嘧啶之间(A=T),形成两个氢键;或者出现于鸟嘌呤与胞嘧啶之间(G=C),形成三个氢键。(图 15-6)
1953年,Watson和Crick提出了著名的DNA分子的双螺旋结构模型,揭示了遗传信息是如何储存在DNA分子中,以及遗传性状何以在世代 间得以保持。这是生物学发展的重大里程碑。 在DNA双螺旋结构模型建立之前,早在1868年,Miescher已经从脓细胞提取到核酸与蛋白质的复合物,当时称为核素(nuclein)。但核酸在 生命活动中的重要地位,却迟至本世纪50年代才被认识。 本世纪20年代,Levene研究了核酸的化学结构并提出四核苷酸假说;40年代末,Avery,Hershey和Chase的实验严密地证实了DNA就是遗传 物质;50年代初,Chargaff应用紫外分光光度法结合纸层析等简单技术,对多种生物DNA作碱基定量分析,发现DNA碱基组成有如下规律(表 15-3)。 表15-3 不同生物来源的DNA四种碱基比例关系 DNA来源 腺嘌呤(A) 胸腺嘧啶(T) 鸟嘌呤(G) 胞嘧啶(C) (A+T)/(G+C) 大肠杆菌 25.4 24.8 24.1 25.7 1.01 小麦 26.8 28.0 23.2 22.7 1.21 鼠 29.7 25.6 21.9 22.8 1.21 猪:肝 29.4 29.7 20.5 20.5 胸腺 30.0 28.9 20.4 20.7 1.43 脾 29.6 29.2 20.4 20.8 酵母 31.3 32.9 18.7 17.5 1.079 (1)同一生物的不同组织的DNA碱基组成相同; (2)一种生物DNA碱基组成不随生物体的年龄、营养状态或者环境变化而改变; (3)几乎所有的DNA,无论种属来源如何,其腺嘌呤摩尔含量与胸腺嘧啶摩尔含量相同(A]=[T),鸟嘌呤摩尔含量与胞嘧啶摩尔含量相同 (G]=[C),总的嘌呤摩尔含量与总的嘧啶摩尔含量相同([A+G]=[C]+[T)。 (4)不同生物来源的DNA碱基组成不同,表现在A+T/G+C比值的不同; 这些结果后来为DNA的双螺旋结构模型提供了一个有力的佐证。 Watson和Crick以立体化学原理为准则,对Wilkins和Franklin的DNa X?射线衍射分析结果加以研究,提出了DNA结构的双螺旋模式,其主 要内容如下: 图15-5 DNA的双螺旋结构模式 A.正面观:长方框内有详细说明,S代表脱氧核糖。 B.俯视:涂黑的是碱基,此处全部碱基都是嘧啶,只看到糖的侧面略呈三角形,最外围是磷酸及其酯键。 (1)在DNA分子中,两股DNA链围绕一假想的共同轴心形成一右手螺旋结构,双螺旋的螺距为3.4nm,直径为2.0nm。(图15-5,?A,B)。 (2)链的骨架(backbone)由交替出现的、亲水的脱氧核糖基和磷酸基构成,位于双螺旋的外侧。 (3)碱基位于双螺旋的内侧,两股链中的嘌呤和嘧啶碱基以其疏水的、近于平面的环形结构彼此密切相近,平面与双螺旋的长轴相垂直。一 股链中的嘌呤碱基与另一股链中位于同一平面的嘧啶碱基之间以氢链相连,称为碱基互补配对或碱基配对(base pairing),碱基对层间的距离为 0.34nm。碱基互补配对总是出现于腺嘌呤与胸腺嘧啶之间(A=T),形成两个氢键;或者出现于鸟嘌呤与胞嘧啶之间(G=C),形成三个氢键。(图 15-6)
图15-6A·T,G-C间的氢键形成 (4)DNA双螺旋中的两股链走向是反平行的,一股链是5'→3'走向,另一股链是3'一→5'走向。两股链之间在空间上形成一条大沟(majo groove)和一条小沟(minor groove),这是蛋白质识别DNA的碱基序列,与其发生相互作用的基础。 DNA双螺旋的稳定由互补碱基对之间的氢键和碱基对层间的堆积力(base?stacking force)维系。DNA双螺旋中两股链中碱基互补的特点】 逻辑地预示了DNA复制过程是先将DNA分子中的两股链分离开,然后以每一股链为模板(亲本),通过碱基互补原则合成相应的互补链(复本), 形成两个完全相同的DNA分子。因为复制得到的每对链中只有一条是亲链,即保留了一半亲链,将这种复制方式称为DNA的半保留复制(smi? conservativereplication)。后来证明,半保留复制是生物体遗传信息传递的最基本方式. DNA双螺旋是核酸二级结构的重要形式。双螺旋结构理论支配了近代核酸结构功能的研究和发展,是生命科学发展史上的杰出贡献。 (二)DNA结构的多态性 Watson和Crick提出的DNA双螺旋结构属于B型双螺旋,它是以在生理盐溶液中抽出的DNA纤维在92%相对湿度下进行X·射线衍射图谱为 依据进行推测的,这是DNA分子在水性环境和生理条件下最稳定的结构。然而以后的研究表明DNA的结构是动态的。在以钾或绝作反离子, 相对湿度为75%时,DNA分子的X·射线衍射图给出的是A构象,A·DNA每螺旋含11个碱基对,而且变成A~DNA后,大沟变窄、变深,小 沟变宽、变浅。由于大沟、小沟是DNA行使功能时蛋白质的识别位点,所以由B·DNA变为A·DNA后,蛋白质对DNA分子的识别也发生了相 应变化。 一般说来,A·T丰富的DNA片段常呈B-DNA。采用乙醇沉淀法纯化DNA时,整个过程中,大部分DNA由B·DNA经过C·DNA,最终 变构为A·DNA。若DNA双链中一条链被相应的RNA链所替换,会变构成A·DNA。当DNA处于转录状态时,DNA模板链与由它转录所得的 RNA链间形成的双链就是A·DNA。由此可见A·DNA构象对基因表达有重要意义。此外,B·DNA双链都被RNA链所取代而得到由两条 RNA链组成的双螺旋结构也是A·DNA。除A~DNA、B·DNA螺旋外,还存在B'·DNA、C·DNA、D·DNA等,其结构参数见表15·4. 表15-4不同右手双螺旋DNA的结构参数 双螺旋 碱基倾 碱基夹 碱基间距 螺距 每轮碱 小沟宽/nm× 大沟宽nm× 角/() 角() /nm /nm 基数 小沟宽nm 大沟宽nm B-DNA 36.0 0.337 3.4 1 0.57×0.75 1.17×0.85 C-DNA 6 38.0 0.331 3.1 9.3 0.48×0.79 1.05×0.75 D-DNA 45.0 0.303 0.13×0.67 0.89x0.58 A-DAN 20 32.7 0.256 2.8 11 1.10×0.28 0.27×135 总之,DNA的双螺旋结构永远处于动态平衡中,DNA分子构象的变化与糖基和碱基之间空间相对位置有关。 1979年,Wang和Rich等人在研究人工合成的CGCGCG单晶的X-射线衍射图谱时出人意料地发现这种六聚体的构象与上面讲到的完全不 同。它是左手双螺旋,与右手螺旋的不同是螺距延长(4.5nm左右),直径变窄(1.8m),每个螺旋含12个碱基对,分子长链中磷原子不是平滑延 伸而是锯齿形排列,有如“之”字形一样,因此叫它Z构象(英文字Zgzg的第一个字母)。还有,这一构象中的重复单位是二核苷酸而不是单核 苷酸;而且Z?DNA只有一个螺旋沟,它相当于B构象中的小沟,它狭而深,大沟则不复存在(图15-7)。进一步的分析还证明,Z·DNA的形成 是DNA单链上出现嘌呤与嘧啶交替排列所成的。比如CGCGCGCG或者CACACACA
图15-6 A-T,G-C间的氢键形成 (4)DNA双螺旋中的两股链走向是反平行的,一股链是5′→3′走向,另一股链是3′→5′走向。两股链之间在空间上形成一条大沟(major groove)和一条小沟(minor groove),这是蛋白质识别DNA的碱基序列,与其发生相互作用的基础。 DNA双螺旋的稳定由互补碱基对之间的氢键和碱基对层间的堆积力(base?stacking force)维系。DNA双螺旋中两股链中碱基互补的特点, 逻辑地预示了DNA复制过程是先将DNA分子中的两股链分离开,然后以每一股链为模板(亲本),通过碱基互补原则合成相应的互补链(复本), 形成两个完全相同的DNA分子。因为复制得到的每对链中只有一条是亲链,即保留了一半亲链,将这种复制方式称为DNA的半保留复制(semi? conservativereplication)。后来证明,半保留复制是生物体遗传信息传递的最基本方式。 DNA双螺旋是核酸二级结构的重要形式。双螺旋结构理论支配了近代核酸结构功能的研究和发展,是生命科学发展史上的杰出贡献。 (二)DNA结构的多态性 Watson和Crick提出的DNA双螺旋结构属于B型双螺旋,它是以在生理盐溶液中抽出的DNA纤维在92%相对湿度下进行X-射线衍射图谱为 依据进行推测的,这是DNA分子在水性环境和生理条件下最稳定的结构。然而以后的研究表明DNA的结构是动态的。在以钾或绝作反离子, 相对湿度为75%时,DNA分子的X-射线衍射图给出的是A构象,A-DNA每螺旋含11个碱基对,而且变成A-DNA后,大沟变窄、变深,小 沟变宽、变浅。由于大沟、小沟是DNA行使功能时蛋白质的识别位点,所以由B-DNA变为A-DNA后,蛋白质对DNA分子的识别也发生了相 应变化。 一般说来,A-T丰富的DNA片段常呈B-DNA。采用乙醇沉淀法纯化DNA时,整个过程中,大部分DNA由B-DNA经过C-DNA,最终 变构为A-DNA。若DNA双链中一条链被相应的RNA链所替换,会变构成A-DNA。当DNA处于转录状态时,DNA模板链与由它转录所得的 RNA链间形成的双链就是A-DNA。由此可见A-DNA构象对基因表达有重要意义。此外,B-DNA双链都被RNA链所取代而得到由两条 RNA链组成的双螺旋结构也是A-DNA。除A-DNA、B-DNA螺旋外,还存在B′-DNA、C-DNA、D-DNA等,其结构参数见表15-4。 表15-4 不同右手双螺旋DNA的结构参数 双螺旋 碱基倾 碱基夹 碱基间距 螺距 每轮碱 小沟宽/nm× 大沟宽nm× 角/(°) 角(°) /nm /nm 基数 小沟宽nm 大沟宽nm B-DNA 0 36.0 0.337 3.4 10 0.57×0.75 1.17×0.85 C-DNA 6 38.0 0.331 3.1 9.3 0.48×0.79 1.05×0.75 D-DNA 45.0 0.303 0.13×0.67 0.89×0.58 A-DAN 20 32.7 0.256 2.8 11 1.10×0.28 0.27×1.35 总之,DNA的双螺旋结构永远处于动态平衡中,DNA分子构象的变化与糖基和碱基之间空间相对位置有关。 1979年,Wang和Rich等人在研究人工合成的CGCGCG单晶的X-射线衍射图谱时出人意料地发现这种六聚体的构象与上面讲到的完全不 同。它是左手双螺旋,与右手螺旋的不同是螺距延长(4.5nm左右),直径变窄(1.8nm),每个螺旋含12个碱基对,分子长链中磷原子不是平滑延 伸而是锯齿形排列,有如“之”字形一样,因此叫它Z构象(英文字Zigzag的第一个字母)。还有,这一构象中的重复单位是二核苷酸而不是单核 苷酸;而且Z?DNA只有一个螺旋沟,它相当于B构象中的小沟,它狭而深,大沟则不复存在(图15-7)。进一步的分析还证明,Z-DNA的形成 是DNA单链上出现嘌呤与嘧啶交替排列所成的。比如CGCGCGCG或者CACACACA
Z-DN 图15-7Z-DNA和B-DNA Z·DNA有什么生物学意义呢?应当指出Z·DNA的形成通常在热力学上是不利的。因为Z·DNA中带负电荷的磷酸根距离太近了,这会产 生静电排斥。但是,DNA链的局部不稳定区的存在就成为潜在的解链位点。DNA解螺旋却是DNA复制和转录等过程中必要的环节,因此认为 这一结构与基因调节有关。比如SV40增强子区中就有此结构,又如鼠类微小病毒DNS复制区起始点附近有GC交替排列序列。此外,DNA螺旋 上沟的特征在其信息表达过程中起关键作用。调控蛋白都是通过其分子上特定的氨基酸侧链与DNA双螺旋沟中的碱基对一侧的氢原子供体或受 体相互作用,形成氢键从而识别DNA上的遗传信息的。大沟所带的遗传信息比小沟多。沟的宽窄和深浅也直接影响到调控蛋白质对DNA信息 的识别。Z?DNA中大沟消失,小沟狭而深,使调控蛋白识别方式也发生变化。这些都暗示Z?DNA的存在不仅仅是由于DNA中出现嘌岭一啶嘧 交替排列之结果,也一定是在漫漫的进化长河中对D、A序列与结构不断调整与筛选的结果,有其内在而深刻的含意,只是人们还未充分认识而 已. DNA构象的可变性,或者说DNA二级结构的多态性的发现拓宽了人们的视野。原来,生物体中最为稳定的遗传物质也可以采用不同的姿 态来实现其丰富多采的生物学功能。 多年来,DNA结构的研究手段主要是X射线衍射技术,其结果是通过间接观测多个DNA分子有关结构参数的平均值而获得的。同时,这项 技术的样品分析条件使被测DNA分子与天然状态相差甚远。因此,在反映DNA结构真实性方面这种方法存在着缺陷。1989年,应用扫描隧道 显微镜(scanning tummelingmicroscopy,STM)研究DNA结构克服了上述技术的缺陷。这种先进的显微技术,不仅可将被测物放大50O万倍,且 能直接观测接近天然条件下单个DNA分子的结构细节。STM技术的应用是DNA结构研究中的重要进展,可望在探索DNA结构的某些未知点上 展示巨大潜力。 (三)DNA结构的不均一性heterogeneity) 在DNA的一级结构中,四种碱基A,T,C,G远非均匀分布,尽管双螺旋的构型大体相同,但沿着DNA链各处的物理结构不完全相同,各 处双螺旋的稳定性也就显示出差别,充分体现了DNA一级结构决定高级结构的原理。其不均一性主要有: 1.反向重复序列(inverted repeats) 又称回文序列(palindrome),它能在DNA或RNA中形成发夹结构。这种回文结构通常是作为一种特别信号,如限制性核酸内切酸 (restriction encl闩迥onuclease)及调节蛋白的识别位点,转录终止信号等。 2.富含A/T的序列 在高等生物中,A+T与G+C的含量差不多相等,然而在它们的染色体某一区域,A·T含量可能相当高。如在很多有重要调节功能的DNA区 段都富含A·T,特别是在复制起点和启动子的Pribnow框(真核生物为TATA框)的序列中,其对于复制和起始十分重要。因为A·T对只有二条氢 键,此处的双链较G·C对处易于解开,有利于起始复合物的形成。 3.嘌呤和嘧啶的排列顺序对双螺旋结构稳定性的影响。 人们考察了十种相邻的二核苷酸对(nearest?neighbor doublets),发现一个非常有趣的现象,那就是碱基组成相同,但嘌呤和嘧啶的排列顺 序不同,双螺旋的稳定性具有显著的差异。例如5'Gc3'3'G5和5'GC3”3'GC5'的稳定性相差很大,前者的稳定性远大于后。它们的氢键数 目是相同的,它们的差别在于相邻碱基之间的堆集力不同。即从嘌呤到嘧啶的方向的碱基堆集作用显著地大于同样组成的嘧啶到嘌呤方向的碱 基堆集作用。(这里的方向就是常规的从5'端到3端的方向)。这是因为前者的嘌呤环和嘧啶环重迭面积大于后者的嘧啶环和嘌呤环的重迭面 积,这在B型DNA中确是如此。 根据Gotoh1981年的研究,十种相邻二核苷酸对的Tm值如表15?所示,单位为℃,所用离子强度为19.5mmol1Na+。 表15·5相邻二核苷酸对Tm值 3 A G A 54.50 57.02 58.42 97.73 T 36.73 54.50 54.71 86.44 G 86.44 97.73 85.97 136.12 C 54.71 58.42 72.55 85.97 由表15-5可以看到,5TA3'3'AT5'的Tm值最低。在真核生物中,常可以在?19到?27的位置上看到一个叫做TATA框的结构(又称Hogness 框),这是RNA聚合酶的结合位点。在这里RNA聚合酶和有关蛋白质因子形成转录起始复合物。 又如,生命有机体选择UAA作为最有效的终止密码子绝不是偶然的,因为64个三联体密码子中,它与反密码子(假定有的话)形成的互补产 物5UAA3'3'AUU5'的Tm值是最低的一个,即使在生理温度下也是不稳定的。当初有人花了很多工夫去寻找一个不携带氨基酸的专供肽链终止
图15-7 Z-DNA和B-DNA Z-DNA有什么生物学意义呢?应当指出Z-DNA的形成通常在热力学上是不利的。因为Z-DNA中带负电荷的磷酸根距离太近了,这会产 生静电排斥。但是,DNA链的局部不稳定区的存在就成为潜在的解链位点。DNA解螺旋却是DNA复制和转录等过程中必要的环节,因此认为 这一结构与基因调节有关。比如SV40增强子区中就有此结构,又如鼠类微小病毒DNS复制区起始点附近有GC交替排列序列。此外,DNA螺旋 上沟的特征在其信息表达过程中起关键作用。调控蛋白都是通过其分子上特定的氨基酸侧链与DNA双螺旋沟中的碱基对一侧的氢原子供体或受 体相互作用,形成氢键从而识别DNA上的遗传信息的。大沟所带的遗传信息比小沟多。沟的宽窄和深浅也直接影响到调控蛋白质对DNA信息 的识别。Z?DNA中大沟消失,小沟狭而深,使调控蛋白识别方式也发生变化。这些都暗示Z?DNA的存在不仅仅是由于DNA中出现嘌呤一啶嘧 交替排列之结果,也一定是在漫漫的进化长河中对DNA序列与结构不断调整与筛选的结果,有其内在而深刻的含意,只是人们还未充分认识而 已。 DNA构象的可变性,或者说DNA二级结构的多态性的发现拓宽了人们的视野。原来,生物体中最为稳定的遗传物质也可以采用不同的姿 态来实现其丰富多采的生物学功能。 多年来,DNA结构的研究手段主要是X射线衍射技术,其结果是通过间接观测多个DNA分子有关结构参数的平均值而获得的。同时,这项 技术的样品分析条件使被测DNA分子与天然状态相差甚远。因此,在反映DNA结构真实性方面这种方法存在着缺陷。1989年,应用扫描隧道 显微镜(scanning tummelingmicroscopy,STM)研究DNA结构克服了上述技术的缺陷。这种先进的显微技术,不仅可将被测物放大500万倍,且 能直接观测接近天然条件下单个DNA分子的结构细节。STM技术的应用是DNA结构研究中的重要进展,可望在探索DNA结构的某些未知点上 展示巨大潜力。 (三)DNA结构的不均一性(heterogeneity) 在DNA的一级结构中,四种碱基A,T,C,G远非均匀分布,尽管双螺旋的构型大体相同,但沿着DNA链各处的物理结构不完全相同,各 处双螺旋的稳定性也就显示出差别,充分体现了DNA一级结构决定高级结构的原理。其不均一性主要有: 1.反向重复序列(inverted repeats) 又称回文序列(palindrome),它能在DNA或RNA中形成发夹结构。这种回文结构通常是作为一种特别信号,如限制性核酸内切酸 (restriction encl闩迥onuclease)及调节蛋白的识别位点,转录终止信号等。 2.富含A/T的序列 在高等生物中,A+T与G+C的含量差不多相等,然而在它们的染色体某一区域,A·T含量可能相当高。如在很多有重要调节功能的DNA区 段都富含A·T,特别是在复制起点和启动子的Pribnow框(真核生物为TATA框)的序列中,其对于复制和起始十分重要。因为A-T对只有二条氢 键,此处的双链较G-C对处易于解开,有利于起始复合物的形成。 3.嘌呤和嘧啶的排列顺序对双螺旋结构稳定性的影响。 人们考察了十种相邻的二核苷酸对(nearest?neighbor doublets),发现一个非常有趣的现象,那就是碱基组成相同,但嘌呤和嘧啶的排列顺 序不同,双螺旋的稳定性具有显著的差异。例如5′Gc3′ 3′G 5′和5′GC 3′ 3′GC 5′的稳定性相差很大,前者的稳定性远大于后。它们的氢键数 目是相同的,它们的差别在于相邻碱基之间的堆集力不同。即从嘌呤到嘧啶的方向的碱基堆集作用显著地大于同样组成的嘧啶到嘌呤方向的碱 基堆集作用。(这里的方向就是常规的从5′端到3′端的方向)。这是因为前者的嘌呤环和嘧啶环重迭面积大于后者的嘧啶环和嘌呤环的重迭面 积,这在B型DNA中确是如此。 根据Gotoh 1981年的研究,十种相邻二核苷酸对的Tm值如表15?所示,单位为℃,所用离子强度为19.5mmol/l Na+。 表15-5 相邻二核苷酸对Tm值 3′ A T G C 5′ A 54.50 57.02 58.42 97.73 T 36.73 54.50 54.71 86.44 G 86.44 97.73 85.97 136.12 C 54.71 58.42 72.55 85.97 由表15-5可以看到,5′TA 3′ 3′AT5′的Tm值最低。在真核生物中,常可以在?19到?27的位置上看到一个叫做TATA框的结构(又称Hogness 框),这是RNA聚合酶的结合位点。在这里RNA聚合酶和有关蛋白质因子形成转录起始复合物。 又如,生命有机体选择UAA作为最有效的终止密码子绝不是偶然的,因为64个三联体密码子中,它与反密码子(假定有的话)形成的互补产 物5′UAA3′3′AUU5′的Tm值是最低的一个,即使在生理温度下也是不稳定的。当初有人花了很多工夫去寻找一个不携带氨基酸的专供肽链终止
用的tRNA,其实并不存在这种tRNA。肽链的释放是由释放因子RF在起作用。在三种终止密码子中,UAG和UGA常会为突变型的tRNA无义抑 制,而UAA则很少发生无义抑制也可能就是这个道理。这也就说明了为什么在肽链终止处常常会出现双重终止密码子。 (四)DNA的变性、复性与分子杂交 DNA双螺旋结构模型,不仅与其生物功能有密切关系,还能解释DNA的重要特性枣变性与复性,这对于深入了解DNA分子结构与功能的 关系又有重要意义。 1.DNA变性(denaturation) 指DNA分子由稳定的双螺旋结构松解为无规则线性结构的现象。变性时维持双螺旋稳定性的氢键断裂,碱基间的堆积力遭到破坏,但不涉 及到其一级结构的改变。凡能破坏双螺旋稳定性的因素,如加热、极端的H、有机试剂甲醇、乙醇、尿素及甲酰胺等,均可引起核酸分子变 性。变性DNA常发生一些理化及生物学性质的改变: 溶液粘度降低。DNA双螺旋是紧密的刚性结构,变性后代之以柔软而松散的无规侧单股线性结构,DNA粘度因此而明显下降。 溶液旋光性发生改变。变性后整个DNA分子的对称性及分子局部的构性改变,使DNA溶液的旋光性发生变化. OD250mmn 070 0.65 060 055 050 72768084889296100℃ Tm 15-8核酸的解链曲线 增色效应(hyperchromiceffect)。指变性后DNA溶液的紫外吸收作用增强的效应。DNA分子中碱基间电子的相互作用使DNA分子具有吸收 260m波长紫外光的特性。在DNA双螺旋结构中碱基藏入内侧,变性时DNA双螺旋解开,于是碱基外露,碱基中电子的相互作用更有利于紫 外吸收,故而产生增色效应。 对双链DNA进行加热变性,当温度升高到一定高度时,DNA溶液在260m处的吸光度突然明显上升至最高值,随后即使温度继续升高,吸 光度也不再明显变化。若以温度对DNA溶液的紫外吸光率作图,得到的典型DNA变性曲线呈S型(图15?8)。可见DNA变性是在一个很窄的温度 范围内发生的。通常将核酸加热变性过程中,紫外光吸收值达到最大值的50%时的温度称为核酸的解链温度,由于这一现象和结晶的融解相类 似,又称融解温度(Tm,meltingtemperature)。在Tm时,核酸分子内50%的双螺旋结构被破坏。特定核酸分子的Tm值与其G+C所占总碱基数的 百分比成正相关,两者的关系可表示为: Tm=69.3+0.41(%G+C) 一定条件下(相对较短的核酸分子),Tm值大小还与核酸分子的长度有关,核酸分子越长,Tm值越大;另外,溶液的离子强度较低时,Tm 值较低,融点范围也较宽,反之亦然,因此DNA制剂不应保存在离子强度过低的溶液中。 2.DNA复性(renaturation) 指变性DNA在适当条件下,二条互补链全部或部分恢复到天然双螺旋结构的现象,它是变性的一种逆转过程。热变性DNA一般经缓慢冷 却后即可复性,此过程称之为退火(annealing)。这一术语也用以描述杂交核酸分子的形成(见后)。DNA的复性不仅受温度影响,还受DNA自身 特性等其它因素的影响: 温度和时间。一般认为比Tm低25℃左右的温度是复性的最佳条件,越远离此温度,复性速度就越慢。复性时温度下降必须是一缓慢过 程,若在超过Tm的温度下迅速冷却至低温(如4℃以下),复性几乎是不可能的,核酸实验中经常以此方式保持DNA的变性(单链)状态。这说明 降温时间太短以及温差大均不利于复性。 DNA浓度。溶液中DNA分子越多,相互碰撞结合的机会越大。 DNA顺序的复杂性。简单顺序的DNA分子,如多聚(A)和多聚(U)这二种单链序列复性时,互补碱基的配对较易实现。而顺序复杂的序列要 实现互补,则困难得多。在核酸复性研究中,定义了一个Cot的术语,(Co为单链DNA的起始浓度,t是以秒为单位的时间),用以表示复性速度 与DNA顺序复杂性的关系。在探讨DNA顺序对复性速度的影响时,将温度、溶剂离子强度、核酸片段大小等其它影响因素均予以固定,以不 同程度的核酸分子重缔合部分(在时间t时的复性率)对Co作图,可以得到如图15·9所示的曲线。曲线上方为示复杂性的核酸分子的非重复碱基 对数。如多聚(A)的复杂性为1,重复的(ATGC)n组成的多聚体的复杂性为4,分子长度是105核苷酸对的非重复DNA的复杂性为105。原核生物 基因组均为非重复顺序,故以非重复核苷酸对表示的复杂性直接体现基因组大小(图上方的箭头所指为基因大小),对于真核生物基因组中的非 重复片段也是如此。在标准条件下(一般为0.18ml/L阳离子浓度,400核苷酸长的片段)测得的复性率达0.5时的Cot值(称Cot1/2),与核苷酸对的
用的tRNA,其实并不存在这种tRNA。肽链的释放是由释放因子RF在起作用。在三种终止密码子中,UAG和UGA常会为突变型的tRNA无义抑 制,而UAA则很少发生无义抑制也可能就是这个道理。这也就说明了为什么在肽链终止处常常会出现双重终止密码子。 (四)DNA的变性、复性与分子杂交 DNA双螺旋结构模型,不仅与其生物功能有密切关系,还能解释DNA的重要特性枣变性与复性,这对于深入了解DNA分子结构与功能的 关系又有重要意义。 1.DNA变性(denaturation) 指DNA分子由稳定的双螺旋结构松解为无规则线性结构的现象。变性时维持双螺旋稳定性的氢键断裂,碱基间的堆积力遭到破坏,但不涉 及到其一级结构的改变。凡能破坏双螺旋稳定性的因素,如加热、极端的pH、有机试剂甲醇、乙醇、尿素及甲酰胺等,均可引起核酸分子变 性。变性DNA常发生一些理化及生物学性质的改变: 溶液粘度降低。DNA双螺旋是紧密的刚性结构,变性后代之以柔软而松散的无规则单股线性结构,DNA粘度因此而明显下降。 溶液旋光性发生改变。变性后整个DNA分子的对称性及分子局部的构性改变,使DNA溶液的旋光性发生变化。 15-8 核酸的解链曲线 增色效应(hyperchromiceffect)。指变性后DNA溶液的紫外吸收作用增强的效应。DNA分子中碱基间电子的相互作用使DNA分子具有吸收 260nm波长紫外光的特性。在DNA双螺旋结构中碱基藏入内侧,变性时DNA双螺旋解开,于是碱基外露,碱基中电子的相互作用更有利于紫 外吸收,故而产生增色效应。 对双链DNA进行加热变性,当温度升高到一定高度时,DNA溶液在260nm处的吸光度突然明显上升至最高值,随后即使温度继续升高,吸 光度也不再明显变化。若以温度对DNA溶液的紫外吸光率作图,得到的典型DNA变性曲线呈S型(图15?8)。可见DNA变性是在一个很窄的温度 范围内发生的。通常将核酸加热变性过程中,紫外光吸收值达到最大值的50%时的温度称为核酸的解链温度,由于这一现象和结晶的融解相类 似,又称融解温度(Tm,meltingtemperature)。在Tm时,核酸分子内50%的双螺旋结构被破坏。特定核酸分子的Tm值与其G+C所占总碱基数的 百分比成正相关,两者的关系可表示为: Tm=69.3+0.41(%G+C) 一定条件下(相对较短的核酸分子),Tm值大小还与核酸分子的长度有关,核酸分子越长,Tm值越大;另外,溶液的离子强度较低时,Tm 值较低,融点范围也较宽,反之亦然,因此DNA制剂不应保存在离子强度过低的溶液中。 2.DNA复性(renaturation) 指变性DNA在适当条件下,二条互补链全部或部分恢复到天然双螺旋结构的现象,它是变性的一种逆转过程。热变性DNA一般经缓慢冷 却后即可复性,此过程称之为退火(annealing)。这一术语也用以描述杂交核酸分子的形成(见后)。DNA的复性不仅受温度影响,还受DNA自身 特性等其它因素的影响: 温度和时间。一般认为比Tm低25℃左右的温度是复性的最佳条件,越远离此温度,复性速度就越慢。复性时温度下降必须是一缓慢过 程,若在超过Tm的温度下迅速冷却至低温(如4℃以下),复性几乎是不可能的,核酸实验中经常以此方式保持DNA的变性(单链)状态。这说明 降温时间太短以及温差大均不利于复性。 DNA浓度。溶液中DNA分子越多,相互碰撞结合的机会越大。 DNA顺序的复杂性。简单顺序的DNA分子,如多聚(A)和多聚(U)这二种单链序列复性时,互补碱基的配对较易实现。而顺序复杂的序列要 实现互补,则困难得多。在核酸复性研究中,定义了一个Cot的术语,(Co为单链DNA的起始浓度,t是以秒为单位的时间),用以表示复性速度 与DNA顺序复杂性的关系。在探讨DNA顺序对复性速度的影响时,将温度、溶剂离子强度、核酸片段大小等其它影响因素均予以固定,以不 同程度的核酸分子重缔合部分(在时间t时的复性率)对Cot作图,可以得到如图15-9所示的曲线。曲线上方为示复杂性的核酸分子的非重复碱基 对数。如多聚(A)的复杂性为1,重复的(ATGC)n组成的多聚体的复杂性为4,分子长度是105核苷酸对的非重复DNA的复杂性为105。原核生物 基因组均为非重复顺序,故以非重复核苷酸对表示的复杂性直接体现基因组大小(图上方的箭头所指为基因大小),对于真核生物基因组中的非 重复片段也是如此。在标准条件下(一般为0.18ml/L阳离子浓度,400核苷酸长的片段)测得的复性率达0.5时的Cot值(称Cot1/2),与核苷酸对的
复杂性成正比。对于原核生物核酸分子,此值可代表基因组的大小及基因组中核苷酸对的复杂程度。真核基因组中因含有许多不同程度的重复 序列(repetitive sequence),所得到的Cot曲线更为复杂。 核苷酸对 10 10 0P 10¥ 0的 10 109 U 必 (非重复序列) 小鼠 05 卫星DNA 1oL山山盟W产amW线 10 10 10 103 10 1000000000 〔摩尔×秒/升) 图15·9不同物种核酸的Cot曲线 DNA的变性和复性原理,现已在医学和生命科学上得到广泛的应用。如核酸杂交与探针技术,聚合酶链反应(polymerasechain reaction,PCR)技术等. 3.分子杂交:(hybridization) 不同来源的核酸变性后,合并在一处进行复性,这时,只要这些核酸分子的核苷酸序列含有可以形成碱基互补配对的片段,复性也会发生 于不同来源的核酸链之间,形成所谓的杂化双链(heterodup lex),这个过程称为杂交(hybridization)图15-I0,I)。杂交可以发生于DNA与DNA 之间,也可以发生于RNA与RNA之间和DNA与RNA之间。例如,一段天然的DNA和这段DNA的缺失突变体(假定这种突变是DNA分子中部丢 失了若干碱基对)一起杂交,电子显微镜下可以看到杂化双链中部鼓起小泡。测量小泡位置和长度,可确定缺失突变发生的部位和缺失的多 少。核酸杂交技术是目前研究核酸结构、功能常用手段之一,不仅可用来检验核酸的缺失、插入,还可用来考察不同生物种类在核酸分子中的 共同序列和不同序列以确定它们在进化中的关系。其应用当然远不止于确定突变位置这一例(图15·10山). 图15·10核酸杂交及其应用示意图 I.变性、复性和杂交。粗细线分别代表不同DNA。A是杂化双链 Ⅱ突变体的鉴别。B代表天然DNA;C是B的缺失突变体;虚线框内是已缺失的部分: D是显示从天然DNA链鼓出小泡Ⅲ粗线代表探针,粗线上的X表示放射性标记 在核酸杂交的基础上发展起来的一种用于研究和诊断的非常有用的技术称探针技术(Prob)。一小段(例如十数个至数百个)核苷酸聚合体的 单链,有放射性同位素如32P、35S或生物素标记其末端或全链,就可作为探针。把待测DNA变性并吸附在一种特殊的滤膜,例如硝酸纤维素 膜上。然后把滤膜与探针共同培育一段时间,使发生杂交。用缓冲液冲洗膜。由于这种滤膜能较牢固地吸附双链的核酸,单链的在冲洗时洗脱 了。带有放射性的探针若能与待测DNA结合成杂化双链,则保留在滤膜上。通过同位素的放射自显影或生物素的化学显色,就可判断探针是否 与被测的DNA发生杂交。有杂交现象则说明被测DNA与探针有同源性(homogeneity),即二者的碱基序列是可以互补的。例如:想知道某种病 毒是否和某种肿瘤有关,可把病毒的DNA制成探针。从肿瘤组织提取DNA,与探针杂交处理后,有杂化双链的出现,就说明两种DNA之间有 同源性。这不等于可以说这种病毒引起肿瘤,但至少这是可以继续深入研究下去的一条重要线索。 探针技术(图15·10四)在遗传性疾病诊断上已开始应用。例如诊断地中海贫血或血红蛋白病,可以由已确诊的病人白细胞中提取D八,这 就是诊断探针。用诊断探针检查,不但可以对有症状患者进行确诊,还可以发现一些没有症状的隐性遗传性疾病。从胎儿的羊水也可以提取到
复杂性成正比。对于原核生物核酸分子,此值可代表基因组的大小及基因组中核苷酸对的复杂程度。真核基因组中因含有许多不同程度的重复 序列(repetitive sequence),所得到的Cot曲线更为复杂。 图15-9 不同物种核酸的Cot曲线 DNA 的 变 性 和 复 性 原 理 , 现 已 在 医 学 和 生 命 科 学 上 得 到 广 泛 的 应 用 。 如 核 酸 杂 交 与 探 针 技 术 , 聚 合 酶 链 反 应 (polymerasechain reaction,PCR)技术等。 3.分子杂交:(hybridization) 不同来源的核酸变性后,合并在一处进行复性,这时,只要这些核酸分子的核苷酸序列含有可以形成碱基互补配对的片段,复性也会发生 于不同来源的核酸链之间,形成所谓的杂化双链(heterodup lex),这个过程称为杂交(hybridization)图15-10,I)。杂交可以发生于DNA与DNA 之间,也可以发生于RNA与RNA之间和DNA与RNA之间。例如,一段天然的DNA和这段DNA的缺失突变体(假定这种突变是DNA分子中部丢 失了若干碱基对)一起杂交,电子显微镜下可以看到杂化双链中部鼓起小泡。测量小泡位置和长度,可确定缺失突变发生的部位和缺失的多 少。核酸杂交技术是目前研究核酸结构、功能常用手段之一,不仅可用来检验核酸的缺失、插入,还可用来考察不同生物种类在核酸分子中的 共同序列和不同序列以确定它们在进化中的关系。其应用当然远不止于确定突变位置这一例(图15-10Ⅱ)。 图15-10 核酸杂交及其应用示意图 Ⅰ.变性、复性和杂交。粗细线分别代表不同DNA。A是杂化双链 Ⅱ.突变体的鉴别。B代表天然DNA;C是B的缺失突变体;虚线框内是已缺失的部分; D是显示从天然DNA链鼓出小泡 Ⅲ.粗线代表探针,粗线上的X表示放射性标记 在核酸杂交的基础上发展起来的一种用于研究和诊断的非常有用的技术称探针技术(Probe)。一小段(例如十数个至数百个)核苷酸聚合体的 单链,有放射性同位素如32P、35S或生物素标记其末端或全链,就可作为探针。把待测DNA变性并吸附在一种特殊的滤膜,例如硝酸纤维素 膜上。然后把滤膜与探针共同培育一段时间,使发生杂交。用缓冲液冲洗膜。由于这种滤膜能较牢固地吸附双链的核酸,单链的在冲洗时洗脱 了。带有放射性的探针若能与待测DNA结合成杂化双链,则保留在滤膜上。通过同位素的放射自显影或生物素的化学显色,就可判断探针是否 与被测的DNA发生杂交。有杂交现象则说明被测DNA与探针有同源性(homogeneity),即二者的碱基序列是可以互补的。例如:想知道某种病 毒是否和某种肿瘤有关,可把病毒的DNA制成探针。从肿瘤组织提取DNA,与探针杂交处理后,有杂化双链的出现,就说明两种DNA之间有 同源性。这不等于可以说这种病毒引起肿瘤,但至少这是可以继续深入研究下去的一条重要线索。 探针技术(图15-10Ⅲ)在遗传性疾病诊断上已开始应用。例如诊断地中海贫血或血红蛋白病,可以由已确诊的病人白细胞中提取DNA,这 就是诊断探针。用诊断探针检查,不但可以对有症状患者进行确诊,还可以发现一些没有症状的隐性遗传性疾病。从胎儿的羊水也可以提取到