分子生物学基本知识 核酸的结构与功能-核酸的化学组成 核酸的结构与功能 The Structure and Function of Nucleic acid 868年,瑞士的内科医生 Friedrich miescher从外科医院包扎伤口的绷带上的脓 细胞核中提取到一种富含磷元素的酸性化合物,将其称为核质( nuclein):后来他 又从鲭鱼精子中分离出类似的物质,并指出它是由一种碱性蛋白质与一种酸性物 质组成的,此酸性物质即是现在所知的核酸( nucleic acid)。1944年 Oswald Avery; Colin macleod和 Maclyn McCarty发现,一种有夹膜、具致病性的肺炎球 菌中提取的核酸桪NA( deoxyribonucleic acid,脱氧核糖核酸),可使另一种无夹膜, 不具致病性的肺炎球菌的遗传性状发生改变,转变为有夹膜,具致病性的肺炎球 菌,且转化率与DNA纯度呈正相关,若将DNA预先用DNA酶降解,转化就不 发生。该项实验彻底纠正了蛋白质携带遗传信息这一错误认识,确立了核酸是遗 传物质的重要地位;DNA遗传作用的进一步肯定来自 Alfred Hershey和 Martha Chase对一个感染大肠杆菌的病毒的研究。即用放谢性同位素32P标记噬菌体 DNA,35S标记其蛋白质外壳,再用标记的噬菌体去感染培养的大肠杆菌,结果 发现进入细菌体内,使细菌生长、繁殖发生变化的是32P标记的DNA,而不是 35S标记的蛋白质,并且新繁殖生成的噬菌体不含35S,只含32P。1953年 Watson 和 Crick创立的DNA双螺旋结构模型,不仅阐明了DNA分子的结构特征,而且 提出了DNA作为执行生物遗传功能的分子,从亲代到子代的DNA复制 ( replication)过程中,遗传信息的传递方式及高度保真性,为遗传学进入分子水平 奠定了基础,成为现代分子生物学发展史上最为辉煌的里程碑。后来的研究又发 现了另一类核酸泰NA( ribonucleic acid,核糖核酸),RNA在遗传信息的传递中起 着重要的作用。从此,核酸硏究的进展日新月异,如今,由核酸研究而产生的分 子生物学及其基因工程技术已渗透到医药学、农业、化工等领域的各个学科,人 类对生命本质的认识进入了一个崭新的天地
分子生物学基本知识 核酸的结构与功能--核酸的化学组成 核酸的结构与功能 The Structure and Function of Nucleic Acid 1868 年,瑞士的内科医生 Friedrich Miescher 从外科医院包扎伤口的绷带上的脓 细胞核中提取到一种富含磷元素的酸性化合物,将其称为核质(nuclein);后来他 又从鲭鱼精子中分离出类似的物质,并指出它是由一种碱性蛋白质与一种酸性物 质组成的,此酸性物质即是现在所知的核酸(nucleic acid)。1944 年 Oswald Avery,Colin Macleod 和 Maclyn McCarty 发现,一种有夹膜、具致病性的肺炎球 菌中提取的核酸桪 NA(deoxyribonucleic acid,脱氧核糖核酸),可使另一种无夹膜, 不具致病性的肺炎球菌的遗传性状发生改变,转变为有夹膜,具致病性的肺炎球 菌,且转化率与 DNA 纯度呈正相关,若将 DNA 预先用 DNA 酶降解,转化就不 发生。该项实验彻底纠正了蛋白质携带遗传信息这一错误认识,确立了核酸是遗 传物质的重要地位;DNA 遗传作用的进一步肯定来自 Alfred Hershey 和 Martha Chase 对一个感染大肠杆菌的病毒的研究。即用放谢性同位素 32P 标记噬菌体 DNA,35S 标记其蛋白质外壳,再用标记的噬菌体去感染培养的大肠杆菌,结果 发现进入细菌体内,使细菌生长、繁殖发生变化的是 32P 标记的 DNA,而不是 35S标记的蛋白质,并且新繁殖生成的噬菌体不含 35S,只含32P。1953年Watson 和 Crick 创立的 DNA 双螺旋结构模型,不仅阐明了 DNA 分子的结构特征,而且 提出了 DNA 作为执行生物遗传功能的分子,从亲代到子代的 DNA 复制 (replication)过程中,遗传信息的传递方式及高度保真性,为遗传学进入分子水平 奠定了基础,成为现代分子生物学发展史上最为辉煌的里程碑。后来的研究又发 现了另一类核酸桼 NA(ribonucleic acid,核糖核酸),RNA 在遗传信息的传递中起 着重要的作用。从此,核酸研究的进展日新月异,如今,由核酸研究而产生的分 子生物学及其基因工程技术已渗透到医药学、农业、化工等领域的各个学科,人 类对生命本质的认识进入了一个崭新的天地
核酸的化学组成 核酸是生物体内的高分子化合物,包括DNA和RNA两大类。 、元素组成 组成核酸的元素有C、H、O、N、P等,与蛋白质比较,其组成上有两个特点: 一是核酸一般不含元素S,二是核酸中P元素的含量较多并且恒定,约占9~10%。 因此,核酸定量测定的经典方法,是以测定P含量来代表核酸量。 二、化学组成与基本单位 核酸经水解可得到很多核苷酸,因此核苷酸是核酸的基本单位。核酸就是由很多 单核苷酸聚合形成的多聚核苷酸。核苷酸可被水解产生核苷和磷酸,核苷还可再 进一步水解,产生戊糖和含 磷酸 氮碱基(图1)。 核酸一→核苷酸 戊糖 pentose 核苷 碱基(bae) 图1核酸的组成 Nucleotide )(nucleoside 核苷酸中的碱基均为含氮杂环化合物,它们分别属于嘌呤衍生物和嘧啶衍生物。 核苷酸中的嘌呤碱( purine)主要是鸟嘌呤( guanine, G)和腺嘌呤(adεnine,A),嘧啶碱 ( pyrimidine)主要是胞嘧啶( cytosine, C)、尿嘧啶( uraci,U和胸腺嘧啶( thymine,T。 DNA和RNA都含有鸟嘌呤(G)、腺嘌呤(A)和胞嘧啶(C;:胸腺嘧啶(①般而言 只存在于DNA中,不存在于RNA中;而尿嘧啶(U)只存在于RNA中,不存在 于DNA中。它们的化学结构请参见图示
核酸的化学组成 核酸是生物体内的高分子化合物,包括 DNA 和 RNA 两大类。 一、元素组成 组成核酸的元素有 C、H、O、N、P 等,与蛋白质比较,其组成上有两个特点: 一是核酸一般不含元素 S,二是核酸中 P 元素的含量较多并且恒定,约占 9~10%。 因此,核酸定量测定的经典方法,是以测定 P 含量来代表核酸量。 二、化学组成与基本单位 核酸经水解可得到很多核苷酸,因此核苷酸是核酸的基本单位。核酸就是由很多 单核苷酸聚合形成的多聚核苷酸。核苷酸可被水解产生核苷和磷酸,核苷还可再 进一步水解,产生戊糖和含 氮碱基(图 1)。 图 1 核酸的组成 核苷酸中的碱基均为含氮杂环化合物,它们分别属于嘌呤衍生物和嘧啶衍生物。 核苷酸中的嘌呤碱(purine)主要是鸟嘌呤(guanine,G)和腺嘌呤(adenine,A),嘧啶碱 (pyrimidine)主要是胞嘧啶(cytosine,C)、尿嘧啶(uracil,U)和胸腺嘧啶(thymine,T)。 DNA 和 RNA 都含有鸟嘌呤(G)、腺嘌呤(A)和胞嘧啶(C);胸腺嘧啶(T)一般而言 只存在于 DNA 中,不存在于 RNA 中;而尿嘧啶(U)只存在于 RNA 中,不存在 于 DNA 中。它们的化学结构请参见图示
嗜啶 H N 嘌岭 鸟嘿吟 (6-氯基嚓呤) (2-氨基6-氧呤) CH 胞吃啶 尿嚼啶 胸嘧啶 (2一氧4-氨基啶)(2,4-二氧嘧啶)(5-甲基尿啦嚏 核酸中五种碱基中的酮基和氨基,均位于碱基环中氮原子的邻位,可以发生酮式 一烯醇式或氨基亚氨基之间的结构互变。这种互变异构在基因的突变和生物的 进化中具有重要作用。 啊式 婦醇式 氨式 亚弧式 有些核酸中还含有修饰碱基( modified component),(或稀有碱基, unusual com ponent,这些碱基大多是在上述嘌呤或嘧啶碱的不同部位甲基化( methylation或 进行其它的化学修饰而形成的衍生物。一般这些碱基在核酸中的含量稀少,在各 种类型核酸中的分布也不均一。DNA中的修饰碱基主要见于噬菌体DNA,如5- 甲基胞嘧啶(m5C),5-羟甲基胞嘧啶hm5C;RNA中以tRNA含修饰碱基最多, 如1-甲基腺嘌呤(mlA,2,2一二甲基鸟嘌呤(m2G)和5,6-二氢尿嘧啶(ODHU)
核酸中五种碱基中的酮基和氨基,均位于碱基环中氮原子的邻位,可以发生酮式 一烯醇式或氨基 亚氨基之间的结构互变。这种互变异构在基因的突变和生物的 进化中具有重要作用。 有些核酸中还含有修饰碱基(modified component),(或稀有碱基,unusual com ponent),这些碱基大多是在上述嘌呤或嘧啶碱的不同部位甲基化(methylation)或 进行其它的化学修饰而形成的衍生物。一般这些碱基在核酸中的含量稀少,在各 种类型核酸中的分布也不均一。DNA 中的修饰碱基主要见于噬菌体 DNA,如 5- 甲基胞嘧啶(m5C),5-羟甲基胞嘧啶 hm5C;RNA 中以 tRNA 含修饰碱基最多, 如 1-甲基腺嘌呤(m1A),2,2 一二甲基鸟嘌呤(m22G)和 5,6-二氢尿嘧啶(DHU) 等
NH, C CHOH 5一甲基胞啥嚏 5-羟甲基嘻啶hm HC-N H,C 甲基腺嘌呤(m'A)22-二甲基马嘌呤如m3G)56-二氯尿嘧DDHU 嘌呤和嘧啶环中含有共轭双键,对26σnm左右波长的紫外光有较强的吸收。碱 基的这一特性常被用来对碱基、核苷、核苷酸和核酸进行定性和定量分析。 核酸中的戊糖有核糖( ribose)和脱氧核糖( deoxyribose)两种,分别存在于核糖核苷 酸和脱氧核糖核苷酸中。为了与碱基标号相区别,通常将戊糖的C原子编号都 加上“”,如C1表示糖的第一位碳原子。 戊糖与嘧啶或嘌呤碱以糖苷键连接就称为核苷,通常是戊糖的CI'与嘧啶碱的NI 或嘌呤碱的N9相连接。 核苷中戊糖的羟基与磷酸以磷酸酯键连接而成为核苷酸。生物体内的核苷酸大多 数是核糖或脱氧核糖的C5'上羟基被磷酸酯化,形成ξ核苷酸。核苷酸在5进 步磷酸化即生成二磷酸核苷和三磷酸核苷。以核糖腺苷酸为例,除AM外,还 有二磷酸腺苷(ADP, adenosine5′- diphosphate)和三磷酸腺苷(ATP, adenosine 5-triphosphate)两种形式。核苷酸的二磷酸酯和三磷酸酯多为核苷酸有关代谢的 中间产物或者酶活性和代谢的调节物质,以及作为核苷酸有关代谢的中间产物或 者酶活性和代谢的调节物质,以及作为生理储能和供能的重要形式。 核苷酸还有环化的形式。它们主要是3,5′一环化腺苷酸(cAMP, adenosine3,5 cyclicmonophosphate)和3’,5一环化鸟苷酸(cGMP, guanosine3,5′- cyclic monophosphate),化学结构如下。环化核苷酸在细胞内代谢的调节和跨细胞膜信 号中起着十分重要的作用
嘌呤和嘧啶环中含有共轭双键,对 260nm 左右波长的紫外光有较强的吸收。碱 基的这一特性常被用来对碱基、核苷、核苷酸和核酸进行定性和定量分析。 核酸中的戊糖有核糖(ribose)和脱氧核糖(deoxyribose)两种,分别存在于核糖核苷 酸和脱氧核糖核苷酸中。为了与碱基标号相区别,通常将戊糖的 C 原子编号都 加上“′”,如 C1′表示糖的第一位碳原子。 戊糖与嘧啶或嘌呤碱以糖苷键连接就称为核苷,通常是戊糖的 C1′与嘧啶碱的 N1 或嘌呤碱的 N9 相连接。 核苷中戊糖的羟基与磷酸以磷酸酯键连接而成为核苷酸。生物体内的核苷酸大多 数是核糖或脱氧核糖的 C5′上羟基被磷酸酯化,形成 5′核苷酸。核苷酸在 5′进一 步磷酸化即生成二磷酸核苷和三磷酸核苷。以核糖腺苷酸为例,除 AMP 外,还 有二磷酸腺苷(ADP,adenosine 5′-diphosphate)和三磷酸腺苷(ATP,adenosine 5′-triphosphate)两种形式。核苷酸的二磷酸酯和三磷酸酯多为核苷酸有关代谢的 中间产物或者酶活性和代谢的调节物质,以及作为核苷酸有关代谢的中间产物或 者酶活性和代谢的调节物质,以及作为生理储能和供能的重要形式。 核苷酸还有环化的形式。它们主要是 3′,5′-环化腺苷酸(cAMP,adenosine 3′,5′ -cyclicmonophosphate)和 3′,5′-环化鸟苷酸(cGMP,guanosine 3′,5′-cyclic monophosphate),化学结构如下。环化核苷酸在细胞内代谢的调节和跨细胞膜信 号中起着十分重要的作用
足 个N基 个N碱 Ho-P-0-CHO、 磷曲 酸 核糖 OHⅡ脱 尿酸UUMP 脱瓢熙香设(dAMP Ho-P-0-P-0-CHy oul 磷酸腺苷[ADP y,°-环化腺苷酸(MP) H NNN HO-P-O-P-0-P-0-CH,O HO-P=D 二婢酸腺苷(ATrP) 3,5-环化鸟登酸( CGMP 表1核苷酸及相应的核苷、碱基名称中英文对照表 核苷酸 核苷 碱基 腺苷酸(AMP) 腺苷 腺嘌呤(A) adenosine 脱氧腺苷酸(dAMP) 脱氧腺苷 deoxyadenosine monophosphate deoxyadenosine 鸟苷酸(GMP) 鸟苷 鸟嘌呤(G)
表 1 核苷酸及相应的核苷、碱基名称中英文对照表 核苷酸 核苷 碱基 腺苷酸(AMP) 腺苷 腺嘌呤(A) adenosine monophosphate adenosine adenine 脱氧腺苷酸(dAMP) 脱氧腺苷 deoxydenosine monophosphate deoxyadenosine 鸟苷酸(GMP) 鸟苷 鸟嘌呤(G) guanosine monophosphate guanosine guanine
脱氧鸟苷酸(dGMP) 脱氧鸟苷 deoxyguanosine monophosphate deoxyguanosine 胞苷酸(CMP) 胞苷 胞嘧啶(C) 胞氧胞苷酸(dCMP) 脱氧胞苷 deoxycytidine monophosphate deoxycytidine 胸苷酸(TMP/dTMP) 胸苷 胸腺嘧啶(T) thymid thymi 尿苷酸(UMP) 尿苷 尿嘧啶(U) uridine monop urac DNA的一级结构与功能 ()DNA的一级结构 核酸是由很多单核苷酸聚合形成的多聚核苷酸( polynucleotide),DNA的一级结构 即是指四种核苷酸(dAMP、dCMP、dGMP、dTMP)按照一定的排列顺序,通过 磷酸二酯键连接形成的多核苷酸,由于核苷酸之间的差异仅仅是碱基的不同,故 又可称为碱基顺序。核苷酸之间的连接方式是:一个核苷酸的5′位磷酸与下一位 核苷酸的3-OH形成3',5'磷酸二酯键,构成不分支的线性大分子,其中磷酸基 和戊糖基构成DNA链的骨架,可变部分是碱基排列顺序。核酸是有方向性的分 子,即核苷酸的戊糖基的5′位不再与其它核苷酸相连的5末端,以及核苷酸的戊 糖基3′位不再连有其它核苷酸的3‘末端,两个末端并不相同,生物学特性也有差 异 寡核苷酸( oligonucleotide)是指二至十个甚至更多个核苷酸残基以磷酸二酯键连 接而成的线性多核苷酸片段。目前多由仪器自动合成而用作DNA合成的引物 ( Primer)、基因探针(φ probe)等,在现代分子生物学研究中具有广泛的用途
脱氧鸟苷酸(dGMP) 脱氧鸟苷 deoxyguanosine monophosphate deoxyguanosine 胞苷酸(CMP) 胞苷 胞嘧啶(C) cytidine monophosphate cytidine cytosine 胞氧胞苷酸(dCMP) 脱氧胞苷 deoxycytidine monophosphate deoxycytidine 胸苷酸(TMP/dTMP) 胸苷 胸腺嘧啶(T) thymidine monophate thymidine thymine 尿苷酸(UMP) 尿苷 尿嘧啶(U) uridine monophosphate uridine uracil DNA 的一级结构与功能 (一)DNA 的一级结构 核酸是由很多单核苷酸聚合形成的多聚核苷酸(polynucleotide),DNA 的一级结构 即是指四种核苷酸(dAMP、dCMP、dGMP、dTMP)按照一定的排列顺序,通过 磷酸二酯键连接形成的多核苷酸,由于核苷酸之间的差异仅仅是碱基的不同,故 又可称为碱基顺序。核苷酸之间的连接方式是:一个核苷酸的 5′位磷酸与下一位 核苷酸的 3′-OH 形成 3′,5′磷酸二酯键,构成不分支的线性大分子,其中磷酸基 和戊糖基构成 DNA 链的骨架,可变部分是碱基排列顺序。核酸是有方向性的分 子,即核苷酸的戊糖基的 5′位不再与其它核苷酸相连的 5′末端,以及核苷酸的戊 糖基 3′位不再连有其它核苷酸的 3′末端,两个末端并不相同,生物学特性也有差 异。 寡核苷酸(oligonucleotide)是指二至十个甚至更多个核苷酸残基以磷酸二酯键连 接而成的线性多核苷酸片段。目前多由仪器自动合成而用作 DNA 合成的引物 (Primer)、基因探针(probe)等,在现代分子生物学研究中具有广泛的用途
表示一个核酸分子结构的方法由繁至简有许多种(图1)。由于核酸分子结构除了 两端和碱基排列顺序不同外,其它的均相同。因此,在核酸分子结构的简式表示 方法中,仅须注明一个核酸分子的哪一端是5′末端,哪一端是3末端,末端有无 磷酸基,以及核酸分子中的碱基顺序即可。如未特别注明5和3末端,一般约定, 碱基序列的书写是由左向右书写,左侧是5末端,右侧为3'末端。 POCH o→POcH o-P o 0-P-o-al @reloeroarafcNoH s PpApApTptPC OHy y PGipAATTC-OH 5=Tc-3 CAATTC 图1核酸分子结构的表示方式 (二)基因组DNA 自然界绝大多数生物体的遗传信息贮存在DNA的核苷酸排列顺序中。DNA是巨 大的生物高分子,一般将细胞内遗传信息的携带者棗染色体所包含的DNA总体 称为基因组( genome)。同一物种的基因组DNA含量总是恒定的,不同物种间基 因组大小和复杂程度则差异极大,一般讲,进化程度越高的生物体其基因组构成 越大、越复杂,见(表1)。 表1某些有代表性的生物体内DNA大小 分子量 碱基对 千碱基对(kb) 最简单的微生 SV40病毒3×106 5×103 物 λ噬菌体 3.4×107 5×104
表示一个核酸分子结构的方法由繁至简有许多种(图 1)。由于核酸分子结构除了 两端和碱基排列顺序不同外,其它的均相同。因此,在核酸分子结构的简式表示 方法中,仅须注明一个核酸分子的哪一端是 5′末端,哪一端是 3′末端,末端有无 磷酸基,以及核酸分子中的碱基顺序即可。如未特别注明 5′和 3′末端,一般约定, 碱基序列的书写是由左向右书写,左侧是 5′末端,右侧为 3′末端。 图 1 核酸分子结构的表示方式 (二)基因组 DNA 自然界绝大多数生物体的遗传信息贮存在 DNA 的核苷酸排列顺序中。DNA 是巨 大的生物高分子,一般将细胞内遗传信息的携带者棗染色体所包含的 DNA 总体 称为基因组(genome)。同一物种的基因组 DNA 含量总是恒定的,不同物种间基 因组大小和复杂程度则差异极大,一般讲,进化程度越高的生物体其基因组构成 越大、越复杂,见(表 1)。 表 1 某些有代表性的生物体内 DNA 大小 分子量 碱基对(bp) 千碱基对(kb) 最简单的微生 物 SV40 病毒 3×106 5×103 5 λ 噬菌体 3.4×107 5×104 50
细菌 大肠杆菌 2.2×109 4.6×106 4600 哺乳动物小鼠 1.5×10122.3×109230万 1.8×1012 2.8×109 DNA分子中不同排列顺序的DNA区段构成特定的功能单位,即基因(gene)。基 因的功能取决于DNA的一级结构。一个DNA分子能携带多少基因呢?如果以 1000~1500bp编码一个基因计算,猿猴病毒SV40基因组DNA有5000碱基对 base pair, bp),可编码5种基因,人类基因组含3×10‰ bp dna,理论上可编码200 万以上的基因,然而,由于哺乳动物的基因含有内含子( (intron),因而每个基因可 长达5000~800b,少数可达20,000p。按这样大小的基因进行推算,人类基 因组相当于40~60万个基因。这可能吗?虽然现在还不知道确切数字,但利用核 酸杂交已测得哺乳类细胞含50,000~10,000种mRNA,由此推论整个基因 组所含基因不会超过10万个,只占全部基因组的6%,另外5~10%为rRNA等 重复基因,其余80~90%属于非编码区,没有直接的遗传学功能。DNA的复性 动力学研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集 中成簇,或分散在基因之间,可能在DNA复制、调控中具有重要意义,并与生 物进化、种族特异性有关。可见原核细胞由于DNA分子较小,必须充分利用有 限的核苷酸序列,这是真核基因组与原核基因组显然不同之处。 真核基因组与原核基因组在结构上还有很多不同的特点,归纳如下: 1.真核生物基因组结构特点 ①真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细 胞外,体细胞内的基因组是双份的(即双倍体, diploid),即有两份同源的基因组 ②真核细胞基因转录产物为单顺反子( monocistron),即一个结构基因转录、翻译 成一个mRNA分子,一条多肽链 ③存在大量重复序列,即在整个DNA中有许多重复出现的核苷酸顺序,重复序 列长度可长可短,短的仅含两个核苷酸,长的多达数百、乃至上千。重复频率也 不尽相同;高度重复序列重复频率可达106次,包括卫星DNA、反向重复序列
细菌 大肠杆菌 2.2×109 4.6×106 4600 哺乳动物 小鼠 1.5×1012 2.3×109 230 万 人 1.8×1012 2.8×109 280 万 DNA 分子中不同排列顺序的 DNA 区段构成特定的功能单位,即基因(gene)。基 因的功能取决于 DNA 的一级结构。一个 DNA 分子能携带多少基因呢?如果以 1000~1500bp 编码一个基因计算,猿猴病毒 SV40 基因组 DNA 有 5000 碱基对 (base pair,bp),可编码 5 种基因,人类基因组含 3×109bp DNA,理论上可编码 200 万以上的基因,然而,由于哺乳动物的基因含有内含子(intron),因而每个基因可 长达 5000~8000bp,少数可达 20,000bp。按这样大小的基因进行推算,人类基 因组相当于 40~60 万个基因。这可能吗?虽然现在还不知道确切数字,但利用核 酸杂交已测得哺乳类细胞含 50,000~100,000 种 mRNA,由此推论整个基因 组所含基因不会超过 10 万个,只占全部基因组的 6%,另外 5~10%为 rRNA 等 重复基因,其余 80~90%属于非编码区,没有直接的遗传学功能。DNA 的复性 动力学研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集 中成簇,或分散在基因之间,可能在 DNA 复制、调控中具有重要意义,并与生 物进化、种族特异性有关。可见原核细胞由于 DNA 分子较小,必须充分利用有 限的核苷酸序列,这是真核基因组与原核基因组显然不同之处。 真核基因组与原核基因组在结构上还有很多不同的特点,归纳如下: 1.真核生物基因组结构特点 ①真核生物基因组 DNA 与蛋白质结合形成染色体,储存于细胞核内,除配子细 胞外,体细胞内的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。 ②真核细胞基因转录产物为单顺反子(monocistron),即一个结构基因转录、翻译 成一个 mRNA 分子,一条多肽链。 ③存在大量重复序列,即在整个 DNA 中有许多重复出现的核苷酸顺序,重复序 列长度可长可短,短的仅含两个核苷酸,长的多达数百、乃至上千。重复频率也 不尽相同;高度重复序列重复频率可达 106 次,包括卫星 DNA、反向重复序列
和较复杂的重复单位组成的重复序列;中度重复序列可达103~104次,如为数 众多的Alu家族序列,Kpn家族,Hinf家族序列,以及一些编码区序列如rRNA 基因、邙RNA基因、组蛋白基因等;单拷贝或低度重复序列,指在整个基因组中 只出现一次或很少几次的核苷酸序列,主要是编码蛋白质的结构基因,在人基因 组中占约60~65%,因此所含信息量最大。 ④基因组中不编码的区域多于编码区域。 ⑤基因是不连续的,在真核生物结构基因的内部存在许多不编码蛋白质的间隔序 列 (intervening sequences),称为内含子( Intron),编码区则称为外显子(exon)。内 含子与外显子相间排列,转录时一起被转录下来,然后RNA中的内含子被切掉, 外显子连接在一起成为成熟的mRNA,作为指导蛋白质合成的模板 ⑥基因组远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较 2原核生物基因组结构特点 ①基因组较小,没有核膜包裹,且形式多样,如病毒基因组可能是DNA,也可 能是RNA,可能是单链的,也可能是双链的,可能是闭环分子,也可能是线性 分子;细菌染色体基因组则常为环状双链DNA分子,并与其中央的RNA和支 架蛋白构成一致密的区域,称为类核( nucleoid)。 ②功能相关的结构基因常常串连在一起,并转录在同一个mRNA分子中,称为 多顺反子mRNA( polycistronic mRNA),然后再加工成各种蛋白质的模板mRNA ③DNA分子绝大部分用于编码蛋白质,不编码部分(又称间隔区)通常包含控制基 因表达的顺序。例如,噬菌体νX174中只有5%是非编码区 ④基因重叠是病毒基因组的结构特点,即同一段DNA片段能够编码两种甚至三 种蛋白质分子。 ⑤除真核细胞病毒外,基因是连续的,即不含内含子序列
和较复杂的重复单位组成的重复序列;中度重复序列可达 103~104 次,如为数 众多的 Alu 家族序列,KpnI 家族,Hinf 家族序列,以及一些编码区序列如 rRNA 基因、tRNA 基因、组蛋白基因等;单拷贝或低度重复序列,指在整个基因组中 只出现一次或很少几次的核苷酸序列,主要是编码蛋白质的结构基因,在人基因 组中占约 60~65%,因此所含信息量最大。 ④基因组中不编码的区域多于编码区域。 ⑤基因是不连续的,在真核生物结构基因的内部存在许多不编码蛋白质的间隔序 列(intervening sequences),称为内含子(intron),编码区则称为外显子(exon)。内 含子与外显子相间排列,转录时一起被转录下来,然后 RNA 中的内含子被切掉, 外显子连接在一起成为成熟的 mRNA,作为指导蛋白质合成的模板。 ⑥基因组远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较 小。 2.原核生物基因组结构特点 ①基因组较小,没有核膜包裹,且形式多样,如病毒基因组可能是 DNA,也可 能是 RNA,可能是单链的,也可能是双链的,可能是闭环分子,也可能是线性 分子;细菌染色体基因组则常为环状双链 DNA 分子,并与其中央的 RNA 和支 架蛋白构成一致密的区域,称为类核(nucleoid)。 ②功能相关的结构基因常常串连在一起,并转录在同一个 mRNA 分子中,称为 多顺反子 mRNA(polycistronic mRNA),然后再加工成各种蛋白质的模板 mRNA。 ③DNA 分子绝大部分用于编码蛋白质,不编码部分(又称间隔区)通常包含控制基 因表达的顺序。例如,噬菌体 ψX 174 中只有 5%是非编码区。 ④基因重叠是病毒基因组的结构特点,即同一段 DNA 片段能够编码两种甚至三 种蛋白质分子。 ⑤除真核细胞病毒外,基因是连续的,即不含内含子序列
(三)限制性片段长度多态性 随着对基因认识的不断深入,发现在同种生物的不同个体之间,尽管其蛋白质产 物的结构和功能完全相同或仅存在着细微的差异,但在DNA水平却存在着差异, 尤其在不编码蛋白质的区域以及没有重要调节功能的区域表现更为突出。这种不 影响生物体表型的DNA突变被称为中性突变。 分子生物学技术的不断发展已使得从DNA水平直接分析这类突变成为可能。 目前应用较多且成熟的方法是限制性片段长度多态性( Restriction fragment length polymorphism,RFLP)。即当DNA序列中某一个碱基发生突变,使突变所在部位 的DNA序列获得或丢失某种限制性核酸内切酶位点;或当DNA分子内部发生 较大的顺序突变如缺失、重复、插入,或DNA高变区内某串联重复顺序的拷贝 数不同致使其两侧限制性核酸内切酶位点发生相对位移时,利用相应的限制性核 酸内切酶消化此DNA,便会产生与正常不同的限制性片段。这样,在同种生物 的不同个体中就会出现不同长度的限制性片段类型 因为DNA的中性突变常以孟德尔显性遗传方式遗传给下一代,所以对这类突变 检测已广泛用于遗传病的诊断、产前诊断、亲子鉴定以及法医学上对罪犯的确认 等 (四)DNA序列分析 NA sequencing) DNA的一级结构决定了基因的功能,欲想解释基因的生物学含义,首先必须知 道其DNA顺序。因此DNA序列分析是分子遗传学中一项既重要又基本的课题 1986年由美国学者提出的,目前正在实施的人类基因组计划 human genome project),则是要通过对人类基因组3×10%bp全序列的序列分析和人类基因的染色 体图谱制定达到了解其结构,认识其功能,即从分子遗传学水平来认识人类自身 的结构和功能特征的目的。 核酸的核苷酸序列测定方法已经过近20年的发展,因而测序的具体方法五花八 门、种类繁多。但是究其所依据的基本原理,不外乎 Sanger的核酸链合成终止
(三)限制性片段长度多态性 随着对基因认识的不断深入,发现在同种生物的不同个体之间,尽管其蛋白质产 物的结构和功能完全相同或仅存在着细微的差异,但在 DNA 水平却存在着差异, 尤其在不编码蛋白质的区域以及没有重要调节功能的区域表现更为突出。这种不 影响生物体表型的 DNA 突变被称为中性突变。 分子生物学技术的不断发展已使得从 DNA 水平直接分析这类突变成为可能。 目前应用较多且成熟的方法是限制性片段长度多态性(Restriction fragment length polymorphism,RFLP)。即当 DNA 序列中某一个碱基发生突变,使突变所在部位 的 DNA 序列获得或丢失某种限制性核酸内切酶位点;或当 DNA 分子内部发生 较大的顺序突变如缺失、重复、插入,或 DNA 高变区内某串联重复顺序的拷贝 数不同致使其两侧限制性核酸内切酶位点发生相对位移时,利用相应的限制性核 酸内切酶消化此 DNA,便会产生与正常不同的限制性片段。这样,在同种生物 的不同个体中就会出现不同长度的限制性片段类型。 因为 DNA 的中性突变常以孟德尔显性遗传方式遗传给下一代,所以对这类突变 检测已广泛用于遗传病的诊断、产前诊断、亲子鉴定以及法医学上对罪犯的确认 等。 (四)DNA 序列分析(DNA sequencing) DNA 的一级结构决定了基因的功能,欲想解释基因的生物学含义,首先必须知 道其 DNA 顺序。因此 DNA 序列分析是分子遗传学中一项既重要又基本的课题。 1986 年由美国学者提出的,目前正在实施的人类基因组计划(human genome project),则是要通过对人类基因组 3×109bp 全序列的序列分析和人类基因的染色 体图谱制定达到了解其结构,认识其功能,即从分子遗传学水平来认识人类自身 的结构和功能特征的目的。 核酸的核苷酸序列测定方法已经过近 20 年的发展,因而测序的具体方法五花八 门、种类繁多。但是究其所依据的基本原理,不外乎 Sanger 的核酸链合成终止