第十四章基因表达调控 学习目标 通过本章的学习,你应该能够: 掌握基因与基因组的概念。基因表达的概念。操纵子的概念。乳糖操纵子的 结构及调节机制。直核基因表达调烤的可调烤点。直核基因染色质水平 的调控机制。真核基因转录水平的调控机制。顺式作用元件、反式作用 因子及转录因子的概念。 熟悉原核基因和真核基因的结构。真核生物基因组的特点。基因表达的特 点、方式与生物学意义。管家基因、增强子、沉默子的概念。mRNA稳定 性的调控机制。转录因子的分类及结构特点。miRNA、siRNA和IneRNA 的概念。 了解病毒基因组和原核基因组的特点。原核基因表达调控的特点。原核生物 基因表达的翻译水平调控。真核基因翻译水平和翻译后水平的调控机 制。非编码RNA在基因表达调控中的作用。 细胞内蕴藏着整套的遗传信息,它决定了生物个体的遗传和表型。人类基因组约有2万~2.5万个基 因。这些基因首先转录形成多种RNA,其中mRNA则进而又经翻译过程合成具有各种功能的蛋白质或者 多肽。基因表达主要涉及转录和翻译的过程,基因表达调控也是主要在这两个过程进行调节。基因表达 调控是在细胞生物学、分子生物学以及分子遗传学研究基础上逐步发展起来的领域。对基因表达调控的 深人研究可以认识人类如何从一个只有一套遗传信息的受精卵细胞逐步发育成为具有不同形态和功能的 多细胞、多组织和多器官的复杂个体。同样也是我们逐步认识同一个体中不同组织细胞虽然具有相同的 遗传信息却产生各自特异蛋白质的原因。此外,还可以阐明生物体怎样通过不断调控各种基因的表达来 适应不同生存环境的规律。基因表达调控的异常与各种疾病的发生发展存在着密切联系。 第一节基因与基因组 一、基因 (一)基因的概念 生物性状的遗传规律早在19世纪60年代已经被奥地利遗传学家Gregor Johann Mendel所认识 19O9年,丹麦生物学家Wilhelm Ludwig Johannsen根据希腊文“给予生命"之义,创造了基因(genc) 词,代替了G.Mendel的“遗传因子”,但是基因的本质和机制在20世纪后半叶的分子生物学时代才真 825
第三篇遗传信息传递及其调控 正得以认识。 基因的现代分子生物学概念是:基因是能够表达蛋白质或RNA等具有特定功能产物的遗传信息的 基本单位,是染色体或基因组的一段DNA序列。但对RNA作为遗传信息载体的RNA病毒而言则是 段RNA序列。 (二)基因的功能 DNA是基因的物质基础,所以基因的功能实际上是DNA的功能。基因的功能包括,①利用4种碱 基的不同排列荷载遗传信息:②通过复制将遗传信息稳定、忠实地遗传给子代细胞:同时为了适应环境 变化,生物体的遗传性和变异性同时存在。变异性即基因突变也是普遍存在的自然现象:③作为基因表 达的模板。基因表达(gene exp ession)是基因所携带的遗传信息表现出表型的过程,通过各种RNA和 蛋白质在细胞内有序合成实现。基因经过转录生成RNA,包括mRNA,RNA、rRNA等。其中RNA和 rRNA属于非编码RNA(non-coding RNA),不能作为模板合成蛋白质,而mRNA则属于编码RNA(coding RNA),可进一步作为模板指导合成蛋白质 (三)基因的结构 对一个基因的完整描述不仅应包括它的被转录区,同时也应包括它的调控区。因此,广义上讲,基 因的序列包括两部分:一是通常所说的基因自身的序列,即从转录起始位点开始到转录终止位点结束的 作为转录模板的被转录区域:二是其调控区序列,如启动子、增强子等。一般来讲,调控区序列位于基因 转录起始位点的上游 1.原核生物基因的结构原核生物中,绝大多数基因按功能相关性成簇地串联排列于染色体上, 共同组成一个转录单位一操纵子(operor)。操纵子也是原核生物基因表达的协调控制单位。其被转 录区包括功能上相关的几个结构基因前后相连成串,位于上游的调控区序列同时调控下游的多个结构 基因的表达(图141)。原核生物基因的转录调控序列中,最基本的是启动子和转录终止信号,在不同 的基因中尚有可被其他调节蛋白(阻遏蛋白或激活蛋白)所识别和结合的顺式作用元件。图141是 原核生物基因的典型结构组成及其序列特征。 编码阻退蛋白 启动序列操纵序列结构基因 -35 -10 S-TAGTGTATTGACATGATAGAAGCACTCTACTATAATCTCAATAGGTCCACG-3 3-ATCACATAACTCTACTATCTTCGTGACATGATATAAGACTTATCCAGGTCC-5 图14-1大肠杆菌基因及其调控序列 (1)启动序列:启动序列具有方向性,一般位于结构基因转录起始位点的上游。不同基因间的启动序 列上存在一定保守性。启动序列本身不在RNA产物中出现,仅提供转录起始信号。大肠杆菌启动序列的 长度为4O~6Obp,至少包括了三个功能区,一是RNA合成的起点,即+1位碱基:二是位于-1Obp区的RNA 聚合酶结合部位,有着“TATAAT"的共有序列,亦称为普里布诺盒(Pribnow box);三是转录起始识别部位, 位于-35bp区,共有序列是“TTGACA”。尽管存在者上述共有序列,但原核生物的启动序列间可存在较 大差异。启动序列越接近共有序列,起始转录的作用越强,称为强启动序列,反之为弱启动序列。例如 入噬菌体的PL,PR以及TT味菌体的P,是强启动子,而乳糖操纵子的P是弱启动子。 (2)终止序列:在结构基因下游近3'端的一段DNA序列中有GC富集区组成的具有回文特征的重 326
第十四章基因表达调控、 复序列,转录后在RNA分子中形成特殊的结构以终止RNA链的延伸。 (3)操纵序列:操纵序列(operator)是一些启动序列邻近部位的一小段特定序列,可被具有抑制转 录作用的阻遏蛋白识别并结合,通常与启动序列有部分重叠。 (4)正调控蛋白结合位点:在前已述及的原核基因的弱启动子附近常有一些特殊的DNA序列,某 些具有转录激活作用的正调控蛋白可以识别并结合这种DNA序列,加快转录的启动。 2.真核生物基因的结构与原核生物相比较,真核生物编码蛋白质的基因最突出的特点是其不连 续性,称为断裂基因。如图142所示,如果将成熟的mRNA分子序列与其基因编码序列比较,可以发现 并不是全部的基因序列都保留在成熟的mRNA分子中,有一些区段被剪接去除了。在基因序列中,与 成熟RNA分子相对应的序列称为外显子,即真核生物断裂基因中被转录的、在转录后加工剪接时被 保留并最终呈现于成熟RNA中的DNA片段。内含子位于外显子之间、与mRNA剪接过程中删除部分 相对应的序列,即真核生物断裂基因中被转录的、但在转录后加工剪接时被除去的DNA片段。外显子 与内含子相间排列,共同组成直核生物基因的被转录区。每个基因的内含子的数目比外显子要少1个 内含子和外显子同时出现在最初合成mRNA前体中,在合成后被剪接。如全长为7.5kb鸡卵清蛋白基 因有8个外显子和7个内含子,最初合成的RNA前体与相应的基因是等长的,内含子序列被切除后的 成熟mRNA分子的长度仅为1.8kb(见图1214)。在不同的基因中外显子的数量不同,少则数个,多则 数十个。外显子的数量是描述基因结构的重要特征之一 调控区 上密码子 成熟mRNA 图142真核生物断裂基因 高等真核生物中绝大部分编码蛋白质的基因都有内含子,只有组蛋白编码基因例外。此外,编码 RNA和个别RNA的基因也都有内含子。低等真核生物的内含子分布差别很大,有的酵母的基因较少 有内含子,有的则较常见。原核生物的结构基因基本没有内含子。病毒的基因常与宿主基因的结构特 征相似。感染细菌的病毒(噬菌体)的基因与细菌基因的结构特征相似,基因是连续的:而感染真核细 胞的病毒的基因具有某些真核生物基因结构特征,少量的基因也由于含有内含子而间断。病毒基因由 于基因组大小的限制,有的还存在着重叠编码,以便更为有效地利用基因序列。 真核生物基因的调控序列较原核生物更为复杂,迄今了解仍很有限,包括启动子、增强子和沉默子 等(图143)。 沉默 转录起始点 增强子 启动子 基因 位点控制区等 外显子 内含子 图143真核生物基因及其调控序列 327
第三篇遗传信息传递及其调控 (1)启动子:大部分直核生物基因的启动子(promoter)位于其基因序列转录起始位点的上游,启动 子本身通常不被转录:但有些启动子(如编码RNA基因的启动子)的DNA序列位于转录起始位点的下 游,这些DNA序列可以被转录 真核生物主要有三类启动子(图14-4),分别由细胞内三种不同的NA聚合酶识别启动。①I类启动 子:由RNA聚合酶I识别。I类启动子富含GC碱基对,包括核心元件(on element)和上游调控元件 (upstream control element,UCE)两部分,前者位于-45+20bp,转录起始的效率很低,后者位于-156 -107p,增强转录的起始。两个元件之间的距离非常重要,距离过远或过近都会降低转录起始效率, 具有I类启动子的基因主要是编码rRNA的基因;②Ⅱ类启动子:由RNA聚合酶Ⅱ识别。Ⅱ类启动 通常是由核心启动子、近端启动子和远端启动子组成。核心启动子常见有TFⅡB识别组件、TATA盒 起始序列/起始子和下游启动子等保守性序列组件。其中TATA盒位于转录起始位点上游-25bp处,其 核心序列是TATA(A/T)A(A/T),决定着RNA合成的起始位点。但有些基因并不含有TATA盒,如管 家基因(hou8 ekeeping gene)和同源盒基因(homeobox genes.一类与发有相关的基因)。具.有Ⅱ类启动 的基因主要是编码蛋白质(mRNA)的基因和一些小RNA基因:③Ⅲ类启动子:由RNA聚合酶Ⅲ识别。 Ⅲ类启动子的位置较独特,如RNA基因的启动子,包括A盒、B盒和C盒三部分,分别位于+10~+20bp 和+50~+6Obp两个区域。Ⅲ类启动子基因主要编码5SRNA,tRNA,U6 snRNA等RNA分子。 I类启动子 -156-107bg 45-+20p 上游调控元件 核心启动子 Ⅱ类启动子 -37p+32p 增强子沉默子 远端启动子近端启动子核心启动子 Ⅲ类启动子 +10p A盒 B盒 C盒 图144真核生物基因的三类启动子 (2)增强子:增强子(enhancer)是可以增强真核生物基因启动子转录的特异DNA序列,是真核生 物基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平。增强子位置灵活,可位于启动子 的任何方向和任何位置,大部分位于上游,有的位于下游,距离所调控基因近者达几十个碱基对,远的则 可达几千个碱基对。不同的增强子序列结合不同的调节蛋白。 (3)沉歌子:沉默子(silencer)是对基因转录起阻遏作用的特异DNA序列,属于负性调控元件。当 一些调节蛋白结合到沉歌子时,能够抑制基因的转录。 (4)其他:其他的调控元件有绝缘子(insulator)、位点控制区(locus control region,LCR)、核基质结 合区(matrix attachment region,MAR)等。绝缘子也称为边界元件(boundary element),位于基因或基因 位点的两侧,它通过结合蛋白质阻断增强子对基因的激活作用,而且只对处于其边界另一侧的增强子有 抑制作用。当绝缘子置于增强子和启动子之间时,绝缘子将抑制增强子对基因的激活作用:绝缘子并不 抑制位于启动子下游的另一个增强子对同一基因的激活作用:同样也不能抑制增强子对另一基因的作 328
第十因章基因表达调控 用。LCR是真核细胞中能够远程调控相关基因表达的DNA序列,具有组织特异性和拷贝数依赖性。 LCR是由多序列元件组成,某些元件具有启动子,增强子、绝缘子等的特点,LCR很可能通过染色质重 塑,控制大量调节蛋白的结合而调控基因的表达。MAR是存在于真核细胞染色质中的一段与核基质或 核骨架特异结合的DNA序列,富含碱基A、T。MAR能使染色质形成独立的环状结构,通过调节蛋白将 启动子和增强子等锚定在核基质上,调节基因的表达,而且通过MAR形成的环状结构使得此功能区域 具有位置独立效应,能独立进行表达。此外,MAR还具有调节染色质的构象、参与DNA复制等功能。 二、基因组 基因组(genome)是指细胞或者生物体的一整套完整单倍体遗传物质的总和。1920年德国科学家 Hans Winkler首先使用基因组这一概念,用“gene"和“chromosome'"两个词组合来描述生物的全部基因 和染色体。人类基因组包含了细胞核染色体(常染色体和性染色体)DNA及线粒体DNA所携带的所有 遗传物质。不同的生物体基因组的大小和复杂程度各不相同。表14】列出了具有代表性的原核生物 和真核生物DNA分子的大小。不同生物基因组所携带的遗传信息量有着巨大差别,其结构和组织形式 也各有特点。 表141不同生物体DNA的比较 大小(kb)双螺旋线性长度(m)染色体数染色体(拷贝数) 形状 病毒 病毒SV40 5.2 0.0000017 环状 噬菌体X174 5.4 0.0000018 线性单链 噬菌体入 46 0.000015 线性 原核生物 细菌大肠杆菌 4600 0.00136 1 环状 真核生物 限酒酵母 12100 0.00034 17 1或2 线性 黑骏果蝇 180000 0.014 4 2 线性 人 3200000 1.2 22+X.Y 2 线性 (一)病毒基因组的结构特点 1.病毒基因组大小差异较大病毒的基因组很小,但不同病毒基因组相差较大。如乙肝病毒DNA 只有3kb大小,能编码4种蛋白质:痘病毒的基因组有300kb,可以编码几百种蛋白质,包括病毒复制所 需要的酶,以及核苷酸代谢相关的酶等,因此痘病毒对宿主的依赖性较乙肝病毒小得多。 2.有的病毒基因组是DNA,而有的病毒基因组是RNA每种病毒只含有一种核酸,DNA或RNA, 两者不共存于同一种病毒中。基因组为DNA的病毒称为DNA病毒,基因组为RNA的病毒称为RNA 病毒。病毒基因组DNA或RNA可以是单链结构,也可以是双链结构,可以是闭环分子,也可以是线性 分子。如乳头瘤病毒是一种闭环的双链DNA:腺病毒则是线性的双链DNA:脊髓灰质炎病毒是一种单 链RNA病毒:呼肠孤病毒是双链RNA病毒。大多数DNA病毒基因组是双链DNA分子,大多数RNA病 毒基因组是单链RNA分子。 3.多数RNA病毒的基因组是由连续的核糖核酸链组成,但有些RNA病毒基因组由数条不连续的 RNA链组成。RNA病毒基因组可以由不相连的几条RNA链组成,如流感病毒的基因组是由8条RNA 分子构成,每个NA分子都含有编码蛋白质分子的信息:呼肠孤病毒的基因组是由10条不相连的双链 RNA片段构成,同样每段RNA分子都编码一种蛋白质。截至目前,尚未在DNA病毒中发现类似情况。 829
第三篇遗传信息传递及其调控 4.病毒基因组存在着基因重叠1977年研究中X174噬菌体时发现了重叠基因。bX174感染大肠 杆菌后可合成11个蛋白质分子,总分子量为250kDa左右,相当于6078个核苷酸所容纳的信息量。而 该病毒DNA本身只有5375个核苷酸,最多能编码总分子量为200kD的蛋白质分子,由此发现了基因 重叠现象。病量基因组大小十分有限,因此在讲化时程中形成了基因重叠编码现象,即同一DNA片段 可以是2种甚至3种蛋白质分子的部分编码区,换句话说,两种不同蛋白质的编码区有一部分是共用 的。这样的重叠编码机制提高了病毒基因组的编码能力。 病毒基因组不仅存在着结构基因的重叠,也存在着编码区和调控区的重叠。乳头瘤病毒是一类感 染人和动物的病毒,基因组约为8.0kb,其中不翻译的部分约为L.0k,该区域同时作为其他基因表达的 调控区。 5.病毒基因组的大部分区域是编码蛋白质的,只有极小部分不被翻译。中X174噬菌体中不翻译的 DNA部分只有217个核苷酸(总长5375),占不到5%。不翻译的DNA序列通常是基因表达的调控区 如RNA聚合酶结合位点、转录的终止信号及核糖体结合位点等 6.有的病毒基因可以转录生成多顺反子RNA病毒基因组中有的功能相关的基因或DNA基因 (转录生成核糖体RNA的基因)可以形成一个转录单元。它们可被一起转录成为多顺反子mRNA,然后 再加工成为编码各种蛋白质的mRNA模板。如腺病毒晚期基因编码病毒的12种外壳蛋白,转录时是在 一个启动子的作用下生成多顶反子mRNA,然后再加工成各种mRNA,编码病毒的各种外壳蛋白 7.除反转录病毒外,病毒基因组都是单倍体,每个基因只有一个拷贝,即在病毒颗粒中只出现 次。反转录病毒基因组有两个拷贝。 噬菌体基因是连续的,而真核细胞病毒的基因是不连续的。除了正链RNA病毒外,感染真核细胞 的病毒基因都是先转录成mRNA前体,再经加工切除内含子成为成熟的mRNA。由于基因重叠现象,某 一基因的内含子或其中的一部分可以是另一个基因的外显子。 (二)原核生物基因组的结构特点 原核生物的基因组较小,对其结构和功能的认识远较直核生物深入。原核生物基因组DNA虽然与 蛋白质结合,但并不形成真正的染色体结构,只是习惯上称之为染色体DNA。原核生物的基因组主要 是染色体DNA,有的含有质粒等其他携带遗传物质的DNA。 原核生物基因细的结构具有以下特点:①基因组较小,基因组中很少有重复序列:②编码蛋白的基 因多为单拷贝基因,但编码RNA的基因是多拷贝基因:③编码蛋白的基因在基因组中所占的比例约为 50%:④许多编码蛋白的结构基因在基因组中以慢纵子(operon)为单位排列 1.原核生物基因以操纵子方式组构操纵子是原核生物基因表达的协调控制单位,包括启动序 列、操纵序列和结构基因等。启动序列是基因转录调控中NA聚合酶识别位点及其周围的序列。操纵 序列并非结构基因,而是一段能被阻渴蛋白识别和结合的特异DNA序列。操纵子结构中,数个功能上 有关联的结构基因串联排列,共同构成信息编码区。这些结构基因共用一个启动序列和一个转录终止 信号序列,因此转录合成时仅产生一条mRNA长链,编码几种不同的蛋白。这种mRNA分子携带了几 个多肽链的编码信息,被称为多顺反子mRNA(polycistron) 原核生物所完成的生命活动不仅仅是简单的基因组复制,还有复杂的代谢活动,即获得外界环境的 营养成分,产生能量并合成自身生长所需的材料(核苷酸、氨基酸等)。原核生物需要根据外界环境的 变化,调控自身的酶系统的组成及功能,调整细胞内某些蛋白质的数量,适应环境的变化(如高温、渗透 压改变等)。 2.原核生物中的质粒DNA质粒(plasmid)是细菌细胞内一种自我复制的环状双链DNA分子,能 够稳定的独立存在于宿主染色体外,并传递到子代,不整合到宿主染色体DNA上。质粒的分子量一般 为10°~10kb,小型质粒的长度一般为1.5~15kb。质粒常含有抗生素抗性基因,经过人工改造后的质 粒DNA是重组DNA技术中常用的载体。 质粒只有在宿主细胞内才能完成自己的复制,一旦离开宿主就无法复制和扩增。质粒对宿主细胞 330
第十四章基因表达调控 的生存不是必需的,宿主细胞离开了质粒依日能够存活。尽管质粒不是细菌生长、繁殖所必需的物质 但它所携带的遗传信息能赋予细菌特定的遗传性状,如耐药性质粒带有耐药基因,可以使宿主细菌获得 耐受相应抗生素的能力:一些人类致病菌的毒力基因亦存在于质粒中,如炭疽杆菌中编码炭疽毒素的 基因 (三)真核生物基因组的结构特点 直核生物的基因组比较庞大,并日不同生物种间养异很大。直核生物基因组具有以下特点:①直核 生物基因结构庞大,如人的单倍体基因组含有3×10p,大约含有2万~2.5万个基因,而大肠杆菌基因 组含有约4×10°bp,约4000个基因;②真核基因转录产物为单顺反子,即一个编码基因转录生成一个 RNA分子,经翻译生成一条多肽麟:③直核基因组含有大量的重复序列.重复序列成集中成藤,或散召 分布于基因间:④真核基因中不被转录的区域远远超过被转录的区域。基因两侧的不被转录的序列往 往是基因表达的调控区。在基因内部有内含子、外显子之分,因此真核基因是不连续的。 L,人类基因组DNA的组成人类基因组DNA包含了细胞核染色体DNA和线粒体DNA所携带的 所有遗传物质,见图14-5。 人类基因组 细胞核基因组 约25%约75% 基因外序列 24224格鷂 约1%约 外显子 内子中 图145人类基因组DNA的组成 2.人类基因组中存在大量重复序列真核生物基因组存在着大量重复序列。重复序列的长度不 等,短的仅含两个碱基,长的多达数百、乃至上千个碱基。重复序列的重复频率也不尽相同,可以分为高 度重复序列(highly repetitive sequences)、中度重复序列(moderately repetitive sequences)和单拷贝或低度 重复序列(single copy sequences)等3种 (1)高度重复序列:高度重复序列重复频率可达10次。在基因组中所占比例随种属而异,从 10%~60%不等。在人基因组中,高度重复序列约占基因组长度的20%。高度重复序列又按其结构特 点分为以下2种:①反向重复序列(inverted repeated sequence)是存在于双链核酸分子中排列方向相反 的一段DN4序列,其总长度约占人基因组的5%。反向重复序列多数是散在,而非群集于基因组中 ②卫是DNA(satellite dna)是另一类高度重复序列.这类重复序列的重复单位一般由2≈1Obm组成,成 串排列。由于这类序列的碱基组成不同于基因组的其他部分,可用等密度梯度离心法将其与主体DNA 分开,因而称为卫星DNA或随体DNA。在人基因组中,卫星DNA约占5%~6% 目前认为,高度重复序列的功能是:①参与复制水平的调节。反向重复序列常存在于DNA复制起 点区的附近,是一些蛋白质(包括酶)的结合位点:②参与基因表达的调控。高度重复序列可以转录至 核内不均一RNA分子中,而有些反向重复序列可以形成发夹结构,有助于稳定RNA分子:③参与染色 体配对。如卫星DNA成能样分布在色体着丝粒附近,可能与染色体减数分婴时染色体配对有关 即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DA序列 (2)中度重复序列:中度重复序列指在真核基因组中重复数十至数万(<10)次的重复序列。少数 在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。依据重复序列的长度分为两种类型: ①短分散重复片段(shor interspersed repeated segments,SNES)的平均长度为300 -500bp,与平均长度 为10OObp的单拷贝序列间隔排列。拷贝数可达10万左右。如Au家族、Hinf家族等属于这种类型的 3别
第三篇遗传信息传递及其调控 中度重复序列。②长分散重复序列(long interspersed repeated segments.LNES)的平均长度为3500 5000bp,与平均长度为13000bp的单拷贝序列(个别长几万bp)间隔排列 中度重复序列在基因组中所占比例在不同种属之间差异很大,一般占10%一40%,在人类基因组 中约占12%,这些序列大多不编码蛋白质。这些非编码的中度重复序列的功能可能类似于高度重复序 列。在结构基因之间以及内含子内都可以见到中度重复序列。 真核生物基因组中的RNA基因也属于中度重复序列。与其他中度重复序列不同,各重复单位中 的RNA基因都是相同的。RNA基因通常集中成簇存在,而不是分散于基因组中,这样的区域称为 rDNA区,如染色体的核仁组织区即为DNA区。 (3)单拷贝序列:单拷贝序列,又称为低度重复序列,在单倍体基因组中以单拷贝形式存在的DNA 序列,大多数编码为蛋白质的基因属于这一类。在基因组中,单拷贝序列的两侧往往为散在分布的重复 序列 3.线粒体DNA的结构线粒体是细胞内的一种重要细胞器,是生物氧化的场所。 ,个细胞可拥 有数百至上千个线粒体。线粒体DNA(mitochondrial DNA,mtDNA)可以独立编码线粒体中的一些蛋白 质,因此mtDNA是核外遗传物质。mtDNA的结构与原核生物的DNA类似,是环状分子。线粒体基因的 结构特点也与原核生物相似。 人的线数体基因组全长16569bD,共编码37个基因,句括13个编码构成呼吸链多酶体系的一些多 肽的基因22个编码mt-RNA的基因,2个编码mt-rRNA(16S和12S)的基因。 第二节基因表达调控的基本知识 一、基因表达的概念 基因表达就是指基因负载的遗传信息转变生成具有生物学功能产物的过程,包括基因的激活、转 录、翻译以及相关的加工修饰等多个步骤或过程。在一定的调节机制控制下,大多数基因经历基因激 活、转录及翻泽等时程,产生具有特定生物学功能的蛋白质成者RNA分子,赋予细胞或者个体一定的功 能或形态表型。并非所有基因的表达都产生蛋白质,RNA,RNA编码基因转录产生RNA的过程也 干基因表达 不同生物的基因组含有不同数量的基因。细菌的基因组约含有4000个基因;多细胞生物的基因数 达万个:人类基因组约含有2万~2.5万个基因。在某一特定时间或生长阶段,基因组中只有一小部分 基因处于表达状态。例如,大肠杆菌通常只有约5%的基因处于高水平转录活性状态,其余大多数基因 不表达,或者表达水平很低。基因表达水平的高低不是固定不变的。例如,大肠杆菌中与细菌蛋白质生 物合成有关的延长因子编码基因大多数情况下表达十分活跃,而参与DNA损伤修复有关的基因却很少 表达:但在紫外线照射引起DNA损伤时,DNA损伤修复相关的蛋白表达变得异常活跃。因此,生物体 中某种功能的基因产物在细胞中的数量会随时间和环境而改变。 二、基因表达的特点 基因表达具有时间特异性及空间特异性的特点 (一)时间特异性 基因的表达按一定的时间顺序发生,即根据功能需要,某一特定基因的表达严格按特定的时间顺序 发生,称为基因表达的时间特异性(temporal specif6ciy)。如噬菌体、病毒或细菌侵入宿主后,呈现一定 的感染阶段。随感染阶段发展、生长环境变化,这些病原体以及宿主的基因表达都有可能发生改变,有 的基因开启,有的基因关闭。 332
第十四章基因表达调控 多细胞生物基因表达的时间特异性又可称为阶段特异性。一个受精卵含有发育成为一个成 熟个体的全部遗传信息,在个体发育分化的各个阶段,各种基因极为有序的表达。一般在胚胎时 间基因开放的数量最多,随着分化发展,细胞中某些基因关闭,某些基因开放。胚胎发育不同阶 段、不同部位的细胞中开放的基因及其开放的程度不一样,合成蛋白质的种类和数量都不相同,显 示出基因表达调控在空间和时间上极高的有序性,从而逐步形成形态与功能各不相同、极为协调、 巧妙有序的组织脏器。 (二)空间特异性 多细胞生物个体在某一特定生长发育阶段,同一基因在不同的组织器官表达不同,称之为基因表达 的空间特异性(patial specificity)。例如:编码胰岛素的基因只在胰岛B细胞中表达,从而指导生成胰岛 素。又如:编码肌浆蛋白的基因在成纤维细胞和成肌细胞中几乎不表达,而在肌原纤维中高水平表达 细胞特定的基因表达状态,决定了这个组织细胞特有的形态和功能。基因表达伴随时间顺序所表现出 的这种分布上的差异,实际上是由细胞在器官的分布决定的,所以空间特异性又称细胞特异性或组织特 异性。 三、基因表达的方式 生物体只有适应环境才能生存。当周围的营养、温度、湿度、酸度等条件变化时,生物体就要改变自 身基因表达状况,以调整体内执行相应功能蛋白质的种类和数量,从而改变自身的代谢、活动等以适应 环境。根据基因表达随环境变化的情况,可以大致分成两类: (一】组成性表达 组成性表达(constitutive expression)是指在一个生物个体的几乎所有组织细胞中和所有时间阶段都 持续表达的基因,其表达水平变化很小且较少受环境变化的影响。这类基因表达产物通常是细胞或生 物体整个生命过程中都持续需要而必不可少的,因此,这类基因可称为管家基因。这些基因可看成是细 胞的基本表达。例如,糖酵解途径中甘油醛-3-磷酸脱氢酶(glyceraldehyde-3-phosphate dehydrogenase GAPDH)和参与细胞骨架组成的B肌动蛋白(B-actin)的基因。管家基因的表达水平受环境因素影响 小,而且在生物体各个生长阶段的大多数、或几乎所有组织中持续表达、或变化很小。组成性基因表达 只受启动序列或启动子与RNA聚合酶相互作用的影响,而不受其他机制的调节。但实际上,组成性基 因表达也不是一成不变的,其表达强弱也是受一定机制调控的。 (一】非细成性表达 非组成性表达是指受特定环境信号刺激后表达水平发生变化的一类基因表达,随环境条件变化,基 因表达水平增高的现象称为诱导(duction).这类基因称为可诱导因:相反,随环墙条件亦化,基因表 达水平降低的现象称为阻遏(repressior),相应的基因称为可阻遏基因。诱导和阻遏现象在生物界普遍 存在,是生物体适应环境的基本途径。例如,DNA损伤情况下,一些DNA损伤修复基因就会被激活,也 就是被诱导,其转录产物参与DNA修复。又如,当细菌培养基中色氨酸供应充分时,细菌体内与色氨酸 合成有关的基因的表达就会被抑制,也就是被阻遏。 在一定机制控制下,功能上相关的一组基因,无论其为何种表达方式均需协调一致、共同表达,即协 调表达,对这种表达的调节称为协调调节(coordinate regulation)。无论是原核生物还是真核生物,基因 的协调调节都存在。原核生物在外界生存环境发生变化时,改变基因表达的情况以适应环境变化。例 如,当有充足的葡萄糖时,细菌就可以利用葡萄糖作为能源和碳源,不必去合成利用其他糖类的酶类;当 外界没有葡萄糖时,细菌就要适应环境中存在的其他糖类(如乳糖、半乳糖等),激活能利用这些糖的基 因的表达以满足生长需要。内环境保持稳定的高等哺乳类动物,也要经常改变基因的表达以适应环境 例如,与话宜温度下生活的动物相比,在适应冷成热环境下生活的动物的肝脏合成蛋白质的能力明显不 同。因此,基因表达调控是生物适应环境、维持生长和增殖,维持细胞分化和个体发育所必需。 333
第三篇遗传信息传递及其调 四、基因表达调控的生物学意义 (一)生物体调节基因表达以适应环境、雏持生长和增殖 生物体所处的内、外环境是在不断变化的。所有生物的所有活细胞都必须对内、外环境的变化做出 适当反应,以使生物体能更好地适应变化的环境状态。生物体这种适应环境的能力总是与某种或某些 蛋白质的功能有关。细胞内某些功能蛋白质的有或无、多成少的变化则由绵码这些蛋白质的基因表达 与否、表达水平高低等状况决定。通过一定程序调控基因的表达,可使生物体表达出合适的蛋白质,以 便更好地适应环境,维持生长。 生物体调节基因表达、适应环境是普遍存在的。原核生物、单细胞生物调节基因的表达就是为适应 环境、维持生长和细胞分裂。例如,当葡萄糖供应充足时,细菌中与葡萄糖代谢有关的酶编码基因表达 增强,其他糖类代谢有关的酶基因关闭:当葡萄糖耗尽而有糖存在时,与乳糖代谢有关的喜绵码基因 则表达,此时细菌可利用乳糖作为碳源,维持细胞生长和增殖。高等生物也普遍存在适应性表达方式。 经常饮酒者体内乙醇脱氢酶活性较高,即与相应基因表达水平升高有关。 (二)生物体调节基因表达以维持细胞分化与个体发育 在多细胞生物中,基因表达调控的意义还在于维持细胞分化与个体发育。在多细胞个体生长、发育 的不同阶段,细胞中的蛋白质种类和含量变化很大;即使在同一生长发育阶段,不同组织器官内蛋白质 分布也存在很大差异,这些差异是调节细胞表型的关键。例如,果蝇幼虫(蛹)最早期只有一组“母亲效 应基因”(maternal effect genes)表达,使受精卵发生头尾轴和背腹轴固定,以后三组“分节基因”(segmen- tation genes)顺序表达,控制蛹的“分节”发有过程,最后这些“节”分别发育成成虫的头、胸、翅膀、肢体 腹及尾等。高等哺乳动物的细胞分化,各种组织、器官的发育都是有一些特定基因控制的。当某种基因 缺陷或表达异常时,则会出现相应组织或器官的发育异常 基因组研究表明:酵母转录因子/基因数大致为300/6000,果蝇约为1000/14000,线虫约为1000, 20000,人约为3000/(20000~25000)。这提示生物物种越高级,基因表达调节越精细、复杂。基因表 达具有种属特异性、组织细胞特异性和发育阶段特异性。基因是否表达,表达的量、时间和部位,与细胞 结构与功能的需求和内外环境的变化相适应。生物体具有极其严密的基因表达时空秩序,无比精巧和 复杂的基因表达调控机制。在人类基因组计划完成后,研究细胞核染色质DNA/RNA/蛋白质相互作用 和基因表达(激活/阻遏)调控,已成为生命科学关注的焦点。生物遗传、生长、发育、增殖、分化、衰老与 退变的奥秘及其相关疾病的防治均有望从中获得解答。 (三)基因表达调控的异常在疾病发生发展过程中起重要作用 基因表达水平的变化,过量表达或表达量不足,在一些疾病的发生发展中起重要作用。比如在癌后 的发生发展过程中,大量基因的表达水平均出现异常升高或降低。如原癌基因cm℃的异常扩增可造 成其基因表达水平升高,而c~m以转录因子的形式参与很多癌基因的表达调控。这些原癌基因的表 达异常促进了癌症的发生发展。又如转录因子TBX5基因突变可以引起Hol-Oam综合征或称心手综 合征,病人表现为以房间隔缺损为主的心脏异常和上肢不同部位、不同程度的畸形 第三节原核基因表达调控 一、原核基因表达调控的特点 (一】原核基因表达的调控机制相时简单 由于原核生物没有细胞核,亚细胞结构及其基因组结构要比真核生物简单得多,基因表达的调控机 制相对简单,大多数基因在需要时被打开,不需要时被关闭。 334