第十一章群体遗传和进化 孟德尔遗传学是建立在个体水平上的。即是研究特定个体遗传信息的传递和表达 规律(三大规律)的。而自然界中任何一个物种都是以群体方式生存的,群体是由行 有性繁殖的同一物种的雌雄个体组成,可由不同的品种、品系和亚种组成,群体内品 种之间的差别是基因频率的差别,不是基因类型的差别。在一个很大的群体,含有各种 各样的基因及基因型,在群体遗传中,其遗传结构往往要用基因频率和基因型频率来 描述,着重考虑基因在群体(的相继世代)中是如何传递和分配的,这是因为在群体 的繁育过程中,并不能把基因型传给后代,传给子代的只是各种基因。 群体遗传学(population genetics)就是研究一个群体内基因的传递情况和基因频率改 变的科学。 群体遗传学涉及到与生物进化有关的环境的研究,通过研究。可以探讨生物的进 化过程,并据以培育各种生物品系和品种。 第一节基本概念 l.孟德尔氏群体(Mendelian population) 群体遗传学所研究的群体不是许多个体的简单的集合。而是特定的孟氏群体。所 谓孟德尔氏群体是指一群能够相互杂交进行有性繁殖的个体的集合,或者是具有同一基 因库(群体中所有个体共有的全部基因)并且是由有性交配的个体所组成的繁殖群 体。 理解:(1)经常指异交的生物群体(群体中不同基因型个体之间的杂交)。而通过 无性繁殖的群体,无分离现象,不符合孟德尔规律。自交的植物也不属于孟氏群体。 (2)孟德尔氏群体的研究对象为二倍体,在个体水平上符合孟德尔规律,即后代都是由 孟德尔式分离所产生的配子随机结合而形成的。,孟德尔遗传学的发展。(3)从广义上 讲,孟德尔氏群体包括同一物种中所有的个体,但通常指在一定地域内能相互交配的 个体群。一个孟氏群体享有一个共同的基因库(有时,同一空间的同一种个体,由于 基因交流受限,可能形成不同的基因库)。在同一个群体内虽然不同个体的基因型可 能不同,但群体的基因总是一定的。 2.随机交配(random mation) 孟氏群体中,每个个体与其他相反性别的个体以相等的概率进行交配,这种交配 称为随机交配(随机交配并不等于自由交配,在自由交配中,存在着强弱竞争)。在 群体遗传研究中,随机交配是一个重要原则,随机交配的群体标志着各个个体之间的 交配是相互独立的。因此,在随机交配的情况下,两个基因型交配的概率等于各自基 因型频率的乘积。 3.基因频率和基因型频率 (I)基因频率(gene frequcney)。群体中,在一个二倍体基因座位内,某一(特殊 型的)(等位)基因在该座位所有等位基因总数中所占的比例。 基因频率= 群体中某基因的数目 群体中该基因所有等位基因的数目 ①例:在某一人群中,调查了1788个人的血型,其中397个是M(LMLM)型,861个是 LMLN,530介是NLL型。因此
基因的频率p= 2×397+861 =0.4628 2×1788 基因的频率g 861+2×530=0.5372 2×1788 ②各等位基因的频率之和等于1,对于一对等位基因而言,通常用表示显性基因 的频率,用q表示隐性基因的频率,p+q=1 (2)基因型频率(genotype frequeney) 基因型是基因的一种组合,一对或几对基因构成某一或某些性状的基因型,它决定着 个体的表型。任何一个群体都是由它所包含的各种基因型组成的。一个群体中,某一 性状的特定基因型在所有基因型中所占的比率就是基因型频率。 为了说明方便,以一对基因为例。设A和a是某一位点上的两个等位基因,它们组 成的基因型有三个一一AA,Aa,和aa,在一个总数为N的群体中的个数分别为nL,n2,n3, 如果以D、H、R代表基因型领率,则其分别为: D=P (AA)=nl/N H-P (Aa)=n2/N R=P (aa)=n3/N D+H+R=1 (3)基因频率与基因型频率的关系 在上例中,设A和a的频率分别为p和q,因为每个AA型含两个A基因,每个Aa型含一 个A和一个a,每个aa型含两个a基因,而AA,Aa,和aa三种基因型个体的数量分别为DN,HN, RN,故: p=(2DN+HN)/[(2DN+HN)+(HN+2RN)]=(2DN+HN)/2N-D+H/2 q=(HN+2RN)/2N=H/2+R 第二节群体中的遗传平衡 一、哈代-温伯格(Hardy-Weinberg)定律 又称基因平衡定律(Law of genite equilibrium),是英国数学家哈代G.H.Hardy和 德国医生温伯格Wihelm Weinberg于1908年分别提出的。 (一)定律要点及说明: A.在一个大的随机交配群体内,如果没有突变,选择和迁移因素的干扰,则基 因频率在世代间保持不变(即这个群体处于随机交配下的平衡中)。 B在任何一个大的群体内,不论(起初基因型频率如何,是否处于平衡状态,只要 经过一代随机交配,一对常染色体上的基因频率和基因型频率就可达到平衡。所谓平 衡,指的是在·个群体中,从一代到另一代,没有基因(型)频率的变化. C.一个群体在平衡状态时,基因频率和基因型频率的关系是: D-p2 H=2pq R-q2
即基因型频率决定基因频率, 说明:①上式只适用于平衡群体,而p=D+H/2:q-R+H/2适于一般 ②满足上面三个关系的群体,则为平衡群体。 (二)定律的证明: 假定在一个群体内(O世代),存在两个等位基因A和,其频率分别是p和q。虽然我 们不知道这个群体的基因型频率,但根据基因频率,可算出一世代的基因型频率。 根据概率论,群体中,♀、♂亲体产生A和a配子的频率各为p和q,各种♀、♂配子 随机结合产生的1世代的基因型频率如下: 雄配子的类型和频率 1世代的基因型和基因型频率 A a 9 雌配子的类型和频率 A p AA(p2) Aa(pq) q Aa(pq) aa(q2) 即在一世代中: D-P(AA)-P(A)XP(A)=p2 R-P(aa)-P(a)XP(a)-q2 H-P(Aa)-P(AaUaA)-2pq[或者H-1-(D+R)=2pq] (杂合体的频率之所以为2pq,是因为基因频率为p的A基因的雄配子和唯配子会分别 与基因频率为q的a基因的雌配子和雄配子结合) 并且D+H+Rp2+2pq+q2-(p+q)2=1 根据一般群体中基因频率和基因型频率的关系,可计算出一世代中A和a的频率,即 A:D+H/2-p2+2pq/2-p2+pq-p(p+q)-p a:R+H/2=q2+2pq/2=q 即一世代的基因A的频率仍然是p,基因a的频率仍然是q,与0世代相同,即经过 代随机交配后基因型频率就达到了平衡。同理,可证明后一世代与前一世代的基因颜 率是相同的,即基因频率在所有世代保持恒定。 0世代基因频率为,q时,一世代的基因型频率为p2+2pq+q子,同理,当一世代的基因 频率为p,q时,二世代的基因型频率仍为p2+2pq+g。重复上述过程,其所产生子代的基 因型频率总是p2+2pq+q2,即经一代随机交配后,基因型频率就达到平衡。 说明(平衡的条件):①大的群体:产生的后代符合孟德尔比例。②随机交配: 各种基因的配子有同等的结合机会,相互独立。③其他因素:不存在突变、选择、迁 移等改变基因频率的因素。 (三)遗传平衡群体的一些性质 1.在二倍体遗传平衡群体中,杂合型(Aa)的频率H=2pq的值水远不大于0.5 因当p-q=1/2时,H=2pq0.5(最大值)
H值永远不能大于D+R 2.在二倍体遗传平衡群体中,杂合型(Aa)的频率H-2pq是纯合子(AA和aa)频率 乘积(DR)平方根的2倍:H-2)DR (四)定律的意义 定律揭示了在一个随机交配的群体中,基因型频率和基因频率的一般关系,特别 是隐性纯合体的频率与隐性基因频率的关系,从而为在各种情况下计算群体的基因频 率打开了一个通路 (五)应用举例:常用于人类群体遗传研究。 1.检验某性状是否处于遗传平衡。 上海中心血站1977在上海居民中调查1788人的血型。其中397人一M型,861人 MN型,530人N型,检验此性状是否处于平衡 由于MN血型遗传是共显性的,故根据表型就可以直接识别基因型。 p=0.4628q-0.5372 p2-0.21422pq0.4972q2-0.2886(×总数) P=389.6H=889.05Q-515.99x2=1.77自由度df2-1=1,p>0.1 理论数与实际数相符。 (自由度指在观察研究的项目中,能自由变动的项目有多少,在本例中,归根是 基因频率的变动,又因p+q-1,所以自由度为1。 2.从平衡群体中隐性纯合体的比率推算其他基因和基因型频率。如幼年痴呆病患 者(隐性基因)。假定它的频率为0.000038即g2-0.000038,则q=0.0062p=0.9938 基因型频率p2=0.98762pq0.0123 二、复等位基因的遗传平衡 以人的ABO血型为例,计算各基因频率 设p=基因IA的频率q-B的频率=i的频率则p4q+r=1 在自由婚配的条件下,四种表型的频率为 P(A)-p2+2pr P(B)=q2+2qr P(AB)-2pq P(O)-2 p2+q2+r2+2qr+2pq+2pr=1 已知各种表型的比例,就可以算出各种基因的频率。解方程 A(p) B(q) 0(r) A(p) AA(p2) AB(pq) A(pr)) B(q) AB(pq) BB(q2) B(qr) 0(r) A(pr) B(gr) 2
r=P(O) P(A)+P(O)=p2+2pr+r2=(p+)2=1-g)2 =P(A)+P(O)-r q=1-P(A+P(0) q=1-p-r. 例:ABO血型复等位的基因型频率分析数据如下: 总人数:190177 O型:88783人 A型79334人 则①P(A)0.4172 P(0)=0.4658 ②r=0.6832 p=0.2570 q-0.0598 ③P(B)=q2+2qr-0.853 P(AB)=2pq-0.0307 一、伴性基因的遗传平衡(以XY型为例) 对于雄性异型(xy)动物来说,位于x染色体上的伴性基因无论是显性或是隐性, 都能在雄性个体中表现。因此,在雄性群体中,显性个体(或隐性个体)的表型频率 (=基因型频率),也是显性基因(或隐性基因)在雄性群体中的频率(-基因频 率)。又因为在随机交配的情况下,伴性基因处于平衡状态时,雌雄群体中伴性基因 的频率是相等的(但基因型频率不相等)。即 雄体 雌体 XA xa XAxA XAxa xaxa p2 2pq q2 例:红绿色盲是伴X染色体的隐性基因,己知男性中的患病率为8%,求①女人中 色盲个体的频率:②女人中色盲基因杂合的占多少。 从以上分析可知,整个人群中,q0.08,在女人中,同样q=0.08,所以①女人中色盲 个体的频率为 q2-0.0064;②色盲基因杂合的个体占女人的频率为2pq=0.1472。 结论:异配性别中伴性性状在该性别群内的表型频率一整个群体中控制该性状的基 因频率。 值得注意的是:伴性基因的平衡不能由一个任意的群体经过一个世代的随机交配 就在两个性别中达到,而是以一种振荡的方式快速地接近,即雌雄两性群体中基因频 率差别随着交配世代的增加而递减。 (色盲患者的男女比例是多少?) 第三节改变基因频率的因素 遗传平衡所讲的群体是理想的群体。严格地讲,在自然界中这样的群体是不存在 的,只能有近似于遗传平衡所要求条件的群体。因而在考虑遗传平衡时,也必须考虑 影响遗传平衡的因素。 导致群体基因频率变化的主要因素有以下几种: 一、突变
1.频发突变和非频发突变 频发突变是指某种突变在一个大群体内以某一突变频率在各个世代都发生的突变 (频繁地发生),它是导致基因频率变化的一个主要因素。 非频发突变是指整个群体里仅仅产生单一突变基因而言。而且不会经常。它不是 改变基因频率的主要原因。 2.基因平衡 正突变(每代突变速率为u),a增加up △q0时。则突变处于平衡状 态, 反突变(每代突变速率为v),a减少vh 率为 初始基因频率 孔+V (1)基因频率完全由突变率u和v决定。 (2)一对基因的正反突变率若相等,即u一v,则p=q-1/2。 (3)若v=0,即反突变率为0,则q1,这个群体最终被a代替。设基因A的频率在某 世代为pO,则n代后,其频率pn为o(I-u)n。但是总的看来,这种变化的速率是很 慢的。如真核生物中的突变速率为10~/配子/世代,p由1.0变到0.9需千年的时间 [1×(1-105)n=0.9,n=103]如果突变即有正向又有反向,则等位基因的变化率将 更慢。 3、突变的作用 (1)是影响基因频率,产生遗传变异的重要源泉。(2)供给自然选择的原始材料,即进 化材料来源的途径。(3)低频有害基因得以保存。 二、选择 在随机交配的大群体中,若各种基因型在交配能力和子代数目等方面没有差别, 那么就达到平衡状态,但是,在一定的自然条件下,群体内某些基因型个体比另一些 基因型个体具有更高的成活率和生殖率。因此它们在群体内就会逐渐占优势。在自然 界,造成一个群体内不同基因型个体成活率和生殖率间发生差异的过程称为自然选择 (natural selection)。 1.适合度和选择系数 为了对自然选择进行定量的研究,可以为各种基因型定出适应值(adaptive value)或适合度
(I)适合度(fitness)W是指某一基因型跟其它基因型相比时,能够存活并留下子 裔的相对能力。 ①一般把最适基因型的适应度定为W=1,其他基因型的适应则为W-0~1。 ②包括的主要内容是生存力和生殖力。 ③适合度的计算:先计算群体内各种基因型在下一代产生的子代平均数。随后用 每种基因型的平均子代数除以最佳基因型的平均子代数。 (2)选择系数(selective coefficicnt,S) 又称淘汰系数。用一个基因型在选择作用下降低的适合度来衡量,即被淘汰的比 例,表示某一基因型在群体中不利于生存的程度。 S-1-W ①当W=1则S-0选择不起作用。 ②当W0则S=1为完全选择(致死基因或不育基因的纯合体)。 ③若0<W<1则为不完全选择。 2.选择对隐性纯合体的作用(不利)。 ()选择作用于隐性纯合时对基因频率的改变:在选择的作用下,不同基因型的亲 本,不等量地把它们的基因传给下一代。这样,选择作用就使基因频率、基因型频率 发生变化。 设:基因A和a原来的频率为p和q,如果显性是完全的,则选择只对aa起作用,设 选择指数为s,则aa个体的适合度为(1-s),AA,Aa的适合度仍为l,各基因型下一代 的比例为原来频率与其适应值的积。 即: AAAa aa 原来频率 p2 2pq q2 适应值 111-s 选择后的比例p2+2pq+q2(1-s)=1-sg2(总计) 相对频率 +91-g】 1-sg2 选择后基因α的频率 器 9 1-s2 1-sq2 一代选择基因频率的改变 4g=-9=0-Y-g=9-g上1-g.=91-g到 1-sg2 1-sq 1-sg2 当s很小时,分母几乎等于1,公式可以写成: △q=-5q2(1-q) 从这个公式可见,q值小时,每代基因频率的改变是很小的,当q值较大,△q的变 化较大。当q=2/3时,达到最大,自然选择最有效。 (2)基因频率的改变所需的世代数公式
假定完全淘汰隐性个体,即s=1,如致死基因或不育基因 则 =a1-gnl-1-go】 90 1-g2 (1+g01-g0)T1+g0 g0/1+90)-90 92= 941= 1+41+90/1+90)1+240 同理 9w= 0解得n=90一丝=1-1 1+2g0 9o9N9x90 例:人类遗传白化病基因型频率2万人中有一个,假如采取禁婚的办法,使其频 率减低为现有的一半,试问需多长时期 46 1 1 20000 90=149=400 9= 200 2=200-141=59代59×25=1500年 3.对显性基因不利的选择。 显性完全,选择对显性个体(AA或Aa)不利时,基因频率p的改变。 AAAa a aa 原来的频率p2+2pg+g2-1P(A)=2 适应值1-s1-s1 选择后的频率22(1-)+2pg1-)+g2=1-(2-P) 相对频率 p2(1-s)2p91-s)g2 1-(2-p)1-(2-p)1-2(2-p) p2(1-s) 选择后基因A的频率n11即2-)十21-即2-p列-即(2-刊 2pg(1-s) p(1-s) 基因频率的改变△2= p(1-s) -1-2)2 1-2(2-p) 1-2(2-p) 如果s很小,分母接近于1,△p≈-sp(1-p)2又p=1-q,·△p=-s(1-q)q2即在选 择系数很小时,△p与△q相同。 如果带有显性等位基因的个体是致死的,那么一代之内1=0 4.在突变和选择下的群体平衡。 在自然界,突变和选择是都在起作用的。所以基因频率同时受到这两个因素的影 响。例如隐性基因在纯合状态时在选择上是不利的。可是群体中还有一定比例的隐性 基因存在,那是因为有新的突变产生的缘故。 根据前面的推算,由于隐性纯合体在选择上不利,隐性基因的频率q每代减少 sq(1-q),而新产生的隐性突变基因的频率等于up一u(1-q),在平衡时,突变所产生的隐 性基因数应该等于选择所淘汰的隐性基因数目。即
sg2(1-g)=u(1-g)sq2=u g2=4g=1s S 这就是平衡时的基因频率。在己知q,s的情况下,可以估计突变率u。如人类全色 盲的常染色体隐性遗传。大约8万人中有一个全色盲(g2-1/80000)。据调查,他们的平 均子女数约为正常人的一半,即,s0.5,则突变率为:u=0.5×1/80000=0.6×105。人类 各种基因的自发突变率大多根据这个原理来推算。 三、迁移 迁移率m:迁入的个体数占迁入后总体数(土生个体数和迁入个体数总和)的比 率。即群体中,迁入者占群体的比例。原有个体的比例将是1-m。 设q0为原有个体某一基因在群体中的基因频率,qm是迁入个体中某一基因频率, 则传一代后,在混合群体中这一基因的的基因型率为: q1-mqm+(1-m)qo-m(qm- q0)+q0 迁移引起的基因频率的改变: △q-q1-q0-m(qm-q0) 由公式可见,在一个有迁入的群体里,基因频率的变化明显地取决于迁入率以及 迁入体与原群体之间基因频率的差异。 四、遗传漂变(随机漂变)(random genetic drift) 群体中基因频率稳定的条件之一是群体很大,事实上,生物群体的个体数量是有 限的,尤其是动物,常以小群体居多,在小群体内,由于取样误差,易造成基因频率 的随机波动,基因频率很难保持平衡,。这种现象称为遗传漂变。 例如:对于由4个雄体和4个雌体所形成的小群体,A、a的频率均为0.5,当它们产 生配子时雌雄各4个配子中所含A基因的数目的可能性有4种,即0,1,2,3,4,其概率分别为 1/16,4/16,6/16,4/16,1/16,即产生不含A基因或产生的全是A基因的配子的概率是相当大 的,这就造成下一代基因频率的不稳定,而当群体很大时,这种可能性就很小 漂变的效应: (1)可以使在选择上既不是有利,又不是有害的基因,即所谓中性基因或近于中性 的基因保存下来,或淘汰掉。 (2)如果群体很小,由于机会的关系,甚至也有可能使不利的基因保留下来