第八章基因变异的群体行为 基因变异是人类进化的基础,构成了群体中的个体多样性.由于 群体是由一群可以相互婚(交)配的个体组成,如果仅仅从个体的遗 传结构是难以解释群体的遗传组成及其随时间和空间的变化规律,而 且基因型和表型存在复杂关系,因此,研究群体中基因的分布及逐代 传递中影响基因频率和基因型频率的因素,追踪基因变异的群体行 为,应用数学手段研究基因频率和相对应的表型在群体中的分布特征 和变化规律,这就是群体遗传学的研究内容,也是人类遗传学、人类 进化和后基因组学研究的中心任务。 第一节群体的遗传平衡 按照遗传学的分离率和自由组合率,当两个杂合个体婚配后,子 代3A4表现显性性状,14表现为隐性性状,因此在群体中随着隐性性 状的减少,显性性状将会增加,最终大多数为显性性状;然而实际上 并非如此;在随机婚配的大群体中,没有受到外在因素影响的情况下 显性性状并没有随着隐性性状的减少而增加,不同基因型相互比例在 一代代传递中保持稳定,这就是Hady- Weinberg平衡律。 、 Hardy-Weinberg平衡律 Hardy- Weinberg平衡律是1908年由英国数学家 GH Hardy和德国 内科医生 WEinberg分别提出的,它是遗传学中最基本的原理之 奠定了现代群体遗传学最重要的理论基础;即在一个大群体中,如果 是随机婚配,没有突变,没有自然选择,没有大规模迁移所致的基因 流,群体中的基因频率和基因型频率一代代保持不变 假设在一个理想的群体中,某个基因座上的两个等位基因A和a, 其频率分别为p和q;因为一个基因座只有两个等位基因,因此p+q=1
第八章 基因变异的群体行为 基因变异是人类进化的基础,构成了群体中的个体多样性.由于 群体是由一群可以相互婚(交)配的个体组成,如果仅仅从个体的遗 传结构是难以解释群体的遗传组成及其随时间和空间的变化规律,而 且基因型和表型存在复杂关系,因此,研究群体中基因的分布及逐代 传递中影响基因频率和基因型频率的因素,追踪基因变异的群体行 为,应用数学手段研究基因频率和相对应的表型在群体中的分布特征 和变化规律,这就是群体遗传学的研究内容,也是人类遗传学、人类 进化和后基因组学研究的中心任务。 第一节 群体的遗传平衡 按照遗传学的分离率和自由组合率,当两个杂合个体婚配后,子 代 3/4 表现显性性状,1/4 表现为隐性性状,因此在群体中随着隐性性 状的减少,显性性状将会增加,最终大多数为显性性状;然而实际上 并非如此;在随机婚配的大群体中,没有受到外在因素影响的情况下, 显性性状并没有随着隐性性状的减少而增加,不同基因型相互比例在 一代代传递中保持稳定,这就是 Hardy-Weinberg 平衡律。 一、Hardy-Weinberg 平衡律 Hardy-Weinberg 平衡律是1908 年由英国数学家 GH Hardy 和德国 内科医生 W Weinberg 分别提出的,它是遗传学中最基本的原理之一, 奠定了现代群体遗传学最重要的理论基础;即在一个大群体中,如果 是随机婚配,没有突变,没有自然选择,没有大规模迁移所致的基因 流,群体中的基因频率和基因型频率一代代保持不变。 假设在一个理想的群体中,某个基因座上的两个等位基因 A 和 a, 其频率分别为p 和q;因为一个基因座只有两个等位基因,因此p+q=1
这一群体中的每种基因型频率可以通过不同等位基因的组合得出(表 8-1)。 表8-1第一代的两个等位基因频率和基因型频率 卵A(p) AA (p2) Aa(pq) 子a(q) Aa(pq a(q2) 从表8-1可得到不同基因型频率,这是精子和卵子随机婚配的第 代基因型频率。如果这些个体相互婚配,可以得到第二代基因型频 率并发现基因型的分布特点(表8-2、8-3) 表8-2第二代基因型频率 AA(p) AAXAA(p) AA×Aa(2p2q) AAaa(pq) AaxAA(2pq) Aa×Aa(4p2q2) Aaxaa(2pg,) a(q2) aaxAA(p-q2) aaaA(2pg) aaaa(g) 表8-3各种婚配的后代基因型分布 婚配类型 频率 AAXAA AAXAa 4pq 2pq 2pq AAX aa 2pq Aa xAa 4pq aax aa 4 表中结果显示:AA后代=p+2pq+pq2p3(p32+2pq+q2)→p3(p+q}=p2; Aa后代=2pq+4p2q2+2pq3=2pq(p2+2pq+q2)2pq(p+q)2=2pq;而Aa后代 p2q2+2pq3+q4=q(p2+2pq+q2)=q(p+q)=q2
这一群体中的每种基因型频率可以通过不同等位基因的组合得出(表 8-1)。 表 8-1 第一代的两个等位基因频率和基因型频率 精 子 A(p) a(q) 卵 A(p) AA(p²) Aa(pq) 子 a(q) Aa(pq) aa(q²) 从表 8-1 可得到不同基因型频率,这是精子和卵子随机婚配的第 一代基因型频率。如果这些个体相互婚配,可以得到第二代基因型频 率并发现基因型的分布特点(表 8-2、8-3)。 表 8-2 第二代基因型频率 AA(p²) Aa(2pq) aa(q²) AA( p²) AA×AA(p4 ) AA×Aa(2p³q) AA×aa(p²q²) Aa(2pq) Aa×AA(2p³q) Aa×Aa(4p²q²) Aaxaa(2pq³) aa(q²) aaxAA(p²q²) aaxAa(2pq³) aaxaa(q 4 ) 表 8-3 各种婚配的后代基因型分布 婚配类型 频率 后 代 AA Aa aa AA×AA AA×Aa AA×aa Aa×Aa Aa×aa aa×aa p 4 4p³q 2p²q² 4p²q² 4pq³ q 4 p 4 2p³q p²q² 2p³q 2p²q² 2p²q² 2pq³ p²q² 2pq³ q 4 表中结果显示:AA 后代=p 4+2p³q+p²q²=p²(p²+2pq+q²)=p²(p+q)²=p²; Aa 后代=2p³q+4p²q²+2pq³=2pq(p²+2pq+q²)=2pq(p+q)²=2pq;而 Aa 后代 =p²q²+2pq³+q 4=q²(p²+2pq+q²)=q²(p+q)²=q²
从表8-2和表8-3可以看出在这一群体中第一代和第二代的基因 型频率是一致的。实际上无论经过多少代,基因型频率将保持不变, 每种基因型的个体数量随着群体大小而增减,但是相对频率不变,这 就是 Hardy- Weinberg平衡的推理。当证明每个基因型的相对比例保持 不变,即p2、2pq和q的比例,那么这个群体可以说是处于 Hardy- Weinberg平衡。 Hardy- Weinberg平衡的应用 Hardy- Weinberg平衡最重要的医学应用是通过某一性状(疾病) 频率在群体中的分布情况,确定等位基因频率和杂合子频率,然而首 先必须判定该群体的基因型和等位基因频率是否处于 Hardy-Weinber 平衡。 (一) Hardy- Weinberg平衡的判定 当鉴定了某一群体特定性状的基因型频率,就可以得知这个群体 的该性状是否处于 Hardy- Weinberg平衡。假设某一基因座的一对等位 基因A和a,有三种基因型AA,Aa/aA和a,在随机1000人的群 体中,观察的基因型分布如下:AA为600人、Aa/aA为340人、aa 为60人。 从这个数据可以得到A等位基因频率p是(2×600+340)/2000 等于0.77,而等位基因a的频率q是(2×60+340)/2000等于023, 这些数据是在该群体中的观察值,如果是 Hardy-Weinberg平衡,预期 值如表8-4 表8-4不同基因型频率的预期值和观察值 基因型 预期值 观察值 5929(p2×1000 Aaaa 354.2(2pq×1000 60 X=1.607p>0.05
从表 8-2 和表 8-3 可以看出在这一群体中第一代和第二代的基因 型频率是一致的。实际上无论经过多少代,基因型频率将保持不变, 每种基因型的个体数量随着群体大小而增减,但是相对频率不变,这 就是 Hardy-Weinberg 平衡的推理。当证明每个基因型的相对比例保持 不变,即 p²、2pq 和 q²的比例,那么这个群体可以说是处于 Hardy-Weinberg 平衡。 二、Hardy-Weinberg 平衡的应用 Hardy-Weinberg 平衡最重要的医学应用是通过某一性状(疾病) 频率在群体中的分布情况,确定等位基因频率和杂合子频率,然而首 先必须判定该群体的基因型和等位基因频率是否处于 Hardy-Weinberg 平衡。 (一)Hardy-Weinberg 平衡的判定 当鉴定了某一群体特定性状的基因型频率,就可以得知这个群体 的该性状是否处于 Hardy-Weinberg 平衡。假设某一基因座的一对等位 基因 A 和 a,有三种基因型 AA,Aa/aA 和 aa,在随机 1000 人的群 体中,观察的基因型分布如下:AA 为 600 人、Aa/aA 为 340 人、aa 为 60 人。 从这个数据可以得到 A 等位基因频率 p 是(2×600+340)/2000 等于 0.77,而等位基因 a 的频率 q 是(2×60+340)/2000 等于 0.23, 这些数据是在该群体中的观察值,如果是 Hardy-Weinberg 平衡,预期 值如表 8-4。 表 8-4 不同基因型频率的预期值和观察值 基因型 预期值 观察值 AA 592.9(p 2×1000) 600 Aa/aA 354.2(2pq×1000) 340 aa 52.9(q2×1000) 60 X 2 =1.607 p>0.05
用检验等位基因频率和基因型频率分布是否符合 Hardy- Weinberg平衡,根据值查分布表得到p值;当p>005 时,表示预期值和观察值之间没有显著差异,可以认为等位基因频率 和基因型频率分布符合 Hardy-Weinberg平衡,当p<0.05时,表示预 期值和观察值之间有显著差异,则认为等位基因频率和基因型频率分 布不符合 Hardy- Weinberg平衡 另假设某一基因座的一对等位基因B和b,在1000人群体中,该 基因型频率分布是:BB为600人、Bb/bB为320、bb为80人。 因此可以得到B和b等位基因频率分别是p=(2×600+320) 2000=0.76和q=(2×80+320)2000=024,通过比较基因型观察 值和期望值(表8-5),经Ⅺ检验证明有显著差异。因此,对于该基 因座随着BB纯合子的减少,Bb杂合子增加,该群体偏离了 Hardy- Weinberg平衡,原因可能是某些因素如杂合子优势或负性选型 婚配造成杂合子频率增加。通常对于大多数遗传性状,群体是处于 Hardy- Weinberg平衡的 表8-5不同基因型频率的预期值和观察值 预期值 观察值 5776(p2×1000 600 Bb/bB 3648(2pq×1000) 320 576(q2×1000) X=15.0816p<0.05 目前可采用HWE软件作2检验判定基因型的 Hardy-Weinberg平 衡吻合度( ttp: //inkage. rockefeller. edu/software/utilities)。此外,一群体 MN血型基因型的 Hardy-Weinberg平衡检验如表8-6。 表8-6MN血型的观察值和期望值的X2检验
用 X2 检 验 等 位 基 因 频 率 和 基 因 型 频 率 分 布 是 否 符 合 Hardy-Weinberg 平衡,根据 X2 值查 X2分布表得到 p 值;当 p>0.05 时,表示预期值和观察值之间没有显著差异,可以认为等位基因频率 和基因型频率分布符合 Hardy-Weinberg 平衡,当 p<0.05 时,表示预 期值和观察值之间有显著差异,则认为等位基因频率和基因型频率分 布不符合 Hardy-Weinberg 平衡。 另假设某一基因座的一对等位基因 B 和 b,在 1000 人群体中,该 基因型频率分布是:BB 为 600 人、Bb/bB 为 320、bb 为 80 人。 因此可以得到 B 和 b 等位基因频率分别是 p=(2×600+320) /2000=0.76 和 q=(2×80+320)/2000=0.24,通过比较基因型观察 值和期望值(表 8-5),经 X2 检验证明有显著差异。因此,对于该基 因座随着 BB 纯合子的减少,Bb 杂合子增加,该群体偏离了 Hardy-Weinberg 平衡,原因可能是某些因素如杂合子优势或负性选型 婚配造成杂合子频率增加。通常对于大多数遗传性状,群体是处于 Hardy-Weinberg 平衡的。 表 8-5 不同基因型频率的预期值和观察值 预期值 观察值 BB 577.6(p 2×1000) 600 Bb/bB 364.8(2pq×1000) 320 bb 57.6(q2×1000) 80 X 2 =15.0816 p< 0.05 目前可采用 HWE 软件作X2检验判定基因型的Hardy-Weinberg平 衡吻合度(fttp://linkage.sockefeller.edu/software/utilities)。此外,一群体 MN 血型基因型的 Hardy-Weinberg 平衡检验如表 8-6。 表 8-6 MN 血型的观察值和期望值的 X2 检验
MM MN NN 合计 观察值(O) 400 765 335 1500 405.6 5.6 1500 预期值(E) (p2×1500 (2pq×1500) (q2×1500 (O-E/E 0.077 0.35 0.32 X2=0.747 p=(400×2+765)/3000=0.52;q=235×2+765)/3000=0.48p>0.05 (二)等位基因频率和杂合子频率的计算 当已知一群体某一性状的频率,就可以确定等位基因频率和杂合 子频率。例如常染色体隐性遗传病囊性纤维化在欧洲白种人的发病率 约12000说明患者为突变基因的纯合子q2=1200,则q=√1/2000 145=0.022,p=1-1/45=4445=0,978,杂合子即携带突变基因的个体 pq2×4445×1/45=123=0043。因此,白种人中有4%为囊性纤维化 突变基因携带者,他们的生存和婚配是囊性纤维化突变基因遗传的重 要原因,因此对囊性纤维化家族的遗传咨询十分重要。 对于罕见的隐性遗传病(q2≤0.0001,p近似于1,因此,杂合 子频率(2pq)约为2q,也就是说杂合子频率是突变基因频率q的2 倍;所以,群体中杂合携带者的数量2q远远高于患者q3。如表8-7 所示,随着隐性遗传病的发病率下降(q2),携带者和患者的比率升高, 由此可见,对于隐性遗传病在制定筛查计划时有重要意义 表8-7基因型频率对携带者患者比率的影响 患病率 基因频率(q) 携带者频率(2pq)携带者/患者(2pq/) 1/1000 1/32 l/16 1000/16=62.5 1/5000 1/71 5000/36=139 1/10000 10000/50=200 1/50000 1/244 50000/112=446 l/100000 1/316 1/518 100000/158=633 Ⅹ连锁基因频率估计不同于常染色体基因,因为男性为半合子 男性发病率等于突变基因频率q。对于一种相对罕见的Ⅹ连锁隐性遗
MM MN NN 合计 观察值(O) 400 765 335 1500 预期值(E) 405.6 (p 2×1500) 748.8 (2pq×1500) 345.6 (q2×1500) 1500 (O—E)2 /E 0.077 0.35 0.32 X2=0.747 p=(400×2+765)/3000=0.52;q=(235×2+765)/3000=0.48 p>0.05 (二)等位基因频率和杂合子频率的计算 当已知一群体某一性状的频率,就可以确定等位基因频率和杂合 子频率。例如常染色体隐性遗传病囊性纤维化在欧洲白种人的发病率 约 1/2000,说明患者为突变基因的纯合子 q 2=1/2000,则 q=√1/2000 =1/45=0.022,p=1-1/45=44/45=0.978,杂合子即携带突变基因的个体 2pq=2×44/45×1/45=1/23=0.043。因此,白种人中有 4%为囊性纤维化 突变基因携带者,他们的生存和婚配是囊性纤维化突变基因遗传的重 要原因,因此对囊性纤维化家族的遗传咨询十分重要。 对于罕见的隐性遗传病(q 2≤0.0001),p 近似于 1,因此,杂合 子频率(2pq)约为 2q,也就是说杂合子频率是突变基因频率 q 的 2 倍;所以,群体中杂合携带者的数量 2q 远远高于患者 q 2。如表 8-7 所示,随着隐性遗传病的发病率下降(q 2),携带者和患者的比率升高, 由此可见,对于隐性遗传病在制定筛查计划时有重要意义。 表 8-7 基因型频率对携带者/患者比率的影响 患病率 基因频率(q) 携带者频率(2pq) 携带者/患者(2pq/q2 ) 1/1000 1/32 1/16 1000/16=62.5 1/5000 1/71 1/36 5000/36=139 1/10000 1/100 1/50 10000/50=200 1/50000 1/244 1/112 50000/112=446 1/100000 1/316 1/518 100000/158=633 X 连锁基因频率估计不同于常染色体基因,因为男性为半合子, 男性发病率等于突变基因频率 q。对于一种相对罕见的 X 连锁隐性遗
传病如甲型血友病,其男性发病率为1/5000,q=1/5000,人群中 杂合子频率2q,即1/2500,男性患者比女性患者高q(男)>q2(女)。 相反,对于Ⅹ连锁显性遗传病,男性患者是女性患者的1/2 第二节影响遗传平衡的因素 Hardy- Weinberg平衡的群体是一个理想群体,这个群体为无选择、 无突变、无迁移、无限大的随机婚配群体,对人类某些基因如血型基 因、酶变异型基因等能够达到这些条件,但是,对于单基因遗传病, 些因素就可以影响基因分布或改变基因频率,从而破坏 Hardy- Weinberg平衡,这些因素包括:非随机婚配、突变、选择、遗 传漂变、基因流。 、非随机婚配 随机婚配指无须考虑配偶的基因型选择配偶;而非随机婚配可以 通过两种方式增加纯合子的频率。一种是选型婚配( assortative mating),即选择具有某些特征(如身高、智力、种族)的配偶;如果 这种选择发生在常染色体隐性遗传性聋哑病患者中,就将增加纯合患 者的相对频率;另一种是近亲婚配( consanguinous mating),即有共 同祖先血缘关系的亲属婚配,尽管表面上不改变等位基因频率,但可 以增加纯合子的比例,降低杂合子数量,因此使不利的隐性表型面临 选择,从而又最终改变了后代的等位基因频率。近亲婚配不仅提高了 后代的有害隐性基因纯合子的发生风险,而且增加了后代对多基因或 多因素疾病的出生缺陷的易感性,这是因为多基因病的患病风险与亲 属级别成正比。近亲的程度可以用亲缘系数( coefficient of relationship, r)来表示。亲缘系数是指两个人从共同祖先获得某基因座的同一等位 基因的概率。按照等位基因的分离规律,每传一代得到其中一个等位 基因的概率是12,双亲和子女之间的亲缘系数为1n,同胞之间的亲
传病如甲型血友病,其男性发病率为 1/5000,q=1/5000,人群中 杂合子频率 2q,即 1/2500,男性患者比女性患者高 q(男)>q(女)。 2 相反,对于 X 连锁显性遗传病,男性患者是女性患者的 1/2。 第二节 影响遗传平衡的因素 Hardy-Weinberg 平衡的群体是一个理想群体,这个群体为无选择、 无突变、无迁移、无限大的随机婚配群体,对人类某些基因如血型基 因、酶变异型基因等能够达到这些条件,但是,对于单基因遗传病, 一 些因素 就可以 影响基 因分布 或改变 基因频 率,从 而破坏 Hardy-Weinberg 平衡,这些因素包括:非随机婚配、突变、选择、遗 传漂变、基因流。 一、非随机婚配 随机婚配指无须考虑配偶的基因型选择配偶;而非随机婚配可以 通过两种方式增加纯合子的频率。一种是选型婚配(assortative mating),即选择具有某些特征(如身高、智力、种族)的配偶;如果 这种选择发生在常染色体隐性遗传性聋哑病患者中,就将增加纯合患 者的相对频率;另一种是近亲婚配(consanguinous mating),即有共 同祖先血缘关系的亲属婚配,尽管表面上不改变等位基因频率,但可 以增加纯合子的比例,降低杂合子数量,因此使不利的隐性表型面临 选择,从而又最终改变了后代的等位基因频率。近亲婚配不仅提高了 后代的有害隐性基因纯合子的发生风险,而且增加了后代对多基因或 多因素疾病的出生缺陷的易感性,这是因为多基因病的患病风险与亲 属级别成正比。近亲的程度可以用亲缘系数(coefficient of relationship, r)来表示。亲缘系数是指两个人从共同祖先获得某基因座的同一等位 基因的概率。按照等位基因的分离规律,每传一代得到其中一个等位 基因的概率是 1/2,双亲和子女之间的亲缘系数为 1/2,同胞之间的亲
缘系数也是1/2(表8-8)。 表8-8不同亲属级别的亲缘系数 亲属 级别 亲缘系数 双亲-子女 级亲属 同胞(兄弟姐妹) 一级亲属 叔(姑、舅、姨)-侄(甥) 二级亲属 祖-孙 二级亲属 ll 表/堂兄妹 三级亲属 (一)近婚系数 由于夫妇二人是近亲,他们可能从共同祖先传递到同一基因,婚 后又可能把同一基因传递到他们子女。这样,子女的这一对基因是相 同的。近亲婚配使子女中得到这样一对相同基因的概率,称为近婚系 *( inbreeding coefficient, F) 以常染色体上的某一基因座为例,计算一级亲属的近婚系数(图 8-1)。设一对同胞兄妹的父亲某一基因座有等位基因A1和A2,母亲 的这个基因座有等位基因A3和A4。他们的子女中,14为A1A3, 14为A1A4,14为A2A3,14为A2A4。这一对子女如果近亲婚配, 将来所生后代中,形成A1A1、A2A2、A3A3、A4A4的总概率即为其 近婚系数 国81同胞兄妹婚配中等位基因的传递:P、P2为父、母;B、B为兄、妹;S为子囡 从图8-1可以看出,P1把等位基因A1传递给的B1机会是12 BI得到等位基因A1后又把它传递给S的机会也是12;另一方面, P1的等位基因A1传给B2的机会也是12,B2的等位基因A1又把它 传递给S的机会也是12。因此,P1等位基因A1要经过4步传递, 才能使S的基因型为A1A1,其概率为(12)4。同理,P1的等位基 因A2也要经过4步传递,才能使S的基因型为A2A2。P2的等位基
缘系数也是 1/2(表 8-8)。 表 8-8 不同亲属级别的亲缘系数 亲属 级别 亲缘系数 双亲-子女 一级亲属 1/2 同胞(兄弟姐妹) 一级亲属 1/2 叔(姑、舅、姨)-侄(甥) 二级亲属 1/4 祖-孙 二级亲属 1/4 表/堂兄妹 三级亲属 1/8 (一)近婚系数 由于夫妇二人是近亲,他们可能从共同祖先传递到同一基因,婚 后又可能把同一基因传递到他们子女。这样,子女的这一对基因是相 同的。近亲婚配使子女中得到这样一对相同基因的概率,称为近婚系 数(inbreeding coefficient,F)。 以常染色体上的某一基因座为例,计算一级亲属的近婚系数(图 8-1)。设一对同胞兄妹的父亲某一基因座有等位基因 A1 和 A2,母亲 的这个基因座有等位基因 A3 和 A4。他们的子女中,1/4 为 A1A3, 1/4 为 A1A4,1/4 为 A2A3,1/4 为 A2A4。这一对子女如果近亲婚配, 将来所生后代中,形成 A1A1、A2A2、A3A3、A4A4 的总概率即为其 近婚系数。 图 8-1 同胞兄妹婚配中等位基因的传递:P1、P2 为父、母;B1、B2 为兄、妹;S 为子女 从图 8-1 可以看出,P1 把等位基因 A1 传递给的 B1 机会是 1/2, B1 得到等位基因 A1 后又把它传递给 S 的机会也是 1/2;另一方面, P1 的等位基因 A1 传给 B2 的机会也是 1/2,B2 的等位基因 A1 又把它 传递给 S 的机会也是 1/2。因此,P1 等位基因 A1 要经过 4 步传递, 才能使 S 的基因型为 A1A1,其概率为(1/2)4。同理,P1 的等位基 因 A2 也要经过 4 步传递,才能使 S 的基因型为 A2A2。P2 的等位基
因A3和A4也要各经4步传递,才能使S的基因型为A3A3和A4A4 这样,S形成纯合子A1A1、A2A2、A3A3、A4A4的总概率就是4× (1/2)4=1/4。因此,一级亲属间的近婚系数就是F=1/4。 如果是舅甥女(或姑侄)之间婚配(图8-2),P1的等位基因A1 经B1传递给S,需要传递2步;A1经B2和C传递给S,需要传递3 步。所以,P1的等位基因A1需要经过5步传递才能使S的基因型为 A1A1。同理P1的等位基因A2和P2的等位基因A3和A4都要经过 5步传递,才能使S的基因型为A2A2、A3A3和A4A4。因此,S成 为纯合子A1A1、A2A2、A3A3、A4A4的总概率为4×(12)=18,近 婚系数F=18。 图82舅甥女婚配中等位基因的传遡 图83表兄妹婚配中等位基因的传遡 如果是表兄妹婚配,则等位基因的传递比舅甥女婚配者又增加一 步,形成A1A1、A2A2、A3A3、A4A4各需传递6步,所以其近婚系 数为4×(l/2)=1/16(图8-3)。三级亲属的近婚系数F=1/16 在二级表兄妹婚配的情况下,P的等位基因A1经B1、Cl、Dl 传递给S需经过4步传递,S为A1A1、A2A2、A3A3、A4A4各需8 步传递,其近婚系数为4×(2)=164(图84),五级亲属的近婚系 数F=1/64。 图84二级表兄妹婚配中等位基因的传递图解 如果是X染色体上的等位基因,因为女性有两条X染色体,所 以她可能形成纯合子,会受到近亲婚配的影响;男性是半合子,近亲 婚配对他没有影响。因此,在计算X连锁基因的近婚系数时,只计算 女性的F值。从传递特点来看,男性的X连锁基因一定传给其女儿, 传递概率为1:相反,男性的ⅹ连锁基因不可能传给他的儿子,传递 概率为0。这样,Ⅹ连锁基因的近婚系数计算与常染色体基因者有所 不同
因 A3 和 A4 也要各经4 步传递,才能使 S 的基因型为 A3A3 和A4A4。 这样,S 形成纯合子 A1A1、A2A2、A3A3、A4A4 的总概率就是 4× (1/2)4=1/4。因此,一级亲属间的近婚系数就是 F=1/4。 如果是舅甥女(或姑侄)之间婚配(图 8-2),P1 的等位基因 A1 经 B1 传递给 S,需要传递 2 步;A1 经 B2 和 C 传递给 S,需要传递 3 步。所以,P1 的等位基因 A1 需要经过 5 步传递才能使 S 的基因型为 A1A1。同理 P1 的等位基因 A2 和 P2 的等位基因 A3 和 A4 都要经过 5 步传递,才能使 S 的基因型为 A2A2、A3A3 和 A4A4。因此,S 成 为纯合子 A1A1、A2A2、A3A3、A4A4 的总概率为 4×(1/2)5=1/8,近 婚系数 F=1/8。 图 8-2 舅甥女婚配中等位基因的传递 图 8-3 表兄妹婚配中等位基因的传递 如果是表兄妹婚配,则等位基因的传递比舅甥女婚配者又增加一 步,形成 A1A1、A2A2、A3A3、A4A4 各需传递 6 步,所以其近婚系 数为 4×(1/2)6=1/16(图 8-3)。三级亲属的近婚系数 F=1/16。 在二级表兄妹婚配的情况下,P1 的等位基因 A1 经 B1、C1、D1 传递给 S 需经过 4 步传递,S 为 A1A1、A2A2、A3A3、A4A4 各需 8 步传递,其近婚系数为 4×(1/2)8=1/64(图 8-4),五级亲属的近婚系 数 F=1/64。 图 8-4 二级表兄妹婚配中等位基因的传递图解 如果是 X 染色体上的等位基因,因为女性有两条 X 染色体,所 以她可能形成纯合子,会受到近亲婚配的影响;男性是半合子,近亲 婚配对他没有影响。因此,在计算 X 连锁基因的近婚系数时,只计算 女性的 F 值。从传递特点来看,男性的 X 连锁基因一定传给其女儿, 传递概率为 1;相反,男性的 X 连锁基因不可能传给他的儿子,传递 概率为 0。这样,X 连锁基因的近婚系数计算与常染色体基因者有所 不同
在姨表兄妹婚配中(图8-5),等位基因Ⅹ1由Pl经Bl、Cl传至 S,只需计为传递1步(B1转至C1);基因X1经B、C2传至S则 传递2步(B2传至C2和C2传至S)。所以,S为X1X1的概率为(12) 3。等位基因X2由P2经B1、C1传至S,需计为传递2步;基因X2 经B2、C2传至S,需计为3步。所以,S为的概率为(12)5。同理, S为2X2的概率也是(1/2)5。因此,对Ⅹ连锁基因来说,姨表兄 妹婚配的近婚系数F为(1/2)3+2×(1/2)5=3/16 图85姨表兄妹婚配中,ⅹ连锁基因的传遡囯86舅表兄妹婚配中,ⅹ连锁基因的传選 在舅表兄妹婚配中(图86),等位基因X1由Pl传至B2时中断, 所以,不能形成纯合子X1X1。等位基因X2由P2经B1、C1传至S, 只需计为传递2步;基因X2由P2经B2、C2传至S,也只需计为传 递2步。所以,S为X2X2的概率为(12)4。同理,S为X3X3的概 率也是(1/2)4。因此,对ⅹ连锁基因来说,舅表兄妹婚配的近婚系 数F为2×(1/2)4=1/8 在姑表兄妹婚配中(图8-7),等位基因Ⅹ1由P1传至BI时中断, 基因X2和X3由P2经B1传至C1时,传递中断,所以,不能形成纯 合子X1X1、X2X2和X3X3,其近婚系数F=0 图87姑表兄妹婚配中,X连锁基因的传递图解 图88堂兄妹婚配中,Ⅹ连锁基因的传递 如果堂表兄妹婚配(图8-8),基因X1由P1传到B时中断,基 因X2和X3由P2经B1传到C1时,传递中断,所以,也不能形成纯 合子X1X1、X2X2和X3X3,其近婚系数F=0。 因此,仅就ⅹ连锁基因来看,姨表兄妹婚配或舅表兄妺婚配比姑 表兄妹或堂表兄妹危害还要大 (二)平均近婚系数
在姨表兄妹婚配中(图 8-5),等位基因 X1 由 P1 经 B1、C1 传至 S,只需计为传递 1 步(B1 转至 C1);基因 X1 经 B2、C2 传至 S 则 传递 2 步(B2 传至 C2 和 C2 传至 S)。所以,S 为 X1X1 的概率为(1/2) 3。等位基因 X2 由 P2 经 B1、C1 传至 S,需计为传递 2 步;基因 X2 经 B2、C2 传至 S,需计为 3 步。所以,S 为的概率为(1/2)5。同理, S 为 X2X2 的概率也是(1/2)5。因此,对 X 连锁基因来说,姨表兄 妹婚配的近婚系数 F 为(1/2)3+2×(1/2)5=3/16。 图 8-5 姨表兄妹婚配中,X 连锁基因的传递 图 8-6 舅表兄妹婚配中,X 连锁基因的传递 在舅表兄妹婚配中(图 8-6),等位基因 X1 由 P1 传至 B2 时中断, 所以,不能形成纯合子 X1X1。等位基因 X2 由 P2 经 B1、C1 传至 S, 只需计为传递 2 步;基因 X2 由 P2 经 B2、C2 传至 S,也只需计为传 递 2 步。所以,S 为 X2X2 的概率为(1/2)4。同理,S 为 X3X3 的概 率也是(1/2)4。因此,对 X 连锁基因来说,舅表兄妹婚配的近婚系 数 F 为 2×(1/2)4=1/8。 在姑表兄妹婚配中(图 8-7),等位基因 X1 由 P1 传至 B1 时中断, 基因 X2 和 X3 由 P2 经 B1 传至 C1 时,传递中断,所以,不能形成纯 合子 X1X1、X2X2 和 X3X3,其近婚系数 F=0。 图 8-7 姑表兄妹婚配中,X 连锁基因的传递图解 图 8-8 堂兄妹婚配中,X 连锁基因的传递 如果堂表兄妹婚配(图 8-8),基因 X1 由 P1 传到 B1 时中断,基 因 X2 和 X3 由 P2 经 B1 传到 C1 时,传递中断,所以,也不能形成纯 合子 X1X1、X2X2 和 X3X3,其近婚系数 F=0。 因此,仅就 X 连锁基因来看,姨表兄妹婚配或舅表兄妹婚配比姑 表兄妹或堂表兄妹危害还要大。 (二)平均近婚系数
评价近亲婚配对群体的危害时,除近亲婚配率以外,平均近婚系 数( average inbreeding coefficient,a)有重要作用。a值可按下列公式 计算 ∑MFi 其中,Mi为某型近亲婚配数,N为总婚配数,Fi为某型婚配的 近婚系数 例如,在一次群体普查中,某群体中共有1000例婚配,其中兄 妺1例,姑侄婚1例,舅甥女婚1例,表兄妹婚45例,二级表兄妹 婚18例,二级半表兄妹婚6例,三级表兄妹婚3例,其余均为非近 亲婚配。这个群体的平均近婚系数a可按上述公式计算 a=1/000×14+1/000×18+1/1000×1/8+45/1000×1/16+18/1000 1/64+6/1000×1/128+3/1000×1256=0.003315 般说来,a值如达到0.01即为高值。在发达国家的开放社会中, a值较低;在一些封闭或隔离的群体中或有特殊婚配风俗的人群中,a 值较高。表8-9是一些国家或地区的人群中a值的比较 表8-9不同国家、地区人群中a值的比较 国家或地区 调查年代 调查婚姻数 近亲婚率 平均近婚系数(a) 美国 1958 133228 0.11% 0.00008 德国 1946~1954 l19899 0.59% 0.00019 法国 530000 0.67% 0.00023 意大利 1956~1960 1646612 0.90% 0.00070 日本 1950 213148 0.004 南印度 950 26042 39.37% 0.02835 北京、湖北(汉) 1980~1 7729 14% 0.000665 甘肃(回) 1980~19 1376 9.70% 0.005 四川(彝) 1980~1981 2054 14.16% 0.00913 贵州赤水(苗) 1980~1981 234 0.007696 黑龙江(鄂伦春)1980~1981 183 1.6% 黑龙江(鄂温克)1980-19816634%0016
评价近亲婚配对群体的危害时,除近亲婚配率以外,平均近婚系 数(average inbreeding coefficient,a)有重要作用。a 值可按下列公式 计算: a = ∑Mi.Fi N 其中,Mi 为某型近亲婚配数,N 为总婚配数,Fi 为某型婚配的 近婚系数。 例如,在一次群体普查中,某群体中共有 1000 例婚配,其中兄 妹 1 例,姑侄婚 1 例,舅甥女婚 1 例,表兄妹婚 45 例,二级表兄妹 婚 18 例,二级半表兄妹婚 6 例,三级表兄妹婚 3 例,其余均为非近 亲婚配。这个群体的平均近婚系数 a 可按上述公式计算: a=1/1000×1/4+1/1000 ×1/8+1/1000×1/8+45/1000×1/16+18/1000× 1/64+6/1000×1/128+3/1000×1/256=0.003315 一般说来,a 值如达到 0.01 即为高值。在发达国家的开放社会中, a 值较低;在一些封闭或隔离的群体中或有特殊婚配风俗的人群中,a 值较高。表 8-9 是一些国家或地区的人群中 a 值的比较。 表 8-9 不同国家、地区人群中 a 值的比较 国家或地区 调查年代 调查婚姻数 近亲婚率 平均近婚系数(a) 美国 德国 法国 意大利 日本 南印度 北京、湖北(汉) 甘肃(回) 四川(彝) 贵州赤水(苗) 黑龙江(鄂伦春) 黑龙江(鄂温克) 1958 1946~1954 1956~1958 1956~1960 1950 1950 1980~1981 1980~1981 1980~1981 1980~1981 1980~1981 1980~1981 133228 119899 530000 1646612 213148 26042 7729 1376 2054 234 183 626 0.11% 0.59% 0.67% 0.90% 8.16% 39.37% 1.4% 9.70% 14.16% 16.24% 1.6% 3.4% 0.00008 0.00019 0.00023 0.00070 0.004 0.02835 0.000665 0.005 0.00913 0.007696 0.000256 0.000116