晰江大摩摩粮(农业与生命科学板) Journal of Zheliang University (Agric.Life Sci. 文章编号:1008-9209(2006)05-0515-05 不同交配方式下遗传平衡的信息学分析 张鸿雁,张宏礼2,郭满才,袁志发 1,系龙江八一农最大学生命科技学院,黑龙江大庆153319:2.器龙江八一农显大学文理学院,用龙江大庆163319: 3.西北农林科技大学生命科学学院,陕西畅酸712100) 摘要:闲运了二倍体生物群体多因座垫体达到最大信惠滴时的配子频率分布和基因型颜率分布 一数性,从俗息学角度证明了不论是看存在,健表文配下多因的 华你生空生货章有意一政:有提长发干药动现牛青有心,办果从安是方灯 上时群体施以其他的外部强制,群体发展的结果是最妹会达到一个不随时间变化的状态,这个被态不是 平街态而是非平街定态,此时配子信惠满和善因型信息滴具有板小值,这种非平衡定态是一种远离无外 部接制作用下Hardy-Weinberg平衡铁态的秋态,与群体遗传学传统观点有所不周. 关健词:多基图座:Hardy-Weinberg平衡:配子信怎:蒸型信惠滴非平衢态热力 中围分类号:Q347 文献标识码:A ong-vanl 2HANG Hong-li',GUo Maea cla (1.College of Life Sc Heilongjian Fir t Land Rrclaman china:2.Mathematic iag16331g Department, Heilongjiang August First Land University of Agriculture and Forestry,Yangling,Shanxi 712100.China) Informational analysis of genetie equilibrium on different mating varieties.Journal of Zhejiang University (Agric.&Life Sci.).2006,32(5):515-519 Abstract:It was demonstrated that two kinds of frequency distribution on gamete and genotype were ulatio pe entropy Ac mete and genotype wa briefly prove with respect to limited oci of a randommating population whether linkage or nonlinkage.Differenc from the traditional standpoint of population genetics,the population could not reach the equilibriun state but an non-equilibrium steady state that both the gamete entropy and the genotype entropy of the population reached the minimal possible values far from Hardy-Weinberg equilibrium when it was subiected to a forcible nomrandom mating Key words:limited loci:Hardy-Weinberg equilibrium:gamete entropy:genotype entropy:o equilibrium thermodynamics 收:是江省就育厅科研著金资助项目(105512 万方数据
浙江大学学报(农业与生命科学版) 32(5):515~519.2006 Journal of Zhejiang University(Agric。&Life Sci.、 文章编号:1008—9209(2006)05—0515—05 不同交配方式下遗传平衡的信息学分析 张鸿雁1,张宏礼2,郭满才3,袁志发3 (1.黑龙江八一农垦大学生命科技学院,黑龙江大庆163319;2.黑龙江八一农垦大学文理学院.黑龙江大庆163319 3.西北农林科技大学生命科学学院,陕西杨陵712100) 摘要:阐述了二倍体生物群体多基因座整体达到最大信息熵时的配子频率分布和基因型频率分布与 Hardy-Weinberg平衡分布的一致性.从信息学角度证明了不论是否存在连锁,随机交配下多基因座的 配子平衡分布与基因型平衡分布总一致.与随机交配下的Hardy-Weinberg平衡相比,如果从交配方式 上对群体施以其他的外部强制,群体发展的结果是最终会达到一个不随时间变化的状态,这个状态不是 平衡态而是非平衡定态,此时配子信息熵和基因型信息熵具有极小值,这种非平衡定态是一种远离无外 部强制作用下Hardy-Weinberg平衡状态的状态,与群体遗传学传统观点有所不同. 关 键 词:多基因座;Hardy~Weinberg平衡;配子信息熵;基因型信息熵;非平衡态热力学 中图分类号:Q347 文献标识码:A ZHANG Hong—yanl,ZHANG Hong—li2,GUO Man-cai3,YUAN Zhi—fa3(1.College of Life Sci—Tech. Heilong÷iangAugust First Land Reclamation Agriculture University,Daqing,Heiton93iang 163319. China;2.Mathematics Department,HeilongJiang August First Land Reclamation Agriculture University,Daqing,HeilongJiang 163319,Chinaj 3.College of Life Science,Northwest Sci—Tech University of Agriculture and Forestry,Yangling,Shanxi 712100,China) Informational analysis of genetic equilibrium on different mating varieties.Journal of Zhejiang University (Agric.&Life Sci.),2006,32(5):515—519 Abstract:It was demonstrated that tWO kinds of frequency distribution on gamete and genotype were equivalent to Hardy-Weinberg equilibrium distribution with respect to limited loci in a diploid population when the gamete entropy and genotype entropy reached respective maximal possible value.Accordingly, the equivalent of two kinds of equilibrium distribution between gamete and genotype was briefly proved with respect to limited loci of a random—mating population whether linkage or nonlinkage.Difference from the traditional standpoint of population genetics,the population could not reach the equilibrium state but an non-equilibrium steady state that both the gamete entropy and the genotype entropy of the population reached the minimal possible values far from Hardy-Weinberg equilibrium when it was subjected tO a forcible non-random mating. Key words:limited loci;Hardy-Weinberg equilibrium;gamete entropy;genotype entropy;nonequilibrium thermodynamics 收稿日期:2006一Ol—04 基金项目:黑龙江省教育厅科研基金资助项目(10551221). 作者简介:张鸿雁(1970一),女,黑龙江宝清人,硕士,副教授,主要从事微生物学的教学与研究.Tel:0459—681 9293;E-mail zhanghongligll@yahoo.com.en. 万方数据
516 浙江大零推(农业与生命科学版 第32卷 群体世代传递过程也可以看作是信息传递 其中,x=1,2 ,:i=1,2,m.配子联合频 过程,1998年志发最早提出应用信息论模界 率分布满足 研究群体遗传学问题.此后汪小龙而、张宏礼 证明了任意有限多个基因座(每一个毫位可以 p,n=1,(3) 是成对等位基因,也可以是复等位基因)的 基因型及其联合频率分布表为 Hardy-Weinberg平衡状态下的基因型频率分 (G,P):P(H ,)= 布与基因型信息滴最大时的基因型频率分布等 PAAAAA= 价.当从整体角度进一步研 一个群体位于常 染色体上的多个基因座时,配子频率的平衡分 =1,2,“m.对于 布和基因型频率的平衡分布关系如何、是否惟 ≤m,当x■x(j,k=1,2,…,:)时,该基 一致,用传统的方法很难给出具有一般性的 因座纯合,基因型联合频率分布满足 严格证明,本文应用信息论方法对此给予了回 答.另外,张宏礼等研究了近亲交配群体)、表 含之-名房-2 型同型交配0群体趋向于遗传平衡时的信息学 ■1 (5) 性质本文进一步指出非随机交配下的平衡过 当一个大孟德尔群体中的个体进行随机交 程是一种远离随机交配平衡的过程,这和非平 配,同时没有迁移、突变,选择和遗传漂变发生 衡热力学系统中的最小篇原理相一致,在本文 时,群体的基因颜率世代不变,配子联合频率分 中所用的嫡为Sh on信息熵, 布病足下面立:个等式 为研究需要,本文假定:①所研究的群体总 是没有迁移、突变、选择的是大孟德尔二倍体生 ““ 物群体:②涉及到基因型时将正反交分开,且频 率相等:③所研究的多基因座仅限于常染色 体上 基因型联合频率分布满足下面儿个等式 1多基因座的配子信息熵和基因 型信息熵 (足 考感二倍体生物群体的m个基因座A1 之2 A:,…,A,假设每个基因座上有:个等位基 因,各基因座等位基因频率分布为 (AnP,)P(A)= (1=1,2...m:j=1.2..,n) (1) p产u--i1-w5厂9 (xy=1,2,…ni=1,2,…,m) (7) 各基因座的等位基因频率清足户Q,=1,i= 根据Shannon信息熵的定义,各基因座等 1,2,… 位基因颜率分布的信息嫡为 若正反交分开,二倍体生物群体在上述m S(A)=-a Ing. 个基因座A:,A,…,A.上有Ⅱ元种配子 (i=1,2,m) (8) 配子联合频率分布的信息熵(简称“配子信息 Ⅱm种基因型:配子及其联合频率分布表为 熵”)为 (O.P):P(O. )= P( (2) 万方数据
浙江大学学报(农业与生命科学版) 第3 2卷 群体世代传递过程也可以看作是信息传递 过程,1998年袁志发最早提出应用信息论模型 研究群体遗传学问题.此后汪小龙[1]、张宏礼圆 证明了任意有限多个基因座(每一个座位可以 是成对等位基因,也可以是复等位基因)的 Hardy-Weinberg平衡状态下的基因型频率分 布与基因型信息熵最大时的基因型频率分布等 价.当从整体角度进一步研究一个群体位于常 染色体上的多个基因座时,配子频率的平衡分 布和基因型频率的平衡分布关系如何、是否惟 一一致,用传统的方法很难给出具有一般性的 严格证明,本文应用信息论方法对此给予了回 答.另外,张宏礼等研究了近亲交配群体口]、表 型同型交配[41群体趋向于遗传平衡时的信息学 性质.本文进一步指出非随机交配下的平衡过 程是一种远离随机交配平衡的过程,这和非平 衡热力学系统中的最小熵原理相一致,在本文 中所用的熵为Shannon信息熵. 为研究需要,本文假定:①所研究的群体总 是没有迁移、突变、选择的是大孟德尔二倍体生 物群体;②涉及到基因型时将正反交分开,且频 率相等;③所研究的多基因座仅限于常染色 体h. 1 多基因座的配子信息熵和基因 型信息熵 考虑二倍体生物群体的m个基因座A-, A。,…,A。,假设每个基因座上有咒:个等位基 因.各基因座等位基因频率分布为 (A,,P,)。P(A。)一qi. (i一1,2,…,m;J=1,2,…,扎f) (1) "i 各基因座的等位基因频率满足∑q“=1,i= 』=1 1,2,…m. 若正反交分开,二倍体生物群体在上述m 个基因座A。,A。,…,A。上有1-[卵i种配子, i=1 Ⅱ竹,2种基因型.配子及其联合频率分布表为 (0,P)2 P(Q”,.,xlj,,z。)一 P(A1。,,…A打d…A一。)一Pz∥一扩钿·(2) 其中,zi一1,2,…,ni;i一1,2,m.配子联合频 率分布满足 ”1 ”l H“ ∑…∑…∑Pv v,。=1. (3) 3li。I 1"21|“12l 基因型及其联合频率分布表为 (G,P)。P(H,,,,,。zⅡ,,。。,。)一 P(AlXljAl。。。…A”“A打。…A。。Am。)2 Pz。,z。一“z∥z。z。· (4) 其中z。z*一1,2,…,以f;i=1,2,…,m.对于1 ≤i≤m,当z“一z。(歹,k一1,2,…,靠;)时,该基 因座纯合.基因型联合频率分布满足 ”1 Hl ”I ”i Hm H” ∑∑…∑∑…∑∑ 。1J=1。1I=1 。O=1 2正=1 。叼;1。“霉l Pz。,z彬一。z,.z。z。一1· (5) 当一个大孟德尔群体中的个体进行随机交 配,同时没有迁移、突变、选择和遗传漂变发生 时,群体的基因频率世代不变,配子联合频率分 布满足下面∑孢i个等式 ∑…∑.∑…∑ Al。1J A№l—l,J ^‘批川 A”w PTlJ""3"i—l,jXijXi+l,j。w 2%d· (zd=1,2,…,以i;i。l,2,…,优) (6) 基因型联合频率分布满足下面∑孢i个等式 丢暑(钆著~‘’。¨≥。。。j。Ⅶ≥‰, …∑p,lj—lk"".i--1.j.i--1.k,ij,ik—iq-I.).i+1.k'".mj.n。+ A”“^…卅J ∑… ∑ . ∑ …∑ A11J Al。1^A卜l。卜1.J Al-lxi_1.Ai+17件1.j A汁1x盯l,£Am】|r“A眦州 Pxljx|k""Xi--l,jXi-I,iexija'ikxi+-l,jxi4-l,k""xmja:rt。1一啦i (z“=1,2,…,n“i=1,2,…,m) (7) 根据Shannon信息熵的定义,各基因座等 位基因频率分布的信息熵为 Hi S(A。)一一∑qⅡlnqi. j=1 (i=1,2,…,m) (8) 配子联合频率分布的信息熵(简称“配子信息 熵”)为 ”l *f Hm s(o)=一∑…∑…∑Pv v.。。· 万方数据
第5期 张湾雁,等:不同交配方式下遗传平衡的信息学分析 517 基因型联合频率分布的信息精(简称基因型信 (ln,·(∑…∑ · 息熵”)为 5O=- 求偏导数并令其为零,得方程细 aL py-w (10) n+∑ln以。=0. 2随机交配下的配子平衡分布与 (x=1,2,…,n;i=1,2,…m) 基因型平衡分布的关系 整理并代入约束条件,得配子频率分布惟一解 在m个基因座上满足(1)式的群体如果处 于Hardy-Weinberg平衡,则不论是否连锁,配 (x=1,2,,ni=1,2,…,m) 子频率分布平衡、基因型率分布也平衡如 由于配子信息熵(9)显然存在最大值,所以上述 群体不平衡,则经过一代随机交配以后,各基因 惟一解正是配子信息熵(9)取得最大值的配子 座将平衡,但是即使基因座之间无连锁,多个基 瓶率分布,配子频率为各基因座基因颜率的乘 因座整体也不 一定平衡,甚至理论上有限多代 积,与Hardy-Weinberg平衡状态下的配子频 无法平衡,如果存在连锁,那么情况更复杂.我 率分布相一致.将上述分布代人配子信息嫡(9) 们关心的是:当m个基因座的配子频率达到平 衡分布时是否基因型频率达到平衡:反过来,基 并整理得S.(O)=∑S(A),定理得证 因型频率达到平衡分布时是否配子频率达到平 该定理可以简述为:配子信息熵取得最大 衡:两种平衡是否具有惟一的一致性.下面应用 值时的配子频率分布与Hardy-Weinberg平衡 信息论方法给出这一问题一般性的证明, 状态下的配子频率分布相一致 定理1式(1)对应的群体在各基因座基 值得说明的是:证明中构造相助函数时,参 因频率不变的条件下,当配子频率为Hardy 数写成对数形式对定理证明至关重要,香则证 Weinberg平衡状态下的配子颜率分布,即 明会极其繁复: 定理2式(1)对应的群体在各基因座基 因颍率不变的条件下,当基因型频率为Hrdy (x=1,2,…i=1,2,,m) Veinberg平衡状态下的基因型频率分布,即 时配子信息熵有最大值S(O)=立5A). 证明:由已知条件,在约束条件(3)、(6)之 下,求配子信息熵(9)的最大值.引入正实变量 x,x4=1,2,…,n:i=1,2,…,m) 时,基因型信息熵有最大值 入m入,dm。,构造辅助函数 L(0Ag1A2,…,……入42 Sa(G)=2∑S(A) 该定理可以简述为:基因型信息嫡取得最 大值时的基因型频率分布与Hardy-Weinberg 平衡状态下的基因型频率分布相一致 定理2的证明与定理1类似,且上述两个 定理不以连镇为条件,即不论是否连锁都成立 详细论述见文献2 万方数据
第5期 张鸿雁,等:不同交配方式下遗传平衡的信息学分析 lnpzlJ zi z。· (9) 基因型联合频率分布的信息熵(简称“基因型信 息熵”)为 ”1 H1 n ni ”小 ”“ s(G)=一∑∑…∑∑…∑∑ 。1J=l。lk=l 。0=l 2砖盎1 。卅J=1。磁=1 Pzl,z J∥zii2*…z耐。“‘ln户rl,zlr勺r女钿z“· (10) 2 随机交配下的配子平衡分布与 基因型平衡分布的关系 在m个基因座上满足(1)式的群体如果处 于Hardy—Weinberg平衡,则不论是否连锁,配 子频率分布平衡、基因型频率分布也平衡.如果 群体不平衡,则经过一代随机交配以后,各基因 座将平衡.但是即使基因座之间无连锁,多个基 因座整体也不一定平衡,甚至理论上有限多代 无法平衡.如果存在连锁,那么情况更复杂.我 们关心的是:当m个基因座的配子频率达到平 衡分布时是否基因型频率达到平衡;反过来,基 因型频率达到平衡分布时是否配子频率达到平 衡;两种平衡是否具有惟一的一致性.下面应用 信息论方法给出这一问题一般性的证明. 定理1 式(1)对应的群体在各基因座基 因频率不变的条件下,当配子频率为HardyWeinberg平衡状态下的配子频率分布,即 P,l,zi z。=qlzl,…g扛“…q,mw 2-【土quo· (zi=1,2,…,咒i;i 21,2,…,m) 时,配子信息熵有最大值s。。(O)=∑S(A。). i=1 证明:由已知条件,在约束条件(3)、(6)之 下,求配子信息熵(9)的最大值.引入正实变量 Ao,A11,Ai2,…,A1h,……,Afl,A峰,…,A折。,……, A。、,A。:,…,A。。,构造辅助函数 L(0;Ao,All,A12,…,Alnl,……,Afl,A z2,…, H1 ”1 如,,….,A。。,A……,k。)一一∑…∑ 。1J。1 。“2l nm …∑P~~,。·1n氏v。。+(1m孑+1)· Zmi 21 n1 ni nm m ”i (∑…∑…∑PV v。。一1)+∑∑ (1nA。。 .(∑ …∑ · ∑ A1。1J Ai-l ri-I,] Al+kHl,, …∑P“h,v㈣,。一q。。)). A”Ⅷ 求偏导数并令其为零,得方程组 a[. . 瓦i_i=了2—1n以∥勺…锄+ lmg+∑l以打。=o. i£l (z。一1,2,…,":;i一1,2,…,m) 整理并代入约束条件,得配子频率分布惟一解 P~V‰=qh,…qv”q。。=Ⅱqv (xo一1,2,…,tlij i一1,2,…,垅) 由于配子信息熵(9)显然存在最大值,所以上述 惟一解正是配子信息熵(9)取得最大值的配子 频率分布,配子频率为各基因座基因频率的乘 积,与Hardy—Weinberg平衡状态下的配子频 率分布相一致.将上述分布代入配子信息熵(9) 并整理得s。。。(o)一∑S(Ai),定理得证. i=l 该定理可以简述为:配子信息熵取得最大 值时的配子频率分布与Hardy—Weinberg平衡 状态下的配子频率分布相一致. 值得说明的是:证明中构造辅助函数时,参 数写成对数形式对定理证明至关重要,否则证 明会极其繁复. 定理2式(1)对应的群体在各基因座基 因频率不变的条件下,当基因型频率为Hardy— Weinberg平衡状态下的基因型频率分布,即 AlJflI ,uz∥-钿。融 =91T1,91fl女 …%d口扫硅 … ‰。q。。=Ⅱ(q讧4q。。). (z。z*=1,2,…,咒。;i一1,2,…,m) 时,基因型信息熵有最大值 Smax(G)----2∑S(At). f=1 该定理可以简述为:基因型信息熵取得最 大值时的基因型频率分布与Hardy—Weinberg 平衡状态下的基因型频率分布相一致. 定理2的证明与定理1类似,且上述两个 定理不以连锁为条件,即不论是否连锁都成立, 详细论述见文献Ez3. 万方数据
晰江大学(农业与生命科学版 第32卷 根据定理1和定理2,当群体处于Hardy 非处于孤立的条件下,群体发展的结果是最终 Weinberg平衡分布时,配子信息熵和基因型信 会达到 个不随时间变化的Wright平衡状态 息熵分别取得惟一最大值,此时的频率分布仅 这时群体演化的墙流为零,但是配子信息饰流 由各基因座的基因颜率决定,并且具有关系 和基因型信息熵流的运动依然存在,因此这个 S(G)=2S(O),而此后对于多基因座米 不随时间变化的状态不是平衡态而是非平衡完 说,不论是否连锁,配子频率和基因型摸率将在 态,配子信息嫡和基因型信息嫡具有极小值 随机交配下保持不变,即定理3 时业.口以从m个甚因座A。A,。.A 定理3不论是否连锁、连锁程度如何,随 且每个基因座上有n个等位基因的Hardy 机交配下的m个基因座基因型频率处于平衡 Weinberg平衡群体出发,考虑在某种近亲交面 分布当且仅当配子频率处于平衡分布。 下的世代传递中配子信息摘和基因型信息熵递 减的规律,以及它们达到非平衡定态的最小值 3近亲交配下的遗传平衡与最小 从而验证上 段论述.为简便下面以 个基因 熵原理 座的基因型信息嫡为例说明 设复等位基因座A的基因颜率为 信息论中的最大熵原理指出:在只掌握部 A.pt(A.AA。)m(0.3.0.2.0.5) 分信息的情况下要对某种分布做出推断时,应 (11 取符合约束条件但信息嬸最大的概率分布.定 对应的群体若为随机交配下的平衡群体,则基 理1和定理2可以概括为:最大信息熵原理与 因型频率分布(正、反交分开)为 Hardy-Weinberg平衡定律具有-致性,这种 A:A A:A A:A 致性是结果的一致性,并未考虑群体的演化过 (Go,P):A:A:A2A:A:A3= 程.对于群体的演化过程论述如下 非平衡态热力学的一个重要结果是最小嫡 0.09 0.06 0.15 产生原理.按照这个原理,在接近平衡的条件 0.060.040.10 (12) 下,和外界强加的限制或控制条件相适应的非 0.150.100.25 平衡定态的熵具有极小值.尽管最小熵原理所 若从随机交配下的平衡群体(12)开始的每 论述的嫡是热力学嫡,但是正像Shannon最初 ·世代(设为第0代)施以外部强制:群体中的 定义Shannon信息熵源于热力学一样,将上述 一部分个体完全自交(所占比例设为四),另 嫡理解为Shannon信息嫡,将系统设定为 -个 部分个体随机交配(所占比例为1 .在世代 二倍体生物群体,应用信息论方法结论如下。 交替中,群体的基因频率世代不变,基因型频率 Hrdv-veinberg平定律是随机交配下 (正反交分开)与世代数t之间的关系为 的平衡定律 一个大孟德尔群体在没有迁移 A,A。AA2AA 变、洗择和遗传漂变发生而且总是进行随机交 (G),P) A:A: A:A: A:Ay 配时,可以认为群体不受任何强加的外部限制 A3A:A.Az AA3 面处干孤立的条件下,不管群体初始状态如何 0.21h,-0.120.06(2-h,)0.15(2-h) 群体中的配子信息嫡和基因型信息熵自由发展 0.06(2-h,)0.16h,-0.120.10(2-h,) 的结果总是趋向于最大值而达到Hardy 0.15(2-h.) 0.10(2-h,) 0.25h, Weinberg平衡状态 (13) Wright平衡定律是近亲交配下的平衡定 其中,t为世代数,t=0,1,2,…,h:= 律,假定没有迁移、突变、选择和遗传漂变发生 如果 个大孟德尔群体在世代传递中从整体水 1-(号) 平上表现为一定程度的近亲交配时,可以认为 从交配方式上对群体施以一定的外部强制,而 1一号 h.∈「1,2),G(表示第t代的基 万方数据
浙江大学学报(农业与生命科学版) 第3 2卷 根据定理1和定理2,当群体处于Hardy— Weinberg平衡分布时,配子信息熵和基因型信 息熵分别取得惟一最大值,此时的频率分布仅 由各基因座的基因频率决定,并且具有关系 S。。。(G)一2S。。。(0),而此后对于多基因座来 说,不论是否连锁,配子频率和基因型频率将在 随机交配下保持不变,即定理3. 定理3不论是否连锁、连锁程度如何,随 机交配下的优个基因座基因型频率处于平衡 分布当且仅当配子频率处于平衡分布. 3 近亲交配下的遗传平衡与最小 熵原理 信息论中的最大熵原理指出:在只掌握部 分信息的情况下要对某种分布做出推断时,应 取符合约束条件但信息熵最大的概率分布.定 理1和定理2可以概括为:最大信息熵原理与 Hardy-Weinberg平衡定律具有一致性.这种一 致性是结果的一致性,并未考虑群体的演化过 程.对于群体的演化过程论述如下. 非平衡态热力学的一个重要结果是最小熵 产生原理.按照这个原理,在接近平衡的条件 下,和外界强加的限制或控制条件相适应的非 平衡定态的熵具有极小值.尽管最小熵原理所 论述的熵是热力学熵,但是正像Shannon最初 定义Shannon信息熵源于热力学一样,将上述 熵理解为Shannon信息熵,将系统设定为一个 二倍体生物群体,应用信息论方法结论如下. Hardy—Weinberg平衡定律是随机交配下 的平衡定律.一个大孟德尔群体在没有迁移、突 变、选择和遗传漂变发生而且总是进行随机交 配时,可以认为群体不受任何强加的外部限制 而处于孤立的条件下,不管群体初始状态如何, 群体中的配子信息熵和基因型信息熵自由发展 的结果总是趋向于最大值而达到Hardy— Weinberg平衡状态. Wright平衡定律是近亲交配下的平衡定 律.假定没有迁移、突变、选择和遗传漂变发生, 如果一个大孟德尔群体在世代传递中从整体水 平上表现为一定程度的近亲交配时,可以认为 从交配方式上对群体施以一定的外部强制,而 非处于孤立的条件下,群体发展的结果是最终 会达到一个不随时间变化的Wright平衡状态. 这时群体演化的熵流为零,但是配子信息熵流 和基因型信息熵流的运动依然存在,因此这个 不随时间变化的状态不是平衡态而是非平衡定 态,配子信息熵和基因型信息熵具有极小值. 对此,可以从m个基因座A。,A。,…,A。, 且每个基因座上有卵。个等位基因的HardyWeinberg平衡群体出发,考虑在某种近亲交配 下的世代传递中配子信息熵和基因型信息熵递 减的规律,以及它们达到非平衡定态的最小值, 从而验证上一段论述.为简便下面以一个基因 座的基因型信息熵为例说明. 设复等位基因座A的基因频率为 (A,P):(Al,A 2,A 3)=(0.3,0.2,0.5). (11) 对应的群体若为随机交配下的平衡群体,则基 因型频率分布(正、反交分开)为 fAlAl A1A2 AlA3] (Go,P):l A2A1 A2A2 A2A3 l= 【A3A1 A3A2 A3A3 J fo·09 o·06 o·151 0.06 0.04 0.10 I. (12) 【o.15 0.10 o.25 J 若从随机交配下的平衡群体(12)开始的每 一世代(设为第0代)施以外部强制:群体中的 一部分个体完全自交(所占比例设为侧),另一 部分个体随机交配(所占比例为1一叫).在世代 交替中,群体的基因频率世代不变,基因型频率 (正反交分开)与世代数£之间的关系为 fAlAl A1A2 A1A3] (G(,£),P)。I A2Al A2A2 A2A3 f= IA3A1 A3A2 A3A3) f0.2lh,一0.12 0.06(2一h。)0.t5(2一h。)] 0.06(2一h。)0.16h。一0.12 0.10(2一h,)I 1 0.15(2一h,)0.10(2一h。)0.25h。 J (13) 其中,f为世代数,t=0,1,2,…,h。=∑(罟)2 i世0 — 1一(罢)… =——』一,h。∈[1,2),G(f)表示第t代的基 1一罢 万方数据
第5期 非鸿雁,等:不同交配方式下渍传平衡的信息学分折 519 因型整体第:代基因型信息嫡为 衡定律的一毅形式,但是从Shannon信息摘的 S(G(t))=-(0.21h,-0.12)1n(0.21h. 角度看并不能这样理解,这是应用信息论方法 0.121 -(0.16h,-0.12)ln(0.16h.-0.12) 研究群体遗传学与传统观点的不同之处 (0.25h,)ln(0.25h,)-2(0.06(2-h)ln(0.06 如果从交配方式上对群体施以其他的外部 (2-h,)-2(0.15(2-h,)ln(0.15(2-h,) 强制(如选型交配,文献[4]论述),应有与近亲 2(0.10(2-h,))1n(0.10(2-h,)). (14 交配相类似的结论。 这是关于世代数的减函数随世代数的增加,群 体将趋向于非平衡定态,基因型信息嫡有最小 4 结论 值.但是要想证明上述论断比较困准,表1对不 司的自交比例山,应用Mat山ab想拟群体渲化 假定一个大孟德尔二倍体生物群体没有迁 验证群体达到 一个不随时间变化的Wright平 移、突变、选释和遗传漂变发生,当从整体角度研 衡状态时基因型信息嫡取得最小值的过程, 究该群体位于常染色体上的多个基因座时 表1 不同自交比例下善因型信惠情的变 Hardy-Weinberg平衡状态下的配子频率分布 Table inds of 基因型领率分布与它们的信息嫡取得最大时的 颜率分布相一致.据此可证明:不论是否连锁,连 世代数w=0.25=0.5 因值息 锁程度如何随机交配下的配子平衡分布与基因 型平衡分布总 -致.另外,与随机交配下的 2.0593250 200g 2.05932.0593 Hardy-Weinberg平衡相比,如果从交配方式B 194 18807 18g9 对群体施以其他的外部强制(如近亲交配、选型 20407 1825 1641 1.5572 一个不 20402 1.062g 1.7757 1.5663 1.3505 交配四等),群体发展的结果最终会达到 2.0402 1.9606 1.755 1.505 1.2178 随时间变化的非平衡定态,此时配子信息嫡和基 2.0401 1.9601 1.747 1.4766 1.1373 因型信息嫡具有极小值,远离无外部强制下的 2.0401 1.959 1.7445 1.4632 1.090 Hardy-Weinberg平衡状态.失去了外部强制.群 2.0401 1.959 1.7431 .457 1.063 体将向Hardy-Wcinberg平衡方向回复 2.0401 1.959 1.743 1.048 2.040 1.959 1.743 .039 10 2.040 1.959 52 .035 [1 YUAN Zhi-fa. 2.040 11 、」 GentSna(量传学报).2002.29(6):562-564.(im 415 17430 [2】ZHANG Hong,ZHANG Hong-yan(张宏礼,张满) 10E 1.7430 14520 1.0202 1050 14520 1.0207 ibrium n.Hereditas).2006.28(3) 2.04011.95991.74301.45201.0297 324-328.(in Chinese ZHANG Hong-li,GUO Man-cai XIE Xino-li,et al. 从表中可见:自交比例的增大,对群体施 宏礼,清才.解小有.等).of pair alleles population 加的外部强制越大,基因型信息熵随世代数增 加而减少的幅度越大,最小值也越小,达到最小 北农林科技大学报:自然 值之后基因型信息熵不再变化,群体处于非平 学版 .400 3.31(1):148 衡定态.从Shannon信息熵的角度看,这种非 平衡定态不是平衡状态,而是远离无外部强制 下Hardy-Weinberg平衡的状态,群体遗传学 《中国农学通报) 认为Wright平衡定律是Hardy-Weinberg平 0205.213:12-115.(Chnese 万方数据
第5期 张鸿雁,等:不同交配方式下遗传平衡的信息学分析 519 因型整体.第t代基因型信息熵为 S(G(t))=一(0.21h。一0.12)In(0.21h,一 0.12)一(0.16h。~0.12)in(0.16h。一0.12)一 (0.25h。)ln(0.25h。)一2(0.06(2一h。))ln(0.06 (2一h,))一2(0.15(2一h。))ln(0.15(2一h。))一 2(0.10(2一h,))ln(0.10(2一h,)). (14) 这是关于世代数的减函数.随世代数的增加,群 体将趋向于非平衡定态,基因型信息熵有最小 值.但是要想证明上述论断比较困难,表1对不 同的自交比例硼,应用Matlab模拟群体演化, 验证群体达到一个不随时间变化的Wright平 衡状态时基因型信息熵取得最小值的过程. 表1不同自交比例下基因型信息熵的变化 Table 1 Variety of genotype entropy by five kinds of different selfing proportion 从表中可见:随自交比例的增大,对群体施 加的外部强制越大,基因型信息熵随世代数增 加而减少的幅度越大,最小值也越小,达到最小 值之后基因型信息熵不再变化,群体处于非平 衡定态.从Shannon信息熵的角度看,这种非 平衡定态不是平衡状态,而是远离无外部强制 下Hardy—Weinberg平衡的状态.群体遗传学 认为Wright平衡定律是Hardy—Weinberg平 衡定律的一般形式,但是从Shannon信息熵的 角度看并不能这样理解,这是应用信息论方法 研究群体遗传学与传统观点的不同之处. 如果从交配方式上对群体施以其他的外部 强制(如选型交配,文献[4]论述),应有与近亲 交配相类似的结论. 4 结 论 假定一个大盂德尔二倍体生物群体没有迁 移、突变、选择和遗传漂变发生,当从整体角度研 究该群体位于常染色体上的多个基因座时, Hardy-Weinberg平衡状态下的配子频率分布、 基因型频率分布与它们的信息熵取得最大时的 频率分布相一致.据此可证明:不论是否连锁、连 锁程度如何,随机交配下的配子平衡分布与基因 型平衡分布总一致.另外,与随机交配下的 Hardy-Weinberg平衡相比,如果从交配方式上 对群体施以其他的外部强制(如近亲交配、选型 交配[43等),群体发展的结果最终会达到一个不 随时间变化的非平衡定态,此时配子信息熵和基 因型信息熵具有极小值,远离无外部强制下的 Hardy-Weinberg平衡状态.失去了外部强制,群 体将向Hardy-Weinberg平衡方向回复. References: [1] WANG Xiaoqong,YUAN Zhi—fa,GUO Man-cai.et al (汪小龙,袁志发,郭满才,等).Maximum entropy principle and population genetic equilibrium[J].Aeta Genetica Sinica(遗传学报),2002,29(6):562—564.(in Chinese) [2]ZHANG Hong-li,ZHANG Hong-yan(张宏礼,张鸿雁). Study on the maximum entropy principle and population genetic equilibrium叨.Hereditas tilt传),2006,28(3): 324—328.(in Chinese) [3]ZHANG Hongqi,GUO Man-cai,XIE Xiao-li,et al(张 宏礼,郭满才,解小莉.等).The entropy character of a pair alleles population in inbreeding明.Jomml of Northwest Sd-Teeh University of Awleuitttre and Forestry: Natural ScienceEdition(西北农林科技大学学报:自然科 学版),2003,31(1):148—150.(inChinese) [4] ZHANG Hong-li,GUO Man-eai,WANG Li-bo,et a1. (张宏礼,郭满才,王丽渡,等),The entropy of a pair alleles population in mating of homologous phenotypes明. Chinese Agricultural Science Bulletin(中萄农学通报), 2005.21(3):112—115.(in Chinese) 万方数据
不同交配方式下遗传平衡的信息学分析 日万方数据文旅装# 作者: 张鸿雁,张宏礼,郭满才,哀志发,ZHANG Hongyan,ZHANG Hong-li,G0Mn-cai YUA m-ia 作者单位 雁,ZHANG Hong- m(里龙江人一农大学.生合科技学院,里龙江,大,1631, 大我店晚海 HANG Hong 刊名: 浙江大学学报(农业与生命科学版)STI©PK☑ 英文刊名: JOURNAL OF ZHEJIANG UNIVERSITY (AGRICULTURE LIFE SCIENCES) 年,卷(期: 2006,32(5) 引用次数: 诊考文献(4) 1.汪小龙.袁志发.郭满才.宋世德.张全启.包振民最大信息痛原理与群体造传平衡[期刊论文]-遗传学报2002(6) 2.张宏礼张鸿雁关于最大信息嫡原理与群体遗传平衡一致性的探讨[期刊论文]-遗传2006(3) 3.张宏礼.郭满太.解小莉刘建军。周静芋.寝志发近亲繁殖下一对等位基因群体的箱性质[期刊论文]-西北农林科 技大学学报(自然科学版)2003(1) 4.张宏礼,郭满左王丽波.刘魔。哀志发表型同型交配群体的Shannon信息熵和互信息[期刊论文]-中国农学通报 2005(3) 引证这3)】 1.李大林。陈奇基于自交率的基因型信息熵变规律与自花传粉机制的进化意义[期刊论文]·上海交通大学学报(农 业科学版)2008(6) 2.李大林.陈一帆蔡润多性状群体信息混杂递增链与混杂指数的应用[期刊论文]-安徽农业科学2008(13) 3张宏礼代冬岩。范慧玲.周晓晶李晓晖一类群体迁移的数学模型分析[期刊论文]黑龙江八一农是大学学报 2007(00 本文链接:http:/wanfangdata,co.cn/Periodical-nyysn20605010.asp 下载时间:2010年3月5日
不同交配方式下遗传平衡的信息学分析 作者: 张鸿雁, 张宏礼, 郭满才, 袁志发, ZHANG Hong-yan, ZHANG Hong-li, GUO Man-cai , YUAN Zhi-fa 作者单位: 张鸿雁,ZHANG Hong-yan(黑龙江八一农垦大学,生命科技学院,黑龙江,大庆,163319), 张宏 礼,ZHANG Hong-li(黑龙江八一农垦大学,文理学院,黑龙江,大庆,163319), 郭满才,袁志发 ,GUO Man-cai,YUAN Zhi-fa(西北农林科技大学,生命科学学院,陕西,杨陵,712100) 刊名: 浙江大学学报(农业与生命科学版) 英文刊名: JOURNAL OF ZHEJIANG UNIVERSITY(AGRICULTURE & LIFE SCIENCES) 年,卷(期): 2006,32(5) 引用次数: 3次 参考文献(4条) 1.汪小龙.袁志发.郭满才.宋世德.张全启.包振民 最大信息熵原理与群体遗传平衡[期刊论文]-遗传学报 2002(6) 2.张宏礼.张鸿雁 关于最大信息熵原理与群体遗传平衡一致性的探讨[期刊论文]-遗传 2006(3) 3.张宏礼.郭满才.解小莉.刘建军.周静芋.袁志发 近亲繁殖下一对等位基因群体的熵性质[期刊论文]-西北农林科 技大学学报(自然科学版) 2003(1) 4.张宏礼.郭满才.王丽波.刘璐.袁志发 表型同型交配群体的Shannon信息熵和互信息[期刊论文]-中国农学通报 2005(3) 相似文献(0条) 引证文献(3条) 1.李大林.陈奇 基于自交率的基因型信息熵变规律与自花传粉机制的进化意义[期刊论文]-上海交通大学学报(农 业科学版) 2008(6) 2.李大林.陈一帆.蔡润 多性状群体信息熵混杂递增链与混杂指数的应用[期刊论文]-安徽农业科学 2008(13) 3.张宏礼.代冬岩.范慧玲.周晓晶.李晓晖 一类群体迁移的数学模型分析[期刊论文]-黑龙江八一农垦大学学报 2007(04) 本文链接:http://d.g.wanfangdata.com.cn/Periodical_zjdxxb-nyysm200605010.aspx 下载时间:2010年3月5日