第27卷第6期 作物学报 Vol.27.No.6 2001年11月 ACTA AGRONOMICA SINICA Nov.,200】 数量性状分离分析的精确度及其改善途径 章元明盖钧镒戚存扣 (南京农业大学大豆研究所,农业部国家大豆改良中心,江苏南京210095) 提要在分析提高数量性状分离分析精度的三种途径基础上,对遗传率较低或试验误差较大的数量 性状分离分析,综合上述三方法提出了利用P、F、P,、B,、B2:和F家系重复试验的联合分离分 析法。其基本理论是将分离群体看作由多基因和环境修饰的主基因型正态分布的混合分布。通过油菜 初花期的遗传分析表明:分析家系重复试验的家系平均数资料获得的AIC值比分析单一重复资料获得 的AIC值更低:P、F,和P:的加入可增加一阶遗传参数的估计精度,通过方差分析联合估计提供的 误差方差可增加二阶遗传参数的估计精度。 关键词主基因十多基因混合遗传家系重复试验:数量性状 The Precision of Segregating Analysis of Quantitative Trait and Its Improving Methods ZHANG Yuan-Ming GAI Jun-Yi QI Cun-Kou (Soybean Research Institute.Nanjing Agricultural National Center of Improcement.Ministry of Agriculture.Naniing 210095.China) Abstract To improve the precision of mixed genetic analysis of quantitative traits,three kinds of methods were proposed.By jointing the above methods,joint segregating analysis (JSA)of quantitative trait for the replicated family experiment (RFE)of P1.F1.P2,B.2. Ba.and F:.3 was set up in the paper.The results of an example of the inheritance of date to flower of Brassica napus L.showed that the Akaike's information criterion (AIC)values of genetic models using the averaged data of multiple replications would be lower than those using the data of one replication:the precision of the first order genetic parameters can be improved by means of adding the information of P.Fand P:generations:the unbiased error variance obtained by analysis of variance of RFE could improve the precision of the estimates of second order genetic parameters. Key words Mixed major gene plus polygene inheritance:the replicated family test: Quantitative trait 在王建康、盖钧镒在Elkind等(1986,1990)1.)、莫惠栋等(1993)3.1和姜长鉴等 国家973项目(G1998010206)和重庆市科委应用基础研究项目资助 01 重厌 论文博士研究生,副教授,研究方向:数量遭传与生物统计 受日期 Received on:2000-09-29.Accepted on:2001-01-14
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 第 "#卷 第 $期 作 物 学 报 %&’("#)*&($ "++,年 ,,月 -./- -012*234.- 54*4.- *&6()"++, 数量性状分离分析的精确度及其改善途径7 章元明 盖钧镒 戚存扣77 8南京农业大学大豆研究所)农业部国家大豆改良中心)江苏南京 ",++9:; 提 要 在分析提高数量性状分离分析精度的三种途径基础上)对遗传率较低或试验误差较大的数量 性状分离分析)综合上述三方法提出了利用 ,="@A家系重复试验的联合分离分 析法B其基本理论是将分离群体看作由多基因和环境修饰的主基因型正态分布的混合分布B通过油菜 初花期的遗传分析表明C分析家系重复试验的家系平均数资料获得的 -4.值比分析单一重复资料获得 的 -4.值更低D,和 ,)"@A9d22./c,ge/0.,d,.-(/0.-.2c’/2&3de.4d+,’.&3/0.ge0.-g/de1.&35d/./& 3’&9.-&3=uqttzvqrq({t>(20&9.5/0d//0.-8dg8.?2ge3&-+d/g&e1-g/.-g&e8-4.;6d’c.2&3 h.e./g1+&5.’2c2geh/0.d6.-dh.55d/d&3+c’/g,’.-.,’g1d/g&e29&c’5;.’&9.-/0de/0&2. c2geh/0.5d/d&3&e.-.,’g1d/g&eD/0.,-.1g2g&e&3/0.3g-2/&-5.-h.e./g1,d-d+./.-21de;. g+,-&6.5;6+.de2&3d55geh/0.ge3&-+d/g&e&3,de5<1&c’5g+,-&6./0.,-.1g2g&e&3/0..2/g+d/.2 &32.1&e5&-5.-h.e./g1,d-d+./.-2( @HWANJ[M 3g4.5+d:&-h.e.,’c2,&’6h.e.ge0.-g/de1.D/0.-.,’g1d/.53d+g’6/.2/D jcde/g/d/g6./-dg/ 在 王 建 康=盖 钧 镒 在 <’8ge5等 8,9B$),99+;C,)"D =莫 惠 栋 等 8,99A;CA)ED和 姜 长 鉴 等 7 77 现在江苏省农科院经作所工作)江苏南京)",++,E 收稿日期C"+++f+9f"9)接受日期C"++,f+,f,E 1.1.g6.5&eC"+++f+9f"9)-11.,/.5&eC"++,f+,f,E 国家 9#A项目80,99B+,+"+$;和重庆市科委应用基础研究项目资助 章元明8,9$:年 :月生;)男)重庆永川人)论文博士研究生)副教授)研究方向C数量遗传与生物统计 万方数据
788 作物学报 27卷 (1995)的工作基础上,提出了利用个别世代的数量性状分离分析法6~),经他人在水稻广 亲和性和白叶枯病抗性,大豆抗食叶性害虫、抗斜纹夜蛾、孢囊线虫1号小种和上部节数相 对值等性状的遗传规律研究中应用,提出了相应的育种策略和培育了部分抗病品种。应用中 发现[~],该法在不同分离世代结果间有差异,由此提出了联合多个分离世代的联合分析 法:0,),经他人在水稻广亲和性、抗白叶枯病和株高,小麦白叶枯病抗性,玉米矮枯叶 病,大豆抗食叶性害虫、抗斜纹夜、抗孢囊线虫、抗花叶病毒以及干豆乳产量、干豆腐产量 油分含量、最长叶柄节位相对值等性状的遗传研究表明它们均符合该遗传模式[6)。应用中发 现该套方法还有必要进行拓展。为此,章元明、盖钧镫在分离世代、遗传模型和极大似然估 计的算法等方面进行了拓展1~)。应用中还发现,遗传率低和试验误差大的数量性状分 离分析精度不高,这是因为现有的植物数量性状分离分析法虽进行了拓展但基本上还是针对 试验单位为单株或单株十家系的田间试验遗传资料。然而,作物的重要经济性状,如品质性 状、产量及其产量因素等许多性状属低遗传力的,且田间试验单株资料的误差又较大。因此, 分析影响数量性状分离分析精确度的原因并提出改善途径很有必要。本文就是这方面的探 1提高数量性状分离分析精确度的途径 1.1采用家系平均数代替单株观察值 根据数量性状分离分析的基本假定6.)可知,P1、F,和P2同质群体中单株数量性状观测 值服从单一正态分布N(以,。):若采用n株观测值的平均数进行分析,则该平均数服从 N(,σ2/加)。由此可见,分析平均数资料的误差比分析单株观测值资料误差小,前者是后者 的1/m。该结论同样适合于分离群体。例如,F,群体中单株数量性状观测值是由k1种主基因 由多基因和环境修饰的k个正态分布混合而成的,即 N (gu,i). 其中,=…=1=2十多基因方差组分。然而,由该F2群体衍生的F2:家系群体的数量 性状家系平均数x2(每家系观测n株)分布由k1种主基因型家系所对应的并由多基因和环境 修饰的大个正态分布混合而成的即}N,,其中,一云士多基因和主塞 因方差组分(1=1,,k)。显然,,的误差方差组分是号的误差方差组分的n倍。因此,利 用家系平均数有更小的误差方差。用具有更小误差方差的家系平均数进行分离分析有更高的 精度s.1 1.2采用联合多世代分析代替单世代分析 文献)指出,利用多世代联合分析能够得到的信息量最多,并且可以克服利用几个分离 世代独立分析出现的矛盾现象。从数量遗传学理论可知,有亲本和F,参加的数量性状联合分 析有利于精确定位一阶遗传参数估计值大小,从而提高一阶遗传参数估计值的精度。此外 利用多世代联合分析的样本容量大为增加也是联合分析精度高的重要原因。 1.3采用家系重复试验方法 利用家系重复试验能增加数量性状分离分析精度主要有两方面的原因:1)家系试验可 以设置重某增推重复能降低误差达到提高遗传分析精度的目的;2)家系重复试验方差分析 可获得无偏试 验误差方差估计值,这可增大二阶遗传参数的估计精度,特别是结合重复内分
!"##$%&$’的工作基础上(提出了利用个别世代的数量性状分离分析法&)*+’ (经他人在水稻广 亲和性和白叶枯病抗性(大豆抗食叶性害虫,抗斜纹夜蛾,孢囊线虫 "号小种和上部节数相 对值等性状的遗传规律研究中应用(提出了相应的育种策略和培育了部分抗病品种-应用中 发现&)*+’ (该法在不同分离世代结果间有差异(由此提出了联合多个分离世代的联合分析 法&)(#(".("/’ (经他人在水稻广亲和性,抗白叶枯病和株高(小麦白叶枯病抗性(玉米矮枯叶 病(大豆抗食叶性害虫,抗斜纹夜,抗孢囊线虫,抗花叶病毒以及干豆乳产量,干豆腐产量, 油分含量,最长叶柄节位相对值等性状的遗传研究表明它们均符合该遗传模式&)’ -应用中发 现该套方法还有必要进行拓展-为此(章元明,盖钧镒在分离世代,遗传模型和极大似然估 计的算法等方面进行了拓展&""*"0’ -应用中还发现&""’ (遗传率低和试验误差大的数量性状分 离分析精度不高(这是因为现有的植物数量性状分离分析法虽进行了拓展但基本上还是针对 试验单位为单株或单株1家系的田间试验遗传资料-然而(作物的重要经济性状(如品质性 状,产量及其产量因素等许多性状属低遗传力的(且田间试验单株资料的误差又较大-因此( 分析影响数量性状分离分析精确度的原因并提出改善途径很有必要-本文就是这方面的探 索- 2 提高数量性状分离分析精确度的途径 "3" 采用家系平均数代替单株观察值 根据数量性状分离分析的基本假定&)(#’可知(4",5"和 4/同质群体中单株数量性状观测 值 服从单一正态分布 6!7(8 / %9若采用 :株观测值的平均数进行分析(则该平均数服从 6!7(8 / ;:%-由此可见(分析平均数资料的误差比分析单株观测值资料误差小(前者是后者 的 ";:-该结论同样适合于分离群体-例如(5/群体中单株数量性状观测值是由 *? !每家系观测 :株%分布由 *? <" @A"B/@6!7/@(8 / /@%(其中(8 / /@A8 / ;:1多基因和主基 因方差组分!@A"(C(<"%-显然(8 / "@ 的误差方差组分是 8 / /@的误差方差组分的 :倍-因此(利 用家系平均数有更小的误差方差-用具有更小误差方差的家系平均数进行分离分析有更高的 精度&)(""’ - 23E 采用联合多世代分析代替单世代分析 文献&#’指出(利用多世代联合分析能够得到的信息量最多(并且可以克服利用几个分离 世代独立分析出现的矛盾现象-从数量遗传学理论可知(有亲本和 5"参加的数量性状联合分 析有利于精确定位一阶遗传参数估计值大小(从而提高一阶遗传参数估计值的精度-此外( 利用多世代联合分析的样本容量大为增加也是联合分析精度高的重要原因- 23F 采用家系重复试验方法 利用家系重复试验能增加数量性状分离分析精度主要有两方面的原因G"%家系试验可 以设置重复(增加重复能降低误差达到提高遗传分析精度的目的9/%家系重复试验方差分析 可获得无偏试验误差方差估计值(这可增大二阶遗传参数的估计精度(特别是结合重复内分 H++ 作 物 学 报 /H卷 万方数据
6期 章元明等:数量性状分离分析的精确度及其改善途名 789 组随机区组设计更能有效地减少试验误差。 通过近5年的工作,已从利用单株资料)发展到利用家系平均数资料[]:从利用单个分 离世代,发展到利用多个分离世代的联合.1o,1;从未设置重复的试验~1o.1]发展到设置 重复的试验,从1对主基因+多基因-1发展到了2对主基因+多基因~13],从参数估 计的EM算法-1拓展到了迭代条件EM(IECM)算法2.1。以上这些发展均只是从一个方 面考虑的。本文一方面是对以前工作的总结,更重要的方面是同时结合上述提高数量性状分 离分析精度的三种途径而提出的一种适合低遗传力和误差较大性状的分析方法,以便提高其 分析精度。为此,本文提出利用P1、F1、P、B2、B2:和F2:家系重复试验的联合分离分析 花。 2利用P1、F、P2、B、B2,和E家系试验的联合分离分析 2.1试验设计 利用家系进行遗传试验一般采用随机区组设计。但当家系数较多时,随机区组的区组太 大控制误差的效果可能不佳,可考虑采用不完全区组设计,其中格子设计较好。但格子设计 安排的家系数受平方数限制且环境效应矫正较复杂,其应用也受限制。若供试家系数能被区 组容量整除且重复2一4次时,可采用简单广义格子设计方法口。近来一些研究者常采用重 复内分组随机区组设计。由于这种设计也属不完全区组设计,特别适用于供试样本为随机样 本的情形,这时假定分组后的每组家系均为总体代表性样本,组间应无显著差异,若存在显 著差异,应为环境误差,可予以剔除。设将家系群体供试家系随机分为α组,每组有b个家 系,每家系设置c个重复,按重复内分组随机区组设计,每一重复种b小区。若数据单位为 小区时,数量性状x的数学模型为: x=μ+a+Y十(a)十P,a十 其中,4为群体平均数;a,为第i组的效应,服从N(0,);Y为重复效应,组与重复间的互 作效应(a)w~N(0,后);B,为第i组内第j个家系的效应,服从N(0,):试验误差随机 变量e~N(0,2)。 若数据单位为小区内单株,其数学模型为: x出=4+a+Y+(a)a+月0+(3)a+⊙出 其中,()与以小区为数据单位的同义,可检测组内家系间的差异显著性:⊙m~ N(0,)为小区内株间差异。最后,仍以小区平均数为单位进行分析。误差方差通过方差分 析提供,以此估计二阶遗传参数。 若组间差异显著,则剔除组效应a:后进行以下分析。若家系间差异不显著,则分析到此 为止。 2.2基本假定与遗传模型 数量性状混合遗传分析基本假定参见文献.]。根据文献[6~的方法,可推导出1对主基 因(A)、2对主基因(B)、多基因(C)、1对主基因十多基因(D)和2对主基因+多基因(E)五 类24种遗传模型的迭代公式和遗传参数表达式。其推导方法与文献.们相似,但因群体成分 分布遗传构成的差异,致使迭代公式、约束条件数和约束条件方程组与其他供试群体和试验 设计的情误均有较大的不同。本文着眼点还在于从减少试验误差以提高遗传分析精度出发, 提出家系重复试验的数量性状混合遗传分析方法。为节省篇幅,只列出利用P、F1、P
组随机区组设计更能有效地减少试验误差! 通过近 "年的工作#已从利用单株资料$%&发展到利用家系平均数资料$’& (从利用单个分 离世代$%#’&发展到利用多个分离世代的联合$)#*+#*,& (从未设置重复的试验$%-*+#*,&发展到设置 重复的试验$**& #从 *对主基因.多基因$%-*+&发展到了 ,对主基因.多基因$**-*/& #从参数估 计的 01 算法$2-*+&拓展到了迭代条件 01340516算法$*,#*/& !以上这些发展均只是从一个方 面考虑的!本文一方面是对以前工作的总结#更重要的方面是同时结合上述提高数量性状分 离分析精度的三种途径而提出的一种适合低遗传力和误差较大性状的分析方法#以便提高其 分析精度!为此#本文提出利用 7*89*87,8:*;,8:,;,和 9,;/家系重复试验的联合分离分析 法! 8?>8=;<8@<;<和 ?<;A家系试验的联合分离分析 ,B* 试验设计 利用家系进行遗传试验一般采用随机区组设计!但当家系数较多时#随机区组的区组太 大控制误差的效果可能不佳#可考虑采用不完全区组设计#其中格子设计较好!但格子设计 安排的家系数受平方数限制且环境效应矫正较复杂#其应用也受限制!若供试家系数能被区 组容量整除且重复 ,-C次时#可采用简单广义格子设计方法$*C& !近来一些研究者常采用重 复内分组随机区组设计!由于这种设计也属不完全区组设计#特别适用于供试样本为随机样 本的情形#这时假定分组后的每组家系均为总体代表性样本#组间应无显著差异#若存在显 著差异#应为环境误差#可予以剔除!设将家系群体供试家系随机分为 D组#每组有 E个家 系#每家系设置 F个重复#按重复内分组随机区组设计#每一重复种 DE小区!若数据单位为 小区时#数量性状 GHIJ的数学模型为K GHIJL M. NH. OJ. 3NO6HJ. PI3H6. QHIJ 其中#M为群体平均数(NH为第 H组的效应#服从 R3+#S, N6(OJ为重复效应#组与重复间的互 作效应3NO6HJ- R3+#S, NO6(PI3H6为第 H组内第 I个家系的效应#服从 R3+#S, P6(试验误差随机 变量 QHIJ- R3+#S, 6! 若数据单位为小区内单株#其数学模型为K GHIJTL M. NH. OJ. 3NO6HJ. PI3H6. 3PO6IJ3H6. UHIJT 其中#3PO6IJ3H6与以小区为数据单位的 QHIJ同义#可检测组内家系间的差异显著性(UHIJTR3+#S, V6为小区内株间差异!最后#仍以小区平均数为单位进行分析!误差方差通过方差分 析提供#以此估计二阶遗传参数! 若组间差异显著#则剔除组效应 NH后进行以下分析!若家系间差异不显著#则分析到此 为止! <B< 基本假定与遗传模型 数量性状混合遗传分析基本假定参见文献$2#)& !根据文献$2-)&的方法#可推导出 *对主基 因 3W68,对主基因3:68多基因3568*对主基因.多基因3X6和 ,对主基因.多基因306五 类 ,C种遗传模型的迭代公式和遗传参数表达式!其推导方法与文献$%#)&相似#但因群体成分 分布遗传构成的差异#致使迭代公式8约束条件数和约束条件方程组与其他供试群体和试验 设计的情况均有较大的不同!本文着眼点还在于从减少试验误差以提高遗传分析精度出发# 提出家系重复试验的数量性状混合遗传分析方法!为节省篇幅#只列出利用 7*89*87,8 2期 章元明等K数量性状分离分析的精确度及其改善途径 %’) 万方数据
790 作物学报 27卷 B:2、B2:和F2:3世代联合分离分析的24种独立遗传模型,详见表1。 万方数据
!"#$%!$#$和 &$#’世代联合分离分析的 $(种独立遗传模型)详见表 "* -,+ 作 物 学 报 $-卷 万方数据
6期 章元明等:数量性状分离分析的精确度及其改善途径 791 表1利用P1、F、P2、B1:B2:2和F:世代的联合分离分析遗传模型 Table The genetic models ofjoint segregating analysis of quantitative traits using P F1.P:.B.B2:and F:populations 模型代号 成分分布数 独立参数个数 二阶分布参数 钓束条件个数 一阶遗传参数 Model No.component No.indepence 2nd order distribu- First order genetic parameters No.restrictec code distributions parameters tion parameters conditions A-1 10 mdh 0 3 m,d,(h=0) 10 m.dat d6.ha.hb.i.Jab.Jha, 6 m,d。d4,h,hs。i=b=i九=l=0 d 4 m。d《h三h=0) 2 5 15015 m,d(=d,=d,h=hs=0》 3 430 m.d.-ha.da-he 6 m d(=d.=d=h=hs 6 oi,啡io时 C-1 7 m.「1.「h] i,G号,G, 用1一用6,d, 00 m,d,h,[d,[h] 8 m,d,(h=0) 8 m,=h,[d.[h] 6 m,d=-h,「d.[h] 0i1·03201,0 6 m1~ms,dada.ha,ha.i ja.jt. ,,, m.da.ds.ha.ho.i.ja.js.1.[d].[h] 20015 da.do.ha. i,, d 1 m.d..ds,ha=h=0.[d]. m.d(=d.=ds.h.=hs=0).[d].[h] 10 -5 m.d.=hm,da=ha,[d门,[h] ,,时 15 E-6 1 m:d=d.=d=h=hs+[d][h] o,a,,时 11 2.3多世代联合似然函数及其分布参数和遗传参数的估计 利用P1,F1,P,B:2,B2:和F2:家系世代联合分析的样本似然函数为 )-IIf(f: 其中,01一0,U1一,和w1U,表示样本的后验概率,k,一k3表示B1:2、B2:2和 F2:,分离群体的成分分布个数。利用文献[13]的IECM算法估计其分布参数。 最优遗传模型确定后,根据分布平均数向量日与一阶遗传参数向量G的相互关系:日 AG,由最小二乘原理可得一阶遗传参数的估计为G=(A'A)A6。各群体表型方差由试 验数据直接算得:误差方差由重复内分组随机区组设计方差分析提供:、,和后分别为 多基因方差组分(i。、o和后)和环境方差组分(/n)构成:群体主基因方差品等于群体表 型方差减去该群体纯合主基因型成分分布方差,群体多基因方差等于该群体纯合主基因 型成分分有有羡感去误差方差。主基因遗传率和多基因遗传率的计算参见前面有关文献 [6~12]
表 ! 利用 "!#$!#"%#&!’%#&%’%和 $%’(世代的联合分离分析遗传模型 )*+,-! ).-/-0-123456-,758952017-/:-/*120/*0*,;72758-1:*217=720/"!? $!?"%?&!’%?&%’%*06$%’(@5@=,*12507 模型代号 ABCDE FBCD 成分分布数 GBHFBIJBKDKL CMNLOMPQLMBKN 独立参数个数 GBHMKCDJDKFD JRORIDLDON 一阶遗传参数 SMONLBOCDOTDKDLMFJRORIDLDON 二阶分布参数 UKCBOCDOCMNLOMPQV LMBKJRORIDLDON 约束条件个数 GBHODNLOMFLDC FBKCMLMBKN WVX XY Z [?\?] ^U_ X WVU XY ‘ [?\?a]bYc ^U_ X WV‘ XY ‘ [?\ab]c ^U_ X WVZ XY ‘ [?\abd]c ^U_ X eVX UY XY [?\f?\g?]f?]g?h?ifg?igf?j ^U_ X eVU UY k [?\f?\g?]f?]g?hbifgbigfbjbY ^U_ Z eV‘ UY Z [?\f?\g?a]fb]gbYc ^U_ l eVZ Xl ‘ [?\ab\fb\g?]fb]gbYc ^U_ ‘ eVl UY Z [?\fb]f?\gb]g ^U_ k eVk Xl ‘ [?\ab\fb\gb]fb]gc ^U_ Z m k XY [Xn[k ^UZ?^Ul?^Uk?^U_ d mVX k o [?p\q?p]q ^UZ?^Ul?^Uk?^U_ ‘ r XY XU [Xn[k?\?] ^UZX?^UlU?^UkX?^U_ U rVX XY s [?\?]?p\q?p]q ^UZX?^UlU?^UkX?^U_ l rVU XY t [?\?a]bYc?p\qp]q ^UZX?^UlU?^UkX?^U_ k rV‘ XY t [?\b]?p\q?p]q ^UZX?^UlU?^UkX?^U_ k rVZ XY t [?\bd]?p\q?p]q ^UZX?^UlU?^UkX?^U_ k u UY Xt [Xn[k?\f?\g?]f?]g?h?ifg?igf?j ^UZX?^UlZ?^UkX?^U_ k uVX UY Xl [?\f?\g?]f?]g?h?ifg?igf?j?p\q?p]q ^UZX?^UlZ?^UkX?^U_ s uVU UY XX [?\f?\g?]f?]g?p\q?p]q ^UZX?^UlZ?^UkX?^U_ X‘ uV‘ UY s [?\f?\g?]fb]gbY?p\q?p]q ^UZX?^UlZ?^UkX?^U_ Xl uVZ Xl t [?\ab\fb\g?]fb]gbYc?p\q?p]q ^UZX?^Ul‘?^UkX?^U_ XY uVl UY s [?\fb]f?\gb]g?p\q?p]q ^UZX?^UlZ?^UkX?^U_ Xl uVk Xl t [?\b\fb\gb]fb]g?p\q?p]q ^UZX?^Ul‘?^UkX?^U_ XX %H( 多世代联合似然函数及其分布参数和遗传参数的估计 利用 vX?SX?vU?eX’U?eU’U和 SU’‘家系世代联合分析的样本似然函数为w xyaz{|cb } ~X hbX !a"Xh#$X?^U _c} ~U hbX !a"Uh#$U?^U _c} ~‘ hbX !a"‘h#$‘?^U _c} ~Z hbX % &X ’bX (Z’!a"Zh#$Z’?^U Z’c } ~l hbX % &U ’bX (l’!a"lh#$l’?^U l’c} ~k hbX % &‘ ’bX (k’!a"kh#$k’?^U k’c 其中?)ZhXn )Zh&X?)lhXn )lh&U和 )khXn )kh&‘表示样本的后验概率?&Xn &‘表示 eX’U#eU’U和 SU’‘分离群体的成分分布个数*利用文献pX‘q的 +umA 算法估计其分布参数* 最优遗传模型确定后?根据分布平均数向量 ,与一阶遗传参数向量 -的相互关系w,b .-?由最小二乘原理可得一阶遗传参数的估计为 - /ba.) .cdX .) , /*各群体表型方差 ^ U v由试 验数据直接算得#误差方差由重复内分组随机区组设计方差分析提供#^ U ZX#^ U l0U 和 ^ U kX分别为 多基因方差组分a^ U ZY#^ U lY和 ^ U kYc和环境方差组分a^ U D1Kc构成#群体主基因方差 ^ U IT等于群体表 型方差减去该群体纯合主基因型成分分布方差?群体多基因方差 ^ U JT等于该群体纯合主基因 型成分分布方差减去误差方差*主基因遗传率和多基因遗传率的计算参见前面有关文献 pknXUq* k期 章元明等w数量性状分离分析的精确度及其改善途径 osX 万方数据
792 作物学 报 27卷 当只有一对主基因时,还可利用Bayesian后验概率wu~0,、w1~w,和wol~ 0,对家系主基因型进行归类。 3 应用实例 以油菜HSTC14(P)×宁油7号(Pz)组合6家系世代的初花期数据为例说明家系重复试 验数据的分析方法。在田间试验设计时,将20份亲本材料分成10组,每组2份,重复2次: 将120个B1,2、B,:和F2,家系分成10组,每组12个家系,重复2次。以家系内单株为单位 进行观测记录,考查性状为初花期,以3月1日为1,小区平均数是4株观测值的平均。表2 列出亲本及其杂种后代初花期性状相同家系2重复平均数次数分布。从表2可知,B:2和 B,:2群体不是呈单峰分布,F:群体呈偏态的单峰分布。因此,可认为有主基因控制初花期的 表现。 表2油菜HSTC14(P,)×宁油7号(P:)组合6家系世代初花期分布 Table 2 The frequency distributions of date to flower for six family populations of a rape cross 世代 26. Generation 22 24- 28.30-32343638-40-4244-元 6 6742502.3421 5 4 6 31.805.4842 35.000.388 12 8 3 4 37 33.4535.402 B. 8 25 1433 34 4 1 32.216.7209 F2.3 0 8 345 34.653.5689 为体现利用家系重复试验资料进行混合遗传分析的优点,通过重复内分组随机区组设计 方差分析可提供误差方差的无偏估计,并降低误差方差。方差分析结果见表3。无偏的误差 方差估计值为: G=6.50+7.0+146.8126+212,2032+103.4687+3.2=479,1845=1.3348 10+10+110+110+110+9 359 若分别估计误差方差,如利用亲本和F,群体时为0.5759,而分别利用B1:2、B:2和F2:3群体 时分别为1.3347、1.9291和0.9406。因此,通过方差分析联合估计误差方差的结果更好。从 表3可知,分组间差异不显著,即不进行组间调整。然而,两亲本不同材料间却呈现出显著 差异,这可能是由于两亲本方差分析的误差方差太小所致,若用方差分析提供的误差方差进 行F检验,其显著性将有所改变。 表3 方差分析表 Table 3 The analysis of variance 变异来源 P P: B12 F2, Sources Df SS F SS F df SS F SS F SS F 复Replication 0.10 .90 3.04 6.67 13.54 分组Se 947.501.28153.402.3691110.171.84204.601.57198.112.96 重复×分组 94.40 18.10 99.65 Replication X Set 27.13 16.49 素秒数据00639乱015085品8813以8728飞29 106.50 1.00 110146.81 21220 103.47
当只有一对主基因时!还可利用 "#$%&’#(后验概率 )*+, - )*+.,/)0+, - )0+.1 和 )2+, - )2+.3对家系主基因型进行归类4 5 应用实例 以油菜 6789,*:;,号:;1 *1j0? 1j3*1, ;1 0 * 2 0 3,jg? 0j*g*1 B, k , 30j?? ?j3ggk ",A1 ,1 g 3 3 * * 1> 3> 1, , 33j*030j*?10 "1A1 , g 10 ,* 33 3* * , 31j1, 2j>1?k B1A3 , 1 g 3* 0g k g 3*j20 3j02gk 为体现利用家系重复试验资料进行混合遗传分析的优点!通过重复内分组随机区组设计 方差分析可提供误差方差的无偏估计!并降低误差方差4方差分析结果见表 34无偏的误差 方差估计值为l m1 no 2j0?p >j?p ,*2jg,12p 1,1j1?31p ,?3j*2g>p 3j1 ,?p ,?p ,,?p ,,?p ,,?p k o *>kj,g*0 30k o ,j33*g 若分别估计误差方差!如利用亲本和 B,群体时为 ?j0>0k!而分别利用 ",A1/"1A1和 B1A3群体 时分别为 ,j33*>/,jk1k,和 ?jk*?24因此!通过方差分析联合估计误差方差的结果更好4从 表 3可知!分组间差异不显著!即不进行组间调整4然而!两亲本不同材料间却呈现出显著 差异!这可能是由于两亲本方差分析的误差方差太小所致!若用方差分析提供的误差方差进 行 B检验!其显著性将有所改变4 表 5 方差分析表 FMNOP5 FQPMVMOX[Z[]RqMSZMVWP 变异来源 7ercs%& ;, tu 77 B ;1 77 B ",A1 vu 77 B "1A1 77 B B1A3 77 B 重复 w%xy’s#d’e( , ?j,? *jk? , 3j?* 2j2> ,3j0* 分组 7%d k *>j0? ,j1g ,03j*? 1j32 k ,,,?j,> ,jg* 1?*j2? ,j0> ,kgj,, 1jk2 重复=分组 w%xy’s#d’e(=7%d k *j*? ,gj,? k kj20 1>j,3 ,2j*k 家系 B#z’y$ ,? *,j0? 2j3g 00j?? >jg2 ,,? >3,0j23*kjg3 ,3k*jkg 2j0> 20,j1g 2j1k 误差 {ccec ,? 2j0? >j?? ,,? ,*2jg, 1,1j1? ,?3j*> >k1 作 物 学 报 1>卷 万方数据
6期 章元明等:数量性状分离分析的精确度及其改善途径 793 总Total 39100.00 238.40 2398585.30 1845.58 982.90 为得出用家系重复试验资料进行主基因十多基因混合遗传分析可有较高的精度,这里用 2种方案:(1)用相同家系重复试验平均数资料进行混合遗传分析:(2)分别用本试验的重复 1和2进行混合遗传分析,分别用1、Ⅱ、Ⅱ表示。用IECM算法估计样本似然函数中的分布 参数、极大对数似然函数值和A1C值]。3种情况的AIC值见表4。 表4 各遗传模型AIC值 Table 4 The Akaike's information criterion (AIC)values under various genetic models 型 模因 Mode Model A-1 4515.12 4509.72 4520.64 2049.50 2102.722071.81 5953.33 3480.13 5958.81 D-1 1942.81 2021.25 1952.32 A-3 3555.3 3558.78 D-2 205 2100.9 2075.5 A-4 3484.8 5947.81 3491.72 D-3 2072.1 2133.0 2066.8 2119.05 2152.23 2129.81 D-1 2093.46 2021.59 2114.00 B-2 2271.01 2294.01 2288.57 E 2061.62 2114.72 2081.42 b? 9316.95 2340.55 239602 20H04.78 2065.67 203665 2314.25 2338.55 2324.0 E.2 2133.66 2177.31 2156.98 2365 234 E-3 212 2173.31 2152.98 2338.34 2363.13 2344.64 E- 2176.68 2218.65 2186.66 2045.52 2098.74 2067.83 E-5 2129.66 2173.31 2152.98 2125.69 2169.33 2149.02 E-6 2130.29 2174.63 2153.02 表5 重复试验平均数资料的D-1模型分布参数极大似然估计值 Table 5 The estimates of distribution parameters of D-I model for using the averaged data 参数 估计值 参数 估计值 参数 估计值 参数 估计值 eter Estim Para Estim Parameter Estima Esti 24.89 62 37.573 34.341 51 30.688 63 34.5793 1.9060 31.3060 52 33.5917 1.9060 36.6073 34.5841 1。 2.6385 表6 重复试验平均数资料的遗传参数估计 Table 6 The estimates of genetic parameters for using the averaged data 一阶参数 估计值 2阶参数 估计值Estimate Ist order Estimate 2nd order B1:2 Fz:3 parameter parameter 34.2581 35.4025 6.7209 3.5689 69 32.7640 4.8149 1.6629 1.303 0.571 0.5712 1.6348 1.3348 1.3348 1.334 [h] 5.5271 h2.(% 92.55 71.64 46.59 h/d(%) -479.28 h(%) 3.68 8.50 16.00 根据寿方毖籟相同模型1~Ⅱ间的AIC值,可发现除极个别情况外用家系平均数资料 (I)得到的AIC值比只用个别重复资料(I或Ⅲ)的AIC值低:分别在1~Ⅱ资料形式下
总 !"#$% &’ ())*)) +&,*-) +&’ ,.,.*&) (,-.*., ’,+*’) 为得出用家系重复试验资料进行主基因/多基因混合遗传分析可有较高的精度0这里用 +种方案12(3用相同家系重复试验平均数资料进行混合遗传分析42+3分别用本试验的重复 (和 +进行混合遗传分析0分别用56768表示9用 :;::\( -.(.*(+ -.)’*]+ -.+)*^- _ +)-’*.) +()+*]+ +)](*,( >\+ .’.&*&& &-,)*(& .’.,*,( _\( (’-+*,( +)+(*+. (’.+*&+ >\& &...*&, &..&*&] &..,*], _\+ +).)*’- +())*^) +)].*.& >\- &-,-*,. .’-]*,( &-’(*]+ _\& +)]+*() +(&&*)& +)^^*,, ‘\( +((’*). +(.+*+& +(+’*,( _\- +)’&*-^ +)+(*.’ +((-*)) ‘\+ ++](*)( ++’-*)( ++,,*.] ; +)^(*^+ +((-*]+ +),(*-+ ‘\& +&(^*+. +&-)*.. +&+^*)+ ;\( +))-*], +)^.*^] +)&^*^. ‘\- +&(-*+. +&&,*.. +&+-*)+ ;\+ +(&&*^^ +(]]*&( +(.^*’, ‘\. +&-)*&- +&^.*(& +&-^*^- ;\& +(+’*^^ +(]&*&( +(.+*’, ‘\^ +&&,*&- +&^&*(& +&--*^- ;\- +(]^*^, ++(,*^. +(,^*^^ :::<值低4分别在5z8资料形式下0 ^期 章元明等1数量性状分离分析的精确度及其改善途径 ]’& 万方数据
794 作物学报 27卷 D-1模型的AIC值均是最低的,但是只用重复1资料时D-1与D-4模型的AIC值几乎相等, 这对模型选择是不利的。这说明用相同家系平均数资料的结果比只用个别重复资料的结果为 优。从适合性检验的结果来看也有该特点。因此,当使用重复内分组随机区组设计时用家系 平均数资料进行混合遗传分析结果要好些。此外,通过该设计方差分析提供的无偏误差方差 1.3348均比1~Ⅱ下D-1模型获得的误差方差极大似然估计值1.9060、2.6883和1.6849要 低,这会减少多基因方差和多基因遗传率被低估的可能性。由利用重复试验平均数资料获得 的分布参数估计值(表5)可估计相应的遗传参数(表6)。 4讨论 混合遗传模型分布参数的估计一般采EM用算法[6~]。但是,当利用家系群体时是不现 实的。文献[13]提出的IECM算法有效地解决了这一问题。从表4可知,用相同家系平均数 资料的AIC值比用单一重复资料的低,说明用平均数资料更好。由于亲本和F,群体的加入 联合分析,有效地定位了一阶遗传参数估计值的大小,并认为杂种后代平均数偏向低值亲本 即开花提前是由于主基因的显性效应为负所致。 利用家系重复试验是减少试验误差提高试验精度的重要手段。从方差分析理论知,通 过家系重复试验方差分析提供了误差方差的无偏估计。该误差方差估计值1.3348比通过混 合遗传分析得到的误差方差估计值小,这就减少低估多基因方差和多基因遗传率的概率,提 高了二阶遗传参数的估计精度,使遗传模型及其遗传参数估计值间不致出现大的矛盾。 参考文献 1 Elkind Y 8.A Cahaner.Theor Appl Genet.1986.72:377~383 2 Elkind Y8.A Cahaner.Heredity.990.64:205~13 3莫惠栋.作物学报,1993,19(1):1~6 4莫惠栋.作物学报.1993,19(3):193~200 5姜长鉴,莫惠栋.作物学报,1995,21(6):641一648 6盖钧锐,章元明,王建康著.2001.植物数量性状遗传分析体系。北京,科学出版杜 7王建康盖钧.遗传学报.1997,24(5):432~440 8盖钧锁,王建康.作物学报,1998,24(4):402一409 9 Gai IY &IK Wang.Theor Apel Genet.1998.97(7):1162~1168 10王建康.盖钧.作物学报,1998,24(6):651一659 11章元明,盖钧镀.遗传学报,2000,27(7):634~640 12盖钓,章元明,王建康.作物学报,2000,26(4):385一391 13章元明,盖钧镫.作物学报,2000,26(6):699一706 14吴天侠,盖钧镀,马育华.作物学报,1995,21(3):300一307 万方数据
!"#模型的 $%&值均是最低的’但是只用重复 #资料时 !"#与 !"(模型的 $%&值几乎相等’ 这对模型选择是不利的)这说明用相同家系平均数资料的结果比只用个别重复资料的结果为 优)从适合性检验的结果来看也有该特点)因此’当使用重复内分组随机区组设计时用家系 平均数资料进行混合遗传分析结果要好些)此外’通过该设计方差分析提供的无偏误差方差 #*++(,均比-./下 !"#模型获得的误差方差极大似然估计值 #*012134*2,,+和 #*2,(0要 低’这会减少多基因方差和多基因遗传率被低估的可能性)由利用重复试验平均数资料获得 的分布参数估计值5表 67可估计相应的遗传参数5表 27) 8 讨论 混合遗传模型分布参数的估计一般采 9: 用算法;2.#1?@ABC D$ &EFEAGH*IJKLMNOOPQKRKS’#0,2’T4U+TT.+,+ 4 9>?@ABC D$ &EFEAGH*VKMKWXSY’#001’2(U416.4#+ + 莫惠栋*作物学报’#00+’#05#7U#.2 ( 莫惠栋*作物学报’#00+’#05+7U#0+.411 6 姜长鉴’莫惠栋*作物学报’#006’4#527U2(#.2(, 2 盖钧镒’章元明’王建康著*411#*植物数量性状遗传分析体系*北京U科学出版社 T 王建康’盖钧镒*遗传学报’#00T’4(567U(+4.((1 , 盖钧镒’王建康*作物学报’#00,’4(5(7U(14.(10 0 ZE@[C D[\ ]EA^*IJKLMNOOPQKRKS’#00,’0T5T7U##24.##2, #1 王建康’盖钧镒*作物学报’#00,’4(527U26#.260 ## 章元明’盖钧镒*遗传学报’4111’4T5T7U2+(.2(1 #4 盖钧镒’章元明’王建康*作物学报’4111’425(7U+,6.+0# #+ 章元明’盖钧镒*作物学报’4111’42527U200.T12 #( 吴天侠’盖钧镒’马育华*作物学报’#006’4#5+7U+11.+1T T0( 作 物 学 报 4T卷 万方数据
数量性状分离分析的精确度及其改普途径 日万方数据文款线状 作者: 作者单位 扣(江苏省农科院经作所,) 刊名: 作物学报ST1CP可 英文刊名: ACTA AGRONOMICA SINICA 年,卷(期) 2001.27(6) 引用次数: 9次 击者文献14) L.Elkind Y.A Cahaner查看详情1986 2.Elkind Y.A Cahaner查看详情1990 3.莫忠栋质量-数量性状的遗传分析【.遗传组成和主基因基因型鉴别[期刊论文]~作物学报 1993(1) 4.莫患质量-数量怀状的遗传分析L.世代平均数和遗传方差[期刊论文]-作物学报1993(3) 5.姜长鉴.莫惠栋质量-数量性状的遗传分析Ⅳ.极大似然法的应用[期刊论文]-作物学报1995(⑥) 6,盖钧位.章元明.王建康植物数量性状遗传分析体系2001 7.王建康。盖钧筐利用杂种F2世代鉴定数量性状主基因-多基因混合遗传模型并估计其遗传效应[明 刊论文]-遗传学报1997(6) 8盖钧镒。王建康利用回交或2:3家系世代鉴定数量性状主基因一多基因混合遗传模型[期刊论文 ]-作物学报1998(④ 9.GaiY.JK Wang查看详情1998() 10.王建康.盖钧数量性状主-多基因混合遗传的P1、P2、F1、F2和F2:3联合分析方法[期刊论文 ]-作物学报1998(6) 11.章元明.盖钧镗利用D或RIL群体检测QTL体系并估计其遗传效应[期刊论文]-遗传学报2000(7) 12.盖钓丝.章元明.王建康QT混合遗传模型扩展至2对主基因+多恭因时的多世代联合分析[期刊论 文]-作物学报2000() 13.章元明.盖钧螢数量性状分离分析中分布参数估计的IEC算法[期刊论文]-作物学报2000(6) 14.吴天侠盖钧镒.马育华多品种(系)试验中简化广义格子设计的探讨[期刊论文]-作物学报 1995(3) 相似文献(1条) 1.期刊论文章元明。盖钧镒戚存扣植物数量性状遗传体系检测中回交或自交家系重复试验数据的 分析方法-遗传2001,23(④
数量性状分离分析的精确度及其改善途径 作者: 章元明, 盖钧镒, 戚存扣 作者单位: 章元明,盖钧镒(南京农业大学大豆研究所农业部国家大豆改良中心,), 戚存 扣(江苏省农科院经作所,) 刊名: 作物学报 英文刊名: ACTA AGRONOMICA SINICA 年,卷(期): 2001,27(6) 引用次数: 9次 参考文献(14条) 1.Elkind Y.A Cahaner 查看详情 1986 2.Elkind Y.A Cahaner 查看详情 1990 3.莫惠栋 质量-数量性状的遗传分析 Ⅰ.遗传组成和主基因基因型鉴别[期刊论文]-作物学报 1993(1) 4.莫惠栋 质量-数量怀状的遗传分析 Ⅱ.世代平均数和遗传方差[期刊论文]-作物学报 1993(3) 5.姜长鉴.莫惠栋 质量-数量性状的遗传分析 Ⅳ.极大似然法的应用[期刊论文]-作物学报 1995(6) 6.盖钧镒.章元明.王建康 植物数量性状遗传分析体系 2001 7.王建康.盖钧镒 利用杂种F2世代鉴定数量性状主基因-多基因混合遗传模型并估计其遗传效应[期 刊论文]-遗传学报 1997(5) 8.盖钧镒.王建康 利用回交或F2:3家系世代鉴定数量性状主基因—多基因混合遗传模型[期刊论文 ]-作物学报 1998(4) 9.Gai JY.JK Wang 查看详情 1998(7) 10.王建康.盖钧镒 数量性状主-多基因混合遗传的P1、P2、F1、F2和F2:3联合分析方法[期刊论文 ]-作物学报 1998(6) 11.章元明.盖钧镒 利用DH或RIL群体检测QTL体系并估计其遗传效应[期刊论文]-遗传学报 2000(7) 12.盖钧镒.章元明.王建康 QT混合遗传模型扩展至2对主基因+多基因时的多世代联合分析[期刊论 文]-作物学报 2000(4) 13.章元明.盖钧镒 数量性状分离分析中分布参数估计的IECM算法[期刊论文]-作物学报 2000(6) 14.吴天侠.盖钧镒.马育华 多品种(系)试验中简化广义格子设计的探讨[期刊论文]-作物学报 1995(3) 相似文献(1条) 1.期刊论文 章元明.盖钧镒.戚存扣 植物数量性状遗传体系检测中回交或自交家系重复试验数据的 分析方法 -遗传2001,23(4) 为提高主基因+多基因混合遗传分析的精度,降低试验误差,采用重复内分组随机区组设计,对低遗传力性状的B1:2和B2:2或 F2:3家系平均数资料进行遗传分析.通过AIC准则和适合性检验比较无主基因(A-0)、1对主基因(A)、2对主基因(B)、多基因(C)、 1对主基因+多基因(D)和2对主基因+多基因(E)模型以鉴定其遗传模式.采用IECM算法估计混合模型参数.通过油菜HSTC14×宁油7号 初花期F2:3家系平均数资料阐明该方法
引证文就(10条) 1.黄胜东苏自强。杨娟.谷福林梗型短日不有新种质5021S不育性的遗传研究[期刊论文]-江苏农业 科学2008(6) 2.曹婷.谭永军.陈耀锋.李春莲.任慧莉小麦新种质体克2号对条中31号抗性的遗传分析[期刊论文] -麦类作物学报2008(040 3.张倩辉.张晓科.刘伟华李立会,张锦鹏.武军。高爱农.李秀全.杨欣明小麦有效分檗数的遗传分 析[期刊论文]-麦类作物学报2008(04) 4.郑义.陆维忠陈建民.马鸿翅大麦赤霉病新抗源盐96157抗性的遗传分析[期刊论文]~麦类作物学 报2008(02) 5.任丽娟.张旭周森平.陈庆标马鸿翔小麦梭条花叶病抗性遗传分析[期刊论文]-麦类作物学报 2008(01) 6.张培通。朱协飞.郭旺珍.俞忠.张天真高产棉花品种泗棉3号产量及其产量构成因素的遗传分机 [期刊论文]-作物学报2006(07) 7.侯北伟。实秉德、章元明。李生强杨骨彬,刘福霞。杜金昆.孙其信小麦雌性育性的主基因+多基因 混合遗传分析[期刊论文]-遗传2006(12) 8.丁燕红小豆种质资源SSR遗传多样性及其子粒色泽性状遗传参数的研究[学位论文]硕士2006 9方先文姜东戴廷波荆奇。曹卫星小麦籽粒总淀粉及支链淀粉含量的遗传分析[期刊论文]~作物 学报2003(06) 10方先文,姜东.戴廷波荆奇。曹卫星小麦籽粒蛋白质含量的遗传分析[期刊论文]-江苏农业学报 2003(01) 本文链接:http:/.g.ranfangdata.com.cn/Periodical_zuowxb200106016.asp 下载时间:2010年3月5日
引证文献(10条) 1.黄胜东.苏自强.杨娟.谷福林 粳型短日不育新种质5021S不育性的遗传研究[期刊论文]-江苏农业 科学 2008(6) 2.曹婷.谭永军.陈耀锋.李春莲.任慧莉 小麦新种质体克2号对条中31号抗性的遗传分析[期刊论文] -麦类作物学报 2008(04) 3.张倩辉.张晓科.刘伟华.李立会.张锦鹏.武军.高爱农.李秀全.杨欣明 小麦有效分蘖数的遗传分 析[期刊论文]-麦类作物学报 2008(04) 4.郑义.陆维忠.陈建民.马鸿翔 大麦赤霉病新抗源盐96157抗性的遗传分析[期刊论文]-麦类作物学 报 2008(02) 5.任丽娟.张旭.周淼平.陈庆标.马鸿翔 小麦梭条花叶病抗性遗传分析[期刊论文]-麦类作物学报 2008(01) 6.张培通.朱协飞.郭旺珍.俞敬忠.张天真 高产棉花品种泗棉3号产量及其产量构成因素的遗传分析 [期刊论文]-作物学报 2006(07) 7.侯北伟.窦秉德.章元明.李生强.杨晋彬.刘福霞.杜金昆.孙其信 小麦雌性育性的主基因+多基因 混合遗传分析[期刊论文]-遗传 2006(12) 8.丁燕红 小豆种质资源SSR遗传多样性及其子粒色泽性状遗传参数的研究[学位论文]硕士 2006 9.方先文.姜东.戴廷波.荆奇.曹卫星 小麦籽粒总淀粉及支链淀粉含量的遗传分析[期刊论文]-作物 学报 2003(06) 10.方先文.姜东.戴廷波.荆奇.曹卫星 小麦籽粒蛋白质含量的遗传分析[期刊论文]-江苏农业学报 2003(01) 本文链接:http://d.g.wanfangdata.com.cn/Periodical_zuowxb200106016.aspx 下载时间:2010年3月5日