江苏农业研究B30218 江苏农业研究 旧万数据瓷源系统 JANG SU AGRICULTU RAL RESEARCH 字出期型 1999年第20卷第2期Vol.20No.21999 数量性状基因定位的回归方法 Ⅱ.两侧标记回归分析 莫惠栋 REGRESSION METHODS FOR LOCATING QUANTITATIVE TRAIT LOCUS(QTL) II.FLAN K ING M ARKER REG RESSION AN ALYSIS Mo Huidong (Lab of Quantitative Genetics.Agric.Coll..Yangzhou Univ..Yangzhou 225009) 1一般基础 两侧标记回归是应用回归方法,搜索在染色体上的任何两个标记之间是否存在被研究的QTL及其最可 能的位置和效应。它要解决的基本问题是:1)两个标记之间如果存在一个QTL,该QTL的位置和效应与个 体或品系的表型值有什么遗传关系?②)如何发现此种关系对于前一问题,关键是要导出三点重组率。设有 AQB3个位点,AB的重组率为AB,AQ、QB的重组率分别为和电,如下图。则A和B未发生交换的概率1 AB)等于A和Q、Q和B均未发生交换的概率1T)1电)加上A和Q、Q和B均发生交换的概率电),即: 1B=)1)+电 移项得: xAB=a+电2aB 1) 式)是三点重组率数量关系的基本公式,它的假定是区间AQ和QB的交换无干扰,即彼此独立。如果完全 干扰,即AQ区间发生交换,QB区间就不能发生交换,反之亦然,则式)变为: IABh+电 在缺乏完全干扰的确实证据时,一般都使用式①)描述QTL在AB间的任一位置上的重组率。 f正7作%kmhn抽取20be6ekke0810/mymy9/my9902/90218hm(第1/9页)209H231233840
江苏农业研究/990218 江苏农业研究 JIANG SU AGRICULTURAL RESEARCH 1999年 第20卷 第2期 Vol.20 No.2 1999 数量性状基因定位的回归方法 Ⅱ. 两侧标记回归分析 莫惠栋 REGRESSION METHODS FOR LOCATING QUANTITATIVE TRAIT LOCUS (QTL) Ⅱ. FLANKING MARKER REGRESSION ANALYSIS Mo Huidong (Lab of Quantitative Genetics, Agric. Coll., Yangzhou Univ., Yangzhou 225009) 1 一般基础 两侧标记回归是应用回归方法,搜索在染色体上的任何两个标记之间是否存在被研究的QTL及其最可 能的位置和效应。它要解决的基本问题是: (1) 两个标记之间如果存在一个QTL,该QTL的位置和效应与个 体或品系的表型值有什么遗传关系? (2) 如何发现此种关系?对于前一问题,关键是要导出三点重组率。设有 AQB 3个位点,AB的重组率为rAB, AQ、 QB的重组率分别为rA和rB,如下图。则A和B未发生交换的概率(1- rAB)等于A和Q、Q和B均未发生交换的概率(1-rA)(1-rB)加上A和Q、 Q和B均发生交换的概率(rArB),即: 1-rAB=(1-rA)(1-rB)+rArB 移项得: r•AB=rA+rB-2rArB (1) 式(1)是三点重组率数量关系的基本公式,它的假定是区间AQ和QB的交换无干扰,即彼此独立。如果完全 干扰, 即AQ区间发生交换,QB区间就不能发生交换,反之亦然,则式(1)变为: r AB=rA+rB (2) 在缺乏完全干扰的确实证据时,一般都使用式(1)描述QTL在AB间的任一位置上的重组率。 file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9902/990218.htm(第 1/9 页)2009-12-31 23:58:40
江苏农业研究218 801.gif(1479 bytes) 对于后一问题,基本统计方法有两种:最小平方法和极大似然法。前者是在两个标记之间寻找回归显 著而失拟平方和又最小的位置,后者是在两个标记之间寻找混合正态分布的似然函数极大且L0D或L为显 著的位置。两种方法在结果上并无实质性差异,但最小平方法在计算机上的实现远比极大似然法简易,故 本文只报道前者。 2DH群体的两侧标记回归 2.1遗传原理 设某段染色体的两个标记为A1A2和BB2脚标1和2分别表示来自P1和P2的DNA,下同),则DH群体共有4 种标记基因型:AABB1、AAB2B2、A2ABB1和A2A2B2B2。每种标记基因型又都可能有两种QTL基因型 QQ1~Q2Q2。故在考虑两侧标记及其中间的一个可能QTL时,DH群体共有8种纯合基因型,其遗传组成 和基因型值见表1。 表1DH群体两侧标记的遗传组成和基因型的遗传值 and its fanking m arkers in doub kd hapbid H)popu ltion DH群体基因型 频率 基因型遗传值 G enotype in DH Frequency A1AQ1Q1B1BI AAQ2Q2BB1 qagif (590 bytes) m+a A1A1Q191B2B2 AA Q2Q2B2B2 qb-gif (508 bytes) A2AQQBB ab-gif (427 bytes) m+a A2A2Q1QB2B. sgif (479 bytes) A2A2R202B2B 表1中各种基因型的频率由常法确定,例如AAQQBB1是AQ和QB均未发生交换,故其频率为() A1QRB1B,是AQ0B均发生交换,故其频率为电…等。设e可二 利2之依次为4种标记基因型的平均数,则由表1可得: /作kh抽取2000 ebre ok00810)/mm99/v9902/g0218,hm(第2/9页)2009-23别235840
江苏农业研究/990218 1801.gif (1479 bytes) 对于后一问题,基本统计方法有两种:最小平方法和极大似然法。前者是在两个标记之间寻找回归显 著而失拟平方和又最小的位置,后者是在两个标记之间寻找混合正态分布的似然函数极大且LOD或LR为显 著的位置。两种方法在结果上并无实质性差异,但最小平方法在计算机上的实现远比极大似然法简易,故 本文只报道前者。 2 DH群体的两侧标记回归 2.1 遗传原理 设某段染色体的两个标记为A1A2和B1B2(脚标1和2分别表示来自P1和P2的DNA, 下同), 则DH群体共有4 种标记基因型: A1A1B1B1、 A1A1B2B2、 A2A2B1B1和A2A2B2B2。每种标记基因型又都可能有两种QTL基因型 Q1Q1、 Q2Q2。故在考虑两侧标记及其中间的一个可能QTL时,DH群体共有8种纯合基因型,其遗传组成 和基因型值见表1。 表1 DH群体两侧标记的遗传组成和基因型的遗传值 Table 1 Genetic constitution and genotypic value of a QTL and its flanking markers in doubled haploid (DH) population DH群体基因型 Genotype in DH 频 率 Frequency 基因型遗传值 Genotypic ralue A1A1Q1Q1B1B1 A1A1Q2Q2B1B1 A1A1Q1Q1B2B2 A1A1Q2Q2B2B2 A2A2Q1Q1B1B1 A2A2Q2Q2B1B1 A2A2Q1Q1B2B2 A2A2Q2Q2B2B2 qa-.gif (590 bytes) qb-.gif (508 bytes) ab-.gif (427 bytes) as-.gif (479 bytes) m+a m-a m+a m-a m+a m-a m+a m-a 表1中各种基因型的频率由常法确定,例如A1A1Q1Q1B1B1是AQ和QB均未发生交换,故其频率为(1-rA) (1-rB); A1A1Q2Q2B1B1是AQ和QB均发生交换,故其频率为rArB; ……等。设wa-.gif (241 bytes) 、 wc-.gif (257 bytes) 、 ab11. gif (256 bytes) 和ab22.gif (253 bytes) 依次为4种标记基因型的平均数,则由表1可得: file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9902/990218.htm(第 2/9 页)2009-12-31 23:58:40
江苏农业研究90218 -.gif(4757 bytes) 式③)说明,对DH群体的任一个体或株系,两相邻标记A、B间的任一位置,若令: gif(4693 bytes) 4 就可以进行个体(株系)表型值依x的常规回归分析。回归d非1,失拟离回归)非n-2,n为供试H的个体或 株系数。如果每 个体或株系有次重复,则还有一项重复间误差,具dFn1)。当失拟平方和最小而回明 又显著时,推断该位置上存在1个QTL,其回归系数b即加性效应的估值:当失拟显著时,推断除该位置外 还存在其他位置的QTL。 2.2 一个实例 表2为一个=25的大麦DH群体在第5染色体上的3个分子标记A、B、c),其遗传距离为: 1802.gif (1179 bytes) 19.28cM51.08cM 观察性状Z为4个重复的平均产量,重复间误差SS-=215.20,具dF25×3=75(自:K earsey M Jand Pooni HS.The geneticalanalysisofquan titative traits C hapm an&HaL1996.l38)。表2中的1和2分别表示该标记的DNA 来自亲本P1和P2,即1代表11,2代表22。设以2M为间距进行回归搜索,结果是:位置1距A2cM)回归的 F=1.21,不显著(他见表3):但随着Q位置的右移,F值逐渐增大,在位置11距B4cdM)~21距B24cM),回归 的F都>F001-7.88:在位置17(距B16cM,距A19.28+16-35.28cM)处,SS为最小。以下举出位置1、9和17的 分析以为说明 803.gif(1006bytes) 位置1为: 根据=1e2W)/2可得对应于19.28cM的AB=0.1600,对应于2cM的r=0.0196cM,对应于17.28cM的 =0.1461。因此由式4④)得: X1=1-0.0196-0.1461)/1-0.16)=0.993 X12=(0.0196+0.1461)/0.16=0.791 /l作kan_hm抽取_200e0ekkC200810/知7知y99/my9302218h(第3/9页)209-2-3123580
江苏农业研究/990218 q-.gif (4757 bytes) (3) 式(3)说明,对DH群体的任一个体或株系,两相邻标记A、 B间的任一位置,若令: l-.gif (4693 bytes) (4) 就可以进行个体(株系)表型值Z依X的常规回归分析。回归df=1,失拟(离回归)df=n-2,n为供试DH的个体或 株系数。如果每一个体或株系有r次重复,则还有一项重复间误差,具df=n(r-1)。当失拟平方和最小而回归 又显著时,推断该位置上存在1个QTL,其回归系数b即加性效应a的估值;当失拟显著时,推断除该位置外 还存在其他位置的QTL。 2.2 一个实例 表2为一个n=25的大麦DH群体在第5染色体上的3个分子标记(A、 B、 C),其遗传距离为: 1802.gif (1179 bytes) 19.28 cM51.08 cM 观察性状Z为4个重复的平均产量,重复间误差SS=215.20,具df=25×3=75(引自:Kearsey M J and Pooni H S. The genetical analysis of quantitative traits. Chapman & Hall, 1996. 138)。表2中的1和2分别表示该标记的DNA 来自亲本P1和P2,即1代表11,2代表22。设以2cM为间距进行回归搜索,结果是:位置1(距A 2 cM)回归的 F=1.21, 不显著(也见表3);但随着Q位置的右移,F值逐渐增大,在位置11 (距B 4 cM)~21 (距B 24 cM), 回归 的F都>F0.01=7.88; 在位置17 (距B 16 cM, 距A 19.28+16=35.28 cM) 处,SSL为最小。以下举出位置1、 9和17的 分析以为说明。 位置1为: 1803.gif (1006 bytes) 根据r=(1-e-2M)/2可得对应于19.28 cM的rAB=0.1600,对应于2 cM的rA=0.0196 cM, 对应于17.28 cM的 rB=0.1461。因此由式(4)得: X11=(1-0.0196-0.1461)/(1-0.16)=0.993 X12=(-0.0196+0.1461)/0.16=0.791 file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9902/990218.htm(第 3/9 页)2009-12-31 23:58:40
江苏农业研究990218 表2大麦25个DH系在第5染色体上的标记和小区平均产量亿) Table2 M arkerson chrom osom e5 and average yiel perpbtof5 lines in aD H population ofbarley 遗传标记和距离cM 搜索位置仅) 系号 G enetic m arkerand distance/cM 产量 Position searched (X) N o.of Y iel 9 B 17 lines A 亿) 0 距A2cM 距A18cM 距B16cM 19.28 70.36 2 cM from A 18 cM fiom A 16 cM fiom B 1 1 2 39.87 0.791 -0.866 -0.898 1 2 2 31.95 0.791 0.866 0.898 1 43.90 0.993 0.995 0.898 2221 2 37.96 -0.993 -0.995 0.898 41.14 -0.993 0.995 0.898 39.17 0.791 0.866 0.360 234567890123456789022345 2 41.99 0.993 0.995 0.360 22111222122122211222 1 1 43.59 0.993 0.995 0.898 2 33.46 -0.993 0.995 0.898 2221221 2 39.15 0.993 -0.995 0.898 1 33.34 -0.993 0.995 0.360 1 43.27 0.993 0.995 0.898 1 32.67 -0.993 0.995 0.360 2 32.22 0.993 0.995 0.898 1 42.76 0.993 0.995 0.898 1 1 51.21 -0.791 0.866 0.898 221 2 33.61 -0.993 0.995 0.898 2 42.12 -0.993 0.995 0.898 2 31.28 0.993 0.995 0.360 2 41.90 0.993 0.995 0.360 222 2 41.20 0.993 0.995 0.898 2 44.48 0.993 0.995 0.898 1 41.45 0.993 0.995 0.360 1 1 42.54 0.993 0.995 0.360 2 2 2 31.98 0.993 0.995 0.898 SS 649.48 22.75 21.99 13.16 SPXZ 27.18 57.88 48.43 X21=(0.0196-0.1461)/0.16=0.791 X221+0.0196+0.1461)/1-0.16)=-0.993 1804.gif(1152 bytes) 位置9为: 对应于18cM的r=0.1512,1.28cM的B=0.0126。因此, X1u=1-0.1512-0.0126)/1-0.16)=0.995 X12(0.1512+0.0126)/0.16=0.866 X21=(0.1512-0.0126)/0.16=0.866 X2(1+0.1512+0.0126)/1-0.16)=-0.995 f止/作%kan hmm抽取2000 bepore/kk200810)/nyy /my99/my9902/990218.hm (第4/9页)2009-12-31235840
江苏农业研究/990218 表2 大麦25个DH系在第5染色体上的标记和小区平均产量(Z) Table 2 Markers on chromosome 5 and average yield per plot of 5 lines in a DH population of barley 系号 No. of lines 遗传标记和距离/cM Genetic marker and distance /cM 产量 Yield (Z) 搜索位置(X) Position searched (X) A 0 B 19.28 C 70.36 1 距A 2 cM 2 cM from A 9 距A 18 cM 18 cM from A 17 距B 16 cM 16 cM from B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 1 1 2 2 1 1 1 2 2 2 1 2 2 1 2 2 2 1 1 2 2 2 1 2 2 2 1 2 2 2 1 1 2 2 2 1 2 2 1 1 2 2 1 1 2 2 2 1 2 2 2 1 2 2 1 2 1 2 2 1 1 1 2 1 1 2 2 2 2 2 2 1 2 2 39.87 31.95 43.90 37.96 41.14 39.17 41.99 43.59 33.46 39.15 33.34 43.27 32.67 32.22 42.76 51.21 33.61 42.12 31.28 41.90 41.20 44.48 41.45 42.54 31.98 0.791 0.791 0.993 -0.993 -0.993 0.791 0.993 0.993 -0.993 -0.993 -0.993 0.993 -0.993 -0.993 0.993 -0.791 -0.993 -0.993 0.993 0.993 -0.993 -0.993 -0.993 0.993 -0.993 -0.866 -0.866 0.995 -0.995 -0.995 -0.866 0.995 0.995 -0.995 -0.995 -0.995 0.995 -0.995 -0.995 0.995 0.866 -0.995 -0.995 0.995 0.995 -0.995 -0.995 -0.995 0.995 -0.995 -0.898 -0.898 0.898 -0.898 -0.898 -0.360 0.360 0.898 -0.898 -0.898 -0.360 0.898 -0.360 -0.898 0.898 0.898 -0.898 -0.898 0.360 0.360 -0.898 -0.898 -0.360 0.360 -0.898 SS SPXZ 649.48 22.75 27.18 21.99 57.88 13.16 48.43 X21=(0.0196-0.1461)/0.16=-0.791 X22=(-1+0.0196+0.1461)/(1-0.16)=-0.993 位置9为: 1804.gif (1152 bytes) 对应于18 cM的rA=0.1512, 1.28 cM的rB=0.0126。因此, X11=(1-0.1512-0.0126)/(1-0.16)=0.995 X12=(-0.1512+0.0126)/0.16=-0.866 X21=(0.1512-0.0126)/0.16=0.866 X22=(-1+0.1512+0.0126)/(1-0.16)=-0.995 file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9902/990218.htm(第 4/9 页)2009-12-31 23:58:40
江苏农业厨究90218 805.gif(1219bytes) 位置17为: 对应于51.08cM的BC=0.3200,16cW的=0.1369,35.08cM的=0.2521,故有 X11=1-0.1369-0.2521)/1-0.32)=0.898 X12(0.1369+0.2521)0.32=0.360 X21=(0.1369-0.2521)/0.32=-0.360 X22(1+0.1369+0.2521)/1-0.32)=-0.898 根据相邻标记的编码,将以上X值记于表2右侧,并算得相应的平方和SS和乘积和SP记于表2底部。对 于位置1的分析,求得S8=27.1822.753248,SS=649.48-32,48=617.0,回归不显著:对于位置9的分析, SSR=57.88221.99=152.35,SS1=649.48-152.35=497.13,回归显著性达P=0.05水平。以上结果详见表3。 表3离A2cM和18cM的两个位点的回归分析 Tabe3 Regression analysis for the2 cM and 18 cM positions fiom m arkerA,respectively 离A2cM位点的分析离A18cM位点的分析 变异来源 Source ofvariation df 2 cM position fiom A 18 cM position fiom A SS MS F SS M S F 回归R egresson132.4832.48 失拟Lack offit23617.0026.83 1.21ns 152.35152.357.05 497.1321.61 总Toal24649.48 649.48 表4离B16cM(离A35.28cM)位点的回归分析 Tabe4 om B (comesponding5.0 16 变异来源 dr ss Ms F 回归Regression1178.23178.238.70* 失拟Lack offit23471.2520.497.14 重复间误差Eor75215.202.87 对于位置19,SSR=48.43213.16=178.23,SS=649.48-178.23=471.25。由于此位置是sS最小(回归F值最大) 点,故加上重复间误差SS一起分析(表4)。结果回归和失拟都极显著。前者表明在第5染色体上有一影响产 量的QTL,其最可能位置为距离标记35.28cM(或距离标记B16cM)、距离标记C35.08cM:后者表明除该 QTL外,还存在其他影响产量的QTL。进一步可得该QTL的回归系数和标准误: gr499by 即该QTL的加性效应估计为3.68±1.25。 3BC群体的两侧标记回归 当考虑1个QTL及其两侧标记A和B时,F1配子也是8种基因型,但纯系亲本P1或P2都只有1种基因型: 正作■抽取2000bc5mkk200810/mymy9/my9902/90218hm(第5/9页)2009-129123840
江苏农业研究/990218 位置17为: 1805.gif (1219 bytes) 对应于51.08 cM的rBC=0.3200, 16 cM的rB=0.1369, 35.08 cM的rC=0.2521, 故有: X11=(1-0.1369-0.2521)/(1-0.32)=0.898 X12=(-0.1369+0.2521)/0.32=0.360 X21=(0.1369-0.2521)/0.32=-0.360 X22=(-1+0.1369+0.2521)/(1-0.32)=-0.898 根据相邻标记的编码,将以上X值记于表2右侧,并算得相应的平方和SS和乘积和SP记于表2底部。对 于位置1的分析,求得SSR=27.182/22.75=32.48, SSL=649.48-32.48=617.00, 回归不显著; 对于位置9的分析, SSR=57.882/21.99=152.35, SSL=649.48-152.35=497.13, 回归显著性达P=0.05水平。以上结果详见表3。 表3 离A 2 cM和18 cM的两个位点的回归分析 Table 3 Regression analysis for the 2 cM and 18 cM positions from marker A, respectively 变异来源 Source of variation df 离A 2 cM位点的分析 2 cM position from A 离A 18 cM位点的分析 18 cM position from A SS MS F SS MS F 回归 Regression 失拟 Lack of fit 1 23 32.48 617.00 32.48 26.83 1.21ns 152.35 497.13 152.35 21.61 7.05* 总 Total 24 649.48 649.48 表4 离B 16 cM(离A 35.28 cM)位点的回归分析 Table 4 Regression analysis for the 16 cM position from B (corresponding to 35.28 cM from A) 变异来源 Source of variation df SS MS F 回归 Regression 失拟 Lack of fit 重复间误差 Error 1 23 75 178.23 471.25 215.20 178.23 20.49 2.87 8.70** 7.14** 对于位置19, SSR=48.432/13.16=178.23, SSL=649.48-178.23=471.25。由于此位置是SSL最小(回归F值最大) 点,故加上重复间误差SS一起分析(表4)。结果回归和失拟都极显著。前者表明在第5染色体上有一影响产 量的QTL,其最可能位置为距离标记A 35.28 cM (或距离标记B 16 cM)、距离标记C 35.08 cM; 后者表明除该 QTL外,还存在其他影响产量的QTL。进一步可得该QTL的回归系数和标准误: w-.gif (1499 bytes) 即该QTL的加性效应估计为3.68±1.25。 3 BC群体的两侧标记回归 当考虑1个QTL及其两侧标记A和B时,F1配子也是8种基因型,但纯系亲本P1或P2都只有1种基因型: file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9902/990218.htm(第 5/9 页)2009-12-31 23:58:40
江苏农业研究30C18 AQB1或A2QB2。所以不论BC,(回交于P1)或BC2回交于P2)群体,也都只有8种基因型(标记基因型4种, QTL基因型两种)。它们与DH的区别在于具有杂合位点AA2、B1B2和QQ2表5列出BC1群体的遗传组成及 基因型遗传值。 由表5,可得到4种标记基因型AABB1、A1ABB2、A1ABB1、AA2BB2的平均数依次为: -gif⑧172 bytes) (5) 因此对于BC,个体两相邻标记A和B间的任一位置,设 .gif (6808 bytes) 表5BC群体两侧标记的遗传组成和基因型的遗传值 F配子 矫率 BC]群体基因型基因型遗传值 Frequency G enotype in BCG enotypic vale FI gam ete 作kah抽取2000 bebre ik00810)/mwm99/n 9902/90218,h(第6/9页)2009-123别235840
江苏农业研究/990218 A1Q1B1或A2Q2B2。所以不论BC1(回交于P1)或BC2(回交于P2)群体,也都只有8种基因型(标记基因型4种, QTL基因型两种)。它们与DH的区别在于具有杂合位点A1A2、 B1B2和Q1Q2。表5列出BC1群体的遗传组成及 基因型遗传值。 由表5,可得到4种标记基因型A1A1B1B1、 A1A1B1B2、 A1A2B1B1、 A1A2B1B2的平均数依次为: m-.gif (8172 bytes) (5) 因此对于BC1个体两相邻标记A和B间的任一位置,设: t-.gif (6808 bytes) (6) 表5 BC1群体两侧标记的遗传组成和基因型的遗传值 Table 5 Genetic constitution and genotypic value of a QTL and its flanking markers in backcross 1 (BC1=P1/P2∥P1) population F1配子 F1 gamete 频 率 Frequency BC1群体基因型 Genotype in BC1 基因型遗传值 Genotypic value file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9902/990218.htm(第 6/9 页)2009-12-31 23:58:40
江苏农业研究90218 AQB1 AAQ19B BI ac-.gif (511 bytes) m+a m+d ad-gif (447 bytes) ae-.gif(438 AAQQB B A2Q2B1 hytes) AA2Q92B B1 A2Q B2 af.gif(492 bytes) AA2Q1QBB2 就可以对个体表型值Z依X和Y的关系,作二元线性回归分析。回归dF2,失拟dFn3: 二元回归的F显著可推断为存在1 个QTL,SS最小处为该QTL的最可能位置:其加性效应由Z依X的回归系数估计,显性效应d由Z依Y的回归系数估计。 同样方法可类推于BC2群体,其结果为: -gf6976 bytes) 4F2群体的两侧标记回归 F2是F1雌、雄配子的自由组合,每一位点都有3种基因型纯合体11、22和杂合体12)。所以,当考虑两侧标记及 其中间的一个可能的QTL时,共有33-27种基因型,即32=9种标记基因型,每种标记基因型又含Q1Q1、Q2Q2、Q1Q2 3种数量基因型。但这种复杂性仅是前述方法的推广。表6列出F群体两侧标记的遗传组成和基因型遗传值,由之可得 标记A、B间任一位置的X和Y变数为: 正作hka国h■抽取2000bc5ekk200810)/mym99/my9s2/90218.hm(第7/9页)2009-1231238,40
江苏农业研究/990218 A1Q1B1 A1Q2B1 A1Q1B2 A1Q2B2 A2Q1B1 A2Q2B1 A2Q1B2 A2Q2B2 ac-.gif (511 bytes) ad-.gif (447 bytes) ae-.gif (438 bytes) af-.gif (492 bytes) A1A1Q1Q1B1B1 A1A1Q1Q2B1B1 A1A1Q1Q1B1B2 A1A1Q1Q2B1B2 A1A2Q1Q1B1B1 A1A2Q1Q2B1B1 A1A2Q1Q1B1B2 A1A2Q1Q2B1B2 m+a m+d m+a m+d m+a m+d m+a m+d 就可以对个体表型值Z依X和Y的关系,作二元线性回归分析。回归df=2,失拟df=n-3;二元回归的F显著可推断为存在1 个QTL, SSL最小处为该QTL的最可能位置;其加性效应a由Z依X的回归系数估计,显性效应d由Z依Y的回归系数估计。 同样方法可类推于BC2群体,其结果为: o-.gif (6976 bytes) (7) 4 F2群体的两侧标记回归 F2是F1雌、雄配子的自由组合,每一位点都有3种基因型(纯合体11、 22和杂合体12)。所以,当考虑两侧标记及 其中间的一个可能的QTL时,共有33=27种基因型,即32=9种标记基因型,每种标记基因型又含Q1Q1、 Q2Q2、 Q1Q2 3种数量基因型。但这种复杂性仅是前述方法的推广。表6列出F2群体两侧标记的遗传组成和基因型遗传值,由之可得 标记A、 B间任一位置的X和Y变数为: file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9902/990218.htm(第 7/9 页)2009-12-31 23:58:40
江苏农业研究018 igif (21266 bytes) 式⑨)的Y下标的意义同式(⑧)的X。与前述回交群体相同,性状表型值Z依x的回归系数估计a,Z依Y的回归系数估计d。 表6F2群体两侧标记的遗传组成和基因型的遗传值 Tabe6 G enetic constitu tion and genotypic valeofaQTL and its fankingm arkers in F2 popultion F2基因型 频率 基因型遗传值 标记平均数 Frequency eno type vale M ean ofm arke G enotype in F com bnaton AA Q19BB AA1Q192B B1 .gif (1092 bytes) wa-.gif AA1Q2Q2BB1 AAQBB2 AAQ192B B2 oF.gif(1414bytes) AA1Q2Q2BB2 过 wb-gif AAQ9B2B2 AAQ1Q2B2B2 gif (1008 bytes) AA1Q2Q2B2B2 作%kah抽取200bebr 930218.h(第8/9页)2009123别23584
江苏农业研究/990218 j-.gif (21266 bytes) (9) 式(9)的Y下标的意义同式(8)的X。与前述回交群体相同,性状表型值Z依X的回归系数估计a,Z依Y的回归系数估计d。 表6 F2群体两侧标记的遗传组成和基因型的遗传值 Table 6 Genetic constitution and genotypic value of a QTL and its flanking markers in F2 population F2基因型 Genotype in F2 频 率 Frequency 基因型遗传值 Genotype value 标记平均数 Mean of marker combination A1A1Q1Q1B1B1 A1A1Q1Q2B1B1 A1A1Q2Q2B1B1 bc-.gif (1092 bytes) m+a m+d m-a wa-.gif (241 bytes) A1A1Q1Q1B1B2 A1A1Q1Q2B1B2 A1A1Q2Q2B1B2 bf-.gif (1414 bytes) m+a m+d m-a wb-.gif (240 bytes) A1A1Q1Q1B2B2 A1A1Q1Q2B2B2 A1A1Q2Q2B2B2 bw-.gif (1008 bytes) m+a m+d m-a wc-.gif (257 bytes) file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9902/990218.htm(第 8/9 页)2009-12-31 23:58:40
江苏农业研究B30218 AAQ9B B1 m+a AA2QQ2B1BI bq-.gif (1413 bytes) m+d wd. AA2Q2Q2B B1 m-a AA2Q9B B2 m +a A 1AQ1Q2BiB2bn-gif (1988 bytes) m+d A142Q202BB2 m-a AA2Q9B2B2 AAQQ2B2B2 ad-gif (447 m +a bytes) m+d b21.gi AA2Q2Q2B2B2 m-a A2A2QQBB1 m +a A2AQQ2BB1 be-.gif 988 bytes) m+d A2AQ2Q2BB1 m-a A2A2QQB B2 m +a A2AQQ2BB2 bb-.gif (1415 bytes) m+d m-a A2AQQB2B2 m +a A2A2QQ2B2B2 ba-.gif(1087bytes) m+d 2 A2420202B2B m-a 5待进一步研究的问题 1)如何提高QTL定位研 究的精 确性对于典型的数量性状, 相当于一个基因长度的几百倍,甚至几千倍所以有人认为目前的水平大概只能将QTL定位到染色体的某一 提 径可能句 ①小 ③减由 法导致 假 的标 等。其中最重 的目标是 状的 传 可的数 论标记回归或两侧标记回归,都可以引伸到全基因组的多个位点,对非搜索范围的显著标记实行统计控 制 2)如何扩大QTL定位研究的范围在植物方面, 现今用来定位QTL的分离群体,基本上都源于两个纯系 P、P的杂交。这是积累知识和经验所不可缺少的,但局限性是明显的。首先,一个QTL,如果在亲本中 定停位基因相 同) 就不可能在杂交后代分 基 路分拉务分防网时凉除茶盈整教 ①在群体构建 定遗传设计如双列 作者单位:扬州大学农学院数量遗传研究室,扬州225009) 1999-02-11 正作kon_抽取200 em/k0810/mymy9/my902/9218hn(第9/9页)209-129123840
江苏农业研究/990218 A1A2Q1Q1B1B1 A1A2Q1Q2B1B1 A1A2Q2Q2B1B1 bq-.gif (1413 bytes) m+a m+d m-a wd-. gif (228 A bytes) 1A2Q1Q1B1B2 A1A2Q1Q2B1B2 A1A2Q2Q2B1B2 bn-.gif (1988 bytes) m+a m+d m-a wd-. gif (228 A bytes) 1A2Q1Q1B2B2 A1A2Q1Q2B2B2 A1A2Q2Q2B2B2 ad-.gif (447 bytes) m+a m+d m-a ab21.gif (250 bytes) A2A2Q1Q1B1B1 A2A2Q1Q2B1B1 A2A2Q2Q2B1B1 be-.gif (988 bytes) m+a m+d m-a ab11. gif (256 A bytes) 2A2Q1Q1B1B2 A2A2Q1Q2B1B2 A2A2Q2Q2B1B2 bb-.gif (1415 bytes) m+a m+d m-a ab12.gif (251 bytes) A2A2Q1Q1B2B2 A2A2Q1Q2B2B2 A2A2Q2Q2B2B2 ba-.gif (1087 bytes) m+a m+d m-a ab22.gif (253 bytes) 5 待进一步研究的问题 1) 如何提高QTL定位研究的精确性?对于典型的数量性状,现今定位技术的精确性仍是很不理想的。模 拟研究表明,在300个个体的F2群体定位一个遗传力达20%的QTL,其95%置信区间将在30 cM以上。这至少 相当于一个基因长度的几百倍,甚至几千倍!所以有人认为目前的水平大概只能将QTL定位到染色体的某一 臂上。提高QTL定位准确性的途径可能包括: ① 减少环境差异; ② 控制遗传背景变异; ③ 减少由分析方 法导致的QTL假阳性; ④ 增大样本; ⑤ 选择数量性状差异大的亲本和⑥适当的标记间距等。其中最重要 的目标是减少数量性状的非遗传变异, 例如应用仅有小段DNA不同的数量性状近等基因系等; 在统计上则 不论标记回归或两侧标记回归,都可以引伸到全基因组的多个位点,对非搜索范围的显著标记实行统计控 制。 2) 如何扩大QTL定位研究的范围?在植物方面,现今用来定位QTL的分离群体,基本上都源于两个纯系 P1、 P2的杂交。这是积累知识和经验所不可缺少的,但局限性是明显的。首先,一个QTL,如果在亲本中 固定(等位基因相同),就不可能在杂交后代分离,也就不可能被发现;其次,被发现的QTL也仅限于两杂 交亲本,不能推及其他,因此不能从宏观上认识基因资源。这就严重地限制了植物育种的利用。今后的可 能方向: ① 在群体构建上,设想以基于一定遗传设计(如双列交、 pq交等)的多系杂交来代替两系杂交; ② 在统计分析上,设想将系间变异直接分解为各有关QTL的变异,估计的参数除位置和效应外还需有基因 频率。 作者单位:(扬州大学农学院数量遗传研究室, 扬州 225009) 1999-02-11 file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9902/990218.htm(第 9/9 页)2009-12-31 23:58:40
数量性状基因定位的回归方法Ⅱ.两侧标记回归分析 旧亞数据支依装 作者: 作者单位: 定机 刊名: 江苏农业研究STICPK可 英文刊名 JINAG SU AGRICULTURAL RESEARCH 年,卷(期 引用次数: 引还献6条)■ 1.散避徐辰武贝叶斯回归分析方法及其在QL作图中的应用[期刊论文]-扬州大学学报(农业与生命科学@2005(02 2.编羊经济性状定位技术及其应用[明刊论文]-当代2005(1 3.韩英黯耐大豆疫霉根QL定位的研究[学位论文]硕士2005 4周明亮凉山半细毛羊第3号染色体遗传连镇图谱构建及体重性状QL定位的研究[学位论文]硕士2005 5.露元健水稻卷叶性状的遗传分析及卷叶装因的精细定位[学位论文]博士200 ,胡中立L道传分析的若干理论研究及其应用[学位论文]博士2000 本文链接:htp:/.coa.cn/Periodical-jsnyyjl99020I8.asp 下载时间:2010年3月5日
数量性状基因定位的回归方法Ⅱ. 两侧标记回归分析 作者: 莫惠栋, Mo Huidong 作者单位: 扬州大学农学院数量遗传研究室,扬州,225009 刊名: 江苏农业研究 英文刊名: JINAG SU AGRICULTURAL RESEARCH 年,卷(期): 1999,20(2) 引用次数: 2次 引证文献(6条) 1.敖雁.徐辰武 贝叶斯回归分析方法及其在QTL作图中的应用[期刊论文]-扬州大学学报(农业与生命科学版) 2005(02) 2.绵羊经济性状定位技术及其应用[期刊论文]-当代畜牧 2005(11) 3.韩英鹏 耐大豆疫霉根腐病QTL定位的研究[学位论文]硕士 2005 4.周明亮 凉山半细毛羊第3号染色体遗传连锁图谱构建及体重性状QTL定位的研究[学位论文]硕士 2005 5.邵元健 水稻卷叶性状的遗传分析及卷叶基因的精细定位[学位论文]博士 2005 6.胡中立 QTL遗传分析的若干理论研究及其应用[学位论文]博士 2000 本文链接:http://d.g.wanfangdata.com.cn/Periodical_jsnyyj199902018.aspx 下载时间:2010年3月5日