农业院校《试验设计与分析》课程参考资料（数量性状分析方法）数量性状基因定位的回归方法（标记回归分析）.pdf_大学文库

江苏农业研究990117 江苏农业研究 JIANGSU AGRICULTURAL RESEARCH 1999年第1期 No.1 Vol.20 1999 数量性状基因定位的回归方法* Ⅰ. 标记回归分析莫惠栋 REGRESSION METHODS FOR LOCATING QUANTITATIVE TRAIT LOCUS (QTL) Ⅰ. MARKER REGRESSION ANALYSIS Mo Huidong (Lab of Quantitative Genetics, Agric. Coll., Yangzhou Univ., Yangzhou 225009) DNA分子标记在遗传育种研究中的应用主要有：(1)评价育种亲本； (2)设计遗传试验； (3)定位数量性状基因并估计其效应； (4)辅助选择。这是本世纪90年代以来迅速发展的一个科学领域。本文重点报道以标记回归定位QTL的原理和方法。在分离世代中，每一个体的任一分子标记位点M都最多只可能有3种基因型，即M1M1、M2M2和M1M2，分别表示该位点的两份DNA都来自纯系亲本P1、 P2和P1、 P2各一份。各个位点的基因型以及位点之间的交换率r和遗传距离cM，都是可以直接观察或计算的。另一方面，每一个体的某一被研究性状Z，当然也是可以直接观察的。设以0m. gif (131 bytes) 11、0m. gif (131 bytes) 22和0m. gif (131 bytes) 12分别表示分离群体中任一M的基因型M1M1、 M2M2和M1M2的平均数，则数量性状基因Q 的定位可归结为：(1)根据遗传学原理，建立0m. gif (131 bytes) 和Q的遗传效应的数量关系模型； (2)根据统计学原理，推断Q在染色体上的最可能位置，并估计其效应。标记回归乃是根据Q的假定位置与一染色体上所有M间的距离函数和0m. gif (131 bytes) 的差异的关系，应用回归方法搜索该染色体上是否存在Q及其最可能位置。由于0m. gif (131 bytes) 和Q的效应的关系随试验群体而有不同，下面按不同群体分别讨论。 1 回交(BC)群体的标记回归 1.1 遗传学原理设在标记M的一侧有一数量基因Q，且P1基因型是M1M1Q1Q1，P2基因型是M2M2Q2Q2(Q1、 Q2分别为增、减效等位基因)，M和Q间交换率为r，则BC1群体P1/P2∥P1的遗传图如右。 72.gif (843 bytes) file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9901/990117.htm（第 1／9 页）2009-12-31 23:58:13

江苏农业研究990117 测验单一QTL模型的适合性，此F值显著将暗示该染色体上可能还有其他QTL。式中的MSD为剩余均方，其SSD可由SSZ-SSY得到。 2 回交(BC)群体标记回归的一个实例现以郑康乐等的一个结果〔4〕将上节内容具体化。研究材料是水稻的三品种杂交(“广亲和”品种/籼∥粳)，并非回交群体，但其遗传结构相当于回交。表2列出该群体的n=55个植株的结实率Z及其第6染色体上k=5个遗传标记。其中“1”表示该标记位点有一份“广亲和”DNA，相当于M1M2；“0”表示无，相当于M2M2。表头的标记间遗传距离是我们根据其实际结果，由 M=-ln(1-2r)/2和r=(1-e-2M)/2 (12) 得到的(1 M=100 cM)。例如C和RG138的r=0.055，故M=-ln(1-2×0.055)/2=0.058=5.8 cM)； RG138和RG64的 r=0.255，故M=-ln(1-2×0.255)/2=0.357=35.7 cM； …等。分析步骤如下：表2 水稻“广亲和”/籼∥粳的55个植株在第6染色体上的标记及结实率 Table 2 Markers on chromosome Ⅵ and seed-setting percentages of 55 plants in WCV/Indica∥Japonica rice population 株号 No. of plants 遗传标记和标记间遗传距离/cM Genetic marker and distance between markers 结实率/% Seedsetting Z 株号 No. of plants 遗传标记和标记间遗传距离/cM Genetic marker and distance between markers 结实率/% Seedsetting Z C 0 RG138 5.8 RG64 41.5 RG456 49.4 RG716 74.9 C 0 RG138 5.8 RG64 41.5 RG456 49.4 RG716 74.9 1 1 1 0 1 0 79.0 32 0 0 0 0 0 76.3 2 0 0 1 1 1 79.4 33 1 1 1 0 1 77.1 3 1 1 1 1 0 81.8 34 1 1 1 1 1 77.3 4 0 0 1 1 1 84.0 35 0 0 1 1 1 31.3 5 0 0 1 0 1 84.0 36 0 0 0 0 1 43.2 6 1 1 0 1 0 84.0 37 0 0 0 0 0 43.3 7 1 1 1 0 1 85.8 38 0 0 0 0 0 46.9 8 1 1 0 1 0 87.0 39 0 0 1 1 1 47.0 9 1 1 1 0 1 87.3 40 0 0 1 1 1 47.5 10 1 1 0 0 0 87.5 41 0 0 0 0 48.4 11 1 0 0 1 1 87.6 42 0 0 0 0 1 50.2 12 1 1 1 1 1 89.1 43 0 0 0 1 1 52.3 13 1 1 1 1 1 89.2 44 0 0 0 0 0 53.2 14 1 1 1 1 0 89.6 45 0 0 0 0 1 54.8 15 1 1 1 1 0 90.1 46 0 0 1 1 1 55.0 16 1 1 1 1 1 90.8 47 0 0 0 0 0 55.9 17 1 1 1 1 1 90.3 48 0 0 0 0 1 59.9 18 1 0 1 0 1 65.3 49 0 0 0 0 0 62.3 19 0 0 0 0 0 65.7 50 0 0 0 0 0 63.8 20 0 0 0 0 0 66.2 51 0 0 0 0 0 64.3 21 0 0 0 1 0 66.9 52 1 1 1 1 1 91.6 22 1 1 1 0 1 67.0 53 1 1 1 0 0 93.1 23 0 0 0 0 0 67.2 54 1 1 1 1 0 93.1 file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9901/990117.htm（第 4／9 页）2009-12-31 23:58:13

江苏农业研究990117 24 0 0 0 0 0 68.8 55 1 1 1 1 1 83.9 25 1 0 0 0 0 70.2 26 0 0 0 1 0 71.3 0m. gif (131 bytes) 12 83.4 85.2 77.7 76.1 70.9 0z. gif (110 bytes) = 27 0 0 1 0 1 71.9 (24)* (21) (25) (25) (26) 28 0 0 0 0 0 72.7 0m. gif (131 bytes) 22 61.3 62.5 65.7 67.0 71.4 SSZ= 29 0 0 0 0 0 73.4 (31)* (34) (30) (30) (29) 13 510.49 30 1 1 0 0 0 74.4 Y 22.5 22.7 12.0 9.1 -0.5 31 0 0 0 0 0 74.5 * 括号内数字为个体数。 * Figure in parentheses was the number of individuals. 2.1 从表2计算各标记位点编码为“1”和“0”的个体的结实率(Z)平均数0m. gif (131 bytes) 12和0m. gif (131 bytes) 22以及Z的平均数0z. gif (110 bytes) 和平方和 SSZ，并由0m. gif (131 bytes) 12- 0m. gif (131 bytes) 22得Y。 2.2 计算从C～RG716，即0～74.9 cM区间上QTL在任一可能位置的X=1-2r值，以2 cM为间隔。例如：假定Q在C 位点上，则其离各标记的遗传距离为0、 5.8、 41.5、 49.4、和74.9 cM；由式(12)得其相应重组率r为0.0、 0.055、 0.282、 0.314和0.388；故X=1-2r依次为1.00、 0.89、 0.44、 0.37和0.22。假定Q在2 cM位点上，则其离各标记的cM 依次为2.0、 3.8、 39.5、 47.4和72.9； r为0.020、 0.037、 0.273、 0.306和0.384；故X为0.96、 0.93、 0.45、 0.39和 0.23。表3列出这一计算的部分结果。表3 假定的QTL位置(cM)及其相应的X=(1-2r)值 Table 3 Putative QTL position (cM) and its corresponding X=(1-2r) value 位置1 Position 1 2 3 4 5 cM X cM X cM X cM X cM X 0 5.8 41.5 49.4 74.9 1.00 0.89 0.44 0.37 0.22 2.0 3.8 39.5 47.4 72.9 0.96 0.93 0.45 0.39 0.23 4.0 1.8 37.5 45.4 70.9 0.92 0.96 0.47 0.40 0.24 6.0 0.2 35.5 43.4 68.9 0.89 1.00 0.49 0.42 0.25 8.0 2.2 33.5 41.4 66.9 0.85 0.96 0.51 0.44 0.26 位置6 Position 6 11 16 21 26 Y cM X cM X cM X cM X cM X 10.0 4.2 31.5 39.4 64.9 0.82 0.92 0.53 0.45 0.27 20.0 14.2 21.5 29.4 54.9 0.67 0.75 0.65 0.56 0.33 30.0 24.2 11.5 19.4 44.9 0.55 0.62 0.79 0.68 0.41 40.0 34.2 1.5 9.4 34.9 0.45 0.50 0.97 0.83 0.50 50.0 44.2 8.5 0.6 24.9 0.37 0.41 0.84 0.99 0.61 22.5 22.7 12.0 9.1 -0.5 2.3 从表3的X和Y，以公式(6)、(7)、(9)计算有关统计数，部分结果列于表4。该表说明：距C位点0～20 cM范围的F值都>F0.01=21.20；而2 cM时的SSL最小(37.62)、 F值最大(128.76)。故对2 cM位点再作一次依据于n=55个个体的回归分析，结果见表5。失拟的F值不显著(<1)，表明该染色体上只有2 cM上的一个影响育性的QTL。根据式(8)可进一步得到该QTL的效应和标准误为： b=51.545 0/2.194 0=23.49 (%) 75.gif (580 bytes) =2.07 (%) 根据式(10)可得该QTL的遗传贡献率为： R2=(55×23.492/4)/13 510.49=0.561 6 file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9901/990117.htm（第 5／9 页）2009-12-31 23:58:13

江苏农业研究990117 表4 各个假定QTL位置回归分析的基本数据 Table 4 Regression analysis for each putative QTL position 统计数 Statistic 位置1 Position 1 0 cM 2 2 cM 3 4 cM 4 6 cM 5 8 cM 6 10 cM 11 20 cM 16 30 cM 21 40 cM 26 50 cM SSZ 2.171 0 2.194 0 2.206 5 2.271 1 2.165 4 2.075 1 1.856 4 1.941 5 2.332 3 2.362 8 SSY 1 248.6 1 248.6 1 248.6 1 248.6 1 248.6 1 248.6 1 248.6 1 248.6 1 248.6 1 248.6 SP 51.240 51.545 51.652 52.302 50.911 49.654 44.831 41.912 40.418 36.416 SSR 1 209.37 1 210.98 1 209.12 1 204.48 1 196.98 1 188.14 1 082.64 904.77 700.43 561.25 SSL 39.23 37.62 39.48 44.12 51.62 60.46 165.96 343.83 548.17 687.35 F 123.30 128.76 122.50 109.20 92.72 78.63 26.09 10.52 5.11 3.27 表5 距离C为2 cM位置上QTL的回归分析 Table 5 Regression analysis for the 2 cM position from marker C 变异来源 Source of variation df SS MS F 回归 Regression 1 1 210.98 1 210.98 128.78* 失拟 Lack of fit 4 37.62 9.40 <1 剩余 Residual 49 12 261.89 250.24 总变异 Total 54 13 510.49 以上统计计算在任何个人电脑上都可以非常简捷地实现。 2.4 推断：综上结果，在第6染色体上有一个控制籼/粳杂种育性(结实率)的QTL，其最可能位置为距C基因2 cM；其对结实率的平均效应为23.49±2.07 (%)，即0q. gif (119 bytes) 12比0q. gif (119 bytes) 22提高结实率23.49%±2.07%; 其遗传贡献率为 56.16%，所以显然是一个数量主基因。 3 加倍单倍体(DH)群体的标记回归加倍单倍体是F1配子加倍后的纯合体。参照表1即可写出其群体遗传组成于表6。表6 加倍单倍体(DH)群体的遗传组成和基因型的遗传值 Table 6 Genetic constitution and genotypic value in doubled haploid (DH) population F1配子 F1 gamete 频率 Frequency DH基因型 Genotype in DH 基因型遗传值 Genotypic value M1Q1 1-r M1M1Q1Q1 m+a M1Q2 r M1M1Q2Q2 m-a M2Q1 r M2M2Q1Q1 m+a M2Q2 1-r M2M2Q2Q2 m-a file:///F|/qikan_htm抽取_2000before/kjqk(200810)/jsnyyj/jsny99/jsny9901/990117.htm（第 6／9 页）2009-12-31 23:58:13