农业院校《试验设计与分析》课程参考资料（区域试验分析方法）作物品种区域试验中品种均值估计的模型和方法——算术平均值、加权最小二乘估值和BLUP的比较.pdf_大学文库

第29卷第6期作物学报 Vol 29,No 6 2003年11月884-891页 ACTA AGRONOMICA SINICA p884-891ow.,203 作物品种区域试验中品种均值估计的模型和方法一算术平均值、加权最小二乘估值和BLUP的比较张群远孔繁玲，·杨付新 (1中国农业大学植物遗传育种系，北京10094：2中国农业科学院棉花研究所，河南安阳455112) 摘要针对作物区域试验中的品种均值估计问题，根据混合线性模型的一般原理，总结和提出多种加权最小二乘估计 (WSE)和最佳线性无偏预测(BLP)的方法，推导了这些方法的平衡数据计算简式：同时，利用14套2年多点的棉花区试资料和一套4年多点的棉花品试验对这些方法的预测效果进行验证比较。结果表明 ,与算术平均值相比，以环境内误差方差倒数加权的WSE估值的预测精度（包括预测差的大小和品种排名的一致性）明显不同，但其高低因数据而异其他WLSE估值以及BHUP的预测结果差别不大，和算术平均值以及相互间的相关系数和秩相关系数均在0,93以上。关健词区域试验：算术平均值：加权最小二乘估计：P 中图分类号：0212 文南献标识马：A Models and Methods for Estimating Variety Means in Regional Crop Trials -Comparisons of Arithmetic Mean,Weighted Least Squares Estimates and BLUPs ZHANG Qun-Yuan'KONG Fan-Ling'YANG Fu-Xin g,Ha455112,ia） Abstract Based on the mixed linear model,several weighted least squares estimates(WISEs)and best linear unbiase predictors(BLUPs)were summarized and proposed for estimating variety means in regional crop trials,and the correspond- ing calculating fomle were derived and presented for balanced data.The daa of 14 oundsof2-year-muli-loction gional cotton trials and a 4-year-multi-location cotton trial were used to compare the predictive efficiencies of arithmeti means,WISEs and BLUPs.The results showed that the predictive differences and variety ranks of the WISE weighted by within env ents(WISEe)differed significantly from that of the arithmetic eans,but the predictive accuracy of WISEe increased or decreased iregularly in different trials:the predictive results of other WLSEs and BLUPs were similar to that of the arithmetic means,the correlation coefficients and rank correlation coefficients betweer them were all above 0.93 Key words Regional trial:Arithmetic mean:Weighted least squares estimate:BLUP:Prediction 作物品种区域试验（简称区试）中，品种×环境用我国区试数据，对品种×环境组合均值的几种主组合均值（即某品种在某参试环境中的性状均值）和要估计方法作过比文2知，本文则专门深讨区试中品品种均值（即某品种在所有参试环境中的性状均值）种均值估计的模型和方法问题，并利用我国区试数是两种最基本的统计数，是分析和评价品种的主要据和专设的多年多点试验数据对名种方法的精度作依据。通常，它们都由算术平均的方法获得，但算术比较，旨在为区试中品种均值估计方法的选择或改平均值不一定是最精确的估值2]。张群远等曾利讲作探素。基金项目：家自然科学基金资助项目(307043) 作者荷介：张群远(1970： ,男，云南宜成人，博士，副教授，研究方向：生物统计学和统计遗传学。·通讯作者：孔繁玲，女，教授，博士生导

!"#$%&，’"$( ))$ **+ , *&- ’".$，%//0 作物学报 1231 1456’67821 98’821 第 %& 卷第 ( 期 %//0 年 -- 月 **+ , *&- !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 页作物品种区域试验中品种均值估计的模型和方法 ———算术平均值、加权最小二乘估值和 !"#$ 的比较张群远- 孔繁玲-，" 杨付新% （-中国农业大学植物遗传育种系，北京 -///&+；%中国农业科学院棉花研究所，河南安阳 +::--%）摘要针对作物区域试验中的品种均值估计问题，根据混合线性模型的一般原理，总结和提出多种加权最小二乘估计（;?@+0(* 1*-23+-(* +,’ !"#$* BC1’4 DEFGHEIF - J6’4 KIFG :$(3，?"($( +::--%，45.($） ;A*-0+IOPQ "F RSP TLUPQ #LFPIV T"QP#，OP.PVI# WPLMSRPQ #PIOR OXEIVPO PORLTIRP（O ;<?@；@VPQLZRL"F 作物品种区域试验（简称区试）中，品种 _ 环境组合均值（即某品种在某参试环境中的性状均值）和品种均值（即某品种在所有参试环境中的性状均值）是两种最基本的统计数，是分析和评价品种的主要依据。通常，它们都由算术平均的方法获得，但算术平均值不一定是最精确的估值［-，%］。张群远等曾利用我国区试数据，对品种 _ 环境组合均值的几种主要估计方法作过比较［%］，本文则专门探讨区试中品种均值估计的模型和方法问题，并利用我国区试数据和专设的多年多点试验数据对各种方法的精度作比较，旨在为区试中品种均值估计方法的选择或改进作探索。 #基金项目：国家自然科学基金资助项目（0//‘/+00）。作者简介：张群远（-&‘/ a ），男，云南宣威人，博士，副教授，研究方向：生物统计学和统计遗传学。" 通讯作者：孔繁玲，女，教授，博士生导师，3P#：(%*&00&‘。 5PZPL.PQ万方数据（收稿日期）：%//%G/&G/:，1ZZP)RPQ（接受日期）：%//%G--G-%A

6期张群远等：作物品种区域试验中品种均值估计的模型和方法 885 1材料与方法阵：©为误差向量，通常假设其均值为0，具有方差协差阵R:I为单位矩阵。通过广义最小二乘方程组 1.1品种均值估计的模型和方法和混合模型方程组可获得固定效应b的最佳线性作物品种区试是在多环境中实施同一套试验方无偏估计(best linear unbiased estimate,BLUE)以及随案，其品种均值的估计属于多套试验的合并分析问机效应u的最佳线性无偏预测值(best linear unbi- 颗。以往的研究或应用中，除算术平均外，品种均伯 ased prediction BLUP- 估计的其他一些方法基本上是基于加权平均的思估计品种均值，就是要估计(1)式中的总均值：想，所采用的权”有误差方差倒数、环境内剩余方差与品种效应g:之和。以通常为固定效应，包含在倒数、环境内遗传力、与参照环境的距离的倒数 (2)式的b中：：若为固定效应，也包含在b中，若等)。这些加权方法是经验性的，缺乏完整的统为随机效应，则包含在“中，所以品种均值的估计计学依据，为此，本文利用混合线性模型的理论来统受方差协差阵G和R的影响。G和R的构成是由一阐述品种均值估计方法。不同效应的固定或随机以及误差方差的同质或异质区试中第：个品种在第个环境中的第k次重的假设来决定的，不同假设下G和R的组成不同复观测值的线性模型可写为：由此也就产生了品种均值的不同估计方法。品种效送=+g:+e；+0+e话 (1) 应固定假设下得到的品种均值为BUE:品种效应随为观测值的总体均值：g:为第个品种的效机假设下得到的品种均值为BUP。应：为第j个环境的效应：0，为第i个品种与第j 考虑到计算和应用的方便，本文附录中对)个个环境的基因型×环境(GE)互作效应：E为第i个品种、个环境的平衡数据，以次重复均值为基品种在第个环境中的第k次重复观测值的误差。础，推导了混合模型的几种主要假设下品种均值的上式也可表达为更为一般的混合线性模型6的矩计算简式。将附录中各公式的误差方差(。2和。) 阵形式：替换成单个观测值的误差方差除以重复数，的形式 Y Xb Zu le (/r和)/r),即可得到品种均值的各种估算公 Y为观测值向量：b为固定效应向量：X为固定式，列于表1。表中：均为固定效应，误差均为随材效应的系数矩阵：为随机效应向量，通常假设其均效应：表示环境j内的误差方差：误差同质（或值为0，具有方差协差阵G:Z为随机效应的系数矩异质)指各环境中的试验误差方差同质（或异质）：剩表1混合线性模型几种主要假设下品种均值估值的名称及平衡数据计算简式 Table 1 Calculating formule for balanced data under several main of mixed linear model 模型假设估值类型品种的均值计算式 Types ofe 品种和环境圆定，误差同质最小二乘估计（算术平均）品种和环境定，误差异质加权最小二乘估计品会品种和环境固定，剩余方差异质加权最小二乘估计 WLSE 会高小二乘估计品种因定，环墙随机，利金方差异而加权最小二乘估计 / WLSE 2+合+ 品种和环境随机，误差同质最佳线性无偏预测 P四I 了+e+i+-D

! 材料与方法 !"! 品种均值估计的模型和方法作物品种区试是在多环境中实施同一套试验方案，其品种均值的估计属于多套试验的合并分析问题。以往的研究或应用中，除算术平均外，品种均值估计的其他一些方法基本上是基于加权平均的思想，所采用的“权”有误差方差倒数、环境内剩余方差倒数、环境内遗传力、与参照环境的距离的倒数等［! " #］。这些加权方法是经验性的，缺乏完整的统计学依据，为此，本文利用混合线性模型的理论来统一阐述品种均值估计方法。区试中第 ! 个品种在第 " 个环境中的第 # 次重复观测值的线性模型可写为： $!"# $ ! % %! % &" %"!" %#!"# （&） !为观测值的总体均值；%! 为第 ! 个品种的效应；&" 为第 " 个环境的效应；"!" 为第 ! 个品种与第 " 个环境的基因型 ’ 环境（()）互作效应；#!"# 为第 ! 个品种在第 " 个环境中的第 # 次重复观测值的误差。上式也可表达为更为一般的混合线性模型［*，+］的矩阵形式： ! $ "# % $% % !& （,） ! 为观测值向量；# 为固定效应向量；" 为固定效应的系数矩阵；% 为随机效应向量，通常假设其均值为 -，具有方差协差阵 ’；$ 为随机效应的系数矩阵；!为误差向量，通常假设其均值为 -，具有方差协差阵 (；& 为单位矩阵。通过广义最小二乘方程组和混合模型方程组可获得固定效应 # 的最佳线性无偏估计（./01 234/56 74.350/8 /013951/，:;6/83?13@4 :;13@40 34 9@8/2 估值类型 EF>/0 @D /013951/0 品种 ! 的均值计算式 G52?725134H D@69725/ D@6 1I/ ! 1I J563/1F 9/54 品种和环境固定，误差同质 K563/13/0 548 /4J36@49/410 D3L/8 /66@60 I@9@2@H@70 最小二乘估计（算术平均） ;M)（5631I9/13? 9/54） & ( ! ( " $ & "$!" 品种和环境固定，误差异质 K563/13/0 548 /4J36@49/410 D3L/8 /66@60 I/1/6@2@H@70 加权最小二乘估计 N;M)/ ! ( " $ & "$!" $, （/ "）C) ! ( " $ & & $, （/ "）C) 品种和环境固定，剩余方差异质 K563/13/0 548 /4J36@49/410 D3L/8 6/038752 J56354?/0 I/1/6@2@H@70 加权最小二乘估计 N;M)O ! ( " $ & "$!" $, O（"） ! ( " $ & & $, O（"）品种固定，环境随机，误差异质 K563/13/0 D3L/8，/4J36@49/410 6548@9 /66@60 I/1/6@2@H@70 加权最小二乘估计 N;M)) ! ( " $ & "$!" $, ) %$, () %$, （/ "）C) ! ( " $ & & $, ) %$, () %$, （/ "）C) 品种固定，环境随机，剩余方差异质 K563/13/0 D3L/8，/4J36@49/410 6548@9 6/038752 J56354?/0 I/1/6@2@H@70 加权最小二乘估计 N;M))O ! ( " $ & "$!" $, ) %$, O（"） ! ( " $ & & $, ) %$, O（"）品种随机，环境固定，误差同质 K563/13/0 6548@9，/4J36@49/410 D3L/8 /66@60 I@9@2@H@70 最佳线性无偏预测 :;<A- "$ % $, ( $, ( %$, ()C( %$, / C() （"$! P"$）品种和环境随机，误差同质 K563/13/0 548 /4J36@49/410 6548@9 /66@60 I@9@2@H@70 最佳线性无偏预测 :;<A& "$ % $, ( $, ( %$, )C( %$, ()C( %$, / C() （"$! P"$） * 期张群远等：作物品种区域试验中品种均值估计的模型和方法 BB# 万方数据

886 作物学报 20卷余方差指环境内互作和误差的混合方差：)为环的习惯做法（即品种固定）不太一致，但也有其合理境j内的GE互作和误差的混合方差：、、g品和性。分别指基因型、环境、GE互作以及误差的方差：s 1.2数据来源和试验方案和，分别指环境数和环境内重复数，其余符号含义见附录。为比较表1中各种估值的统计精度，采用两类从表1可看出，品种效应固定时的某品种均值数据进行分析。一类是我国区试历史数据，即长江的估计，都是加权平均值，而“权”就是对应模型假定流域春棉1990~1997年，黄河流域春棉1986~1996 下品种i在环境j中的算术平均值了自身方差的倒年以及黄河流域夏棉1986~1993年每2年为1轮的区试资料（简称为区试数据）：另外，考虑到以上区试数，这意味着某环境中各个了自身的变异越小，其的年份数只有2年，对于进行较长年份的预测效果值对品种均值的贡献越大。品种效应随机时的品种分析来说有一定局限，还采用了一套专设的4年多均值的BP值，则是一种“收缩”的预测值，相当于点的品种试验数据（简称专设试验数据）。该试验洗用对应模型假定下品种均值的重复力对品种效应进择建国以来黄河流域具有代表性的10个棉花品种，行收缩”。若品种均值的重复力越小，对试验中的连续进行了4年的4~6个地点的试验（表2），各点品种表型效应估值（即了-Y)就越持“谨慎”态度，次均采用随机完全区组设计，3~4次重复，3行区也就是根据表型值对品种进行选择后获得的期望的小区面积20m,种植管理和性状考察按国家区试标遗传进展越小，这与我们的实际经验是吻合的。从准进行。以上两类资料均采用皮棉产量，单位为kg 这一个角度看，尽管品种随机的假设与我们区试中 hm2。表2 4年多点棉花品种验证试验的设置 Table 2 Inforr ation of the-yeami-ocatio cotto trial for validation 参试点重复数参试品种 19%6 沧州安阳西华临清 4 岱15，徐州1818，徐州142，鲁棉1号，鲁棉6 197 沧州安阳西华临清菏泽 3 号，冀棉8号，中棉所12号（种质库原种），中 198 沧州安阳西华临清荷泽运城 3 棉所12号CK(目前生产用种)，中棉所19 1999 沧州安阳西华临清菏泽运城 3 号，石远321 1.3估值精度的比较方法析获得：，则通过第j个地点的单一点次的方差根据各轮历史区试中第1年的数据计算出各品分析获得（即误差项均方MS.):剩余方差品，的计种对应于表1中的7种估值，以之作为各品种未来算采用Shukla((1972)的方法。表现的7种预测值：然后，计算各品种在第2年试验中的算术平均值，作为验证值。专设试验则依次根 2 结果与分析据4年中的每一年计算出品种估值（即预测值），把从表3中各种估值各轮验证的预测差来看，在其他3年的各品种算术平均值作为验证值。计算各 18轮验证中，加权最小二乘估值(WSE)的预测差种估计方法所得预测值与验证值之间差值的绝对值小于SE估值（即算术平均值）的有16轮，但其中 (称为预测差)以及该差值占验证值的百分比（称为相对预测差)，并对每轮验证中所有品种的预测差求 WLSEr和WSE与LSE的差别不大，WISE和平均：同时计算各种估值以及验证值之间的相关系 WSE则分别有3轮和7轮的预测差明显小于数和秩相关系数。计算结果列于表3~表5。 LSE。预测精度的提高较为明显的（即预测差明显以上计算中，需要估计表1公式中的客种方弟小于LSE的)，大多数是WSE.估值。比如用验证组分，其西接数界品和通过一年多点的方差分试验中1996年的W1SE.估值对1997-1998三年的

余方差指环境内互作和误差的混合方差；!! "（!）为环境 ! 内的 #$ 互作和误差的混合方差；!! #、!! $、!! #$和 !! % 分别指基因型、环境、#$ 互作以及误差的方差；" 和 # 分别指环境数和环境内重复数，其余符号含义见附录。从表 & 可看出，品种效应固定时的某品种均值的估计，都是加权平均值，而“权”就是对应模型假定下品种 $ 在环境 ! 中的算术平均值!%$!自身方差的倒数，这意味着某环境中各个!%$! 自身的变异越小，其值对品种均值的贡献越大。品种效应随机时的品种均值的 ’()* 值，则是一种“收缩”的预测值，相当于用对应模型假定下品种均值的重复力对品种效应进行“收缩”。若品种均值的重复力越小，对试验中的品种表型效应估值（即!%$ +!%）就越持“谨慎”态度，也就是根据表型值对品种进行选择后获得的期望的遗传进展越小，这与我们的实际经验是吻合的。从这一个角度看，尽管品种随机的假设与我们区试中的习惯做法（即品种固定）不太一致，但也有其合理性。 !"# 数据来源和试验方案为比较表 & 中各种估值的统计精度，采用两类数据进行分析。一类是我国区试历史数据，即长江流域春棉 &,,- . &,,/ 年，黄河流域春棉 &,01 . &,,1 年以及黄河流域夏棉 &,01 . &,,2 年每 ! 年为 & 轮的区试资料（简称为区试数据）；另外，考虑到以上区试的年份数只有 ! 年，对于进行较长年份的预测效果分析来说有一定局限，还采用了一套专设的 3 年多点的品种试验数据（简称专设试验数据）。该试验选择建国以来黄河流域具有代表性的 &- 个棉花品种，连续进行了 3 年的 3 . 1 个地点的试验（表 !），各点次均采用随机完全区组设计，2 . 3 次重复，2 行区，小区面积 !- 4! ，种植管理和性状考察按国家区试标准进行。以上两类资料均采用皮棉产量，单位为 567 84! 。表 # $ 年多点棉花品种验证试验的设置 %&’() # *+,-./&01-+ -, 02) $34)&.3/5(013(-6&01-+ 6-00-+ 0.1&( ,-. 7&(18&01-+ 年份 9%:;%;?4%@:A ABC:@?BDA?C:@?BD DE4F%;%;?4%@:A CEA@?G:;< &,,1 沧州安阳西华临清 3 &,,/ 沧州安阳西华临清菏泽 2 &,,0 沧州安阳西华临清菏泽运城 2 &,,, 沧州安阳西华临清菏泽运城 2 岱 &H，徐州 &0&0，徐州 &3!，鲁棉 & 号，鲁棉 1 号，冀棉 0 号，中棉所 &! 号（种质库原种），中棉所 &! 号 IJ（目前生产用种），中棉所 &, 号，石远 2!& !"9 估值精度的比较方法根据各轮历史区试中第 & 年的数据计算出各品种对应于表 & 中的 / 种估值，以之作为各品种未来表现的 / 种预测值；然后，计算各品种在第 ! 年试验中的算术平均值，作为验证值。专设试验则依次根据 3 年中的每一年计算出品种估值（即预测值），把其他 2 年的各品种算术平均值作为验证值。计算各种估计方法所得预测值与验证值之间差值的绝对值（称为预测差）以及该差值占验证值的百分比（称为相对预测差），并对每轮验证中所有品种的预测差求平均；同时计算各种估值以及验证值之间的相关系数和秩相关系数。计算结果列于表 2 . 表 H。以上计算中，需要估计表 & 公式中的各种方差组分，其中!! #、!! $、!! #$和!! % 通过一年多点的方差分析获得；!! （% !）则通过第 ! 个地点的单一点次的方差分析获得（即误差项均方 &’(）；剩余方差!! "（!）的计算采用 K8E5A（: &,/!）的方法［3］。 # 结果与分析从表 2 中各种估值各轮验证的预测差来看，在 &0 轮验证中，加权最小二乘估值（L(K$）的预测差小于 (K$ 估值（即算术平均值）的有 &1 轮，但其中 L(K$$ 和 L(K$$" 与 (K$ 的差别不大，L(K$" 和 L(K$% 则分别有 2 轮和 / 轮的预测差明显小于 (K$。预测精度的提高较为明显的（即预测差明显小于 (K$ 的），大多数是 L(K$% 估值。比如用验证试验中 &,,1 年的 L(K$% 估值对 &,,/ . &,,0 三年的 001 作物学报 !, 卷万方数据

表 ! 几种品种均值估计方法的绝对预测差和相对预测差 "#$%& ! ’$()%*+& #,- .&%#+/0& 1.&-/2+/0& -/33&.&,2&(（45(）3). 0#./&+6 7&#, /, -/33&.&,+ &(+/7#+/,8 7&+9)-( 试验类型 !"#$% &’()* 年份! +)$"*! 绝对预测差（上）和相对预测差（,）（下） -.*/%0&) 12（* $./3)）$45 ")%$&#3) 12（* ,）（.)%/6） 789 :789) :789; :7899 :7899; ?EE?） ?EE（F ?EEG） ?EE（H ?EEI） ?EE（J ?EEK）平均 -3)"$@) ??FLE? I>L?I HFLGM ???LKJ EKLKH ??FLE? ??FLE? ELK> HLG? GLJH ELJ> MLH> ELK> ELK> F>HL>M J>LHJ ?M?LMK F>GLHK ?EEL?G F>HL>M F>HL>M ?EL?F ILJJ ?KL>H ?EL>J ?MLJJ ?EL?F ?EL?F ?GHLIG G>LFM GHFLMG ?GFLF? ?FELKK ?GHLIG ?GHLIG ?>LKM FLHG FKLHK ?>LIE ?>LH> ?>LKM ?>LKM ?HKLKF GMIL?M ?G>LKM ?HELH? ?I>LJM ?HKLKF ?HKLKF ?>LJ> FKLJH ELGE ?>LKF ?>LM? ?>LJ> ?>LJ> ?HELIH ?JHLJ> ?JMLKK ?HELFH ?HIL?J ?HELIH ?HELIH ?FL>I ?GLFJ ?GLJ> ?FL>G ??LK> ?FL>I ?FL>I 黄河春棉区试 8("#4@ A/&&/4 &"#$%* #4 +)%%/6 ;#3)" ")@#/4 ?EM（I ?EMJ） ?EM（K ?EMM） ?EM（E ?EE>） ?EE（? ?EEF） ?EE（G ?EEH） ?EE（I ?EEJ）平均 -3)"$@) FEMLM? GM>LG> G?FL?> G>?L?? G>ELHH FEMLM? FEMLM? FKL>? GHLGM FMLF? FKLFF FKLEK FKL>? FKL>? IFILHE I?MLHF IGILE? IFJLGK IFHLMM IFILHE IFILHE KKLME KJLMH KELHH KML>F KKLM> KKLME KKLME ?FIL>E HGLMF MGLF> ?F>L?? ?F?LJ? ?FIL>E ?FIL>E ?HL>J HLEG ELGI ?GLI> ?GLJK ?HL>J ?HL>J HEMLMM GHMLJE I?ILJG HEEL>? HEMLHH HEMLMM HEMLMM ?>FLJ> K?LKF ?>JL>I ?>FLJG ?>FLI? ?>FLJ> ?>FLJ> ?IFLMI ?MILK> FHHLMG ?IGLMG ?JGLG? ?IFLMI ?IIL>M ?MLE? FFLEK G>LFM ?EL>G F>LF> ?MLE? ?EL?M JMLIE F>JL>K EELHE JMLJF KELIJ JEL>? KFLG> MLGM FIL?K ?FL?I MLGM ELKF MLHG MLMG FK?LIM FKKL?F FEGLHK FK?LI> FKJLHF FK?LJJ FKFLJI GHL>H GHLKG GJLKM GHL>G GHLJH GHL>I GHL?K 黄河夏棉区试 80NN)" A/&&/4 &"#$%* #4 +)%%/6 ;#3)" ")@#/4 ?EM（J ?EMK） ?EM（M ?EME） ?EE（> ?EE?） ?EE（F ?EEG）平均 -3)"$@) IELGI ?FKLHF HELHH IELEE IILMF JIL?F MFLHM JLE> ?HLMF ILKI JLEM JLHE KLIK ELIE MGLGE J?L>E EJLHM MFLIM E>LMG MGLGE MGLGE ?GL?F ELJ? ?IL?K ?FLEE ?HLFE ?GL?F ?GL?F MHLEH EILII ?FELIJ MHLEE MIL?> MHLEH MHLEH ?>LII ??LMK ?JL?> ?>LIJ ?>LIK ?>LII ?>LII ?GILKH F>FLMM IFLHJ ?GJL>G ?GMLGG ?GILKH ?GILKH F?LHK GFL>E MLG> F?LI? F?LMM F?LHK F?LHK E?LH? ??JLGH MMLHI E?LGE EGLHH EFLHJ EILJF ?FLIG ?ILEI ?FL?F ?FLIG ?FLM? ?FLJK ?GL?? 验证试验 O$%#5$&#/4 &"#$% ?EE（J EK，EM，EE） ?EE（K EJ，EM，EE） ?EE（M EJ，EK，EE） ?EE（E EJ，EK，EM）平均 -3)"$@) ??GL>G J>LEF ?>HLJI ??>LK> ?>HLFF ??ELHK ?I?LFK ?FLKK JLME ??LMG ?FLI? ??LKM ?GLI> ?KL?> F?ILJ> FKMLH? F>HLGJ F?KLGI F?HLKJ F?ILJ> F?ILJ> FFLJJ FELFJ F?LHM FFLMH FFLIK FFLJJ FFLJJ ?EELIF IK>LFI ?EHLF> F>?LFI F>?LHH ?EELIF ?EELIF ?MLEH IHL?H ?MLHH ?EL?? ?EL?G ?MLEH ?MLEH IJLE> F>ML>H ?HFL>I IILF> IFLI? J>L?? EILFE ILKK F?L>E ?HLH> ILJ> ILGF JL>E ELJJ ?HJLFJ FKELH? ?J?LGF ?HJL?G ?HGLFG ?HMLJM ?JILHF ?IL>E FMLMG ?JLJI ?IL>M ?HLKM ?ILGH ?KL>K 总平均 !/&$% $3)"$@) ?MHLG> FGFLHG ?EELJJ ?MHL?K ?MHLKK ?MILF? ?E?L>I F>L?E FILHJ F?LMK F>L?K F>LFH F>LFE F>LEG 注：! 用括号外年份的数据估算各种品种均值，对括号内年份的品种试验均值进行预测（表 H 同）。 P/&)*：! !B) 5$&$ /Q &B) ’)$"* /0& /Q ."$AR)&* 6)") 0*)5 &/ )*&#N$&) 3$"#)&’ N)$4* &/ (")5#A& 3$"#)&’ )S()"#N)4&$% N)$4* #4 &B) ’)$"* #4 ."$AR)&*（&$.%) H #* &B) *$N)）L J 期张群远等：作物品种区域试验中品种均值估计的模型和方法 MMK 万方数据

888 作物学报 20卷平均结果进行预测，其预测差平均为60.92kghm2, 预测差只是预测效果的一个方面，对于区试，还相当于验证均值884kghm2的6.89%，而算术平均要求预侧值的品种排名与后续年份中的表现一致值的预测差平均为113.03kghm2,相当于验证均值这对于品种比较和选择来说更为重要。为此，表4 的12.7%。就这一轮验证来看，WsE估值的预测计算列出了各种估值和验证值的秩相关系数。从表精度高出算术平均值近1倍。不过，预测差明显大中可看出，秩相关系数比1SE有明显提高和降低于ISE的，多数也发生在WSE.估值上。这说明的，多数还是WISE和ISE.两种估值，而且依然 WISE.估值的预测精度比LSE提高或降低的状况不是WLSE的波动大于WLSE的，这一点和预测差的很稳定。正因为如此，从所有轮的总平均来看，WL 情况相似：但是，预测差小的情况下，秩相关系数不 SE。估值的预测差依然大于ISE。WISE也基本类一定高，所有18轮的预测差和秩相关系数的相关系似，但相对而言，预测精度明显提高和降低的情况较数平均只有-0.005，说明二者之间没有明显相关。少。ISE。和IS下则基本上没有顶测精度明显不过，验证试验中用1996年的W1SE估值对1997 比LSE提高或降低的情况。至于BIUP预测值（包 1998三年的平均结果进行预测时，与LSE相比，其括BUPO和BLUPI),在大多轮的验证中都和ISE 预测差从12.77%减小到6.89%的同时，预测值与耳有相同的平均预测差，少数轮有变化，但变化都不验证值的秩相关系数也从0.830提高到0.976。各大。另外，各种估值（包括目前常用的算术平均值）种估值与验证值的秩相关系数平均为0.811 的相对预测弟平均都在0以上，这从一个测面说 0.824,决定系数为0.66-0.68，说明1年的区试尚明，仅根据年的区试结果对品种表现作出估计，准不能很好地反映品种在后续年份表现的相对优劣。确性不高。表4几种品种均值估值与验证值的秩相关系数 Table 4 s and validation data 各种估值与验证值之间的秩相关系数试验类型年份 WLSE 长江春棉 19901991) 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1992(1993】 0.900 0.900 0.600 0.900 0.800 0.900 0.900 10041095】 0700 0700 0.800 0.900 0.700 0.700 1996(1997) 0.571 0.690 0.524 0.57 571 长江春棉（总】 0.7 0.7 0.6 0.761 0 黄河春棉 1985(1986 0.738 0.6 0.738 0.738 0.7538 0.738 I9%8701988 0.476 0.57 0.595 0.476 0.474 0.476 0.47% 19891990 0.905 0.786 0.833 0.905 0.905 0.905 0.905 1991(1992) 0.7% 0.524 0.786 0.786 0.786 0.76 0.78% 1093(1004】 0.40 0.717 0.300 0.400 0.40 0.400 0.400 1995(1996 0.98 0.783 0.95 0.983 0.967 0.983 0.983 黄河春棉（总） 0.715 0.684 0.735 0.715 0.71 0.715 0.715 黄河夏棉 1986(1967 1.00 1.00 1.0m 1988(1989 0.943 0.886 0.829 0.943 0.945 19901991 0.929 0.786 0.929 0.929 0.857 0.929 0.92 19921993) 0.500 0.500 0.300 0.50 0.500 0.500 0.500 黄河夏棉（总） 0.881 0.806 0.821 0.881 0.851 0.881 0.81 验证试险 1006g7.08.09) 0.830 0g76 0.964 0.879 0820 080 1997(96.98.99) 0.915 0.939 0.915 0.915 .915 0 0.915 0.782 0.s06 0.806 996.97,98 003 验证试验） 0D.86 0.876 0.875 0.87 0.864 计 0.817 0.811 0.818 0.824 0.824 0.817 0.817

平均结果进行预测，其预测差平均为 !"#$% &’()*% ，相当于验证均值 ++, &’()*% 的 !#+$-，而算术平均值的预测差平均为 ../#"/ &’()*% ，相当于验证均值的 .%#00-。就这一轮验证来看，12345 估值的预测精度高出算术平均值近 . 倍。不过，预测差明显大于 234 的，多数也发生在 12345 估值上。这说明 12345 估值的预测精度比 234 提高或降低的状况不很稳定。正因为如此，从所有轮的总平均来看，126 345 估值的预测差依然大于 234。12347 也基本类似，但相对而言，预测精度明显提高和降低的情况较少。12344 和 123447则基本上没有预测精度明显比 234 提高或降低的情况。至于 829: 预测值（包括 829:" 和 829:.），在大多轮的验证中都和 234 具有相同的平均预测差，少数轮有变化，但变化都不大。另外，各种估值（包括目前常用的算术平均值）的相对预测差平均都在 %"-以上，这从一个侧面说明，仅根据一年的区试结果对品种表现作出估计，准确性不高。预测差只是预测效果的一个方面，对于区试，还要求预测值的品种排名与后续年份中的表现一致，这对于品种比较和选择来说更为重要。为此，表 , 计算列出了各种估值和验证值的秩相关系数。从表中可看出，秩相关系数比 234 有明显提高和降低的，多数还是 12345 和 12347 两种估值，而且依然是 12345 的波动大于 12347 的，这一点和预测差的情况相似；但是，预测差小的情况下，秩相关系数不一定高，所有 .+ 轮的预测差和秩相关系数的相关系数平均只有 ; "#""?@ABC 年份 D5A?C 各种估值与验证值之间的秩相关系数 7AE& FG??5BAH@GE FG5II@F@5EHC J5HK55E 5CH@*AH5C AEL MAB@LAH@GE LAHA 234 12345 12347 12344 123447 829:" 829:. 长江春棉 .$$（" .$$.） .#""" .#""" .#""" .#""" .#""" .#""" .#""" .$$（% .$$/） "#$"" "#$"" "#!"" "#$"" "#+"" "#$"" "#$"" .$$（, .$$<） "#0"" "#0"" "#+"" "#$"" "#$"" "#0"" "#0"" .$$（! .$$0） "#<0. "#!$" "#<%, "#<0. "#<0. "#<0. "#<0. 长江春棉（总） "#0/0 "#0$0 "#!$" "#0!. "#0,$ "#0/0 "#0/0 黄河春棉 .$+（< .$+!） "#0/+ "#!,/ "#0/+ "#0/+ "#0/+ "#0/+ "#0/+ .$+（0 .$++） "#,0! "#<0. "#<$< "#,0! "#,0! "#,0! "#,0! .$+（$ .$$"） "#$"< "#0+! "#+// "#$"< "#$"< "#$"< "#$"< .$$（. .$$%） "#0+! "#<%, "#0+! "#0+! "#0+! "#0+! "#0+! .$$（/ .$$,） "#,"" "#0.0 "#<"" "#,"" "#,"" "#,"" "#,"" .$$（< .$$!） "#$+/ "#0+/ "#$<" "#$+/ "#$!0 "#$+/ "#$+/ 黄河春棉（总） "#0.< "#!+, "#0/< "#0.< "#0.. "#0.< "#0.< 黄河夏棉 .$+（! .$+0） .#""" .#""" .#""" .#""" .#""" .#""" .#""" .$+（+ .$+$） "#$,/ "#++! "#+%$ "#$,/ "#$,/ "#$,/ "#$,/ .$$（" .$$.） "#$%$ "#0+! "#$%$ "#$%$ "#+<0 "#$%$ "#$%$ .$$（% .$$/） "#<"" "#<"" "#/"" "#<"" "#<"" "#<"" "#<"" 黄河夏棉（总） "#++. "#+"! "#+%. "#++. "#+<. "#++. "#++. 验证试验 .$$（! $0，$+，$$） "#+/" "#$0! "#$!, "#+0$ "#$/$ "#+/" "#+/" .$$（0 $!，$+，$$） "#$.< "#$/$ "#$.< "#$.< "#$.< "#$.< "#$.< .$$（+ $!，$0，$$） "#+"! "#0// "#0+% "#+"! "#0$, "#+"! "#+"! .$$（$ $!，$0，$+） "#$"/ "#+<< "#+/" "#$"/ "#$"/ "#$"/ "#$"/ 验证试验（总） "#+!, "#+0! "#+0/ "#+0! "#+++ "#+!, "#+!, 总计 "#+.0 "#+.. "#+.+ "#+%, "#+%, "#+.0 "#+.0 +++ 作物学报 %$ 卷万方数据

6期张群远等：作物品种区域试验中品种均值估计的模型和方法 889 表5 几种品种均值酷值之间的相关系数（上）和秩相关系数（下） Table 5 Correlation coefficients(above)and rank correlation coefficients(below)between several variety mean estimates WLSE WLSE. 0843 0.868 WLSEa 0.948 0.80e 0.957 8 WLSE 0.99 0.99% 8 0.99 BLUPO % 0.9 BLUPI 0.s68 0.957 0.998 另外，各种估值之间的相关系数和秩相关系数点”有关。由此看来，以后需进一步研究的问题，似 (见表5)都较大，除WISE,以外，各种估值间的两种乎不应该是“哪种估值更好？”，而应该是“哪种估值相关系数均在0.93以上，其中1SE、BIID和H1D 更适合于哪种数据？”。至于数据的特点，包括各项间的秩相关系数为1，这是因为BUP只是对品种效变异（尤其误差）的大小，异常值的多少，误差的同质应进行收缩，但不改变其相对大小顺序的缘故。性、独立性和正态性等许多方面，需要借助更多的数 WSE和其他各种估值的相关较低一点，两种相关据资科（包括更多年份的连续试验资料和数学模拟系数均在0.806-0.890之间。数据)来研究。本文的研究是基于平衡数据的，因为目前我国 3讨论区试中大部分数据是平衡的，而且，从实际应用的角综合以上分析可以看出，与算术平均值（即S 度出发，平衡数据便于计算。对于非平衡数据，计算估计)相比，BP对品种均值的预测效果基本上没量较大，有待进一步探讨。有变化：WMsE类估计中，主要是WISE,的预测效果和LSE不一致。这意味着，除WSE以外的其他几附录区试平衡数据的各种品种均值种方法不易获得预测效果明显优于算术平均值的估估计方法的公式推导计。不过，WSE.的预测效果是否优于算术平均值也难以一概而论将区试观测值模型写成品种i在环境中的，本研究从混合线性模型的角度总结出了一系列次重复均值了的形式：区试品种均值的估计方法。尽管在实际数据的验证 Yi=u gi ei++E (附1) 中没有发现哪种方法绝对的优于算术平均值，但至 ,为，次重复均值对应的误差，其余符号含义少表明，对某些轮的数据而言，确实存在着比算术平与正文中(1)式相同。采用sae等表示法)，上式均值更“好”的估值，而是最有“希塑”的可表示为：种。WE利用各试点试验误差的倒数进行加权计 Y=(1.⑧1，)u+(L1，)g+(1.⑧1)e 算，这意味着，若某试点的试验误差越大，其数值对 +(L.1.)0+(I.I.DE (附2) 品种总均值的贡献就越小，我们对该试点试验结果 Y为了，构成的观测值向量，g、e、6、s分别为的相信程度”就越低，这与我们的一般直觉也是吻，效应构成的向量，为品种数，s为环境合的，可以解释为什么WSE估值有时比算术平均数。以1，表示n个元素均为1的向量：以L,表示值具有更好的预测效果。然而，另一方面，对于一些对角线元素为1，其余元素为0的n×n的单位矩轮的数据来说，WLSE.预测效果与算术平均值的相阵：以J。表示所有元素均为1的n×n的矩阵：以差不大或者反而明显比算术平均值差，这意味着， A☒B表示矩阵A中的每一个非0元素均扩展为该 WSE估值预嫩果的好坏，可能与不同的数据“特元素与矩阵B的乘积矩阵，其余元素则以0填充

表 ! 几种品种均值估值之间的相关系数（上）和秩相关系数（下） "#$%& ! ’())&%#*+(, -(&..+-+&,*（/ #$(0&）#,1 )#,2 -())&%#*+(, -(&..+-+&,*（/ $&%(3）$&*3&&, /&0&)#% 0#)+&*4 5&#, &/*+5#*&/ !"# $!"#% $!"#& $!"## $!"##& ’!()* $!"#% *+,-. *+,/, $!"#& *+0-, *+,*/ *+012 *+,0* $!"## *+000 *+,-1 *+0-0 *+00, *+,2. *+0/3 $!"##& *+000 *+,., *+01. *+000 *+00* *+,21 *+0/, *+00. ’!()* *+000 *+,-* *+0-, *+000 *+00, 4+*** *+,/, *+012 *+00, *+00* ’!()4 *+0,3 *+,3. *+0.3 *+0,4 *+0,4 *+0,0 4+*** *+,/, *+012 *+00, *+00* 4+*** 另外，各种估值之间的相关系数和秩相关系数（见表 1）都较大，除 $!"#% 以外，各种估值间的两种相关系数均在 *+0. 以上，其中 !"#、’!() 和 ’!()4 间的秩相关系数为 4，这是因为 ’!() 只是对品种效应进行收缩，但不改变其相对大小顺序的缘故。 $!"#% 和其他各种估值的相关较低一点，两种相关系数均在 *+,*/ 5 *+,0* 之间。 6 讨论综合以上分析可以看出，与算术平均值（即 !"# 估计）相比，’!() 对品种均值的预测效果基本上没有变化；$!"# 类估计中，主要是 $!"#% 的预测效果和 !"# 不一致。这意味着，除 $!"#% 以外的其他几种方法不易获得预测效果明显优于算术平均值的估计。不过，$!"#% 的预测效果是否优于算术平均值，也难以一概而论。本研究从混合线性模型的角度总结出了一系列区试品种均值的估计方法。尽管在实际数据的验证中没有发现哪种方法绝对的优于算术平均值，但至少表明，对某些轮的数据而言，确实存在着比算术平均值更“好”的估值，而 $!"#% 是最有“希望”的一种。$!"#% 利用各试点试验误差的倒数进行加权计算，这意味着，若某试点的试验误差越大，其数值对品种总均值的贡献就越小，我们对该试点试验结果的“相信程度”就越低，这与我们的一般直觉也是吻合的，可以解释为什么 $!"#% 估值有时比算术平均值具有更好的预测效果。然而，另一方面，对于一些轮的数据来说，$!"#% 预测效果与算术平均值的相差不大或者反而明显比算术平均值差，这意味着， $!"#% 估值预测效果的好坏，可能与不同的数据“特点”有关。由此看来，以后需进一步研究的问题，似乎不应该是“哪种估值更好？”，而应该是“哪种估值更适合于哪种数据？”。至于数据的特点，包括各项变异（尤其误差）的大小，异常值的多少，误差的同质性、独立性和正态性等许多方面，需要借助更多的数据资料（包括更多年份的连续试验资料和数学模拟数据）来研究。本文的研究是基于平衡数据的，因为目前我国区试中大部分数据是平衡的，而且，从实际应用的角度出发，平衡数据便于计算。对于非平衡数据，计算量较大，有待进一步探讨。附录区试平衡数据的各种品种均值估计方法的公式推导将区试观测值模型写成品种 ! 在环境 " 中的 # 次重复均值!$!"的形式： !$!" 6 ! 7 %! 7 &" 7"!" 7#!" （附 4） #!"为 # 次重复均值对应的误差，其余符号含义与正文中（4）式相同。采用 "%89:% 等表示法［2］，上式可表示为： ! 6（"’ " "(）! 7（#’ " "(）$ 7（"’ " #(）% 7（#’ " #(）! 7（#’ " #(）" （附 3） ! 为!$!" 构成的观测值向量，$、%、!、" 分别为 %!、&"、"!"、#!"效应构成的向量，’ 为品种数，( 为环境数。以 ") 表示 ) 个元素均为 4 的向量；以 #) 表示对角线元素为 4，其余元素为 * 的 ) ; ) 的单位矩阵；以 &) 表示所有元素均为 4 的 ) ; ) 的矩阵；以 ’"( 表示矩阵 ’ 中的每一个非 * 元素均扩展为该元素与矩阵 ( 的乘积矩阵，其余元素则以 * 填充。 / 期张群远等：作物品种区域试验中品种均值估计的模型和方法 ,,0 万方数据

890 作物学报 29卷 1品种效应固定时品种均值的最佳线性无 (c)若e,随机，各环境中的误差方差为a 偏估计(BLUE) 此时，V,的构成中还包括环境方差以及 GE互作方差o,即V=L,(+a+),与（附把（附2）式中g的每个元素加上红，即得到品种 6)式同理均值向量4。，（附2）式可改写为： Y=(L⑧1，)4.+(1.⑧1，)e 产=∑ +++a+ +(L,©1，)6+(L,⑧L)e(附3) (附9) 4,即为品种均值4k)=μ+g:构成的向量。此估值也是一种加权最小二乘估计，记为M 由于k为固定效应，由广义最小二乘方程组可 SEe。若同质，上式即为算术平均。获得4，的估计： (D)若e,随机，其余同(B) 4.g=[(L.@1yv-1(L.®1.] 此时，(B)的V,中还将包括环境方差，即 (L,®1，V1Y (附4) =1(i+),所以在此，假定品种效应是相互独立的，所以不同品 s、Y 1 (附10) 种的观测值可以独立进行矩阵运算。记与品种i有在0=+减六t 关的观测值向量为Y,对应V中的分块矩阵为此估值也是加权最小二乘估计，记为WSE V,则根据（附4）式可得到品种i的均值的估计式若)同质，则相当于算术平均。为： 2品种效应随机时品种均值的最佳线性无 =y(V)Y (1,y(Vo)1, (附5) 偏预测(BLUP) (A)若e固定，环境j中的误差方差为若品种效应g,随机，则需求出% =以+g的此时，V()=I,o则： BLUP预测值来估计品种均值。若直接根据混合线 w 性模型方程组来推导平衡数据下计算：+g:的 BLUP的简式比较困难，在此利用一等价公式(Searle (附6) 等，1992)： BLUP(w)=L'b+CV(Y -X6) 此估值为加权最小二乘估值(weighted least (附11) squares estimate,WLSE),即以环境内误差方差倒数加其中W为需要估计的固定效应与随机效应之权的品种平均值，记为E。和的向量，Lb°为w中固定效应的线性组合部分若各环境中的误差方差同质，即。=。2，则（附 C为w与Y的协方差阵，b°为固定效应的广义最小 6)式可简化为：二乘估计。对于品种效应随机时品种均值，= μ+g来说： (附7) BLUP4）=a°+CV(Ye)-1,) 此即为算术平均值，其实质是非加权的最小 (附12) 乘估值(least squares estimate),i记为LSE。 (1yv-Y (B)若固定，GE互作和误差均看作主效以外的随机剩余效应，环境j中的剩余方差记为 (附13) 此时，V()=I¤)，把（附6）式中的o替换为 C)、V,和Y,为对应品种i的参数与观测值 )可得到：的协差阵、观测值的方差协差阵以及观测值向量。 (E)若©固定，各环境中的误差方差同质（即 (附8) 台台p 0=2) 此即为以环境内剩余方差倒数加权的品种平均此时，V=J,o元+1，(o+o2),C=1o元值，记为率据同质，则相当于算术平均。据（附12）式有：

! 品种效应固定时品种均值的最佳线性无偏估计（"#$%）把（附 !）式中 ! 的每个元素加上!，即得到品种均值向量!!，（附 !）式可改写为： " "（#" ! $#）!! #（$" ! ##）% #（#" ! ##）" #（#" ! ##）# （附 $） !! 即为品种均值!（% $） "! # !$ 构成的向量。由于!（% $）为固定效应，由广义最小二乘方程组［&］可获得!! 的估计： ! !! "［（#" ! $#）’&( （) #" ! $#）］() （#" ! $#）’&() " （附 *）在此，假定品种效应是相互独立的，所以不同品种的观测值可以独立进行矩阵运算。记与品种 $ 有关的观测值向量为 "（$），对应 % 中的分块矩阵为 &（$），则根据（附 *）式可得到品种 $ 的均值的估计式为： ! !!（$） " （$#）’ （&（$））() "（$）（$#）’ （&（$））() $# （附 +）（,）若 &’ 固定，环境 ’ 中的误差方差为"! ’ 此时，&（$）" #"# ! ’，则： ! !!（$）" （$#）’ （#"# ! ’）() "（$）（$#）’ （#"# ! ’）() $# " " # ’ " ) #"$’ "! ’ " # ’ " ) ) "! ’ （附 -）此估值为加权最小二乘估值（./0%12/3 4/562 67859/6 /620:52/，;），即以环境内误差方差倒数加权的品种平均值，记为 ;/。若各环境中的误差方差同质，即"! ’ ""! ，则（附 -）式可简化为： ! !!（$） " ) # " # ’ " ) #($’ " #($ （附 &）此即为算术平均值，其实质是非加权的最小二乘估值（4/562 67859/6 /620:52/），记为。（?）若 &’ 固定，@> 互作和误差均看作主效以外的随机剩余效应，环境 ’ 中的剩余方差记为"! A（’）此时，&（$）" #"# ! A（’），把（附 -）式中的"! ’ 替换为 "! A（’）可得到： ! !!（$） " " # ’ " ) #"$’ "! A（’） " # ’ " ) ) "! A（’）（附 B）此即为以环境内剩余方差倒数加权的品种平均值，记为 ;A，若"! A（’）同质，则相当于算术平均。（C）若 &’ 随机，各环境中的误差方差为"! ’ 此时，&（$）的构成中还包括环境方差"! > 以及 @> 互作方差"! @>，即 &（$）" #（# "! > #"! @> #"! ’ ），与（附 -）式同理 ! !!（$）" " # ’ " ) #($’ "! > #"! @> #"! ’ " # ’ " ) ) "! > #"! @> #"! ’ （附 D）此估值也是一种加权最小二乘估计，记为 ;>。若"! ’ 同质，上式即为算术平均。（F）若 &’ 随机，其余同（?）此时，（?）的 &（$）中还将包括环境方差"! >，即 &（$）" #（# "! > #"! A（’）），所以 ! !!（$）" " # ’ " ) #($’ "! > #"! A（’） " # ’ " ) ) "! > #"! A（’）（附 )G）此估值也是加权最小二乘估计，记为 ;>A。若"! A（’）同质，则相当于算术平均。 & 品种效应随机时品种均值的最佳线性无偏预测（"#$’）若品种效应 !$ 随机，则需求出!$ "! # !$ 的 ?）若 &’ 固定，各环境中的误差方差同质（即 "! ’ ""! ）此时，&（$） " ,"# ! @ # #（# "! @> #"!），*（$） " $’ #"! @。据（附 )!）式有： BDG 作物学报 !D 卷万方数据

!"#$ （!!）% ! & ’（!( "" ) *）［""" ) * ’ #（" ") *+ ’") ）］, （- $（!） , !!" & ）（附 -.）与（附 /）、（附 0）式的同理，根据（附 -1）式可得出，误差同质情况下，试验总均值! & 的广义最小二乘估计即为算术平均值，即 ! & % - #"! # ! % - ! " $ % - %!$ % "% （附 -2）另外，根据下面的求逆公式［0］（&#’ ’ ("’）,- % - & #’ , ( & ’ ’( ( "’ ) （附 -/）可得到［""" ) * ’ #（" ") *+ ’") ）］,- % - ") *+ ’") #" , ") * ") ’") *+ ’ "" ) * ( "" ) （附 -0）所以［! ( "" ) ［* """ ) * ’ #（" ") *+ ’") ）］,- % ! ( " ") * ") ’") *+ ’ "" ( ) ) * （附 -3）把（附 -2）和（附 -3）式代入（附 -.）式，可得到 !"#$ （!!）% "% ’ ") * ") 4" ’") *+ 4" ’" ( ) ) * （"%! , "%）（附 -5）此即为品种效应随机，环境效应固定时的品种均值的 !"#$ 预测值，记作 !"#$&。（6）若 )$ 随机，且各环境中的误差方差同质此时，%（!）% """ ) * ’ #（" ") + ’") *+ ’")），而 &（!）同（+）。类似（附 -5）式推导，可得到： !"#$ （!!） % "% ’ ") * ") 4" ’") *+ 4" ’") + 4" ’" ( ) ) * （"%! , "%）（附 )&）此即为品种和环境效应随机时，品种均值的 !"#$ 预测值，记作 !"#$-。 !"#"$"%&"’ ［-］ *789: ; *7>?@>?97A BC7AD@?@ EF GHI?EC7A J?HAK LM?7A@:H YMHK?9>?QH 7998M79D EF 7M?>:XH>?9 XH7C@ 7CK !"#$@ 7CK BZZ[ H@>?X7>H@ ?C MHI?EC7A 9MEY >M?7AH@ 6，WE9:M7C \ *@HK Q@^ 8COH?I:>HK XH7C YHMFEMX7C9H EF Q7M?H>?H@ 79ME@@ HCQ?MECXHC>@HK XH7C@ 7MH 8CCH9H@@7MD ?C 98A>?Q7M YHMFEMX7C9H >M?T 7A@?EC EF "?CH7M ZEKHA（@ 线性模型的理论及应用）?EC $MH@@，-530 ［0］ =H7MAH = G，W7@HAA7 *，Z9W8AAE9: W +@ A?CH7M 8Cb?7@HK H@>?X7>?EC 7CK YMHK?9>?EC 8CKHM 7 @HAH9>?EC XEKHA7>?@>?97A 7@YH9>@ EF Y7M>?>?EC?CI IHCE>DYHTHCQ?MECT XHC>7A 9EXYECHC>@ EF Q7M?7b?A?>D< 9).):!,;，-50)，)5：)10—).2 / 期张群远等：作物品种区域试验中品种均值估计的模型和方法 35- 万方数据

作物品种区域试验中品种均值估计的模型和方法--算术平均值、加权最小二乘估值和BLUP的比较作者：张群远，孔繁玲，杨付新作者单位：张群远,孔繁玲(中国农业大学植物遗传育种系,北京,100094)，杨付新(中国农业科学院棉花研究所,河南安阳,455112) 刊名：作物学报英文刊名： ACTA AGRONOMICA SINICA 年，卷(期)： 2003，29(6) 引用次数： 0次参考文献(9条) 1.GauchHG Statistical Analysis of Regional Yield Trials 1992 2.张群远.孔繁玲.杨付新品种区域试验中算术平均值、 BLUP和AMMI估值的精度比较[期刊论文]-作物学报 2001(4) 3.Yates F.Cochran W G The analysis of groups of experiments 1938 4.Bernardo R Weighted vs. unweighted mean performance of varieties across environments 1992 5.Huhn M Weighted means are unnecessary in cultivar performance trials 1997 6.王松桂线性模型的理论及应用 1987 7.Searle S R.Casella G.McCulloch C E Variance Components 1992 8.Henderson C R Best linear unbiased estimation and prediction under a selection model 1975 9.Shukla G K Some statistical aspects of partitioning genotype-environmental components of variability 1972 相似文献(3条) 1.期刊论文张群远.孔繁玲作物品种区域试验中品种均值的Bayes估计 -中国农业大学学报2001,6(3) 本研究根据Bayes统计原理,提出作物品种区域试验中品种均值的Bayes估计方法;并利用一套包含4年、7个试点和10个棉花品种的多年多点试验对 Bayes估值和算术平均值的预测精度进行比较.结果表明,Bayes估值和算术平均值的平均预测差分别为6.88%和12.77%;而且Bayes估值与验证值之间在数值和品种排序上都有着更高的相关,相关系数分别达0.963和0.976,高于算术平均值的0.876和0.830;Bayes估值显示出比算术平均值更高的预测精度. 2.期刊论文张群远.孔繁玲.杨付新品种区域试验中算术平均值、 BLUP和AMMI估值的精度比较 -作物学报 2001,27(4) 利用1982年以来我国棉花、小麦、水稻和玉米的60套区域试验数据，采用交叉验证方法，对区域试验中算术平均值、最佳线性无偏预测值(best linear unbiased predictor, BLUP)和AMMI(additive main effects and multiplicative interaction)模型估值的预测精度进行比较，结果表明，与算术平均值相比， AMMI估值精度的增益倍数(gain factor, GF)平均为1.045，变幅为0.963～1.414，其精度多数情况下提高不大； BLUP的GF平均为 1.170，变幅为1.008～1.619，其精度普遍较高。同时，文中对3种估值的模型作了论述和比较。 3.期刊论文张群远.孔繁玲作物品种区域试验统计分析模型的比较 -中国农业科学2002,35(4) 通过对作物品种区域试验中有关品种×环境组合均值估计的主要统计分析模型进行概述和比较,改进提出LR-PCA复合模型,并通过数据实例的交叉验证对各种模型的预测精度进行比较.结果表明,各种模型的精度顺序为LR-PCA复合模型>AMMI模型>PCA模型>处理均值模型>回归模型>ANOVA加性主效模型;LRPCA复合模型的预测精度是算术平均值的1.55倍,比AMMI模型的精度提高了8.4%.最后对LR-PCA模型的应用问题作了讨论. 本文链接：http://d.g.wanfangdata.com.cn/Periodical_zuowxb200306015.aspx 下载时间：2010年3月5日