第29卷第6期 作物学报 Vol 29,No 6 2003年11月884-891页 ACTA AGRONOMICA SINICA p884-891ow.,203 作物品种区域试验中品种均值估计的模型和方法 一算术平均值、加权最小二乘估值和BLUP的比较 张群远孔繁玲,·杨付新 (1中国农业大学植物遗传育种系,北京10094:2中国农业科学院棉花研究所,河南安阳455112) 摘要针对作物区域试验中的品种均值估计问题,根据混合线性模型的一般原理,总结和提出多种加权最小二乘估计 (WSE)和最佳线性无偏预测(BLP)的方法,推导了这些方法的平衡数据计算简式:同时,利用14套2年多点的棉花区 试资料和一套4年多点的棉花品 试验对这些方法的预测效果进行验证比较。结果表明 ,与算术平均值相比,以环境内 误差方差倒数加权的WSE估值的预测精度(包括预测差的大小和品种排名的一致性)明显不同,但其高低因数据而异 其他WLSE估值以及BHUP的预测结果差别不大,和算术平均值以及相互间的相关系数和秩相关系数均在0,93以上。 关健词区域试验:算术平均值:加权最小二乘估计:P 中图分类号:0212 文南献标识马:A Models and Methods for Estimating Variety Means in Regional Crop Trials -Comparisons of Arithmetic Mean,Weighted Least Squares Estimates and BLUPs ZHANG Qun-Yuan'KONG Fan-Ling'YANG Fu-Xin g,Ha455112,ia) Abstract Based on the mixed linear model,several weighted least squares estimates(WISEs)and best linear unbiase predictors(BLUPs)were summarized and proposed for estimating variety means in regional crop trials,and the correspond- ing calculating fomle were derived and presented for balanced data.The daa of 14 oundsof2-year-muli-loction gional cotton trials and a 4-year-multi-location cotton trial were used to compare the predictive efficiencies of arithmeti means,WISEs and BLUPs.The results showed that the predictive differences and variety ranks of the WISE weighted by within env ents(WISEe)differed significantly from that of the arithmetic eans,but the predictive accuracy of WISEe increased or decreased iregularly in different trials:the predictive results of other WLSEs and BLUPs were similar to that of the arithmetic means,the correlation coefficients and rank correlation coefficients betweer them were all above 0.93 Key words Regional trial:Arithmetic mean:Weighted least squares estimate:BLUP:Prediction 作物品种区域试验(简称区试)中,品种×环境 用我国区试数据,对品种×环境组合均值的几种主 组合均值(即某品种在某参试环境中的性状均值)和 要估计方法作过比文2知,本文则专门深讨区试中品 品种均值(即某品种在所有参试环境中的性状均值) 种均值估计的模型和方法问题,并利用我国区试数 是两种最基本的统计数,是分析和评价品种的主要 据和专设的多年多点试验数据对名种方法的精度作 依据。通常,它们都由算术平均的方法获得,但算术 比较,旨在为区试中品种均值估计方法的选择或改 平均值不一定是最精确的估值2]。张群远等曾利 讲作探素。 基金项目:家自然科学基金资助项目(307043) 作者荷介:张群远(1970: ,男,云南宜成人,博士,副教授,研究方向:生物统计学和统计遗传学。·通讯作者:孔繁玲,女,教授,博士生导
!"#$%&,’"$( ))$ **+ , *&- ’".$,%//0 作 物 学 报 1231 1456’67821 98’821 第 %& 卷 第 ( 期 %//0 年 -- 月 **+ , *&- !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 页 作物品种区域试验中品种均值估计的模型和方法 ———算术平均值、加权最小二乘估值和 !"#$ 的比较 张群远- 孔繁玲-," 杨付新% (-中国农业大学植物遗传育种系,北京 -///&+;%中国农业科学院棉花研究所,河南安阳 +::--%) 摘 要 针对作物区域试验中的品种均值估计问题,根据混合线性模型的一般原理,总结和提出多种加权最小二乘估计 (;?@+0(* 1*-23+-(* +,’ !"#$* BC1’4 DEFGHEIF - J6’4 KIFG :$(3,?"($( +::--%,45.($) ;A*-0+IOPQ "F RSP TLUPQ #LFPIV T"QP#,OP.PVI# WPLMSRPQ #PIOR OXEIVPO PORLTIRP(O ;<?@;@VPQLZRL"F 作物品种区域试验(简称区试)中,品种 _ 环境 组合均值(即某品种在某参试环境中的性状均值)和 品种均值(即某品种在所有参试环境中的性状均值) 是两种最基本的统计数,是分析和评价品种的主要 依据。通常,它们都由算术平均的方法获得,但算术 平均值不一定是最精确的估值[-,%] 。张群远等曾利 用我国区试数据,对品种 _ 环境组合均值的几种主 要估计方法作过比较[%] ,本文则专门探讨区试中品 种均值估计的模型和方法问题,并利用我国区试数 据和专设的多年多点试验数据对各种方法的精度作 比较,旨在为区试中品种均值估计方法的选择或改 进作探索。 #基金项目:国家自然科学基金资助项目(0//‘/+00)。 作者简介:张群远(-&‘/ a ),男,云南宣威人,博士,副教授,研究方向:生物统计学和统计遗传学。" 通讯作者:孔繁玲,女,教授,博士生导 师,3P#:(%*&00&‘。 5PZPL.PQ万方数据 (收稿日期):%//%G/&G/:,1ZZP)RPQ(接受日期):%//%G--G-%A
6期 张群远等:作物品种区域试验中品种均值估计的模型和方法 885 1材料与方法 阵:©为误差向量,通常假设其均值为0,具有方差协 差阵R:I为单位矩阵。通过广义最小二乘方程组 1.1品种均值估计的模型和方法 和混合模型方程组可获得固定效应b的最佳线性 作物品种区试是在多环境中实施同一套试验方 无偏估计(best linear unbiased estimate,BLUE)以及随 案,其品种均值的估计属于多套试验的合并分析问 机效应u的最佳线性无偏预测值(best linear unbi- 颗。以往的研究或应用中,除算术平均外,品种均伯 ased prediction BLUP- 估计的其他一些方法基本上是基于加权平均的思 估计品种均值,就是要估计(1)式中的总均值: 想,所采用的权”有误差方差倒数、环境内剩余方差 与品种效应g:之和。以通常为固定效应,包含在 倒数、环境内遗传力、与参照环境的距离的倒数 (2)式的b中::若为固定效应,也包含在b中,若 等)。这些加权方法是经验性的,缺乏完整的统 为随机效应,则包含在“中,所以品种均值的估计 计学依据,为此,本文利用混合线性模型的理论来统 受方差协差阵G和R的影响。G和R的构成是由 一阐述品种均值估计方法。 不同效应的固定或随机以及误差方差的同质或异质 区试中第:个品种在第个环境中的第k次重 的假设来决定的,不同假设下G和R的组成不同 复观测值的线性模型可写为: 由此也就产生了品种均值的不同估计方法。品种效 送=+g:+e;+0+e话 (1) 应固定假设下得到的品种均值为BUE:品种效应随 为观测值的总体均值:g:为第个品种的效 机假设下得到的品种均值为BUP。 应:为第j个环境的效应:0,为第i个品种与第j 考虑到计算和应用的方便,本文附录中对)个 个环境的基因型×环境(GE)互作效应:E为第i个 品种、个环境的平衡数据,以次重复均值为基 品种在第个环境中的第k次重复观测值的误差。 础,推导了混合模型的几种主要假设下品种均值的 上式也可表达为更为一般的混合线性模型6的矩 计算简式。将附录中各公式的误差方差(。2和。) 阵形式: 替换成单个观测值的误差方差除以重复数,的形式 Y Xb Zu le (/r和)/r),即可得到品种均值的各种估算公 Y为观测值向量:b为固定效应向量:X为固定 式,列于表1。表中:均为固定效应,误差均为随材 效应的系数矩阵:为随机效应向量,通常假设其均 效应:表示环境j内的误差方差:误差同质(或 值为0,具有方差协差阵G:Z为随机效应的系数矩 异质)指各环境中的试验误差方差同质(或异质):剩 表1混合线性模型几种主要假设下品种均值估值的名称及平衡数据计算简式 Table 1 Calculating formule for balanced data under several main of mixed linear model 模型假设 估值类型 品种的均值计算式 Types ofe 品种和环境圆定,误差同质 最小二乘估计(算术平均) 品种和环境定,误差异质 加权最小二乘估计 品会 品种和环境固定,剩余方差异质 加权最小二乘估计 WLSE 会高 小二乘估计 品种因定,环墙随机,利金方差异而 加权最小二乘估计 / WLSE 2+合+ 品种和环境随机,误差同质 最佳线性无偏预测 P四I 了+e+i+-D
! 材料与方法 !"! 品种均值估计的模型和方法 作物品种区试是在多环境中实施同一套试验方 案,其品种均值的估计属于多套试验的合并分析问 题。以往的研究或应用中,除算术平均外,品种均值 估计的其他一些方法基本上是基于加权平均的思 想,所采用的“权”有误差方差倒数、环境内剩余方差 倒数、环境内遗传力、与参照环境的距离的倒数 等[! " #] 。这些加权方法是经验性的,缺乏完整的统 计学依据,为此,本文利用混合线性模型的理论来统 一阐述品种均值估计方法。 区试中第 ! 个品种在第 " 个环境中的第 # 次重 复观测值的线性模型可写为: $!"# $ ! % %! % &" %"!" %#!"# (&) !为观测值的总体均值;%! 为第 ! 个品种的效 应;&" 为第 " 个环境的效应;"!" 为第 ! 个品种与第 " 个环境的基因型 ’ 环境(())互作效应;#!"# 为第 ! 个 品种在第 " 个环境中的第 # 次重复观测值的误差。 上式也可表达为更为一般的混合线性模型[*,+]的矩 阵形式: ! $ "# % $% % !& (,) ! 为观测值向量;# 为固定效应向量;" 为固定 效应的系数矩阵;% 为随机效应向量,通常假设其均 值为 -,具有方差协差阵 ’;$ 为随机效应的系数矩 阵;!为误差向量,通常假设其均值为 -,具有方差协 差阵 (;& 为单位矩阵。通过广义最小二乘方程组 和混合模型方程组可获得固定效应 # 的最佳线性 无偏估计(./01 234/56 74.350/8 /013951/,:;6/83?13@4 :;13@40 34 9@8/2 估值类型 EF>/0 @D /013951/0 品种 ! 的均值计算式 G52?725134H D@69725/ D@6 1I/ ! 1I J563/1F 9/54 品种和环境固定,误差同质 K563/13/0 548 /4J36@49/410 D3L/8 /66@60 I@9@2@H@70 最小二乘估计(算术平均) ;M)(5631I9/13? 9/54) & ( ! ( " $ & "$!" 品种和环境固定,误差异质 K563/13/0 548 /4J36@49/410 D3L/8 /66@60 I/1/6@2@H@70 加权最小二乘估计 N;M)/ ! ( " $ & "$!" $, (/ ")C) ! ( " $ & & $, (/ ")C) 品种和环境固定,剩余方差异质 K563/13/0 548 /4J36@49/410 D3L/8 6/038752 J56354?/0 I/1/6@2@H@70 加权最小二乘估计 N;M)O ! ( " $ & "$!" $, O(") ! ( " $ & & $, O(") 品种固定,环境随机,误差异质 K563/13/0 D3L/8,/4J36@49/410 6548@9 /66@60 I/1/6@2@H@70 加权最小二乘估计 N;M)) ! ( " $ & "$!" $, ) %$, () %$, (/ ")C) ! ( " $ & & $, ) %$, () %$, (/ ")C) 品种固定,环境随机,剩余方差异质 K563/13/0 D3L/8,/4J36@49/410 6548@9 6/038752 J56354?/0 I/1/6@2@H@70 加权最小二乘估计 N;M))O ! ( " $ & "$!" $, ) %$, O(") ! ( " $ & & $, ) %$, O(") 品种随机,环境固定,误差同质 K563/13/0 6548@9,/4J36@49/410 D3L/8 /66@60 I@9@2@H@70 最佳线性无偏预测 :;<A- "$ % $, ( $, ( %$, ()C( %$, / C() ("$! P"$) 品种和环境随机,误差同质 K563/13/0 548 /4J36@49/410 6548@9 /66@60 I@9@2@H@70 最佳线性无偏预测 :;<A& "$ % $, ( $, ( %$, )C( %$, ()C( %$, / C() ("$! P"$) * 期 张群远等:作物品种区域试验中品种均值估计的模型和方法 BB# 万方数据
886 作物学报 20卷 余方差指环境内互作和误差的混合方差:)为环 的习惯做法(即品种固定)不太一致,但也有其合理 境j内的GE互作和误差的混合方差:、、g品和 性。 分别指基因型、环境、GE互作以及误差的方差:s 1.2数据来源和试验方案 和,分别指环境数和环境内重复数,其余符号含义 见附录。 为比较表1中各种估值的统计精度,采用两类 从表1可看出,品种效应固定时的某品种均值 数据进行分析。一类是我国区试历史数据,即长江 的估计,都是加权平均值,而“权”就是对应模型假定 流域春棉1990~1997年,黄河流域春棉1986~1996 下品种i在环境j中的算术平均值了自身方差的倒 年以及黄河流域夏棉1986~1993年每2年为1轮的 区试资料(简称为区试数据):另外,考虑到以上区试 数,这意味着某环境中各个了自身的变异越小,其 的年份数只有2年,对于进行较长年份的预测效果 值对品种均值的贡献越大。品种效应随机时的品种 分析来说有一定局限,还采用了一套专设的4年多 均值的BP值,则是一种“收缩”的预测值,相当于 点的品种试验数据(简称专设试验数据)。该试验洗 用对应模型假定下品种均值的重复力对品种效应进 择建国以来黄河流域具有代表性的10个棉花品种, 行收缩”。若品种均值的重复力越小,对试验中的 连续进行了4年的4~6个地点的试验(表2),各点 品种表型效应估值(即了-Y)就越持“谨慎”态度, 次均采用随机完全区组设计,3~4次重复,3行区 也就是根据表型值对品种进行选择后获得的期望的 小区面积20m,种植管理和性状考察按国家区试标 遗传进展越小,这与我们的实际经验是吻合的。从 准进行。以上两类资料均采用皮棉产量,单位为kg 这一个角度看,尽管品种随机的假设与我们区试中 hm2。 表2 4年多点棉花品种验证试验的设置 Table 2 Inforr ation of the-yeami-ocatio cotto trial for validation 参试点 重复数 参试品种 19%6 沧州安阳西华临清 4 岱15,徐州1818,徐州142,鲁棉1号,鲁棉6 197 沧州安阳西华临清菏泽 3 号,冀棉8号,中棉所12号(种质库原种),中 198 沧州安阳西华临清荷泽运城 3 棉所12号CK(目前生产用种),中棉所19 1999 沧州安阳西华临清菏泽运城 3 号,石远321 1.3估值精度的比较方法 析获得:,则通过第j个地点的单一点次的方差 根据各轮历史区试中第1年的数据计算出各品 分析获得(即误差项均方MS.):剩余方差品,的计 种对应于表1中的7种估值,以之作为各品种未来 算采用Shukla((1972)的方法。 表现的7种预测值:然后,计算各品种在第2年试验 中的算术平均值,作为验证值。专设试验则依次根 2 结果与分析 据4年中的每一年计算出品种估值(即预测值),把 从表3中各种估值各轮验证的预测差来看,在 其他3年的各品种算术平均值作为验证值。计算各 18轮验证中,加权最小二乘估值(WSE)的预测差 种估计方法所得预测值与验证值之间差值的绝对值 小于SE估值(即算术平均值)的有16轮,但其中 (称为预测差)以及该差值占验证值的百分比(称为 相对预测差),并对每轮验证中所有品种的预测差求 WLSEr和WSE与LSE的差别不大,WISE和 平均:同时计算各种估值以及验证值之间的相关系 WSE则分别有3轮和7轮的预测差明显小于 数和秩相关系数。计算结果列于表3~表5。 LSE。预测精度的提高较为明显的(即预测差明显 以上计算中,需要估计表1公式中的客种方弟 小于LSE的),大多数是WSE.估值。比如用验证 组分,其西接数界品和通过一年多点的方差分 试验中1996年的W1SE.估值对1997-1998三年的
余方差指环境内互作和误差的混合方差;!! "(!)为环 境 ! 内的 #$ 互作和误差的混合方差;!! #、!! $、!! #$和 !! % 分别指基因型、环境、#$ 互作以及误差的方差;" 和 # 分别指环境数和环境内重复数,其余符号含义 见附录。 从表 & 可看出,品种效应固定时的某品种均值 的估计,都是加权平均值,而“权”就是对应模型假定 下品种 $ 在环境 ! 中的算术平均值!%$!自身方差的倒 数,这意味着某环境中各个!%$! 自身的变异越小,其 值对品种均值的贡献越大。品种效应随机时的品种 均值的 ’()* 值,则是一种“收缩”的预测值,相当于 用对应模型假定下品种均值的重复力对品种效应进 行“收缩”。若品种均值的重复力越小,对试验中的 品种表型效应估值(即!%$ +!%)就越持“谨慎”态度, 也就是根据表型值对品种进行选择后获得的期望的 遗传进展越小,这与我们的实际经验是吻合的。从 这一个角度看,尽管品种随机的假设与我们区试中 的习惯做法(即品种固定)不太一致,但也有其合理 性。 !"# 数据来源和试验方案 为比较表 & 中各种估值的统计精度,采用两类 数据进行分析。一类是我国区试历史数据,即长江 流域春棉 &,,- . &,,/ 年,黄河流域春棉 &,01 . &,,1 年以及黄河流域夏棉 &,01 . &,,2 年每 ! 年为 & 轮的 区试资料(简称为区试数据);另外,考虑到以上区试 的年份数只有 ! 年,对于进行较长年份的预测效果 分析来说有一定局限,还采用了一套专设的 3 年多 点的品种试验数据(简称专设试验数据)。该试验选 择建国以来黄河流域具有代表性的 &- 个棉花品种, 连续进行了 3 年的 3 . 1 个地点的试验(表 !),各点 次均采用随机完全区组设计,2 . 3 次重复,2 行区, 小区面积 !- 4! ,种植管理和性状考察按国家区试标 准进行。以上两类资料均采用皮棉产量,单位为 567 84! 。 表 # $ 年多点棉花品种验证试验的设置 %&’() # *+,-./&01-+ -, 02) $34)&.3/5(013(-6&01-+ 6-00-+ 0.1&( ,-. 7&(18&01-+ 年份 9%:;%;?4%@:A ABC:@?BDA?C:@?BD DE4F%;%;?4%@:A CEA@?G:;< &,,1 沧州 安阳 西华 临清 3 &,,/ 沧州 安阳 西华 临清 菏泽 2 &,,0 沧州 安阳 西华 临清 菏泽 运城 2 &,,, 沧州 安阳 西华 临清 菏泽 运城 2 岱 &H,徐州 &0&0,徐州 &3!,鲁棉 & 号,鲁棉 1 号,冀棉 0 号,中棉所 &! 号(种质库原种),中 棉所 &! 号 IJ(目前生产用种),中棉所 &, 号,石远 2!& !"9 估值精度的比较方法 根据各轮历史区试中第 & 年的数据计算出各品 种对应于表 & 中的 / 种估值,以之作为各品种未来 表现的 / 种预测值;然后,计算各品种在第 ! 年试验 中的算术平均值,作为验证值。专设试验则依次根 据 3 年中的每一年计算出品种估值(即预测值),把 其他 2 年的各品种算术平均值作为验证值。计算各 种估计方法所得预测值与验证值之间差值的绝对值 (称为预测差)以及该差值占验证值的百分比(称为 相对预测差),并对每轮验证中所有品种的预测差求 平均;同时计算各种估值以及验证值之间的相关系 数和秩相关系数。计算结果列于表 2 . 表 H。 以上计算中,需要估计表 & 公式中的各种方差 组分,其中!! #、!! $、!! #$和!! % 通过一年多点的方差分 析获得;!! (% !)则通过第 ! 个地点的单一点次的方差 分析获得(即误差项均方 &’();剩余方差!! "(!)的计 算采用 K8E5A(: &,/!)的方法[3] 。 # 结果与分析 从表 2 中各种估值各轮验证的预测差来看,在 &0 轮验证中,加权最小二乘估值(L(K$)的预测差 小于 (K$ 估值(即算术平均值)的有 &1 轮,但其中 L(K$$ 和 L(K$$" 与 (K$ 的差别不大,L(K$" 和 L(K$% 则分别有 2 轮和 / 轮的预测差明显小于 (K$。预测精度的提高较为明显的(即预测差明显 小于 (K$ 的),大多数是 L(K$% 估值。比如用验证 试验中 &,,1 年的 L(K$% 估值对 &,,/ . &,,0 三年的 001 作 物 学 报 !, 卷 万方数据
6期 张群远等:作物品种区域试验中品种均值估计的模型和方法 887 表3 几种品种均值估计方法的绝对预测差和相对预测 Table 3 Absolute and relative predictive differences PDs)for variety mean in different estimating metheds 试验类型 年份· 绝对预测差(上)和相对预测差(%(下) and relative PDe((below Trial type Years LSE BLUPO 1990K1991) 112.91 50.15 42.38 111.76 97.74 112.91 112.91 970 4.31 3.64 9.60 8.40 9.7 204.08 60.46 181.8 203.4 19921993) 199.13 204.0s 长江春棉区试 19.12 5.66 17.04 19.06 1994(19%5 134.53 30.28 342.83 4 196(197) 385 平均Aeng 168. 149.24 4s16 49.54 2.06 13.26 130 130 1170 1205 1305 208发1 380.30 31310 301.11 309.44 208发1 0N1 1985(1986) 27.01 34.38 2821 27.22 27.97 27.01 27.01 19%71988) 525.49 518.42 535.91 526.37 524.88 525.9 525.49 7.89 76.84 79.44 78.02 7n.80 n.89 1989(1990) 125.09 43.82 83.20 121.61 黄河春棉区试 14.06 4.93 9.35 191(192) 498.88 348.69 515.6 99.01 102.60 106.0 193(194 5 89 195(196) 8.38 9.2 27158 2m1.12 293.42 271.0 276.42 271.6 3404 34 2678 44 417 59.35 127.42 49.44 59.99 55.82 65.12 1986(1987) 82.48 6g0 14.82 5.15 6.98 6.49 g.9 1988(1989) 83.39 61.09 96.48 82.58 黄河夏棉区试 13.12 9.61 15.17 12.99 1990(1991) 84.94 95.55 129.56 84.99 10.5 11.87 16.10 10.5 19921993) 平均Amg 199697.9g,99) 05 51 199796,98,99) 215.60 217.35 ::: 21.48 2.57 5702 10430 201.4 199.52 1998(9%.97.99) 18.94 54.14 184 19.11 19.13 18.94 18.9 1999X96,97.98) 56.90 208.04 142.05 55.20 52.51 60.11 95.29 5.7 21.09 14.40 5.60 5.32 6.09 平均Aee 146.26 279.41 161.32 146.13 143.23 148.68 15.09 28.83 16.65 15.08 14.78 15.34 17.0m 84.0 232.43 19.66 184.1 184.77 185.2 191.0 用指号外年骨的告各种品种均值,对活内车份的 0.17 20.24 20.29 20.93 种试验均值 行预测(表4同)》 (table 4 i 万方数据
表 ! 几种品种均值估计方法的绝对预测差和相对预测差 "#$%& ! ’$()%*+& #,- .&%#+/0& 1.&-/2+/0& -/33&.&,2&((45()3). 0#./&+6 7&#, /, -/33&.&,+ &(+/7#+/,8 7&+9)-( 试验类型 !"#$% &’()* 年份! +)$"*! 绝对预测差(上)和相对预测差(,)(下) -.*/%0&) 12(* $./3))$45 ")%$) 12(* ,)(.)%/6) 789 :789) :789; :7899 :7899; ?EE?) ?EE(F ?EEG) ?EE(H ?EEI) ?EE(J ?EEK) 平均 -3)"$@) ??FLE? I>L?I HFLGM ???LKJ EKLKH ??FLE? ??FLE? ELK> HLG? GLJH ELJ> MLH> ELK> ELK> F>HL>M J>LHJ ?M?LMK F>GLHK ?EEL?G F>HL>M F>HL>M ?EL?F ILJJ ?KL>H ?EL>J ?MLJJ ?EL?F ?EL?F ?GHLIG G>LFM GHFLMG ?GFLF? ?FELKK ?GHLIG ?GHLIG ?>LKM FLHG FKLHK ?>LIE ?>LH> ?>LKM ?>LKM ?HKLKF GMIL?M ?G>LKM ?HELH? ?I>LJM ?HKLKF ?HKLKF ?>LJ> FKLJH ELGE ?>LKF ?>LM? ?>LJ> ?>LJ> ?HELIH ?JHLJ> ?JMLKK ?HELFH ?HIL?J ?HELIH ?HELIH ?FL>I ?GLFJ ?GLJ> ?FL>G ??LK> ?FL>I ?FL>I 黄河春棉区试 8("#4@ A/&&/4 &"#$%* #4 +)%%/6 ;#3)" ")@#/4 ?EM(I ?EMJ) ?EM(K ?EMM) ?EM(E ?EE>) ?EE(? ?EEF) ?EE(G ?EEH) ?EE(I ?EEJ) 平均 -3)"$@) FEMLM? GM>LG> G?FL?> G>?L?? G>ELHH FEMLM? FEMLM? FKL>? GHLGM FMLF? FKLFF FKLEK FKL>? FKL>? IFILHE I?MLHF IGILE? IFJLGK IFHLMM IFILHE IFILHE KKLME KJLMH KELHH KML>F KKLM> KKLME KKLME ?FIL>E HGLMF MGLF> ?F>L?? ?F?LJ? ?FIL>E ?FIL>E ?HL>J HLEG ELGI ?GLI> ?GLJK ?HL>J ?HL>J HEMLMM GHMLJE I?ILJG HEEL>? HEMLHH HEMLMM HEMLMM ?>FLJ> K?LKF ?>JL>I ?>FLJG ?>FLI? ?>FLJ> ?>FLJ> ?IFLMI ?MILK> FHHLMG ?IGLMG ?JGLG? ?IFLMI ?IIL>M ?MLE? FFLEK G>LFM ?EL>G F>LF> ?MLE? ?EL?M JMLIE F>JL>K EELHE JMLJF KELIJ JEL>? KFLG> MLGM FIL?K ?FL?I MLGM ELKF MLHG MLMG FK?LIM FKKL?F FEGLHK FK?LI> FKJLHF FK?LJJ FKFLJI GHL>H GHLKG GJLKM GHL>G GHLJH GHL>I GHL?K 黄河夏棉区试 80NN)" A/&&/4 &"#$%* #4 +)%%/6 ;#3)" ")@#/4 ?EM(J ?EMK) ?EM(M ?EME) ?EE(> ?EE?) ?EE(F ?EEG) 平均 -3)"$@) IELGI ?FKLHF HELHH IELEE IILMF JIL?F MFLHM JLE> ?HLMF ILKI JLEM JLHE KLIK ELIE MGLGE J?L>E EJLHM MFLIM E>LMG MGLGE MGLGE ?GL?F ELJ? ?IL?K ?FLEE ?HLFE ?GL?F ?GL?F MHLEH EILII ?FELIJ MHLEE MIL?> MHLEH MHLEH ?>LII ??LMK ?JL?> ?>LIJ ?>LIK ?>LII ?>LII ?GILKH F>FLMM IFLHJ ?GJL>G ?GMLGG ?GILKH ?GILKH F?LHK GFL>E MLG> F?LI? F?LMM F?LHK F?LHK E?LH? ??JLGH MMLHI E?LGE EGLHH EFLHJ EILJF ?FLIG ?ILEI ?FL?F ?FLIG ?FLM? ?FLJK ?GL?? 验证试验 O$%#5$&#/4 &"#$% ?EE(J EK,EM,EE) ?EE(K EJ,EM,EE) ?EE(M EJ,EK,EE) ?EE(E EJ,EK,EM) 平均 -3)"$@) ??GL>G J>LEF ?>HLJI ??>LK> ?>HLFF ??ELHK ?I?LFK ?FLKK JLME ??LMG ?FLI? ??LKM ?GLI> ?KL?> F?ILJ> FKMLH? F>HLGJ F?KLGI F?HLKJ F?ILJ> F?ILJ> FFLJJ FELFJ F?LHM FFLMH FFLIK FFLJJ FFLJJ ?EELIF IK>LFI ?EHLF> F>?LFI F>?LHH ?EELIF ?EELIF ?MLEH IHL?H ?MLHH ?EL?? ?EL?G ?MLEH ?MLEH IJLE> F>ML>H ?HFL>I IILF> IFLI? J>L?? EILFE ILKK F?L>E ?HLH> ILJ> ILGF JL>E ELJJ ?HJLFJ FKELH? ?J?LGF ?HJL?G ?HGLFG ?HMLJM ?JILHF ?IL>E FMLMG ?JLJI ?IL>M ?HLKM ?ILGH ?KL>K 总平均 !/&$% $3)"$@) ?MHLG> FGFLHG ?EELJJ ?MHL?K ?MHLKK ?MILF? ?E?L>I F>L?E FILHJ F?LMK F>L?K F>LFH F>LFE F>LEG 注:! 用括号外年份的数据估算各种品种均值,对括号内年份的品种试验均值进行预测(表 H 同)。 P/&)*:! !B) 5$&$ /Q &B) ’)$"* /0& /Q ."$AR)&* 6)") 0*)5 &/ )*&#N$&) 3$"#)&’ N)$4* &/ (")5#A& 3$"#)&’ )S()"#N)4&$% N)$4* #4 &B) ’)$"* #4 ."$AR)&*(&$.%) H #* &B) *$N))L J 期 张群远等:作物品种区域试验中品种均值估计的模型和方法 MMK 万方数据
888 作物 学报 20卷 平均结果进行预测,其预测差平均为60.92kghm2, 预测差只是预测效果的一个方面,对于区试,还 相当于验证均值884kghm2的6.89%,而算术平均 要求预侧值的品种排名与后续年份中的表现一致 值的预测差平均为113.03kghm2,相当于验证均值 这对于品种比较和选择来说更为重要。为此,表4 的12.7%。就这一轮验证来看,WsE估值的预测 计算列出了各种估值和验证值的秩相关系数。从表 精度高出算术平均值近1倍。不过,预测差明显大 中可看出,秩相关系数比1SE有明显提高和降低 于ISE的,多数也发生在WSE.估值上。这说明 的,多数还是WISE和ISE.两种估值,而且依然 WISE.估值的预测精度比LSE提高或降低的状况不 是WLSE的波动大于WLSE的,这一点和预测差的 很稳定。正因为如此,从所有轮的总平均来看,WL 情况相似:但是,预测差小的情况下,秩相关系数不 SE。估值的预测差依然大于ISE。WISE也基本类 一定高,所有18轮的预测差和秩相关系数的相关系 似,但相对而言,预测精度明显提高和降低的情况较 数平均只有-0.005,说明二者之间没有明显相关。 少。ISE。和IS下则基本上没有顶测精度明显 不过,验证试验中用1996年的W1SE估值对1997 比LSE提高或降低的情况。至于BIUP预测值(包 1998三年的平均结果进行预测时,与LSE相比,其 括BUPO和BLUPI),在大多轮的验证中都和ISE 预测差从12.77%减小到6.89%的同时,预测值与 耳有相同的平均预测差,少数轮有变化,但变化都不 验证值的秩相关系数也从0.830提高到0.976。各 大。另外,各种估值(包括目前常用的算术平均值) 种估值与验证值的秩相关系数平均为0.811 的相对预测弟平均都在0以上,这从一个测面说 0.824,决定系数为0.66-0.68,说明1年的区试尚 明,仅根据 年的区试结果对品种表现作出估计,准 不能很好地反映品种在后续年份表现的相对优劣。 确性不高。 表4几种品种均值估值与验证值的秩相关系数 Table 4 s and validation data 各种估值与验证值之间的秩相关系数 试验类型 年份 WLSE 长江春棉 19901991) 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1992(1993】 0.900 0.900 0.600 0.900 0.800 0.900 0.900 10041095】 0700 0700 0.800 0.900 0.700 0.700 1996(1997) 0.571 0.690 0.524 0.57 571 长江春棉(总】 0.7 0.7 0.6 0.761 0 黄河春棉 1985(1986 0.738 0.6 0.738 0.738 0.7538 0.738 I9%8701988 0.476 0.57 0.595 0.476 0.474 0.476 0.47% 19891990 0.905 0.786 0.833 0.905 0.905 0.905 0.905 1991(1992) 0.7% 0.524 0.786 0.786 0.786 0.76 0.78% 1093(1004】 0.40 0.717 0.300 0.400 0.40 0.400 0.400 1995(1996 0.98 0.783 0.95 0.983 0.967 0.983 0.983 黄河春棉(总) 0.715 0.684 0.735 0.715 0.71 0.715 0.715 黄河夏棉 1986(1967 1.00 1.00 1.0m 1988(1989 0.943 0.886 0.829 0.943 0.945 19901991 0.929 0.786 0.929 0.929 0.857 0.929 0.92 19921993) 0.500 0.500 0.300 0.50 0.500 0.500 0.500 黄河夏棉(总) 0.881 0.806 0.821 0.881 0.851 0.881 0.81 验证试险 1006g7.08.09) 0.830 0g76 0.964 0.879 0820 080 1997(96.98.99) 0.915 0.939 0.915 0.915 .915 0 0.915 0.782 0.s06 0.806 996.97,98 003 验证试验) 0D.86 0.876 0.875 0.87 0.864 计 0.817 0.811 0.818 0.824 0.824 0.817 0.817
平均结果进行预测,其预测差平均为 !"#$% &’()*% , 相当于验证均值 ++, &’()*% 的 !#+$-,而算术平均 值的预测差平均为 ../#"/ &’()*% ,相当于验证均值 的 .%#00-。就这一轮验证来看,12345 估值的预测 精度高出算术平均值近 . 倍。不过,预测差明显大 于 234 的,多数也发生在 12345 估值上。这说明 12345 估值的预测精度比 234 提高或降低的状况不 很稳定。正因为如此,从所有轮的总平均来看,126 345 估值的预测差依然大于 234。12347 也基本类 似,但相对而言,预测精度明显提高和降低的情况较 少。12344 和 123447则基本上没有预测精度明显 比 234 提高或降低的情况。至于 829: 预测值(包 括 829:" 和 829:.),在大多轮的验证中都和 234 具有相同的平均预测差,少数轮有变化,但变化都不 大。另外,各种估值(包括目前常用的算术平均值) 的相对预测差平均都在 %"-以上,这从一个侧面说 明,仅根据一年的区试结果对品种表现作出估计,准 确性不高。 预测差只是预测效果的一个方面,对于区试,还 要求预测值的品种排名与后续年份中的表现一致, 这对于品种比较和选择来说更为重要。为此,表 , 计算列出了各种估值和验证值的秩相关系数。从表 中可看出,秩相关系数比 234 有明显提高和降低 的,多数还是 12345 和 12347 两种估值,而且依然 是 12345 的波动大于 12347 的,这一点和预测差的 情况相似;但是,预测差小的情况下,秩相关系数不 一定高,所有 .+ 轮的预测差和秩相关系数的相关系 数平均只有 ; "#""?@ABC 年份 D5A?C 各种估值与验证值之间的秩相关系数 7AE& FG??5BAH@GE FG5II@F@5EHC J5HK55E 5CH@*AH5C AEL MAB@LAH@GE LAHA 234 12345 12347 12344 123447 829:" 829:. 长江春棉 .$$(" .$$.) .#""" .#""" .#""" .#""" .#""" .#""" .#""" .$$(% .$$/) "#$"" "#$"" "#!"" "#$"" "#+"" "#$"" "#$"" .$$(, .$$<) "#0"" "#0"" "#+"" "#$"" "#$"" "#0"" "#0"" .$$(! .$$0) "#<0. "#!$" "#<%, "#<0. "#<0. "#<0. "#<0. 长江春棉(总) "#0/0 "#0$0 "#!$" "#0!. "#0,$ "#0/0 "#0/0 黄河春棉 .$+(< .$+!) "#0/+ "#!,/ "#0/+ "#0/+ "#0/+ "#0/+ "#0/+ .$+(0 .$++) "#,0! "#<0. "#<$< "#,0! "#,0! "#,0! "#,0! .$+($ .$$") "#$"< "#0+! "#+// "#$"< "#$"< "#$"< "#$"< .$$(. .$$%) "#0+! "#<%, "#0+! "#0+! "#0+! "#0+! "#0+! .$$(/ .$$,) "#,"" "#0.0 "#<"" "#,"" "#,"" "#,"" "#,"" .$$(< .$$!) "#$+/ "#0+/ "#$<" "#$+/ "#$!0 "#$+/ "#$+/ 黄河春棉(总) "#0.< "#!+, "#0/< "#0.< "#0.. "#0.< "#0.< 黄河夏棉 .$+(! .$+0) .#""" .#""" .#""" .#""" .#""" .#""" .#""" .$+(+ .$+$) "#$,/ "#++! "#+%$ "#$,/ "#$,/ "#$,/ "#$,/ .$$(" .$$.) "#$%$ "#0+! "#$%$ "#$%$ "#+<0 "#$%$ "#$%$ .$$(% .$$/) "#<"" "#<"" "#/"" "#<"" "#<"" "#<"" "#<"" 黄河夏棉(总) "#++. "#+"! "#+%. "#++. "#+<. "#++. "#++. 验证试验 .$$(! $0,$+,$$) "#+/" "#$0! "#$!, "#+0$ "#$/$ "#+/" "#+/" .$$(0 $!,$+,$$) "#$.< "#$/$ "#$.< "#$.< "#$.< "#$.< "#$.< .$$(+ $!,$0,$$) "#+"! "#0// "#0+% "#+"! "#0$, "#+"! "#+"! .$$($ $!,$0,$+) "#$"/ "#+<< "#+/" "#$"/ "#$"/ "#$"/ "#$"/ 验证试验(总) "#+!, "#+0! "#+0/ "#+0! "#+++ "#+!, "#+!, 总 计 "#+.0 "#+.. "#+.+ "#+%, "#+%, "#+.0 "#+.0 +++ 作 物 学 报 %$ 卷 万方数据
6期 张群远等:作物品种区域试验中品种均值估计的模型和方法 889 表5 几种品种均值酷值之间的相关系数(上)和秩相关系数(下) Table 5 Correlation coefficients(above)and rank correlation coefficients(below)between several variety mean estimates WLSE WLSE. 0843 0.868 WLSEa 0.948 0.80e 0.957 8 WLSE 0.99 0.99% 8 0.99 BLUPO % 0.9 BLUPI 0.s68 0.957 0.998 另外,各种估值之间的相关系数和秩相关系数 点”有关。由此看来,以后需进一步研究的问题,似 (见表5)都较大,除WISE,以外,各种估值间的两种 乎不应该是“哪种估值更好?”,而应该是“哪种估值 相关系数均在0.93以上,其中1SE、BIID和H1D 更适合于哪种数据?”。至于数据的特点,包括各项 间的秩相关系数为1,这是因为BUP只是对品种效 变异(尤其误差)的大小,异常值的多少,误差的同质 应进行收缩,但不改变其相对大小顺序的缘故。 性、独立性和正态性等许多方面,需要借助更多的数 WSE和其他各种估值的相关较低一点,两种相关 据资科(包括更多年份的连续试验资料和数学模拟 系数均在0.806-0.890之间。 数据)来研究。 本文的研究是基于平衡数据的,因为目前我国 3讨论 区试中大部分数据是平衡的,而且,从实际应用的角 综合以上分析可以看出,与算术平均值(即S 度出发,平衡数据便于计算。对于非平衡数据,计算 估计)相比,BP对品种均值的预测效果基本上没 量较大,有待进一步探讨。 有变化:WMsE类估计中,主要是WISE,的预测效果 和LSE不一致。这意味着,除WSE以外的其他几 附录 区试平衡数据的各种品种均值 种方法不易获得预测效果明显优于算术平均值的估 估计方法的公式推导 计。不过,WSE.的预测效果是否优于算术平均值 也难以一概而论 将区试观测值模型写成品种i在环境中的, 本研究从混合线性模型的角度总结出了一系列 次重复均值了的形式: 区试品种均值的估计方法。尽管在实际数据的验证 Yi=u gi ei++E (附1) 中没有发现哪种方法绝对的优于算术平均值,但至 ,为,次重复均值对应的误差,其余符号含义 少表明,对某些轮的数据而言,确实存在着比算术平 与正文中(1)式相同。采用sae等表示法),上式 均值更“好”的估值,而是最有“希塑”的 可表示为: 种。WE利用各试点试验误差的倒数进行加权计 Y=(1.⑧1,)u+(L1,)g+(1.⑧1)e 算,这意味着,若某试点的试验误差越大,其数值对 +(L.1.)0+(I.I.DE (附2) 品种总均值的贡献就越小,我们对该试点试验结果 Y为了,构成的观测值向量,g、e、6、s分别为 的相信程度”就越低,这与我们的一般直觉也是吻 ,效应构成的向量,为品种数,s为环境 合的,可以解释为什么WSE估值有时比算术平均 数。以1,表示n个元素均为1的向量:以L,表示 值具有更好的预测效果。然而,另一方面,对于一些 对角线元素为1,其余元素为0的n×n的单位矩 轮的数据来说,WLSE.预测效果与算术平均值的相 阵:以J。表示所有元素均为1的n×n的矩阵:以 差不大或者反而明显比算术平均值差,这意味着, A☒B表示矩阵A中的每一个非0元素均扩展为该 WSE估值预嫩果的好坏,可能与不同的数据“特 元素与矩阵B的乘积矩阵,其余元素则以0填充
表 ! 几种品种均值估值之间的相关系数(上)和秩相关系数(下) "#$%& ! ’())&%#*+(, -(&..+-+&,*(/ #$(0&)#,1 )#,2 -())&%#*+(, -(&..+-+&,*(/ $&%(3)$&*3&&, /&0&)#% 0#)+&*4 5&#, &/*+5#*&/ !"# $!"#% $!"#& $!"## $!"##& ’!()* $!"#% *+,-. *+,/, $!"#& *+0-, *+,*/ *+012 *+,0* $!"## *+000 *+,-1 *+0-0 *+00, *+,2. *+0/3 $!"##& *+000 *+,., *+01. *+000 *+00* *+,21 *+0/, *+00. ’!()* *+000 *+,-* *+0-, *+000 *+00, 4+*** *+,/, *+012 *+00, *+00* ’!()4 *+0,3 *+,3. *+0.3 *+0,4 *+0,4 *+0,0 4+*** *+,/, *+012 *+00, *+00* 4+*** 另外,各种估值之间的相关系数和秩相关系数 (见表 1)都较大,除 $!"#% 以外,各种估值间的两种 相关系数均在 *+0. 以上,其中 !"#、’!() 和 ’!()4 间的秩相关系数为 4,这是因为 ’!() 只是对品种效 应进行收缩,但不改变其相对大小顺序的缘故。 $!"#% 和其他各种估值的相关较低一点,两种相关 系数均在 *+,*/ 5 *+,0* 之间。 6 讨论 综合以上分析可以看出,与算术平均值(即 !"# 估计)相比,’!() 对品种均值的预测效果基本上没 有变化;$!"# 类估计中,主要是 $!"#% 的预测效果 和 !"# 不一致。这意味着,除 $!"#% 以外的其他几 种方法不易获得预测效果明显优于算术平均值的估 计。不过,$!"#% 的预测效果是否优于算术平均值, 也难以一概而论。 本研究从混合线性模型的角度总结出了一系列 区试品种均值的估计方法。尽管在实际数据的验证 中没有发现哪种方法绝对的优于算术平均值,但至 少表明,对某些轮的数据而言,确实存在着比算术平 均值更“好”的估值,而 $!"#% 是最有“希望”的一 种。$!"#% 利用各试点试验误差的倒数进行加权计 算,这意味着,若某试点的试验误差越大,其数值对 品种总均值的贡献就越小,我们对该试点试验结果 的“相信程度”就越低,这与我们的一般直觉也是吻 合的,可以解释为什么 $!"#% 估值有时比算术平均 值具有更好的预测效果。然而,另一方面,对于一些 轮的数据来说,$!"#% 预测效果与算术平均值的相 差不大或者反而明显比算术平均值差,这意味着, $!"#% 估值预测效果的好坏,可能与不同的数据“特 点”有关。由此看来,以后需进一步研究的问题,似 乎不应该是“哪种估值更好?”,而应该是“哪种估值 更适合于哪种数据?”。至于数据的特点,包括各项 变异(尤其误差)的大小,异常值的多少,误差的同质 性、独立性和正态性等许多方面,需要借助更多的数 据资料(包括更多年份的连续试验资料和数学模拟 数据)来研究。 本文的研究是基于平衡数据的,因为目前我国 区试中大部分数据是平衡的,而且,从实际应用的角 度出发,平衡数据便于计算。对于非平衡数据,计算 量较大,有待进一步探讨。 附录 区试平衡数据的各种品种均值 估计方法的公式推导 将区试观测值模型写成品种 ! 在环境 " 中的 # 次重复均值!$!"的形式: !$!" 6 ! 7 %! 7 &" 7"!" 7#!" (附 4) #!"为 # 次重复均值对应的误差,其余符号含义 与正文中(4)式相同。采用 "%89:% 等表示法[2] ,上式 可表示为: ! 6("’ " "()! 7(#’ " "()$ 7("’ " #()% 7(#’ " #()! 7(#’ " #()" (附 3) ! 为!$!" 构成的观测值向量,$、%、!、" 分别为 %!、&"、"!"、#!"效应构成的向量,’ 为品种数,( 为环境 数。以 ") 表示 ) 个元素均为 4 的向量;以 #) 表示 对角线元素为 4,其余元素为 * 的 ) ; ) 的单位矩 阵;以 &) 表示所有元素均为 4 的 ) ; ) 的矩阵;以 ’"( 表示矩阵 ’ 中的每一个非 * 元素均扩展为该 元素与矩阵 ( 的乘积矩阵,其余元素则以 * 填充。 / 期 张群远等:作物品种区域试验中品种均值估计的模型和方法 ,,0 万方数据
890 作物学报 29卷 1品种效应固定时品种均值的最佳线性无 (c)若e,随机,各环境中的误差方差为a 偏估计(BLUE) 此时,V,的构成中还包括环境方差以及 GE互作方差o,即V=L,(+a+),与(附 把(附2)式中g的每个元素加上红,即得到品种 6)式同理 均值向量4。,(附2)式可改写为: Y=(L⑧1,)4.+(1.⑧1,)e 产=∑ +++a+ +(L,©1,)6+(L,⑧L)e(附3) (附9) 4,即为品种均值4k)=μ+g:构成的向量。 此估值也是一种加权最小二乘估计,记为M 由于k为固定效应,由广义最小二乘方程组可 SEe。若同质,上式即为算术平均。 获得4,的估计: (D)若e,随机,其余同(B) 4.g=[(L.@1yv-1(L.®1.] 此时,(B)的V,中还将包括环境方差,即 (L,®1,V1Y (附4) =1(i+),所以 在此,假定品种效应是相互独立的,所以不同品 s、Y 1 (附10) 种的观测值可以独立进行矩阵运算。记与品种i有 在0=+减六t 关的观测值向量为Y,对应V中的分块矩阵为 此估值也是加权最小二乘估计,记为WSE V,则根据(附4)式可得到品种i的均值的估计式 若)同质,则相当于算术平均。 为: 2品种效应随机时品种均值的最佳线性无 =y(V)Y (1,y(Vo)1, (附5) 偏预测(BLUP) (A)若e固定,环境j中的误差方差为 若品种效应g,随机,则需求出% =以+g的 此时,V()=I,o则: BLUP预测值来估计品种均值。若直接根据混合线 w 性模型方程组来推导平衡数据下计算:+g:的 BLUP的简式比较困难,在此利用一等价公式(Searle (附6) 等,1992): BLUP(w)=L'b+CV(Y -X6) 此估值为加权最小二乘估值(weighted least (附11) squares estimate,WLSE),即以环境内误差方差倒数加 其中W为需要估计的固定效应与随机效应之 权的品种平均值,记为E。 和的向量,Lb°为w中固定效应的线性组合部分 若各环境中的误差方差同质,即。=。2,则(附 C为w与Y的协方差阵,b°为固定效应的广义最小 6)式可简化为: 二乘估计。对于品种效应随机时品种均值,= μ+g来说: (附7) BLUP4)=a°+CV(Ye)-1,) 此即为算术平均值,其实质是非加权的最小 (附12) 乘估值(least squares estimate),i记为LSE。 (1yv-Y (B)若固定,GE互作和误差均看作主效以 外的随机剩余效应,环境j中的剩余方差记为 (附13) 此时,V()=I¤),把(附6)式中的o替换为 C)、V,和Y,为对应品种i的参数与观测值 )可得到: 的协差阵、观测值的方差协差阵以及观测值向量。 (E)若©固定,各环境中的误差方差同质(即 (附8) 台台p 0=2) 此即为以环境内剩余方差倒数加权的品种平均 此时,V=J,o元+1,(o+o2),C=1o元 值,记为率据同质,则相当于算术平均。 据(附12)式有:
! 品种效应固定时品种均值的最佳线性无 偏估计("#$%) 把(附 !)式中 ! 的每个元素加上!,即得到品种 均值向量!!,(附 !)式可改写为: " "(#" ! $#)!! #($" ! ##)% #(#" ! ##)" #(#" ! ##)# (附 $) !! 即为品种均值!(% $) "! # !$ 构成的向量。 由于!(% $)为固定效应,由广义最小二乘方程组[&]可 获得!! 的估计: ! !! "[(#" ! $#)’&( () #" ! $#)]() (#" ! $#)’&() " (附 *) 在此,假定品种效应是相互独立的,所以不同品 种的观测值可以独立进行矩阵运算。记与品种 $ 有 关的观测值向量为 "($),对应 % 中的分块矩阵为 &($),则根据(附 *)式可得到品种 $ 的均值的估计式 为: ! !!($) " ($#)’ (&($))() "($) ($#)’ (&($))() $# (附 +) (,)若 &’ 固定,环境 ’ 中的误差方差为"! ’ 此时,&($)" #"# ! ’,则: ! !!($)" ($#)’ (#"# ! ’)() "($) ($#)’ (#"# ! ’)() $# " " # ’ " ) #"$’ "! ’ " # ’ " ) ) "! ’ (附 -) 此估值为加权最小二乘估值(./0%12/3 4/562 67859/6 /620:52/,;),即以环境内误差方差倒数加 权的品种平均值,记为 ;/。 若各环境中的误差方差同质,即"! ’ ""! ,则(附 -)式可简化为: ! !!($) " ) # " # ’ " ) #($’ " #($ (附 &) 此即为算术平均值,其实质是非加权的最小二 乘估值(4/562 67859/6 /620:52/),记为 。 (?)若 &’ 固定,@> 互作和误差均看作主效以 外的随机剩余效应,环境 ’ 中的剩余方差记为"! A(’) 此时,&($)" #"# ! A(’),把(附 -)式中的"! ’ 替换为 "! A(’)可得到: ! !!($) " " # ’ " ) #"$’ "! A(’) " # ’ " ) ) "! A(’) (附 B) 此即为以环境内剩余方差倒数加权的品种平均 值,记为 ;A,若"! A(’)同质,则相当于算术平均。 (C)若 &’ 随机,各环境中的误差方差为"! ’ 此时,&($)的构成中还包括环境方差"! > 以及 @> 互作方差"! @>,即 &($)" #(# "! > #"! @> #"! ’ ),与(附 -)式同理 ! !!($)" " # ’ " ) #($’ "! > #"! @> #"! ’ " # ’ " ) ) "! > #"! @> #"! ’ (附 D) 此估值也是一种加权最小二乘估计,记为 ;>。若"! ’ 同质,上式即为算术平均。 (F)若 &’ 随机,其余同(?) 此时,(?)的 &($)中还将包括环境方差"! >,即 &($)" #(# "! > #"! A(’)),所以 ! !!($)" " # ’ " ) #($’ "! > #"! A(’) " # ’ " ) ) "! > #"! A(’) (附 )G) 此估值也是加权最小二乘估计,记为 ;>A。 若"! A(’)同质,则相当于算术平均。 & 品种效应随机时品种均值的最佳线性无 偏预测("#$’) 若品种效应 !$ 随机,则需求出!$ "! # !$ 的 ?)若 &’ 固定,各环境中的误差方差同质(即 "! ’ ""! ) 此时,&($) " ,"# ! @ # #(# "! @> #"!),*($) " $’ #"! @。 据(附 )!)式有: BDG 作 物 学 报 !D 卷 万方数据
6期 张群远等:作物品种区域试验中品种均值估计的模型和方法 891 BLUP(4,)=°+(Io[J.元 (E)。类似(附19)式推导,可得到: +1,(o2+o2)](Y)-1°) BIUP(A:) (附14) 与(附6)、(附7)式的同理,根据(附13)式可得 =了+s+a++水.- 出,误差同质情况下,试验总均值:°的广义最小 (附20) 乘估计即为算术平均值,即 此即为品种和环境效应随机时,品种均值的 BLUP预测值,记作BUPI。 (附15) 另外,根据下面的求逆公式 References (a.+.={-an)(附16 [1]Gauch HG.Suatistical Analysis of Regional Yicld Trials.New Yock vir,1992 可得到 [2】刀agQY(张群远),Kong F-L(孔繁玲),Yang F-X(杨付新) [J2+1,(2+g2)] Comparison of the predictive accuracy of arithmetic means and BLUP =a+-++ (附17) 物学报),2001 274) -433 [3]Yates F.Cochran WC.The analys 所以 of Agricltural Scienoe:1938.28:556-580 [1a2CJo品+L(a品+g2)] [4]Bemando R.Weighted v.unwrighted mean perfommance of varicties ments.Crop Srienoe 1992.32:490-492 =1+品+品副 (附l8)[s】hhnM.Weighted means are unece ssary in cultivar perfomance tri- lsC08ie.1gg7.37-1745-1750 把(附15)和(附18)式代入(附14)式,可得到 [6] ag王松桂). BUPa)=了++as+- 模型的理论及应用).: Press.1987 (附19 1ok:n Wiley5s1992,1933 此即为品种效应随机,环境效应固定时的品种 [8]Hendersn C R.Best linear unbiased e prediction uer a selection model.Bometrics:1975,31:423-447 均值的BLUP预测值,记作BLUPO, (F)若e,随机,且各环境中的误差方差同质 ents of.Heredity:1972.29:237-245 此时,V0=J品+1(+a品+G2),而C0同 万方数据
!"#$ (!!)% ! & ’(!( "" ) *)[""" ) * ’ #(" ") *+ ’") )], (- $(!) , !!" & ) (附 -.) 与(附 /)、(附 0)式的同理,根据(附 -1)式可得 出,误差同质情况下,试验总均值! & 的广义最小二 乘估计即为算术平均值,即 ! & % - #"! # ! % - ! " $ % - %!$ % "% (附 -2) 另外,根据下面的求逆公式[0] (&#’ ’ ("’),- % - & #’ , ( & ’ ’( ( "’ ) (附 -/) 可得到 [""" ) * ’ #(" ") *+ ’") )],- % - ") *+ ’") #" , ") * ") ’") *+ ’ "" ) * ( "" ) (附 -0) 所以 [! ( "" ) [* """ ) * ’ #(" ") *+ ’") )],- % ! ( " ") * ") ’") *+ ’ "" ( ) ) * (附 -3) 把(附 -2)和(附 -3)式代入(附 -.)式,可得到 !"#$ (!!)% "% ’ ") * ") 4" ’") *+ 4" ’" ( ) ) * ("%! , "%) (附 -5) 此即为品种效应随机,环境效应固定时的品种 均值的 !"#$ 预测值,记作 !"#$&。 (6)若 )$ 随机,且各环境中的误差方差同质 此时,%(!)% """ ) * ’ #(" ") + ’") *+ ’")),而 &(!)同 (+)。类似(附 -5)式推导,可得到: !"#$ (!!) % "% ’ ") * ") 4" ’") *+ 4" ’") + 4" ’" ( ) ) * ("%! , "%) (附 )&) 此即为品种和环境效应随机时,品种均值的 !"#$ 预测值,记作 !"#$-。 !"#"$"%&"’ [-] *789: ; *7>?@>?97A BC7AD@?@ EF GHI?EC7A J?HAK LM?7A@:H YMHK?9>?QH 7998M79D EF 7M?>:XH>?9 XH7C@ 7CK !"#$@ 7CK BZZ[ H@>?X7>H@ ?C MHI?EC7A 9MEY >M?7AH@ 6,WE9:M7C \ *@HK Q@^ 8COH?I:>HK XH7C YHMFEMX7C9H EF Q7M?H>?H@ 79ME@@ HCQ?MECXHC>@HK XH7C@ 7MH 8CCH9H@@7MD ?C 98A>?Q7M YHMFEMX7C9H >M?T 7A@?EC EF "?CH7M ZEKHA(@ 线性 模型的理论及应用)?EC $MH@@,-530 [0] =H7MAH = G,W7@HAA7 *,Z9W8AAE9: W +@ A?CH7M 8Cb?7@HK H@>?X7>?EC 7CK YMHK?9>?EC 8CKHM 7 @HAH9>?EC XEKHA7>?@>?97A 7@YH9>@ EF Y7M>?>?EC?CI IHCE>DYHTHCQ?MECT XHC>7A 9EXYECHC>@ EF Q7M?7b?A?>D< 9).):!,;,-50),)5:)10—).2 / 期 张群远等:作物品种区域试验中品种均值估计的模型和方法 35- 万方数据
作物品种区域试验中品种均值估计的模型和方法一算术平均 日万方数据文秋线热 值、加权最小二乘估值和BLUP的比较 作者: 张群远, 作者单位: 张群远,孔繁玲(中国衣业大学植物遗传有种系,北京,10009),杨付新(中国衣业科学院棉 花研究所,河南安阳,455112 刊名: 作物学报STIC PKI可 英文刊名 ACTA AGRONOMICA SINICA 年,卷(期) 003,29(6) 引用次数: 0 金考文就但条) 1 GauchHG Statistical Analysis of Regional Yield Trials 1992 2张群远.孔繁珍.杨付新品种区城试验中算术平均值、队P和A估值的精度比较[期刊论文]-作物学报 2001(4) 3.Yates F.CochranWGThe analysis of groups of experiments 1938 4.Bernardo R Weighted vs.unweighted sean performance of varieties across environments 1992 5.Huhn M Weighted means are unnecessary in cultivar performance trials 199 6.王松桂线性模型的理论及应用198 7.Searle S R.Casella G.McCulloch C E Variance Components 1992 8.Henderson C R Best linear unbiased estimation and prediction under a selection model 1975 9.Shukla GK Some statistical aspects of partitioning genotype-environmental components of variability 1972 相仪文献(3条) 1.期刊论文张群远.孔繁玲作物品种区域试验中品种均值的Bayes估计-中国农业大学学报200L,6(3) 金有aaa西 2.期刊论文张群远.孔繁玲.杨付新品种区域试验中算术平均值、LP和AI估值的精度比较一作物学报 2001.27(4) 3.期刊论文张群远孔繁玲作物品种区域试验统计分析模型的比较-一中国农业科学2002,35(④ 所进行 家R的风家收收0 均 本文链接:http:/a.g.wanfangdata..com.cn/Periodical_zuowxb20030co15.asp 下载时间:2010年3月5日
作物品种区域试验中品种均值估计的模型和方法--算术平均 值、加权最小二乘估值和BLUP的比较 作者: 张群远, 孔繁玲, 杨付新 作者单位: 张群远,孔繁玲(中国农业大学植物遗传育种系,北京,100094), 杨付新(中国农业科学院棉 花研究所,河南安阳,455112) 刊名: 作物学报 英文刊名: ACTA AGRONOMICA SINICA 年,卷(期): 2003,29(6) 引用次数: 0次 参考文献(9条) 1.GauchHG Statistical Analysis of Regional Yield Trials 1992 2.张群远.孔繁玲.杨付新 品种区域试验中算术平均值、 BLUP和AMMI估值的精度比较[期刊论文]-作物学报 2001(4) 3.Yates F.Cochran W G The analysis of groups of experiments 1938 4.Bernardo R Weighted vs. unweighted mean performance of varieties across environments 1992 5.Huhn M Weighted means are unnecessary in cultivar performance trials 1997 6.王松桂 线性模型的理论及应用 1987 7.Searle S R.Casella G.McCulloch C E Variance Components 1992 8.Henderson C R Best linear unbiased estimation and prediction under a selection model 1975 9.Shukla G K Some statistical aspects of partitioning genotype-environmental components of variability 1972 相似文献(3条) 1.期刊论文 张群远.孔繁玲 作物品种区域试验中品种均值的Bayes估计 -中国农业大学学报2001,6(3) 本研究根据Bayes统计原理,提出作物品种区域试验中品种均值的Bayes估计方法;并利用一套包含4年、7个试点和10个棉花品种的多年多点试验对 Bayes估值和算术平均值的预测精度进行比较.结果表明,Bayes估值和算术平均值的平均预测差分别为6.88%和12.77%;而且Bayes估值与验证值之间在数值 和品种排序上都有着更高的相关,相关系数分别达0.963和0.976,高于算术平均值的0.876和0.830;Bayes估值显示出比算术平均值更高的预测精度. 2.期刊论文 张群远.孔繁玲.杨付新 品种区域试验中算术平均值、 BLUP和AMMI估值的精度比较 -作物学报 2001,27(4) 利用1982年以来我国棉花、小麦、水稻和玉米的60套区域试验数据,采用交叉验证方法,对区域试验中算术平均值、最佳线性无偏预测值(best linear unbiased predictor, BLUP)和AMMI(additive main effects and multiplicative interaction)模型估值的预测精度进行比较,结果表明,与算 术平均值相比, AMMI估值精度的增益倍数(gain factor, GF)平均为1.045,变幅为0.963~1.414,其精度多数情况下提高不大; BLUP的GF平均为 1.170,变幅为1.008~1.619,其精度普遍较高。同时,文中对3种估值的模型作了论述和比较。 3.期刊论文 张群远.孔繁玲 作物品种区域试验统计分析模型的比较 -中国农业科学2002,35(4) 通过对作物品种区域试验中有关品种×环境组合均值估计的主要统计分析模型进行概述和比较,改进提出LR-PCA复合模型,并通过数据实例的交叉验证 对各种模型的预测精度进行比较.结果表明,各种模型的精度顺序为LR-PCA复合模型>AMMI模型>PCA模型>处理均值模型>回归模型>ANOVA加性主效模型;LRPCA复合模型的预测精度是算术平均值的1.55倍,比AMMI模型的精度提高了8.4%.最后对LR-PCA模型的应用问题作了讨论. 本文链接:http://d.g.wanfangdata.com.cn/Periodical_zuowxb200306015.aspx 下载时间:2010年3月5日