正在加载图片...
第3期 张群远等:作物品种区域试验中品种均值的Bayes估计 45 同一批品种一般只进行1年的试验,但由于年份间存在气候条件变化,仅根据1年的算术平均 值判断品种(在以后多年中)的应用价值,可靠性并不高。要提高品种评价的可靠性,一方面可 以增加试验的年份数,另一方面可以采用更有效的统计分析方法。相对而言,前者需消耗较多 的资源(占地和人工等):而后者则几乎不增加任何试验费用。基于后一种想法,本研究从农业 试验中应用较少的贝叶斯(Bayes)统计学原理出发,研究区试中品种均值的Bayes估计方法: 并利用相应的多年多点试验对Bayes估值的预测效果进行分析,以期为区试中品种均值的估 计寻求一种在预测精度上优于传统的算术平均值的方法。 1材料与方法 1.1品种均值的Bayes估计的原理和方法 Bayes方法的基本原理是结合已有经验和认识(称为先验信息)和当前试验信息二者来进 行统计推断]。品种区域试验中,同一套品种要在多个地点(甚至多个年份)重复进行试验,尽 管时间上各地点的试验是同时进行的,但逻辑上我们可以认为是一个地点接一个地点依次进 行的。这样,可以应用Bayes统计的原理,把第1个地点的统计结果作为已知的先验信息,而第 2个地点的试验资料作为试验信息,并根据一定的准则(即Bayes定理)1),对先验信息和试 验信息进行综合,得出新的统计结果;然后,再把这一结果作为先验信息,把第3个地点的试验 资料作为试验信息,再得出新的结果…如此循环,直至最后一个地点,便得到最终的Byes 统计结果。 针对区试中品种均值估计这一问题,现假设我们通过第1个地点的1个试验观测值已认 识到某品种均值:服从先验的正态分布N(4.)。按理,:为品种参数,是一个定值,不应该有 方差:但是,这里我们对以的已有认识是不完全确定的,这种不确定性便以方差岳来度量。这 正是Bayes方法有别于一般统计学的一个重要方面;也正因为如此,才有必要进一步进行试验 观测来更好地认识“。在进一步的试验中(即第2个地点的试验),获得该品种的:个重复观测 值,假定它们是来自正态分布总体N(4,)的随机样本,其样本均值为Y2。结合先验分布信息 (即第1个地点的试验结果)和试验信息(即第2个地点的试验结果),根据Bays公式,可推导 出(见附录)品种均值:服从分布N(2,品),其中: =喷+Y: (1) 品=1/品+n/G (2) 此分布称为:的后验分布,即综合先验信息和试验信息所获得的关于:的新认识。随后, 把4~N(,品)作为新的先验分布,进一步试验(即第3个地点的试验),假定有?个重复观 测值来自总体N(4,),算术平均值为Y,再综合二者信息可再次得到μ的后验分布N( ),其中: %-房+小-房4+学,+ (3) (4 万方数据 后=7%+,/G-1/i+,/0+%/网 按此做法,不断进行试验和估计,形成一个迭代的过程。到最后第、个地点的试验,可得到 同一批品种一般只进行 !年的试验"但由于年份间存在气候条件变化"仅根据 !年的算术平均 值判断品种#在以后多年中$的应用价值"可靠性并不高%要提高品种评价的可靠性"一方面可 以增加试验的年份数"另一方面可以采用更有效的统计分析方法%相对而言"前者需消耗较多 的资源#占地和人工等$&而后者则几乎不增加任何试验费用%基于后一种想法"本研究从农业 试验中应用较少的贝叶斯#’()*+$统计学原理出发"研究区试中品种均值的 ’()*+估计方法& 并利用相应的多年多点试验对 ’()*+估值的预测效果进行分析"以期为区试中品种均值的估 计寻求一种在预测精度上优于传统的算术平均值的方法% , 材料与方法 ,-, 品种均值的 ./012估计的原理和方法 ’()*+方法的基本原理是结合已有经验和认识#称为先验信息$和当前试验信息二者来进 行统计推断3!"45 %品种区域试验中"同一套品种要在多个地点#甚至多个年份$重复进行试验"尽 管时间上各地点的试验是同时进行的"但逻辑上我们可以认为是一个地点接一个地点依次进 行的%这样"可以应用 ’()*+统计的原理"把第 !个地点的统计结果作为已知的先验信息"而第 4个地点的试验资料作为试验信息"并根据一定的准则#即 ’()*+定理$3!"45 "对先验信息和试 验信息进行综合"得出新的统计结果&然后"再把这一结果作为先验信息"把第 6个地点的试验 资料作为试验信息"再得出新的结果77如此循环"直至最后一个地点"便得到最终的 ’()*+ 统计结果% 针对区试中品种均值估计这一问题"现假设我们通过第 !个地点的 8!个试验观测值已认 识到某品种均值 9服从先验的正态分布 :#9;!"< 4 ;!$%按理"9为品种参数"是一个定值"不应该有 方差&但是"这里我们对 9的已有认识是不完全确定的"这种不确定性便以方差 < 4 ;!来度量%这 正是 ’()*+方法有别于一般统计学的一个重要方面&也正因为如此"才有必要进一步进行试验 观测来更好地认识 9%在进一步的试验中#即第 4个地点的试验$"获得该品种的 84个重复观测 值"假定它们是来自正态分布总体 :#9"< 4 4$的随机样本"其样本均值为 =4%结合先验分布信息 #即第 !个地点的试验结果$和试验信息#即第 4个地点的试验结果$"根据 ’()*+公式"可推导 出#见附录$品种均值 9服从分布 :#9;4"< 4 ;4$"其中> 9;4?< 4 ;4 ! <4 ;! 9;!@84 <4 4 A =4 B #!$ < 4 ;4? ! !C<4 ;!@84C<4 4 #4$ 此分布称为 9的后验分布"即综合先验信息和试验信息所获得的关于 9的新认识%随后" 把 9D:#9;4"< 4 ;4$作为新的先验分布"进一步试验#即第 6个地点的试验$"假定有 86个重复观 测值来自总体 E#9"< 4 6$"算术平均值为 =6"再综合二者信息可再次得到 9的后验分布 E#9;6" < 4 ;6$"其中> 9;6?< 4 ;6 ! <4 ;4 9;4@86 <4 6 A =6 B?< 4 ;6 ! <4 ;! 9;!@84 <4 4 =4@86 <4 6 A =6 B #6$ < 4 ;6? ! !C<4 ;4@86C<4 6 ? ! !C<4 ;!@84C<4 4@86C<4 6 #F$ 按此做法"不断进行试验和估计"形成一个迭代的过程%到最后第 G个地点的试验"可得到 第 6期 张群远等>作物品种区域试验中品种均值的 ’()*+估计 FH 万方数据
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有