第五章统计推断 所谓统计推断就是根据抽样分布率和概率理论,由样本结果(统计数)来推断总 体特征(参数)。试验实践中所获得的资料,通常都是样本的结果;而我们希望了解 的却是抽得样本的总体。 统计推断:统计假设测验 参数估计 统计假设测验是根据某种实际需要对未知的或不完全知道的统计总体提出一些 假设,然后由样本的实际结果,经过一定的计算,做出在概率意义上应当接受哪种假 设的测验。 例如在相同的栽培管理条件下种植了甲、乙两个玉米品种各15个小区,如果测 得甲品种平均亩产为x=650kg,乙品种平均亩产为x2=670kg,亩产相差20kg, 这究竟是由于甲品种的总体平均数m的确不同于乙品种的总体平均数呢?还是由 于随机抽样误差(A和并无不同)?这不能通过简单的比较来下结论,必须通过概 率计算做出选择,这就是统计假设测验要研究的问题。 参数估计是指由样本统计数对总体参数做出点估计和区间估计。点估计是指由样 本统计数估计相应参数。区间估计是指以一定的概率保证总体参数位于某两个数值之 间。 第一节统计假设测验的基本原理 统计假设测验的基本方法就是试验工作者提出有关某一总体参数的假 设。例如假设某批产品符合标准。但是如何确切地证实假设是正确的还是错误的呢? 当然可以把全部产品逐个检验,这种研究总体中全部个体的方法当然是很准确的,但 往往是行不通的。我们不得不采用另一种方法,即研究样本。也就是从全部产品中抽 取样本进行检验,然后推断这批产品是否合格。这种利用样本以测验假设是否正确或 错误的过程,称为一个假设正确性(或不正确性)的统计证明。如果通过测验证明假 与试验结果相符,则该假设就被接受:反之,如果假设与试验结果不相符,则该假 设就被否定。 对统计总体一般作两个假设,一个是假设总体参数与某一指定值相等或假设两个 总体参数相等,即假设其没有效应,这一假设称为无效假设,记作H:和无效假设 相对应的另一统计假设,叫对应假设或备择假设记作HA。Ho和HA应是对立的假设 即,如果接受H就否定HA,如果否定H就接受HA。例如:假设某一小麦新品种具 有原当地品种的产量,是指就产量性状而言,将新品种样本看成原当地品种总体的一 个随机样本,其总体平均产量μ等于指定值0(当地品种平均产量),故记作Ho:g 对应假设为 测验前提出无效假设的目的在于:可从假设的总体里推论随机抽样平均数的分 布,从而算出某一样本平均数指定值出现的概率,这样就可以研究样本与总体的关系, 作为假设测验的理论依据。无论是平均数,百分数,还是变异数的统计假设,均应在 试验前按研究目的提出。Ho的形式和内容可以多种多样,但必须遵循两个原则:① 有实际意义;②据之可以算出因抽样误差而获得样本结果的概率。下面通过例子来说
1 第五章 统计推断 所谓统计推断就是根据抽样分布率和概率理论,由样本结果(统计数)来推断总 体特征(参数)。试验实践中所获得的资料,通常都是样本的结果;而我们希望了解 的却是抽得样本的总体。 统计推断:统计假设测验 参 数 估 计 统计假设测验 是根据某种实际需要对未知的或不完全知道的统计总体提出一些 假设,然后由样本的实际结果,经过一定的计算,做出在概率意义上应当接受哪种假 设的测验。 例如在相同的栽培管理条件下种植了甲、乙两个玉米品种各 15 个小区,如果测 得甲品种平均亩产为 1 x =650 kg,乙品种平均亩产为 2 x =670 kg,亩产相差 20 kg, 这究竟是由于甲品种的总体平均数1 的确不同于乙品种的总体平均数2 呢?还是由 于随机抽样误差(1 和2 并无不同)?这不能通过简单的比较来下结论,必须通过概 率计算做出选择,这就是统计假设测验要研究的问题。 参数估计是指由样本统计数对总体参数做出点估计和区间估计。点估计是指由样 本统计数估计相应参数。区间估计是指以一定的概率保证总体参数位于某两个数值之 间。 第一节 统计假设测验的基本原理 一、统计假设测验的基本方法就是试验工作者提出有关某一总体参数的假 设。例如假设某批产品符合标准。但是如何确切地证实假设是正确的还是错误的呢? 当然可以把全部产品逐个检验,这种研究总体中全部个体的方法当然是很准确的,但 往往是行不通的。我们不得不采用另一种方法,即研究样本。也就是从全部产品中抽 取样本进行检验,然后推断这批产品是否合格。这种利用样本以测验假设是否正确或 错误的过程,称为一个假设正确性(或不正确性)的统计证明。如果通过测验证明假 设与试验结果相符,则该假设就被接受;反之,如果假设与试验结果不相符,则该假 设就被否定。 对统计总体一般作两个假设,一个是假设总体参数与某一指定值相等或假设两个 总体参数相等,即假设其没有效应,这一假设称为无效假设,记作 H0;和无效假设 相对应的另一统计假设,叫对应假设或备择假设,记作 HA。H0 和 HA 应是对立的假设, 即,如果接受 H0 就否定 HA,如果否定 H0 就接受 HA。例如:假设某一小麦新品种具 有原当地品种的产量,是指就产量性状而言,将新品种样本看成原当地品种总体的一 个随机样本,其总体平均产量等于指定值 0 (当地品种平均产量),故记作 H0: = 0,对应假设为 HA: ≠ 0。 测验前提出无效假设的目的在于:可从假设的总体里推论随机抽样平均数的分 布,从而算出某一样本平均数指定值出现的概率,这样就可以研究样本与总体的关系, 作为假设测验的理论依据。无论是平均数,百分数,还是变异数的统计假设,均应在 试验前按研究目的提出。H0 的形式和内容可以多种多样,但必须遵循两个原则:① 有实际意义;②据之可以算出因抽样误差而获得样本结果的概率。下面通过例子来说
明假设测验的基本方法 [例51设一水稻地方品种亩产u0=500kg,σ2=324kg 现一新品种平均亩产x=515kg,n=9(9个试验小区) 问 这样本是否从4=500kg的总体中随机抽出的,即该x的总体平均数是否不同于0 亦即x-0=15kg,这一差数究竟是抽样误差造成的?还是确实与0不同。 1、提出假设 这是测验单个平均数,则假该样本是从已知总体(总体平均数为指定值0)中随机 抽出的,即H0:=40。如上例,即假设新品种的总体平均数μ等于原当地品种总体 0=500kg,而样本平均数x40=515-500=15kg乃是随机误差;在Hb:H 0的假设下,我们就有一个具平均数n=10=500kg、2==324=36的 x分布,即M500,36);据之才能算得因抽样误差而获得一个与4o的相差≥15kg的x 的概率。如测验两个平均数,则假设两个样本的总体平均数相等,即Ho:A=42, 也就是假设两个样本平均数的差数x1-x2乃随机误差,而非真实差数 备择假设)HA是与Ho对立的假设,则HA:m≠2,即两个样本的总体平均数 不相等。 2、确定一个否定H的概率标准 这个标准叫显著水平,记作a。a是人为规定的小概率标准。在生物学研究中常 取α=0.05或α=001两个等级(水平)。也可选α=0.10或a=0.001等。显著水 平的选择,应根据试验要求或试验结论的重要性而定。 3、在“无效假设是正确的”假定下,研究样本平均数x的抽样分布 算出试验所得平均数x出现的概率有多大,即算出实得结果由抽样误差造成的概 率。或者划出接受区和否定区。二法选一即可。 (1)计算概率的方法 对例5.1,在H0:4=40的假设下可算得 515-50 2.5 查附表2,P(u1>25)=2×0.00621=0.01242。此即在y0=500的总体中, 如以n=9作随机抽样,抽得一个与500kg相差达15kg以上的x的概率为0.01242 (2)划接受区与否定区的方法 根据上章所述x和=x二的分布,我们知道 P(-1.96≤u≤1.96)=P(-1.96 ≤196)=0.95 196)=0.025,P( ≤-1.96)=0.025 因之可写为 x≥(4+1.96ax)]=0025和Px≤(-1.96a)]=0.025 因此,在x的抽样分布中落在(-196σx,+1.%ax)区间内的x有95%,落
2 明假设测验的基本方法。 [例 5.1]设一水稻地方品种亩产 0 = 500 kg, 2 = 324 kg 现一新品种平均亩产 x = 515 kg, n =9(9个试验小区) 问: 这样本是否从 = 500 kg 的总体中随机抽出的,即该 x 的总体平均数是否不同于 0, 亦即 x - 0 = 15 kg,这一差数究竟是抽样误差造成的?还是确实与 0 不同。 1、提出假设 这是测验单个平均数,则假该样本是从已知总体(总体平均数为指定值 0)中随机 抽出的,即 H0: = 。如上例,即假设新品种的总体平均数等于原当地品种总体 0 = 500 kg,而样本平均数 x - 0 = 515 - 500 = 15 kg 乃是随机误差;在 H0: = 0 的假设下,我们就有一个具平均数 = 0 = 500 kg、 2 x = n 2 = 9 324 = 36 的 x 分布,即 N(500,36);据之才能算得因抽样误差而获得一个与 0 的相差≥15 kg 的 x 的概率。如测验两个平均数,则假设两个样本的总体平均数相等,即 H0:1 = 2, 也就是假设两个样本平均数的差数 x 1- x 2 乃随机误差,而非真实差数。 备择假设)HA 是与 H0 对立的假设,则 HA:1 ≠ 2,即两个样本的总体平均数 不相等。 2、确定一个否定 H0 的概率标准 这个标准叫显著水平,记作。是人为规定的小概率标准。在生物学研究中常 取 = 0.05 或 = 0.01 两个等级(水平)。也可选 = 0.10 或 = 0.001 等。显著水 平的选择,应根据试验要求或试验结论的重要性而定。 3、在“无效假设是正确的”假定下,研究样本平均数 x 的抽样分布 算出试验所得平均数 x 出现的概率有多大,即算出实得结果由抽样误差造成的概 率。或者划出接受区和否定区。二法选一即可。 (1)计算概率的方法 对例 5.1,在 H0: = 0 的假设下可算得: u = x x − = 36 515 − 500 = 2.5 查附表 2,P(∣ u ∣> 2.5) = 2 × 0.00621 = 0.01242。此即在 0 = 500 的总体中, 如以 n = 9 作随机抽样,抽得一个与 500 kg 相差达 15 kg 以上的 x 的概率为 0.01242。 (2)划接受区与否定区的方法 根据上章所述 x 和 u = x x − 的分布,我们知道: P(-1.96 ≤ u ≤1.96) = P(-1.96 ≤ x x − ≤ 1.96) = 0.95 P( x x − ≥ 1.96) = 0.025, P( x x − ≤ -1.96) = 0.025 因之可写为: P[ x ≥ ( + 1.96 x )] = 0.025 和 P[ x ≤ ( - 1.96 x )] = 0.025 因此,在 x 的抽样分布中落在( - 1.96 x, + 1.96 x )区间内的 x 有 95%,落
在这一区间外(即X≤4-1.960和¥≥+1960x)的x只有5%。如果以5%概率 作为接受或否定Ho的界限,则前者为接受假设的区域,简称接受区域( region of acceptance);后者为否定假设的区域,简称否定区域( region of rejection)。在l 测验时,一般将接受区域和否定区域的两个临界值写作μ±1.%6σx,即当x在( 1.96σ,4+1.960)区间内为接受区域;而x≤(-1.960)和x≥(4+1960) 为两个否定H区域。所以在测验时先计算196,然后从加上和减去196σx,(计算 时μ用μ0=500代替),即得两个否定区域的临界值。同理,从平均数x离为258σ 的区间内,即从-258σ到μ+2.58σ区间为99%接受区域,任一样本平均数出现 于这一区间外的概率仅为001。它的两个否定区域则为x≤(-2580)和X≥(r 2.58σ)。例如5.1, √36=1176kg。因此,它的两 个5%概率的否定区域为x≥500+11.76,x≤500-1176,接受区域为500-11.76 ≤x≤500+1176,其划分的几何意义见图5.1。即≥511.76kg和x≤48824kg 的概率只有5%,48824kg≤x≤511.76kg的概率为95% 4.根据“小概率实际不可能性原理”接受或否定假设 “小概率实际不可能性原理”的基本内容为:概率很小的事件,在一次试验中几乎 不可能发生或可以认为不可能发生。如果我们假设了一些条件,并在假设的条件下能够 准确地算出事件A出现的概率很小,但在一次试验中,事件A竟出现了,那么,我们就 可以认为这个假设不正确,从而否定这个假设。 若在Ho:μ=4o的假设下,算出实得结果由抽样误差造成的概率P2.5)=001242a,则不应否定H,可见a的选择是很重要
3 在这一区间外(即 x ≤ - 1.96 x 和 x ≥ + 1.96 x )的 x 只有 5%。如果以 5%概率 作为接受或否定 H0 的界限,则前者为接受假设的区域,简称接受区域(region of acceptance);后者为否定假设的区域,简称否定区域(region of rejection)。在 u 测验时,一般将接受区域和否定区域的两个临界值写作 ± 1.96 x ,即当 x 在( - 1.96 x, + 1.96 x )区间内为接受区域;而 x ≤( - 1.96 x )和 x ≥ ( + 1.96 x ) 为两个否定 H0区域。所以在测验时先计算 1.96 x ,然后从加上和减去 1.96 x ,(计算 时用 0 = 500 代替),即得两个否定区域的临界值。同理,从平均数 x 离为 2.58 x 的区间内,即从 – 2.58 x 到 + 2.58 x 区间为 99%接受区域,任一样本平均数出现 于这一区间外的概率仅为 0.01。它的两个否定区域则为 x ≤( – 2.58 x )和 x ≥(+ 2.58 x )。例如 5.1,0 = 500 kg,1.96 x = 1.96× 36 = 11.76 kg。因此,它的两 个 5%概率的否定区域为 x ≥ 500 + 11.76,x ≤ 500 – 11.76,接受区域为 500 – 11.76 ≤ x ≤ 500 + 11.76,其划分的几何意义见图 5.1。即 x ≥ 511.76 kg 和 x ≤488.24 kg 的概率只有 5%,488.24 kg ≤ x ≤511.76 kg 的概率为 95%。 4. 根据“小概率实际不可能性原理”接受或否定假设 “小概率实际不可能性原理”的基本内容为:概率很小的事件,在一次试验中几乎 不可能发生或可以认为不可能发生。如果我们假设了一些条件,并在假设的条件下能够 准确地算出事件A 出现的概率很小,但在一次试验中,事件A 竟出现了,那么,我们就 可以认为这个假设不正确,从而否定这个假设。 若在 H0: = 0 的假设下,算出实得结果由抽样误差造成的概率 P 2.5) = 0.01242 ,则不应否定 H0,可见 的选择是很重要 的。 480 485 490 495 500 505 510 515 520 0.95 否定区 接受区 否定区 图 5.1 在 = 0.05 水平上接受或否定 H0: = 的几何意义 0.025 2 1 = 0.025 2 1 =
也可以根据接受区域和否定区域作出推断,例5.1得=515kg>51176kg,已 落入否定区域,所以我们冒5%以下的风险否定Ho 在实际测验时,计算可以简化。由于P(|u|>1.96)=005,P(|u|>258) 0.01。因此,在用u分布作假设测验时,实际算得的|u|>1.96就是在a=005水 平上差异显著,若丨u|>2.58就是在α=0.01水平上差异显著(或称极显著),不必 再计算所得u值的确切概率。综上所述,统计假设测验的步骤可总结如下 (1)提出无效假设H和备择假设HA (2)确定显著水平a (3)在H为正确的假定下,根据统计数的抽样分布规律,算出实得差异由误差 造成的概率:或划出否定区域 (4)将算得的概率和a相比较,或者将试验结果和否定区域相比较,从而作出接 受或否定假设的推断 二、两尾测验与一尾测验 1.两尾测验 如例51,无效假设为H:=40,即假设新品种亩产的总体平均数为500kg 对应假设为HA:4≠40,即假设平均亩产不是500kg,而是有大于500kg和小于500 kg两种可能性。因而在假设测验时所考虑的概率为正态曲线左边一尾概率(小于500 kg)和右边一尾概率(大于500kg)之和,这类测验称为两尾测验。 2.一尾测验 在某些情况下,两尾测验不一定符合实际需要。例如某种农药防治蚜虫的效果达 到90%才合格,如果进行抽样测验,则在x大于40=90%时,无论大多少都不需 要否定H:但如x小于40,却可能为一批不合格的药品。因此,假设测验应为Hop ≥90%(即该药品合格),HA:4却可能有严重后果,则所有假设应为H:≤40 对HA:4>μ0。这时,否定区域就只有右尾,所得u>1.645就否定H 一般而论,如果凭借一定的知识和经验,推测山应当或可能是小于o的,为了测 验是否显著小于,我们的假设应是H:4≥0。对HA:Hμ0。这时右尾是否定区域(图5.2b) 三.统计假设测验的两类错误 统计假设测验是根据一定的概率标准(α),由样本的结果对总体的特征作出推 断。因此,不论是接受H或是否定Ho都没有100%的保证,也就是说,不能百分之 百地肯定不发生错误,这就意味着我们需要冒一定的风险。如果Ho是真实的,我们 通过测验却否定了它,就犯了一个否定真实假设的错误。这叫第一类错误( first kind error)或I型错误( type I error)。I型错误只有在否定Ho时才会发生。由于规定 显著水平为a,故H为真而被否定的概率最多为a:因而这类错误又叫a错误。如例
4 也可以根据接受区域和否定区域作出推断,例 5.1 得 x =515 kg > 511.76 kg,已 落入否定区域,所以我们冒 5%以下的风险否定 H0。 在实际测验时,计算可以简化。由于 P(∣u∣> 1.96) = 0.05,P(∣u∣> 2.58) = 0.01。因此,在用 u 分布作假设测验时,实际算得的∣u∣> 1.96 就是在 = 0.05 水 平上差异显著,若∣u∣> 2.58 就是在 =0.01 水平上差异显著(或称极显著),不必 再计算所得 u 值的确切概率。综上所述,统计假设测验的步骤可总结如下: (1)提出无效假设 H0 和备择假设 HA。 (2)确定显著水平。 (3)在 H0 为正确的假定下,根据统计数的抽样分布规律,算出实得差异由误差 造成的概率;或划出否定区域。 (4)将算得的概率和相比较,或者将试验结果和否定区域相比较,从而作出接 受或否定假设的推断。 二、两尾测验与一尾测验 1. 两尾测验 如例 5.1,无效假设为 H0: = 0,即假设新品种亩产的总体平均数为 500 kg。 对应假设为 HA: ≠ 0,即假设平均亩产不是 500 kg,而是有大于 500 kg 和小于 500 kg 两种可能性。因而在假设测验时所考虑的概率为正态曲线左边一尾概率(小于 500 kg)和右边一尾概率(大于 500 kg)之和,这类测验称为两尾测验。 2. 一尾测验 在某些情况下,两尾测验不一定符合实际需要。例如某种农药防治蚜虫的效果达 到 90%才合格,如果进行抽样测验,则在 x 大于 0 = 90%时,无论大多少都不需 要否定 H0;但如 x 小于 0,却可能为一批不合格的药品。因此,假设测验应为 H0 ≥ 90%(即该药品合格),HA: 0 却可能有严重后果,则所有假设应为 H0: ≤ 0。 对 HA: > 0。这时,否定区域就只有右尾,所得 u > 1.645 就否定 H0。 一般而论,如果凭借一定的知识和经验,推测应当或可能是小于 0 的,为了测 验是否显著小于0,我们的假设应是 H0: ≥ 0。对 HA: 0。这时右尾是否定区域(图 5.2b)。 三.统计假设测验的两类错误 统计假设测验是根据一定的概率标准(),由样本的结果对总体的特征作出推 断。因此,不论是接受 H0 或是否定 H0 都没有 100%的保证,也就是说,不能百分之 百地肯定不发生错误,这就意味着我们需要冒一定的风险。如果 H0 是真实的,我们 通过测验却否定了它,就犯了一个否定真实假设的错误。这叫第一类错误(first kind error)或 I 型错误(type I error)。I 型错误只有在否定 H0 时才会发生。由于规定 显著水平为,故 H0 为真而被否定的概率最多为;因而这类错误又叫 错误。如例
51,我们在a=005水平上否定了Ho,推断新品种平均亩产不同于原地方品种的亩 但该新品种即使与地方品种平均亩产相同:以n=9抽样,仍有5%以下的概率 使x和仙相差超过15kg。所以上述推断为错误的概率P<0.05。显然,规定a=0.05 为否定假设的概率标准,就是说我们假设测验结论仅有95%的把握,同时却冒着5 %的下错误结论的风险。而采用更高的显著水平(如a=0.01),则犯第一类错误的 概率就更小了。如果H是不真实的,我们通过测验却不能发现其不真实而接受了它 即犯了一个接受不真实的Ho的错误。这叫第二类错误( second kind error)或Ⅱ型错 误( type ll error)Ⅱ型错误只有在接受Ho时才会发生。通常把犯第二类错误的概率 记为β,所以这类错误又称作B错误。这两类错误的关系如表5.1 表51假设测验的两类错误 测验结果 如果Ho是正确的 如果Ho是错误的 设 如果Ho被否定 第一类错误 没有错误 如果Ho被接受 没有错误 第二类错误 犯第二类错误的概率β,可用例5.1水稻新品种产量为例说明如下: 例5.1中水稻地方品种亩产量服从0=500kg,a2=324kg的正态分布。当 以n=9抽样时,其服从ux=0=500kg、a2= =36的正态分布。当以 0.05为显著水平时,其接受区域下限为500-196×√36=48824kg,上限为500 +196×√36=51.76kg。现假设新品种是一个=505,而方差与地方品种亩产 量方差σ2相同的正态总体,则H:=uo显然是错误的,但是总体的x有相当 部分落在40分布的接受区域内(图53),其概率β可估计为 √6=-279,n=5116-505 488.2-505 79)=0.0026,P(u<1.13)=0.8708 B=0.8708-0.0026=0.8682 因此,尽管与0相差5kg,但是由于误差较大,我们不能发现Ho:4=0为 错误的概率却达到B=0.8682。这就是犯第二类错误的概率 如果将显著水平提高到a=0.01,则由于40分布接受区域的扩大,分布的x落 入该接受区域的将更多。因而更易接受H,犯β错误的概率更大。故显著水平定得 过高,虽然在否定Ho时减少了α错误,但在接受H时却可能增大β错误
5 5.1,我们在 = 0.05 水平上否定了 H0,推断新品种平均亩产不同于原地方品种的亩 产。但该新品种即使与地方品种平均亩产相同;以 n = 9 抽样,仍有 5%以下的概率 使 x 和0 相差超过 15 kg。所以上述推断为错误的概率 P < 0.05。显然,规定 =0.05 为否定假设的概率标准,就是说我们假设测验结论仅有 95%的把握,同时却冒着 5 %的下错误结论的风险。而采用更高的显著水平(如 =0.01),则犯第一类错误的 概率就更小了。如果 H0 是不真实的,我们通过测验却不能发现其不真实而接受了它, 即犯了一个接受不真实的 H0 的错误。这叫第二类错误(second kind error)或Ⅱ型错 误(type Ⅱerror) Ⅱ型错误只有在接受 H0 时才会发生。通常把犯第二类错误的概率 记为β,所以这类错误又称作β错误。这两类错误的关系如表 5.1。 表 5.1 假设测验的两类错误 犯第二类错误的概率β,可用例 5.1 水稻新品种产量为例说明如下: 例 5.1 中水稻地方品种亩产量服从 0 = 500 kg, 2 = 324 kg 的正态分布。当 以 n = 9 抽样时,其服从 x = 0=500 kg、 2 x = n 2 =36 的正态分布。当以 = 0.05 为显著水平时,其接受区域下限为 500 - 19.6 × 36 = 488.24 kg,上限为 500 + 19.6 × 36 = 511.76 kg。现假设新品种是一个=505,而方差与地方品种亩产 量方差 2 相同的正态总体,则 H0: = 0 显然是错误的,但是总体的 x 有相当一 部分落在 0 分布的接受区域内(图 5.3),其概率β可估计为: u1 = 36 488.2 − 505 = -2.79, u2 = 36 511.76 − 505 = 1.13 P(u < -2.79) = 0.0026, P(u < 1.13) = 0.8708 β = 0.8708 –0.0026 = 0.8682 因此,尽管与 0 相差 5 kg,但是由于误差较大,我们不能发现 H0: = 0 为 错误的概率却达到β = 0.8682。这就是犯第二类错误的概率。 如果将显著水平提高到 =0.01,则由于 0 分布接受区域的扩大,分布的 x 落 入该接受区域的将更多。因而更易接受 H0,犯β错误的概率更大。故显著水平定得 过高,虽然在否定 H0 时减少了错误,但在接受 H0 时却可能增大β错误。 如果 H0是正确的 如果 H0 是错误的 如果 H0 被否定 第一类错误 没有错误 如果 H0 被接受 没有错误 第二类错误 统 果 假 设 测 结 验 计
因此,在假设测验中如何既减少α错误,又减少错误,是特别需要注意的问题。 这可从两个方面考虑: (1)如果和0相差对于G2来说是大的,则显著水平可以提高,而犯B错误的 概率又可大大减少。如上述例,若新品种的4=525kg,则即使取α=0.01,犯β错 误的概率也只有0.0559(图54);如果仍取α=0.05,则犯β错误的概率就只有0.0136。 (2)由于和A相差不是主观能改变的客观存在,因此在试验实践中,减少σx 是减少两类错误的关键。由于样本平均数标准误r ,因而通过精密的试验 设计和改进试验技术以及增大样本容量可使σx减小,于是接受区域可变得十分狭窄, 和u0的较小差异也易于被发现。如上述例,假定新品种的x是n=150的平均数, 324 407/1502.16,ax=147,因而在a=005时的接受区域为500±196×147 则 0288,在此情况下,若H=505kg,则我们不能发现Hl:p=0为 错误的概率β只有00749(图5.5)。如n继续增大,则犯两类错误的概率均可继续 小 综上所述,有关两类错误的讨论可概括如下: 本节是以依据于u分布的一个平均数为例,说明统计假设测验的基本原理。这些 原理对于其他统计数的假设测验以及依据于t、z2、F分布的假设测验,也同样适用。 第二节平均数的假设测验 、单个样本平均数的假设测验 这是测验一个样本平均数x的总体平均数山与某一指定的总体平均数u0是否相 1、u测验 在第4章已述及,在正态总体Mμ,a2)中抽样(无论样本容量n多大)或在非 正态总体中以n>30抽样时,均可用u测验Ho(σ2未知时,用s2代替)。其方法 已详细介绍于例5.1。 2、t测验 若正态总体的a2未知,而样本容量又不太大(n<30),如以样本的s2估计a2 则标准化离差x一服从自由度y=n-1的t分布。 [例5.2]某当地推广玉米品种百粒重μo=32(g 现有一新品种百粒重 x=3367(g)(在十个小区种)
6 因此,在假设测验中如何既减少错误,又减少β错误,是特别需要注意的问题。 这可从两个方面考虑: (1)如果和 0 相差对于 2 x 来说是大的,则显著水平可以提高,而犯β错误的 概率又可大大减少。如上述例,若新品种的 =525 kg,则即使取 =0.01,犯β错 误的概率也只有 0.0559(图 5.4);如果仍取=0.05,则犯 错误的概率就只有 0.0136。 (2)由于和0 相差不是主观能改变的客观存在,因此在试验实践中,减少 x 是减少两类错误的关键。由于样本平均数标准误 x = n ,因而通过精密的试验 设计和改进试验技术以及增大样本容量可使 x 减小,于是接受区域可变得十分狭窄, 和 0 的较小差异也易于被发现。如上述例,假定新品种的 x 是 n = 150 的平均数, 则 2 x = 150 324 = 2.16, x = 1.47,因而在 =0.05 时的接受区域为 500 ±1.96 ×1.47 = 497.12 - 502.88,在此情况下,若 = 505 kg,则我们不能发现 H0: = 0 为 错误的概率β只有 0.0749(图 5.5)。如 n 继续增大,则犯两类错误的概率均可继续 减小。 综上所述,有关两类错误的讨论可概括如下: 本节是以依据于 u 分布的一个平均数为例,说明统计假设测验的基本原理。这些 原理对于其他统计数的假设测验以及依据于 t、 2 、F 分布的假设测验,也同样适用。 第二节 平均数的假设测验 一、单个样本平均数的假设测验 这是测验一个样本平均数 x 的总体平均数与某一指定的总体平均数 0 是否相 等。 1、u 测验 在第 4 章已述及,在正态总体 N( , 2)中抽样(无论样本容量 n 多大)或在非 正态总体中以 n > 30 抽样时,均可用 u 测验 H0( 2 未知时,用 s 2 代替)。其方法 已详细介绍于例 5.1。 2、t 测验 若正态总体的 2 未知,而样本容量又不太大(n < 30),如以样本的 s 2 估计 2, 则标准化离差 s n x / − 服从自由度 = n - 1 的 t 分布。 [例 5.2]某当地推广玉米品种百粒重 0=32(g 现有一新品种百粒重 x =33.67(g) ( 在十个小区种)
问:新品种的百粒重与原当地品种百粒重有无显著差异? (1)H0:=0=32g(即:新品种百粒重与当地品种百粒重相同)对HA:μ (2)显著水平a=005 (3)测验计算 336.7 1+32.9+…+33.6)= =3367(g) SS=3312+3292+…+3362-33672 =26.761 V10-1 1.7244 0.5453 33.67-32 0.5453 (4)查附表5,V=9时,105=2.262。现实得|t|>t0s,故P<0.05。 推断,否定H0:=0=32g,即新品种百粒重与当地品种百粒重有显著差异 两个样本平均数相比较的假设测验 这是测验两个样本所属的总体平均数有无显著差异 1、成组数据的平均数比较 如果两个处理为完全随机设计,而处理间(组间)的试验单元彼此独立,则不论 两处理的样本容量是否相同,所得数据皆称为成组数据。成组数据的平均数比较又依 两个样本所属总体方差(σ12和2)是否已知、是否相等而采用不同的测验方法 现分述如下 (1)u测验 在两个样本所属的总体方差2和2为已知时,用u测验 根据抽样分布的公式知两个样本平均数x1和x2的差数标准误,在G2和 a2已知时为 心×、么
7 问:新品种的百粒重与原当地品种百粒重有无显著差异? (1)H0:= 0=32g (即:新品种百粒重与当地品种百粒重相同) 对 HA: ≠ 32g。 (2)显著水平 =0.05 (3)测验计算 x = 10 1 (33.1 + 32.9 + … +33.6) = 10 336.7 = 33.67(g) SS = 33.12 + 32.92 + … +33.6 2 - 2 10 336.7 = 26.761 s = 10 1 26.761 − =1.7244 s x = 10 1.7244 = 0.5453 t = 0.5453 33.67 − 32 = 3.063 (4)查附表 5, =9 时,t0.05 = 2.262。现实得 |t| > t0.05,故 P < 0.05。 推断,否定 H0:= 0=32g,即新品种百粒重与当地品种百粒重有显著差异。 二、两个样本平均数相比较的假设测验 这是测验两个样本所属的总体平均数有无显著差异。 1、成组数据的平均数比较 如果两个处理为完全随机设计,而处理间(组间)的试验单元彼此独立,则不论 两处理的样本容量是否相同,所得数据皆称为成组数据。成组数据的平均数比较又依 两个样本所属总体方差( 2 1 和 2 2 )是否已知、是否相等而采用不同的测验方法, 现分述如下。 (1)u 测验 在两个样本所属的总体方差 2 1 和 2 2 为已知时,用 u 测验。 根据抽样分布的公式知,两个样本平均数 x 1 和 x 2 的差数标准误 1 2 x −x ,在 2 1 和 2 2 已知时为: 1 2 x −x = 2 2 2 1 2 1 n n + 并有:
0 在假设H:仙==0下,正态离差u值为a=(x1-x2) ,故可对两个平均数 差数的差异作出假设测验 [例5.3]A法x=1.2(kg)m=12a2=04(kg)2 B法x2=14(kg)m=8 比较A、B两法每平方米产量是否有显著差异? H4:1=42(或H:-42=0);对HA:山≠2, 显著水平a=0.05,1005=1.96 测验计算: 1=2=0.4,m=12,m=8 404 =0.2887(kg) 1.2-1.4 0.2887 因为实得的||0.05,推断:接受H:A=2,即A、B两 法取样方法所得每平方米产量没有显著差异 (2)t测验 在两个总体方差σ2和2为未知时,用t测验。因总体方差G2和G2是否相等 分为以下两种测验方法 ①在两个总体方差a1和2为未知,但可假定σ=02=2,用t测验。 首先,应将样本变异合并成一个平均的均方S2,作为对G2的估计,即有: x1)2+X(x2-2)2M2-(Xx1)2 V1+ (n1-1)+(m2-1) (n1-1)+(m2-1) n n2 若 n1-/2-n s (5.3) 并有:
8 u = 1 2 ( ) ( ) 1 2 1 2 x x x x − − − − 在假设 H0:1 = 2=0 下,正态离差 u 值为 u = 1 2 ( ) 1 2 x x x x − − ,故可对两个平均数 差数的差异作出假设测验。 [例 5.3] A 法 1 x =1.2(kg) n1 = 12 2 = 0.4(kg)2 B 法 2 x =1.4(kg) n2 =8 比较 A、B 两法每平方米产量是否有显著差异? H0:1 = 2(或 H0:1 − 2=0);对 HA:1 ≠ 2, 显著水平 =0.05,u 0.05 = 1.96。 测验计算: 2 2 2 1 2 = = = 0.4,n1 = 12,n2 = 8, 1 2 x −x = 8 0.4 12 0.4 + = 0.2887(kg) 0.2887 1.2 −1.4 u = = -0.69 因为实得的|u| 0.05,推断:接受 H0:1 = 2,即 A、B 两 法取样方法所得每平方米产量没有显著差异。 (2)t 测验 在两个总体方差 2 1 和 2 2 为未知时,用 t 测验。因总体方差 2 1 和 2 2 是否相等 分为以下两种测验方法。 ① 在两个总体方差 2 1 和 2 2 为未知,但可假定 2 1 = 2 2 = 2 ,用 t 测验。 首先,应将样本变异合并成一个平均的均方 2 e s ,作为对 2 的估计,即有: 2 e s = 1 2 1 2 + SS + SS = ( 1) ( 1) ( ) ( ) 1 2 2 2 2 2 1 1 − + − − + − n n x x x x = ( 1) ( 1) ( ) / ( ) / 1 2 2 2 2 2 1 2 2 1 2 1 − + − − + − n n x x n x x n 1 2 x x s − = 2 2 1 2 n s n se e + = ) 1 1 ( 1 2 2 n n se + (5.2) 若 n1=n2=n 时,则: 1 2 x x s − = n se 2 2 (5.3) 并有:
(x1-x2)-(41-12) S 当假设H4:A1=,上式为 (5.5) 其自由度 v=(m1-1)+(n-1)=m-m2-2 (5.6) 【例5。4] 假设H0:山=,对HA:1≠ 显著水平a=0.05 测验计算 x1=12.74(%)x2=1303(% 63.7 SS=1312+1342+…+1242-912 0.9943 故 12320+09943 0.2226 4+6 S 1274-13.03 0.2763 查附表 =4+6=10时,1005=2228 推断:实得|t<os,故接受H,即该小麦品种在甲、乙两地种植,蛋白质含量 无显著差异 [例5.5] 显著水平a=0.0 测验计算: x1=8620mg)x2=3.575(mg) S,=0.7874 2.2880+0.7874 =0.4393 故 0.4446 8.620-3.575 =11.34 0.4446
9 t = 1 2 ( ) ( ) 1 2 1 2 x x s x x − − − − (5.4) 当假设 H0:1 = 2,上式为: t = 1 2 1 2 x x s x x − − (5.5) 其自由度 = (n1 – 1) + (n2 – 1) = n1 –n2 – 2 (5.6) 【例5。4] 假设 H0:1 = 2,对 HA:1 ≠ 2 显著水平 = 0.05 测验计算: 1 x = () 2 x =3.03(%) SS1 = 12.62 + 13.42 + … + 13.02 – 5 63.7 2 = 1.2320 SS2 = 13.12 + 13.42 + … + 12.42 – 7 91.2 2 = 0.9943 故 2 e s = 4 6 1.2320 0.9943 + + = 0.2226 1 2 x x s − = ) 7 1 5 1 0.2226( + = 0.2763 t = 0.2763 12.74 −13.03 = - 1.05 查附表 5, = 4 + 6 = 10 时,t0.05 = 2.228。 推断:实得|t| < t0.05,故接受 H0,即该小麦品种在甲、乙两地种植,蛋白质含量 无显著差异。 [例 5. 5] 显著水平 = 0.05 测验计算: 1 x = 8.620(mg) 2 x =3.575(mg) SS1 = 2.2880 SS2 = 0.7874 2 e s = 4 3 2.2880 0.7874 + + = 0.4393 故 1 2 x x s − = ) 4 1 5 1 0.4393( + = 0.4446 t = 0.4446 8.620 − 3.575 = 11.34
查附表5,v=4+3=7时,105=1.895(一尾) 推断:实得|t>to0,故可冒5%的风险否定Ho,接受HA,即前作喷过农药会 显著增高后作植株农药残留量。 ②在两个总体方差a和a2为未知,且1≠a2(可由F测验得知时,差数标 准误需用两个样本的均方s和s2分别估计G2和2,用5.2)计算sx-x,,用(5.4减 (5.5)计算t值。 这时所得1值不再做成准确的t分布,在a水平上显著的t值需由下式算出: (t1)2n2s2+(2)2n1s2 (5.7) n2S +n,S2 (57)中的1)是v=n1-1的L值,(2)是v=n2-1的l值。若t>t,则否定 H:否则接受H。由于l的取值区间为()a~(h)x,故只有实得的t值恰巧在()a (h2)a之间才需计算a 以上是近似测验,一般在Ho:a2=a2在a=0.01被否定时才采用。同时在试 验设计上最好使m=m,这样可以减少误差,又不必计算(5.7) [例5.6 该资料经F测验(方法见第三节)得知两品种脂肪含量是显著不同的,因而需按下 述步骤测验 假设两品种脂肪含量相等,即H:=,对H4:A≠ 显著水平a=0.05 测验计算: 1.0520.156=035 s1945-1864=-2.294 0.3531 查附表5,M=10-1时的(1)0s=2262,=8-1=7时的(2)05=2.365,实得t= 2.29,在(n)05和()0之间,故需计算toa5的值: 2.262×8×1.052+2.365×10×0.156 2.278 8×1.052+10×0.156 推断:实得|t>to05,否定H:=,接受HA:≠2,即辽豆10号和 铁丰24号大豆的脂肪含量有显著差异。 2、成对数据的比较 成对法是指先将试验单元按成对的要求两两配对,然后将每一个对内的两个试验 单元独立随机地分配到两个处理中。例如
10 查附表 5, = 4 + 3 = 7 时,t0.05 = 1.895(一尾) 推断:实得|t| > t0.05,故可冒 5%的风险否定 H0,接受 HA,即前作喷过农药会 显著增高后作植株农药残留量。 ②在两个总体方差 2 1 和 2 2 为未知,且 2 1 2 2 (可由 F 测验得知)时,差数标 准误需用两个样本的均方 2 1 s 和 2 2 s 分别估计 2 1 和 2 2 ,用(5. 2)计算 1 2 x x s − ,用(5. 4)或 (5.5)计算 t 值。 这时所得 t 值不再做成准确的 t 分布,在 水平上显著的 ' t 值需由下式算出: ' t = 2 1 2 2 2 1 2 2 1 2 2 1 2 1 ( ) ( ) n s n s t n s t n s + + (5.7) (5.7)中的(t1)是 = n 1 – 1 的 t值,(t2)是 = n 2 – 1 的 t值。若|t| > ' t ,则否定 H0;否则接受 H0。由于 ' t 的取值区间为(t1) (t2),故只有实得的 t 值恰巧在(t1) (t2)之间才需计算 ' t 。 以上是近似测验,一般在 H0: 2 1 = 2 2 在 = 0.01 被否定时才采用。同时在试 验设计上最好使 n1 = n2,这样可以减少误差,又不必计算(5.7)。 [例 5.6] 该资料经 F 测验(方法见第三节)得知两品种脂肪含量是显著不同的,因而需按下 述步骤测验: 假设两品种脂肪含量相等,即 H0:1 = 2,对 HA:1 ≠ 2。 显著水平 = 0.05 测验计算: 1 2 x x s − = ) 8 0.156 10 1.052 ( + = 0.3531 t = 0.3531 19.45 −18.64 = - 2.294 查附表 5, = − 时的(t1)0.05 = 2.262, =8 - 1 = 时的(t2)0.05 = 2.365,实得 t = 2.29,在(t1)0.05 和(t2)0.05 之间,故需计算 ' 0.05 t 的值: ' 0.05 t = 8 1.052 10 0.156 2.262 8 1.052 2.365 10 0.156 + + = 2.278 推断:实得|t| > ' 0.05 t ,否定 H0:1 = 2,接受 HA:1 ≠ 2,即辽豆 10 号和 铁丰 24 号大豆的脂肪含量有显著差异。 2、成对数据的比较 成对法是指先将试验单元按成对的要求两两配对,然后将每一个对内的两个试验 单元独立随机地分配到两个处理中。例如: