第七章假设检验 统计推断的另一个主要方面是统计假设检验在这一章里我们将讲座统计假设的检验问 题,顺便也介绍一些区间估计的内容 §1假设检验的基本思想和概念 前一章中我们讲座了如何根据子样去得到母体分布所含参数的优良估计.以如此得到的 估计值作为参数的已知值的一个母体必须与真的母体作比较,考察它们之间是否在统计意义 上相似合显然,这种比较也只能在子样的基础上进行怎样在子样基础上作出一个有较大把 握的结论就是统计假设检验问题实际上很多问题都可以作为统计假设检验问题予以解决我 们用一个例子来说明 例7.1设某厂生产一种灯管,其寿命5服从正态分布N(μ40000),从过去较长一段时 间的生产情况来看灯管的平均寿命为μ=1500小时.现在采用新工艺后,在所生产的灯管中抽 取25只,测得平均寿命为1675小时问采用新工艺后,灯管寿命是香否是显著提高?我们的问 就是要判别新产品的寿命是服从>1500的正态分布呢? 还是与老 品 样仍然服从 1500的正态分布呢?若是前者,我门说新产品的寿命有显著提高,若是后者,就说没有显者提 高 今后我们把任意一个有关未知分布的假设称为统计假设或简称假设在上面的例子中,我 们可以把所有涉及到的两种情况用统计假设的形式表示出来第一个统计假设μ=1500表示 彩新工艺后产品平均寿命没有显著增加第二个统计假设>1500表示采用新工艺后产品平 均寿命有显著增加这第一个假设我们称为原假设,用符号H。:=1500表示;第二个假设 μ>1500表示称为备择假设,用符号H,:μ>1500表示.至于在两个假设中用哪一个作为原假 设哪一个作为备择假设,要看具体的目的和要求而定.假如我们的目的是希望从子样观察值 对某一陈述取得强有力的支持,我们把这一陈述的否定作为原假设,而陈述本身作为备择假设 很多实际例子都是这样的.兽如例7.1中所提出的新工艺对产品寿命确有提高,但它又不可能 象老产品那样有较多的数据为此,我们取“寿命没有提高(μ=1500)”作原假设,并以“提高 寿命(μ>1500)”作备择假设有时原假设的选定还要考虑到数学上的处理方便 在许多问题中母体分布的类型为己知,仅是一个或几个参数为未知,只要对这一个或几个 未知参数的值作出假设,就可完全确定母体的分布这种仅涉及到母体分布的未知参数的统 假设称为参数假设如上例中就是只对参数“作出假设在有些实际问题中,我们不知道母体 分布的具体类型譬如某种家作物的家药残留量,它可能服从对数正态分布,也可能服从其它 的分布因此,统计假设只能对未知分布函数的类型或者它的某些特征提出某种假设这种不 司于参数假设的统计假设称作非参数假设例如 H。:F(x)∈{对数正态分布族 H,F(x)∈{正态分布族} 上面看到,一个统计假设是关于母体分布状态的一种陈述如 果一个统计假设完全确定母体的分布,则称这假设为简单统计假设或简单假设,否则就称为复 合统计假设或复合假设如例7.1中H。:μ=1500,完全确定母体分布N(1500,40000),所以H。 为简单假设.H,:μ>1500就是一个复合假设.在非参数假设情形,若原假设H。:F(x)=F。(x
第七章 假设检验 统计推断的另一个主要方面是统计假设检验.在这一章里我们将讲座统计假设的检验问 题,顺便也介绍一些区间估计的内容. § 7.1 假设检验的基本思想和概念 前一章中我们讲座了如何根据子样去得到母体分布所含参数的优良估计.以如此得到的 估计值作为参数的已知值的一个母体必须与真的母体作比较,考察它们之间是否在统计意义 上相似合.显然,这种比较也只能在子样的基础上进行.怎样在子样基础上作出一个有较大把 握的结论就是统计假设检验问题.实际上很多问题都可以作为统计假设检验问题予以解决.我 们用一个例子来说明. 例 7.1 设某厂生产一种灯管,其寿命ξ服从正态分布.N(μ;40000),从过去较长一段时 间的生产情况来看,灯管的平均寿命为μ=1500 小时.现在采用新工艺后,在所生产的灯管中抽 取 25 只,测得平均寿命为 1675 小时.问采用新工艺后,灯管寿命是否是显著提高?我们的问题 就是要判别新产品的寿命是服从μ>1500 的正态分布呢?还是与老产品一样仍然服从μ =1500 的正态分布呢?若是前者,我们说新产品的寿命有显著提高;若是后者,就说没有显著提 高. 今后我们把任意一个有关未知分布的假设称为统计假设或简称假设.在上面的例子中,我 们可以把所有涉及到的两种情况用统计假设的形式表示出来.第一个统计假设μ=1500 表示 彩新工艺后产品平均寿命没有显著增加.第二个统计假设μ>1500 表示采用新工艺后产品平 均寿命有显著增加.这第一个假设我们称为原假设,用符号 H0 :μ=1500 表示;第二个假设 μ>1500 表示称为备择假设,用符号 H1 :μ>1500 表示.至于在两个假设中用哪一个作为原假 设,哪一个作为备择假设,要看具体的目的和要求而定.假如我们的目的是希望从子样观察值 对某一陈述取得强有力的支持,我们把这一陈述的否定作为原假设,而陈述本身作为备择假设. 很多实际例子都是这样的.譬如例 7.1 中所提出的新工艺对产品寿命确有提高,但它又不可能 象老产品那样有较多的数据.为此,我们取“寿命没有提高(μ=1500) ”作原假设,并以“提高 寿命(μ>1500) ”作备择假设.有时,原假设的选定还要考虑到数学上的处理方便. 在许多问题中,母体分布的类型为已知,仅是一个或几个参数为未知,只要对这一个或几个 未知参数的值作出假设,就可完全确定母体的分布.这种仅涉及到母体分布的未知参数的统计 假设称为参数假设.如上例中就是只对参数μ作出假设.在有些实际问题中,我们不知道母体 分布的具体类型.譬如某种家作物的家药残留量,它可能服从对数正态分布,也可能服从其它 的分布.因此,统计假设只能对未知分布函数的类型或者它的某些特征提出某种假设.这种不 同于参数假设的统计假设称作非参数假设.例如 H0 :F(x) ∈{对数正态分布族} H1 :F(x) ∈{正态分布族} 上面看到,一个统计假设是关于母体分布状态的一种陈述.如 果一个统计假设完全确定母体的分布,则称这假设为简单统计假设或简单假设,否则就称为复 合统计假设或复合假设.如例 7.1 中 H0 :μ=1500,完全确定母体分布 N(1500,40000),所以 H0 为简单假设. H1 :μ>1500 就是一个复合假设.在非参数假设情形,若原假设 H0 :F(x)=F 0 (x)
F,()为具有参数=2. 2三10的对数正态分布.这就是一个简单假设:若原假设 H。F(x)∈{对数正态分布族,它没有指定F(x)是对数分布族中哪一个分布,这就是一个复合 假设,又如,我们要检验两个子样是否米自同一母体,我们作假设H。:F(x一G(x),这里F(x)和 Gx)分别表示这两个子样的分布函,但不指定这两个分布的具体形式这也是一个复合假设 统计假设检验问愿的一般提法是:在给定各择假设H,下对原假设H。作出判断,若拒绝原 假设H。,那就意味着接受备择假设H,否则就接受假设H。,简单的说,假设检验问题就是要 在原假设H。和备择假设H,中作出拒绝哪一个接受哪一个的判断这类假设检验问题常常简 称为H。对H,的检验问题 在H。对H的检验问题中作出某种判断,必须要从子样(ξ,…,ξ。)出发,制定一个法则, 一旦子样的观察值(x,x,)确定后,利用我们所构造的法则作出判断拒绝H。还是拒绝H 这种法则就称为H。对H,的一个检验法则,有时就简称为一个检验法则,或一个检验 我们的检验法则是什么呢?显然,它应该是以定义在子样空间上的一个函数为依据所构成 的一个准则.一旦子样观察什(x,,x,)确定后,我们就可根据这一准则作出判断;拒绝H还 是接受H。所以我们的检验法则本质上就是把子样空间x划分成两个互不相交的子集C和 C,使得当子样(5,…,5。)的观察值点(x…,x)eC,我们将拒绝原假设H。(即接受备择假 设H)若(x,,x,)∈C,我们将接受原假设H。(也即拒绝备择假设H,)这样的划分构成 一个准则,我们称这个子样空间的子集C为检验的临域(或拒绝域). 假如我们给出了H。对H,的某个检验法则,亦即给出了X的一个划分C与C由于子样 的随机性,在进行判断时,我们还是有可能犯两类错误一类错误是,当H。为真时,而子样的观 察值落入C,按给定的检验法则,我们应当拒绝H。,这种错误称为第一类错误其发生的概率称 为犯第一类错误的概率或称拒真概率,通常记为a即 P(拒绝HolH。为真)=a 在上面的例子中就是 P(x1,x)∈Cμ=uo=a 另一种错误是,当H,为真时,而子样的观察落入C`按给定的检验法则,我们应当接受H。这
F 0 (x)为具有参数μ=2, 10 2 = 的对数正态分布,这就是一个简单假设;若原假设 H0 :F(x) ∈{对数正态分布族},它没有指定F(x)是对数分布族中哪一个分布,这就是一个复合 假设,又如,我们要检验两个子样是否来自同一母体,我们作假设 H0 :F(x)=G(x),这里 F(x)和 G(x)分别表示这两个子样的分布函,但不指定这两个分布的具体形式.这也是一个复合假设. 统计假设检验问题的一般提法是:在给定备择假设 H1 下对原假设 H0 作出判断,若拒绝原 假设 H0 ,那就意味着接受备择假设 H1 ,否则就接受假设 H0 ,简单的说,假设检验问题就是要 在原假设 H0 和备择假设 H1 中作出拒绝哪一个接受哪一个的判断这类假设检验问题常常简 称为 H0 对 H1 的检验问题. 在 H0 对 H1 的检验问题中作出某种判断,必须要从子样( 1 n ξ , ,ξ )出发,制定一个法则, 一旦子样的观察值( n x , x 1 )确定后,利用我们所构造的法则作出判断;拒绝 H0 还是拒绝 H1 这种法则就称为 H0 对 H1 的一个检验法则,有时就简称为一个检验法则,或一个检验. 我们的检验法则是什么呢?显然,它应该是以定义在子样空间上的一个函数为依据所构成 的一个准则.一旦子样观察什( n x , x 1 )确定后,我们就可根据这一准则作出判断;拒绝 H0 还 是接受 H0 .所以我们的检验法则本质上就是把子样空间 x 划分成两个互不相交的子集 C 和 * C ,使得当子样( 1 n ξ , ,ξ )的观察值点( n x , x 1 )∈C,我们将拒绝原假设 H0 (即接受备择假 设 H1 ).若( n x , x 1 )∈ * C ,我们将接受原假设 H0 (也即拒绝备择假设 H1 ).这样的划分构成 一个准则,我们称这个子样空间的子集 C 为检验的临域(或拒绝域). 假如我们给出了 H0 对 H1 的某个检验法则,亦即给出了 X 的一个划分 C 与 * C .由于子样 的随机性,在进行判断时,我们还是有可能犯两类错误.一类错误是,当 H0 为真时,而子样的观 察值落入C,按给定的检验法则,我们应当拒绝 H0 ,这种错误称为第一类错误.其发生的概率称 为犯第一类错误的概率或称拒真概率.通常记为 a 即 P(拒绝 H0 | H0 为真)=a 在上面的例子中就是 P(( n x , x 1 )∈C|μ=μ0 )=a 另一种错误是,当 H1 为真时,而子样的观察落入 * C ,按给定的检验法则,我们应当接受 H0 这
种错误称为第二种错误,其发生的概率称为犯第二类错误的概率或称受伪概率,通常记为B即 P(接受H。IH为真)=B 在上面的例子中就是 P(x1…,x)∈CIμ≠μ0 对给定的一对H。和H,总可找出许多临界域当然,我们希望得这种临界域C,使得犯两 类错误的概率a和B都很小.但是在子样容量n固定时,要使a与B都很小是不可能的,否则将 会导致子样容量·的无限增大,这又是不实际的基于这种情况,奈曼与皮尔提出一个原则,即 在控制犯第一错误的概率的条件下,尽量使犯第二类错误的概率B小,因为人们常常把拒绝 H。比错误的接受H。看得更重要些.基于奈曼皮尔逊的这一原则去寻找最优检验的总是将 在本章未讨论 现在我们进一步讨论:对给定的犯第一类错误的概率a往后也称显著性水平,在H。的检 验总是中如何来构造一个检验呢?假如一个检验已确定,那末临界域C及其补集C‘就完全确 定.在实践中为了能简化数据,总是去寻找这样一个统计量(今后称为检验统计 量)=5,…,5n),并记 n=t(x…,xn)(x…,xn)eC} n=(x…,xn(…,x)eC 于是 PI∈nlH为真)=P(x,x)∈CH为真)=a (7.1) Pt∈n'1H,为真)=P(x,x)∈C`为真)FB 这样,根据子样观察值,计算相应统计量t的值,就可作等价的判断: 值得注意的是,倘若统计量t的分布已知,那末在原假设H。成立的条件下,对给定的a可 以通过等式 P(t∈nlH。为真)a 来定出区域n.譬如在例7.1中,如果原假设H。:μ。=1500为真,那末在新工艺下的灯管 寿命仍服从N(1500,40000),于是25只灯管的平均寿命E服从N1500,1600).在重复取样下,号 取值可以小于,等于或大于1500大到什么程度,我们才认为这组子样观察值已经不是从H。所 规定的母体中抽出的?这时我们取
种错误称为第二种错误,其发生的概率称为犯第二类错误的概率或称受伪概率,通常记为β即 P(接受 H0 | H1 为真)= β 在上面的例子中就是 P(( n x , x 1 )∈ * C |μ≠ μ0 对给定的一对 H0 和 H1 ,总可找出许多临界域.当然,我们希望得这种临界域 C,使得犯两 类错误的概率 a 和β都很小.但是在子样容量 n 固定时,要使 a 与β都很小是不可能的,否则将 会导致子样容量 n 的无限增大,这又是不实际的.基于这种情况,奈曼与皮尔提出一个原则,即 在控制犯第一错误的概率 a 的条件下,尽量使犯第二类错误的概率β小,因为人们常常把拒绝 H0 比错误的接受 H0 看得更重要些.基于奈曼皮尔逊的这一原则去寻找最优检验的总是将 在本章未讨论. 现在我们进一步讨论:对给定的犯第一类错误的概率 a,往后也称显著性水平,在 H0 的检 验总是中如何来构造一个检验呢?假如一个检验已确定,那末临界域 C 及其补集 * C 就完全确 定 . 在 实践 中 为 了能 简 化 数 据, 总是 去 寻 找这 样 一 个 统计 量 ( 今 后 称 为检 验 统 计 量)t=t( 1 n ξ , ,ξ ),并记 η={t=t ( n x , x 1 ):( n x , x 1 )∈C} η={t=t ( n x , x 1 ):( n x , x 1 )∈ * C } 于是 P(t∈η| H0 为真)=P(( n x , x 1 )∈C| H0 为真)=a (7.1) P(t∈ * | H1 为真)=P(( n x , x 1 )∈ * C |为真)= β 这样,根据子样观察值,计算相应统计量 t 的值,就可作等价的判断: 值得注意的是,倘若统计量 t 的分布已知,那末在原假设 H0 成立的条件下,对给定的 a 可 以通过等式 P(t∈η| H0 为真)= a 来定出区域η.譬如在例 7.1 中,如果原假设 H0 : μ0 =1500 为真,那末在新工艺下的灯管 寿命仍服从N(1500,40000),于是25只灯管的平均寿命 服从N(1500,1600).在重复取样下, 取值可以小于,等于或大于1500大到什么程度,我们才认为这组子样观察值已经不是从 H0 所 规定的母体中抽出的?这时我们取
u-150 40 作为检验统计量.容易看出,在H。为真时,它服从N(0,1),于是对给定的a,通过等式 P(>)-a 可以定出一个值4时就拒绝原假设H。否则就接受H。 若我们一次抽样得到的观察值(x1…,x)∈C,就作出拒绝H。:μ=1500的决定这时犯第 一类错误的概率a005现在我们观察到25只灯管的平均寿命为=》x,=1675显然 25台 x>156,这一组子样值是落入临域C的,我们就拒绝原假设H。:4=1500,并且说x与1500差 异显著 那么为什么能作出拒绝H的决定呢?换名话说,为什么能把{(任,…x,)云>1566作这临 界域C呢?因为u=1500下, P(E>1566=0.05 这意味着“>1566”是一个小概率事件.根据小概率事件在一次试验中认为不可能发生的实 际推断原理,现在在一次试验或观察中出现了,我们甘骨犯第一类错误的风险而拒绝原假设 H。 我们在这里归纳一下解题的思想和步骤 (①)根据根据的要求建立原假设H,及备择假设H,(在以下的叙述中我们以例7.1中的 H和H,来说明): (②)选择一个合适的统计量“,一般以简单为好,并且它的抽样分布不含任何未知参数 从而可以算出它的分位点, (③)给定显著性水平a的值(一般取得较小,如0.05,0.01等),并在原假设H。为真的条件 下求出能使 Pa,(u>)≤a 成立的4值,从而求出临界域C={(…x)上μ(…x)≥4(临界域可以是单侧,也可以 是双侧,可根据具体情况予以解决), (4)若由子样观察值算出的μ的值(x,…x)≥,即子样观察值落入临界域C,则拒绝原假
μ= 40 −1500 作为检验统计量.容易看出,在 H0 为真时,它服从 N(0,1),于是对给定的 a,通过等式 P(μ> 1−a )=a 可以定出一个值 1−a 时就拒绝原假设 H0 否则就接受 H0 . 若我们一次抽样得到的观察值( n x , x 1 )∈C,就作出拒绝 H0 :μ=1500 的决定.这时犯第 一类错误的概率α=0.05.现在我们观察到 25 只灯管的平均寿命为 1675 25 1 25 1 = = i= i x x 显然 x >1566,这一组子样值是落入临域 C 的,我们就拒绝原假设 H0 : =1500,并且说 x 与 1500 差 异显著. 那么为什么能作出拒绝 H0 的决定呢?换名话说,为什么能把{ ( ) 1 n x x : x >1566}作这临 界域 C 呢?因为μ=1500 下, P( >1566)=0.05 这意味着“ >1566”是一个小概率事件.根据小概率事件在一次试验中认为不可能发生的实 际推断原理,现在在一次试验或观察中出现了,我们甘冒犯第一类错误的风险而拒绝原假设 H0 . 我们在这里归纳一下解题的思想和步骤: (1) 根据根据的要求建立原假设 H0 及备择假设 H1 (在以下的叙述中我们以例7.1中的 H0 和 H1 来说明); (2) 选择一个合适的统计量μ,一般以简单为好,并且它的抽样分布不含任何未知参数, 从而可以算出它的分位点; (3) 给定显著性水平α的值(一般取得较小,如 0.05,0.01 等),并在原假设 H0 为真的条件 下求出能使 H0 P (μ> 0 )≤α 成立的 0 值,从而求出临界域 C={ ( ) 1 n x x :μ ( ) 1 n x x ≥ 0 }(临界域可以是单侧,也可以 是双侧,可根据具体情况予以解决); (4) 若由子样观察值算出的μ的值 ( ) 1 n x x ≥ 0 ,即子样观察值落入临界域 C,则拒绝原假
设。,否则接受
设 H0 ,否则接受 H0