第八章假设检验 s1假设检验
2 第八章 假设检验 §1 假设检验
统计推断的另一类重要问题是假设检验问题 在总体的分布函数完全未知或只知其形式,但 不知道参数的情况,为了推断总体的某些未知 特性,提出某些关于总体的假设例如,提出总 体服从泊松分布的假设,又如,对正态总体提 出数学期望等于的假设等我们是要根据样 本对所提出的假设作出是接受还是拒绝的决 策.假设检验是作出这一决策的过程
3 统计推断的另一类重要问题是假设检验问题. 在总体的分布函数完全未知或只知其形式, 但 不知道参数的情况, 为了推断总体的某些未知 特性, 提出某些关于总体的假设. 例如, 提出总 体服从泊松分布的假设, 又如, 对正态总体提 出数学期望等于m0的假设等. 我们是要根据样 本对所提出的假设作出是接受, 还是拒绝的决 策. 假设检验是作出这一决策的过程
例1某车间用一台包装机包装葡萄糖.包得的 袋装糖重是一个随机变量,它服从正态分布 当机器正常时,其均值为05公斤,标准差为 0015公斤.某日开工后为检验包装机是否正 常,随机地抽取它所包装的糖9袋,称得净重为 公斤 0.497,0.506,0.518,0.524,0.498,0.511,0.520, 0.515.0.512 问机器是否正常?
4 例1 某车间用一台包装机包装葡萄糖. 包得的 袋装糖重是一个随机变量, 它服从正态分布. 当机器正常时, 其均值为0.5公斤, 标准差为 0.015公斤. 某日开工后为检验包装机是否正 常, 随机地抽取它所包装的糖9袋, 称得净重为 (公斤): 0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512 问机器是否正常?
以山O分别表示这一天袋装糖重总体X的均值 和标准差.由于长期实践表明标准差比较稳定 就设a=0.015.于是X~N(40.0152),这里知 问题是根据样本值来判断=0.5还是0.5.为 此,我们提出两个相互对立的假设 G:=A=0.5 和 H1:=0.5 然后给一个合理的法则,利用已知样本作出是 接受假设H还是接收假设H1,如果接受H, 则认为机器工作正常,否则不正常
5 以m,s分别表示这一天袋装糖重总体X的均值 和标准差. 由于长期实践表明标准差比较稳定, 就设s=0.015. 于是X~N(m,0.0152 ), 这里m未知. 问题是根据样本值来判断m=0.5还是m0.5. 为 此, 我们提出两个相互对立的假设 H0 :m=m0=0.5 和 H1 :m0.5. 然后给一个合理的法则, 利用已知样本作出是 接受假设H0 , 还是接收假设H1 . 如果接受H0 , 则认为机器工作正常,否则不正常
由于要检验的假设涉及总体均值故首先想 到是否可借助样本均值X这一统计量来进行 判断.X是的无偏估计,其观察值的大小在 定程度上反映的大小.如果假设H0为真 则观察值x与A的偏差x-A一般不应太大 若|x过分大,就怀疑假设H0的正确性而拒 绝H0,考虑到当H为真时 X-~N(0,1),而衡 o/vn 量|x-01的大小可归结为衡量的大小 o/√n
6 由于要检验的假设涉及总体均值m, 故首先想 到是否可借助样本均值`X这一统计量来进行 判断. `X是m的无偏估计, 其观察值的大小在 一定程度上反映m的大小. 如果假设H0为真, 则观察值`x与m0的偏差|`x-m0 |一般不应太大. 若|`x-m|过分大, 就怀疑假设H0的正确性而拒 | | . , ~ (0,1), 0 0 0 量 的大小可归结为衡量 的大小 绝 考虑到当 为真时 而 衡 n x x N n X H H s m m s m - - -
因此,可适当选定一正数k,使当观察值x满足 a/7<k,就接受假设n 然而,因为决策的依据是样本,当实际上H为 真时仍可能做出拒绝H0的决策这种可能性是 无法消除的),这是一种错误,犯这种错误的概 率记为 P{当H为真拒绝H}减或P{拒绝H0} 或P=n{拒绝H0
7 因此, 可适当选定一正数k,使当观察值`x满足 , . | | 0 0 k H n x 就接受假设 - s m { }. { } { } 0 0 0 0 0 0 P H P H H P H 或 H 拒 绝 当 为真拒绝 或 拒 绝 m m 然而, 因为决策的依据是样本, 当实际上H0为 真时仍可能做出拒绝H0的决策(这种可能性是 无法消除的), 这是一种错误, 犯这种错误的概 率记为
因无法排除犯这类错误的可能性,因此自然希 望将犯这类错误的概率控制在一定的限度之 类即给出一个较小的数a(0<∝x<1),使犯这类 错误的概率不超过a,即使得 P{当H为真拒绝H0}≤a (1.1) 为确定常数,考虑统计量由于只允许 O/√n 犯这类错误的概率最大为a令(11)式取等号, P{当H为真拒细Hb=Dv/÷k}=a
8 因无法排除犯这类错误的可能性, 因此自然希 望将犯这类错误的概率控制在一定的限度之 类. 即给出一个较小的数a(0<a<1), 使犯这类 错误的概率不超过a, 即使得 P{当H0为真拒绝H0 }a. (1.1) 为确定常数 ,考虑统计量 0 .由于只允许 n X k s - m { } . 0 0 0 0 a s m m = - = k n X P 当H 为真拒绝H P 犯这类错误的概率最大为a, 令(1.1)式取等号
P{当H为真拒绝}=PJX-2k}=a o√n 由于当H为真时_X-~N(0,)由标准正 √n 态分布分位点的定义得:k=xm2 2 O/2 Zo2
9 态分布分位点的定义得: k=za/2. 由于当 为真时 由标准正 当 为真拒绝 , ~ (0,1), { } . 0 0 0 0 0 0 N n X H Z k n X P H H P s m a s m m - = = - = 0 a/2 za/2 a/2 -za/2
因而,若Z的观察值满足 z|= x-Hol2k=a/23 o/vn 则拒绝H0,而若 x z|= <k=n/2, o√n 则接受H
10 因而, 若Z的观察值满足 | | , / 2 0 a s m k z n x z = - = 则拒绝H0 , 而若 | | , / 2 0 a s m k z n x z = - = 则接受H0
例如,在本例中取a=0.05,则有 k=052=a025=196,又已知n=9,o=0.015,再由 样本算得x=0.511,即有 r-p 0.511-0.5 a/√n|0059 =22>1.96, 于是拒绝H,认为这天包装机工作不正常
11 例如, 在本例中取a=0.05, 则有 k=z0.05/2=z0.025=1.96, 又已知n=9, s=0.015, 再由 样本算得`x=0.511, 即有 2.2 1.96, 0.015 9 0 0.511 0.5 = - = - n x s m 于是拒绝H0 , 认为这天包装机工作不正常