8.4分布拟合检验 一、总体可分为有限类,且总体分布不含未知参数 二、总体可分为有限类,但总体分布中含有未知参数 三、总体为连续分布的情形 2024年8月27日星期二 2 目录○ 上页> 下页 返回
2024年8月27日星期二 2 目录 上页 下页 返回 8.4 分布拟合检验 一、总体可分为有限类,且总体分布不含未知参数 二、总体可分为有限类,但总体分布中含有未知参数 三、总体为连续分布的情形
一、总体可分为有限类,且总体分布不含未知参数 设总体X可以分成r类,记为A,A,.,A,即将随 机试验的样本空间分解成”个两两互不相容的事件之 和,2=4U4UUA,AA=Φ,i≠j,现在需要 检验假设 Ho:P(A)=P,;H:P(A)≠P 其中∑p,=1且p,为已知.一般地,此类备择假设常常可 i=l 以省略. 2024年8月27日星期二 3 目录○ 、上页 下页 、返回
2024年8月27日星期二 3 目录 上页 下页 返回 设总体 X 可以分成 r 类,记为 1 2 , , , A A Ar ,即将随 机试验的样本空间分解成 r 个两两互不相容的事件之 和 , = A A A 1 2 r , A Ai j = ,i j ,现在需要 检验假设 0 : ( ) H P A p i i = ; 1 : ( ) H P A p i i 其中 1 1 n i i p = = 且 i p 为已知.一般地,此类备择假设常常可 以省略. 一、总体可分为有限类,且总体分布不含未知参数
定理1若n充分大(n≥50),则当H为真时,统计量 吧派服从-)分布,(吧 np 根据上述定理,对于给定的显著性水平α,可以推 知假设检验的拒绝域为 -x-. np 由此可知,在显著性水平a下,当x2≥x2(r-1)时就 拒绝原假设H。,否则就接受原假设H。.这种检验称X 拟合检验 2024年8月27日星期二 目录 、上页> 下页 返回
2024年8月27日星期二 4 目录 上页 下页 返回 定理 1 若 n 充分大( n 50),则当 H0 为真时,统计量 2 2 1 ( ) r i i i i n np np = − = 近似服从 2 ( 1) r − 分布.(证明略) 根据上述定理,对于给定的显著性水平 ,可以推 知假设检验的拒绝域为 2 2 2 1 ( ) ( 1) r i i i i n np r np = − = − . 由此可知,在显著性水平 下,当 2 2 ( 1) r − 时就 拒绝原假设 H0 ,否则就接受原假设 H0 .这种检验称 2 拟合检验
【例9】某公司的人事部门想了解公司职工的病假日是 否服从周一到周五的均匀分布,以便合理安排工作.今 抽取100名职工的病假日,其数据分布如下: 工作日 周一 周二 周三 周四 周五 频数 17 27 10 28 18 试问该公司职工的病假日是否服从周一到周五的均匀 分布?(a=0.05) 若病假日均匀分布在五个工作日中,则应有A}, 解 i=1,2,.,5,以A表示事件“病假日在周i”,则需要检 验假设 P4)=5t=l2.5). 2024年8月27日星期二 目录○ 、上页 下页 返回
2024年8月27日星期二 5 目录 上页 下页 返回 【例 9】 某公司的人事部门想了解公司职工的病假日是 否服从周一到周五的均匀分布,以便合理安排工作.今 抽取 100 名职工的病假日,其数据分布如下: 工作日 周一 周二 周三 周四 周五 频数 17 27 10 28 18 试问该公司职工的病假日是否服从周一到周五的均匀 分布?( = 0.05) 解 若病假日均匀分布在五个工作日中,则应有 1 5 pi = , i =1, 2, ,5,以 Ai 表示事件“病假日在周i ”,则需要检 验假设 0 1 : ( ) , 5 H P Ai = ( 1,2, ,5) i =
选择检验统计量=吧》,由定理1知 np np 当显著性水平为=0.05时,检验的拒绝域为 t-2≥xr-). np. 又 吧 (17-20)2,(27-20)2,(10-20)2,(28-20)2,(18-20) 20 20 20 20 20 =11.3. 2024年8月27日星期二 6 目录 上页 下页 返回
2024年8月27日星期二 6 目录 上页 下页 返回 选择检验统计量 2 2 1 ( ) r i i i i n np np = − = ,由定理 1 知 2 2 1 ( ) ~ ( 1) r i i i i n np r np = − − . 当显著性水平为 = 0.05时,检验的拒绝域为 2 2 2 1 ( ) ( 1) r i i i i n np r np = − = − . 又 5 2 2 1 ( ) i i i i n np np = − = 2 2 2 2 2 (17 20) (27 20) (10 20) (28 20) (18 20) 20 20 20 20 20 − − − − − = + + + + =11.3
查表得x6s(4)=9.488,显然有11.3>9.488,即样本 观测值落在拒绝域内.因此,在显著性水平=0.05下 拒绝H。,从而认为该公司职工的病假日不服从周一到周 五的均匀分布. 2024年8月27日星期二 7 目录>上页下页○ 返回
2024年8月27日星期二 7 目录 上页 下页 返回 查表得 2 0.05 (4) 9.488 = ,显然有 11.3 9.488 ,即样本 观测值落在拒绝域内.因此,在显著性水平 = 0.05下 拒绝 H0 ,从而认为该公司职工的病假日不服从周一到周 五的均匀分布
二、总体可分为有限类,但总体分布中含有未知参数 设总体X可以分成r类,记为A,A,.,A,即将随 机试验的样本空间分解成·个两两不相容的事件之和, 2=AUA,UUA,A,A=Φ,i≠j,现在需要检验 假设 H:P(A)=p,(i=1,2,.,r), 其中p为未知参数0,02,.,0的函数,即 p=p,(0,0日2,.,0),i=1,2,.,r. 2024年8月27日星期二 8 目录○ 上页> 下页 返回
2024年8月27日星期二 8 目录 上页 下页 返回 设总体 X 可以分成 r 类,记为 1 2 , , , A A Ar ,即将随 机试验的样本空间分解成 r 个两两不相容的事件之和, = A A A 1 2 r , A Ai j = ,i j ,现在需要检验 假设 0 : ( ) H P A p i i = ,(i r =1, 2, , ), 其 中 i p 为 未 知 参 数 1 2 , , , k 的 函 数 , 即 1 2 ( , , , ) p p i i k = ,i r =1, 2, , . 二、总体可分为有限类,但总体分布中含有未知参数
般地,先求出0的极大似然估计0,i=1,2,.,k, 然后计算出p,(01,02,0k),代入检验统计量得 x2=-np)》 i=l npi 议证明,当H为时,统计量乙 np 近似服从自由度为r-k-1的x分布(r>k+1),由此可 导出相应的拒绝域为 r-2p≥. npi 2024年8月27日星期二 目录 上页 下页 返回
2024年8月27日星期二 9 目录 上页 下页 返回 一般地,先求出i 的极大似然估计 i ,i k =1,2, , , 然后计算出 ( , , , ) 1 2 k i p ,代入检验统计量得 2 2 1 ( ) r i i i i n n p n p = − = . 可以证明,当 H0 为真时,统计量 2 2 1 ( ) r i i i i n n p n p = − = 近似服从自由度为r k − −1的 2 分布( r k +1),由此可 导出相应的拒绝域为 2 2 2 1 ( ) ( 1) r i i i i n n p r k n p = − = − −
【例10】查了一本书的100页,记录各页中印刷错误 的个数,其结果为 错误个数n 0 1 2 3 5 6 含n,个错误的页数 36 40 19 2 0 2 1 0 据此数据,问能否认为该书的一页中印刷错误个数服从 泊松分布?(a=0.05) 解按题意需检验假设 只Pr=小-g.=12. 记A={X=},(i=01,2,.,6),4,={X≥7}: 2024年8月27日星期二 10 目录○ 上页 下页 返回」
2024年8月27日星期二 10 目录 上页 下页 返回 【例 10】 查了一本书的 100 页,记录各页中印刷错误 的个数,其结果为 错误个数ni 0 1 2 3 4 5 6 7 含ni 个错误的页数 36 40 19 2 0 2 1 0 据此数据,问能否认为该书的一页中印刷错误个数服从 泊松分布?( = 0.05) 解 按题意需检验假设 0 e : ! i H P X i i − = = ,(i = 0,1,2, ). 记 A X i i = = ,(i = 0,1,2, ,6 ), A X 7 = 7
则假设等价于 P4029=012.6 P4)=1-Ae =0 原假设H,中含有未知参数入,由极大似然估计得 元=x=(0×36+1×40+2×19+3×2+4×0+ 5×2+6×1+7×0)/100=1. 由此可得 巴FP0=,0126,P4)=129J 2024年8月27日星期二 11 目录 上页 下页 返回
2024年8月27日星期二 11 目录 上页 下页 返回 则假设等价于 0 e : ( ) ! i H P Ai i − = ,( i = 0,1,2, ,6 ), 6 7 0 e ( ) 1 ! i i P A i − = = − . 原假设 H0 中含有未知参数 ,由极大似然估计得 ˆ (0 36 1 40 2 19 3 2 4 0 5 2 6 1 7 0) /100 1. = = + + + + + x + + = 由此可得 1 e ( ) ! i i p P A i − = = ,( i = 0,1,2, ,6 ), 6 1 7 0 e ˆ ( ) 1 i ! P A i − = = −