第二十一讲分布拟合检验 重点:分布拟合检验方法 在很多场合下,我们连总体服从什么分布也无法知道,这时我们需要对总体的分布进行检验, 这正是分布拟合检验要解决的问题 、分布拟合检验的方法 原假设H:F(x)=F0(x)(X为离散时用分布律) 1.若F(x)中含s个未知参数,用极大似然法估计。2.当X为连续型 时将X的可能取值范围R分成不相交的子区间算出落入第i个小区间内 样本值个数n。当X为离散型时将X取值分成类,算出频数。3.计算 万 法|D=F(t)-F(t-)及m,将mp小于5的与相邻区间或类合并,设合并 后小区间或类个数为k4.计算检验统计量x2=-m25.拒绝域 例题 例1在某一实验中,每隔一定时间观测一次某种铀所放射的到达计数器上的a粒子数X,共观测了 100次,得结果如下表所示 01234 n1516172611992 1100
第二十一讲 分布拟合检验 重点:分布拟合检验方法 在很多场合下,我们连总体服从什么分布也无法知道,这时我们需要对总体的分布进行检验, 这正是分布拟合检验要解决的问题。 一、分布拟合检验的方法 原假设 H0:F(x)=F0(x)(X 为离散时用分布律) 方 法 1.若 F0(x)中含 s 个未知参数,用极大似然法估计。2.当 X 为连续型 时将 X 的可能取值范围 R 分成不相交的子区间算出落入第 i 个小区间内 样本值个数 ni。当 X 为离散型时将 X 取值分成类,算出频数。3.计算 pi=F0(ti)-F0(ti-1) 及 npi, 将 npi小于 5 的与相邻区间或类合并,设合并 后小区间或类个数为 k 4.计算检验统计量 = − = k i i i i np n np 1 2 2 ( ) 5.拒绝域 ( 1) 2 2 k − s − 二、例题 例 1 在某一实验中,每隔一定时间观测一次某种铀所放射的到达计数器上的α粒子数 X,共观测了 100 次,得结果如下表所示 i 0 1 2 3 4 5 6 7 8 9 10 11 ∑ ni 1 5 16 17 26 11 9 9 2 1 2 1 100
其中n为观测到i个粒子的次数。从理论上考虑,X应服从泊松分布,问这种理论上的推断是否符 合实际(取显著性水平a=0.05) 解:原假设H:X服从泊松分布P{X=l} λ的极大似然估计值为元=x=42 当H为真时,P{X=l的估计值p 4.21 ,i=0,1, x2的计算如下表所示。 P n pi (npi-n, 0.015 1.5 0.415 0.063 6.3 0123456789 0.132 13.2 0.594 0.185 18.5 0.122 0.194 19.4 2.245 0.163 16.3 1.723 0.114 11.4 0.505 0.069 6.9 2.1 0.639 0.036 0.0385 0.017 1.7 10 0.007 0.7 11 0.003 0.3 0.002 0.2 6.2815 查表可得x205=12.592,由于x2=68215<12.592,故在显著性水平a=0.05下接受H,即认为理论上 的推断符合实际 例2自1965年1月1日至1971年2月9日共2231天中,全世界记录到的里氏震级4级和4级以 上地震计162次,统计如下 两次地震间隔天数0~45~910~1920~2425~2930~3435~39≥40
其中 ni为观测到 i 个粒子的次数。从理论上考虑,X 应服从泊松分布,问这种理论上的推断是否符 合实际(取显著性水平α=0.05) , 0,1, ! { } 0 = = = − i i e H X P X i i 解:原假设 : 服从泊松分布 λ的极大似然估计值为 4.2 ˆ = x = , 0,1, ! 4.2 { } ˆ 4.2 0 = = = − i i e H P X i p i 当 为真时, 的估计值 2 的计算如下表所示。 i ni pi ˆ n pi ˆ n pi ˆ - ni i i i np np n ˆ ( ˆ ) 2 − 0 1 0.015 1.5 1.8 0.415 1 5 0.063 6.3 2 16 0.132 13.2 -2.8 0.594 3 17 0.185 18.5 1.5 0.122 4 26 0.194 19.4 -6.6 2.245 5 11 0.163 16.3 5.3 1.723 6 9 0.114 11.4 2.4 0.505 7 9 0.069 6.9 -2.1 0.639 8 2 0.036 3.6 0.5 0.0385 9 1 0.017 1.7 10 2 0.007 0.7 11 1 0.003 0.3 ≥12 0 0.002 0.2 ∑ 6.2815 查表可得 12.592 2 0.05 = ,由于 6.8215 12.592 2 = ,故在显著性水平α=0.05 下接受 H0,即认为理论上 的推断符合实际 例 2 自 1965 年 1 月 1 日至 1971 年 2 月 9 日共 2231 天中,全世界记录到的里氏震级 4 级和 4 级以 上地震计 162 次,统计如下: 两次地震间隔天数 0~4 5~9 10~19 20~24 25~29 30~34 35~39 ≥40
出现的频数 50311710 8 试检验相继两次地震间隔天数是否服从指数分布?取显著性水平α=0.05 解:原假设H0:X的概率密度为f(x)= x>0 0x≤0 λ的极大似然估计值为元=0.0726 X是连续性随机变量,将X可能取值的空间(0,+∞)分为k=9个互不重叠的子区间A1,A2,…,A 当H为真时,的分布函数为F(x)= x>0 x≤0 由上式可得概率p=P{X∈A}的估计值,将计算结果列表如下 ni Pi n Pi ni P-n1) 1(4.5] 500.2788 45.1656 4.83440.5715 2(4.5,9.5]310.2196 35.57524.5752 0.5884 3(9.5,14.5]|260.1527247374|-1.2626|0.0644 4(14.5,19.5]170.106217.20440.2044 0.0024 5(19.5,24.5]10|0.0739 11.9718|1.9718 0.3248 6(24.5,29.5]80.0514 8.3268 0.3268 0.0126 7|(29.5,34.5]60.0358 5.7996 0.20040.0069 8(34.5,39.5]60.0248 4.0176 0.7808 0.046l 9 (39.5,+∞)|810.0568 9.2016 1.5631 查表可得x05(7)=14067,由于x2=156531<14.067,故在显著性水平a=0.05下接受H,即认为X服 从指数分布
出现的频数 50 31 17 10 8 6 6 8 试检验相继两次地震间隔天数是否服从指数分布?取显著性水平α=0.05 = − 0 0 0 ( ) 0 x e x H X f x x 解:原假设 : 的概率密度为 λ的极大似然估计值为 0.0726 ˆ = X 是连续性随机变量,将 X 可能取值的空间(0,+∞)分为 k=9 个互不重叠的子区间 1 2 9 A , A , , A − = − 0 0 1 0 ( ) ˆ 0.0726 0 x e x H X F x x 当 为真时, 的分布函数为 由上式可得概率 pi=P{X∈Ai}的估计值 pi ˆ ,将计算结果列表如下 i Ai ni pi ˆ n pi ˆ n pi ˆ - ni i i i np np n ˆ ( ˆ ) 2 − 1 (4.5] 50 0.2788 45.1656 -4.8344 0.5715 2 (4.5,9.5] 31 0.2196 35.5752 4.5752 0.5884 3 (9.5,14.5] 26 0.1527 24.7374 -1.2626 0.0644 4 (14.5,19.5] 17 0.1062 17.2044 0.2044 0.0024 5 (19.5,24.5] 10 0.0739 11.9718 1.9718 0.3248 6 (24.5,29.5] 8 0.0514 8.3268 0.3268 0.0126 7 (29.5,34.5] 6 0.0358 5.7996 -0.2004 0.0069 8 (34.5,39.5] 6 0.0248 4.0176 -0.7808 0.0461 9 (39.5,+∞) 8 0.0568 9.2016 ∑ 1.5631 查表可得 (7) 14.067 2 0.05 = ,由于 1.5631 14.067 2 = ,故在显著性水平α=0.05 下接受 H0,即认为 X 服 从指数分布