93总体分布的假设检验 通常的处理方法是:先依据某种理由假设总体的一个 理论分布或分布形式,然后用获得的样本检验总体是否服从 这样的理论分布检验总体分布的方法很多,在这里我们仅 介绍分布函数的检验法 x2检验法的基本想法:假设X服从某一理论分布F(x),提出假设 Ho: F(x)=FoG)H,: F(x)* Folr) 若F(x)中包含有未知参数,可先利用极大似然法求得未知参数 的估计.然后在(-∞,+∞)内插入l-1个分点a1,a2,…,a11,构造 下面的总体分布假设检验表(一般取l=6~17) 欐率统计(ZYH) ▲区u
概率统计(ZYH) 9.3 总体分布的假设检验 0 0 1 0 H F x F x H F x F x : ( ) : ( ) = ( ) ( ) 通常的处理方法是:先依据某种理由假设总体的一个 理论分布或分布形式,然后用获得的样本检验总体是否服从 这样的理论分布.检验总体分布的方法很多,在这里我们仅 介绍分布函数的检验法. X F x 0 2 检验法的基本想法:假设 服从某一理论分布 ( ),提出假设 0 1 2 1 ( , ) 1 6 ~ 17 l F x l a a a l − + − − = 若 ( )中包含有未知参数,可先利用极大似然法求得未知参数 的估计. 然后在 内插入 个分点 , , , ,构造 下面的总体分布假设检验表(一般取 )
总体分布假设检验表 区间划分 频数 (n12-P (=6~17) 概率 (n25)理论频数m (n1-1)2 P n 152 np 2 (n1-1-Pp1-1) l-2:l-1 1-1,+) n 合计 欐率统计(ZYH) ▲区u
概率统计(ZYH) 总体分布假设检验表 区间划分 2 ( ) i i i n np np − i 概率p 合计 频数ni 理论频数npi 1 (- , ] a 1 2 ( , ] a a 2 1 ( , ] l l a a − − 1 ( , ) l a − + 2 1 1 1 ( ) n np np − 2 2 2 2 ( ) n np np − 2 1 1 1 ( ) l l l n np np − − − − 2 ( ) l l l n np np − 2 1 p 2 p l 1 p − l p 1 n1 n2 nl−1 nl n np1 np2 npl−1 npl n 5 ni ( ) l = 6 ~ 17 ( )
皮尔逊证明了: 在n→∞时,样本观测值x1,x2,…,xn落入每一个区间的个 数n,n2,…,nn(即频数,一般要求n1≥5,不足5时可以合并区间) 与理论频数m,m2…m间的差异统计量x2=∑m (见上表)的分布趋于自由度为l-k-1的x2分布,其中l是划分 的区间个数,k是理论分布函数F(x)中需要利用极大似然法估计 的参数个数.亦即,对大样本(一般要求n≥50)有 (n2-m1) 近似 x2(-k-1) 故否定假设H0:F(x)=F(x)的拒绝条件(或拒绝域)为 x2=2 (n1-即) (-k-1) i=1 欐率统计(ZYH) ▲
概率统计(ZYH) 皮尔逊证明了: 2 2 1 ( ) l i i i i n np np = − = 1 2 1 2 , ( 5, 5 ) n n i n x x x n n n n → 在 时 样本观测值 , , , 落入每一个区间的个 数 , , , 即频数,一般要求 不足 时可以合并区间 0 1 ( 50) l k l k F x n − − 2 (见上表)的分布趋于自由度为 的 分布,其中 是划分 的区间个数, 是理论分布函数 ( )中需要利用极大似然法估计 的参数个数. 亦即,对大样本 一般要求 有 2 2 2 1 ( ) ~ ( 1) l i i i i n np l k np = − = − − 近似 0 0 故否定假设H F x F x : ( ) = ( )的拒绝条件(或拒绝域)为 2 2 2 1 ( ) ( 1) l i i i i n np l k np = − = − − 与理论频数 np np np 1 2 n , , , 间的差异统计量
例1某材料的抗断强度原来呈正态分布,今改变了配料 方案,做了66次抗断性强度试验,所得数据(单位:N/mm2)如下 20.0,13.7,191,11.3,15.3,18.2,138,218,24,9,13.9,26,9 14.5,168,23.5,194,19.8,16.3,20.7,17.1,177,193,156 194,13.7,15.7,18.2,22.1,16.3,192,19.4,10.9,13.9,135 16.1,20.5,15,1,14.9,22.6,178,20.7,16,4,19.0,193,12.0 157,14.0,13.8,18.2,13.1,16.1,16.3,17.1,22.3,11.9,15.7 18.1,19.0,20.1,16.9,17.1,23.7,20.5,156,17.2,23.1,191 试问这种建筑材料的抗断强度仍呈现正态分布吗(=0.05)? 解设抗断强度为X,问题化为检验假设H:X~N(2) 为求未知参数u,a2,用极大似然估计,得 x=17.558, (x1-x)2=3.133 欐率统计(ZYH) ▲
概率统计(ZYH) 某材料的抗断强度原来呈正态分布,今改变了配料 方案,做了66次抗断性强度试验,所得数据(单位:N/mm2 )如下: 例1 20.0, 13.7, 19.1, 11.3, 15.3, 18.2, 13.8, 21.8, 24.9, 13.9, 26.9 14.5, 16.8, 23.5, 19.4, 19.8, 16.3, 20.7, 17.1, 17.7, 19.3, 15.6 19.4, 13.7, 15.7, 18.2, 22.1, 16.3, 19.2, 19.4, 10.9, 13.9, 13.5 16.1, 20.5, 15.1, 14.9, 22.6, 17.8, 20.7, 16.4, 19.0, 19.3, 12.0 15.7, 14.0, 13.8, 18.2, 13.1, 16.1, 16.3, 17.1, 22.3, 11.9, 15.7 18.1, 19.0, 20.1, 16.9, 17.1, 23.7, 20.5, 15.6, 17.2, 23.1, 19.1 试问这种建筑材料的抗断强度仍呈现正态分布吗(α=0.05)? 2 0 2 , : ~ ( , ). , X H X N 设抗断强度为 问题化为检验假设 为求未知参数 ,用极 解 大似然估计,得 1 1 ˆ 17.558, n i i x n = = = 2 2 2 1 1 ˆ ( ) 3.133 n i i x x n = = − =
解设抗断强度为X问题化为检验假设H:X~N(mo2) 为求未知参数u,a2,用极大似然估计,得 ∑ x.=17.558 12 x.-x)2=3.,1332 n 这时由 X--M0,1)知理论分布函数为 X-1758x-17.558 Fo(=PXsx =P d/x-1.558 3.133 3.133 3.133 取分点14.0,15.9,16.7,18.0,19.5,21.0,将(-∞,+) 分为7个子区间,并计算x2值得总体分布假设检验表 由表中计算结果并查2分布表知 x2=4.8794<x2(-k-1)=x5(7-2-1)=949 故接受假设Hn,即认为改变配料方案后,X~N(17558,3.1332) 欐率统计(ZYH) ▲
概率统计(ZYH) 2 0 2 , : ~ ( , ). , X H X N 设抗断强度为 问题化为检验假设 为求未知参数 ,用极大似然估计,得 解 1 1 ˆ 17.558, n i i x n = = = 2 2 2 1 1 ˆ ( ) 3.133 n i i x x n = = − = ~ (0,1) X N − 这时由 知理论分布函数为 0 17.558 17.558 17.558 ( ) { } 3.133 3.133 3.133 X x x F x P X x P − − − = = = 取分点14.0,15.9,16.7,18.0,19.5,21.0,将(- ,+ ) 分为 2 7个子区间,并计算 值得 总体分布假设检验表 由表中计算结果并查 2 分布表知 2 =4.8794 2 2 0.05 ( 1) (7 2 1) 9.49 l k − − = − − = 2 0 故接受假设H X N ,即认为改变配料方案后, ~ (17.558, 3.133 )
例2观察2880个婴儿出生时刻知0~24小时各时间间 隔(每间隔1小时)出生婴儿人数如下: 127,139,142,138,134,115,127,113,126,122,121,119 130,125,112,97,115,94,99,97,100,119,127,139 眼可以看出,出生人数更多地集中在夜间试问这种倾向 是否显著(α=0.05) 解设X表示婴儿出生的时刻则问题化为检验假设 H0:P1=P{-1<X≤}=,(i=1,2,…,24) 24 由假设知n2=2880/24=120,从而有 x2-∑-吗)= (n2-120)2 120 =40467≥x22(24-0-1)=352 故拒绝H,即认为出生时刻不均匀,而是更多地集中在夜间 欐率统计(ZYH) ▲
概率统计(ZYH) 观察2880个婴儿出生时刻知0~24小时各时间间 隔(每间隔1小时)出生婴儿人数如下: 例2 解 设X表示婴儿出生的时刻,则问题化为检验假设 127, 139, 142, 138, 134, 115, 127, 113, 126, 122, 121, 119 130, 125, 112, 97, 115, 94, 99, 97, 100, 119, 127, 139 一眼可以看出,出生人数更多地集中在夜间,试问这种倾向 是否显著(α=0.05)? 2880 / 24 120 npi 由假设知 = = ,从而有 0 1 : { 1 } ( 1,2, ,24) 24 H p P i X i i i = − = = 24 24 2 2 2 1 1 ( ) ( 120) 40.467 120 i i i i i i n np n np = = − − = = = 2 0.05 (24 0 1) 35.2 − − = 故拒绝 H0 ,即认为出生时刻不均匀,而是更多地集中在夜间