§7.4非参数假设检验 在§7.2中讨论了母体分布类型为已知时的参 数假设检验问题.一般在进行参数假设检验之 前,需要对母体的分布进行推断.本节将讨论母 体分布的假设检验问题.因为所用的方法适用 于任何分布或者仅有微弱假定分布,实质上是 不依赖于分布的.在数理统计学中不依赖于分 布的统计方法统称为非参数统计方法.这里所 讨论的问题就是非参数假设检验问题.这里所 研究的检验是如何用子样去似全母体分布,所 以又称为分布拟合扰度检验,一般有两种:一是 拟合母体的分布函数;另一是拟合母体分布的 概率函数.这里我们只介绍三种检验方法:概率 图纸法.-拟合优度检验和柯尔莫哥洛夫斯米 尔诺夫检验
§ 7.4 非参数假设检验 在§7.2中讨论了母体分布类型为已知时的参 数假设检验问题.一般在进行参数假设检验之 前,需要对母体的分布进行推断.本节将讨论母 体分布的假设检验问题.因为所用的方法适用 于任何分布或者仅有微弱假定分布,实质上是 不依赖于分布的.在数理统计学中不依赖于分 布的统计方法统称为非参数统计方法.这里所 讨论的问题就是非参数假设检验问题.这里所 研究的检验是如何用子样去似全母体分布,所 以又称为分布拟合扰度检验,一般有两种:一是 拟合母体的分布函数;另一是拟合母体分布的 概率函数.这里我们只介绍三种检验方法:概率 图纸法. -拟合优度检验和柯尔莫哥洛夫斯米 尔诺夫检验
一,概率图纸法 这是一种此较直观和简便的检验方法.它适合于在现场使 用.目前常见的概率图纸有正态,对数正态,二项分布,指数分布 和威布尔分布概率图纸等这里我们只介绍正态概率图纸,关 于其它分布的概率图纸的构造原理和使用方法都是类似的 1.正态概率图纸的构造原理 设母体有分布函数F(8,N(4,G2)》表示正态分布族 需要检验假设 H:F(x)∈(2W(4,σ2)》 这里4和σ2均为未知常数在原假设H。为真时,通过中
心化变换 1-“ F(x)= gsdt三6m8 2π0- 即A)=5严 服从正态N0,).函效是x的线性拯数 =5 (7.13) C 在(8,〔8)直角坐标平面上是一条直线这条直线过4,0),且 斜率为 2.检验步骤
事实上,我们知道的不是母体取出的一组子样观察值 x1,·,x由格里汶科定理知道子样的经验分布函数F(x) 依慨率收剑于母体分布函数F().所以在检验母分体布函数 F()是否属于正态分布族时,我们以大子样的经验分布函数 F(x)作为母体分布的近似若H。F(8)∈(K4,σ2)》为真, 那末点(x,F(x),i=1,…,,在正态概率图纸上应该在一 条直线上.所以根据上述经验分布函数F,(x)是母体分布函 数F(8很好的近似,点(x,F(x》,i=1,…,,在正态概率图
纸上也应该近似地在一条直线附近倘若点列(x,F(x》,不 是近似地在一条直线附近,那末只能说明F(x)不属于正态分 布族根据上述想法,用正态概率图纸去检验假设H的具体 步骤如下」 (1)整理数据 (2)描点 (3)目测这些点的位置, 3.未知参数4与G2的估计 若通过概率图纸检验已经知道母体服从正态分布,我们就 凭目测在概率图纸上画出最靠近各点
(,R(x》,i=1,,%,的一条直线1因为4()=5-4 服从正态N0,1所以当4()=-严=0即答4时对应的 概率F=0.5.因此,只要在概率图纸上面一条F=0.5的水平直线 这条直线与直线1的交点的横坐标x5就可以作为参数为“ 的估计.又由4(8)=1时所对应的概率F=0.8413的水平直线, 这条直线与直线1的交点的横坐标为x0413这个x0413显然 满足64B=0845一丛=1即G=04B一女因此可以用 6 差x0.8413-x05估计C.2
例7.8咯)见P338 二,x2的似体检验法 前面介绍了直观而简便的概率图纸法,它不需要很多计算 就能对母体分布族作出一个统计推断,并且还能对分布所含 的参数作出估计但是这种方法因人而异,且精度不高,又不能 控制犯错误的概率这里介绍X2拟合检验法,它能够像各种 显著性检验一样控制犯第一类错误的概率 设母体的分布函数为具有明确表达式的F(),我们把随 机变量号的值域R分成k个互不相容的区间 A=[a,aA2=[a1,a2]…,A=[ak-1,a]这些区间不-
定有相同的长度 设x1,…,x是容量为的子样的一组观测值.2:为子样观 测值x1,…,x中落入4的频数∑%=n在这n次事件4 出现的频率为 我们现在检验原假设H。:F(x)=F。(x).设在原假设 H。成立下,母体落入区间A的概率为P,即
日=P(4)=(a)-F(a-1),i=1,…k (7.14) 此时n个观察值中,恰有81个值落入A内,22的观察值落入 A2内,…2.个观察值落入A,内的概率为 刻 …P 2122…2k 这是一个多项分布 按大数定理,在H。为真时,频率与概率的差异不应
太大根据这个思想构造一个统计量 22-克%-) (7.15) R 称做X2统计量往后可以看到,用x2表示这一统计量不是 没有原因的因为它的极限分布就是自由度为k-1的x2分布 为了能够把X2统计量用来作检验的统计量,我们必须知 道它的抽样分布我们先=2的简单情形.在H。成立下, P(A)=日,P(A2)=B