s53非参数假设检验方法 前面介绍的各种统计假设的检验方法,几乎都假定了总 体服从正态分布,然后再由样本对分布参数进行检验。 但在实际问题中,有时不能预知总体服从什么分布,这 里就需要根据样本来检验关于总体分布的各种假设,这 就是分布的假设检验问题。在数理统计学中把不依赖于 分布的统计方法称为非参数统计方法。 本节讨论的问题就是非参数假设检验问题。 本节主要介绍拟合优度检验,柯尔莫哥洛夫一斯米尔诺 夫( Kolmogrow- Smirnov)检验和独立性检验。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 1 §5.3 非参数假设检验方法 前面介绍的各种统计假设的检验方法,几乎都假定了总 体服从正态分布,然后再由样本对分布参数进行检验。 但在实际问题中,有时不能预知总体服从什么分布,这 里就需要根据样本来检验关于总体分布的各种假设,这 就是分布的假设检验问题。在数理统计学中把不依赖于 分布的统计方法称为非参数统计方法。 本节讨论的问题就是非参数假设检验问题。 本节主要介绍拟合优度检验,柯尔莫哥洛夫-斯米尔诺 夫(Kolmogrow-Smirnov)检验和独立性检验
、x2拟合优度检验 多项分布的x2检验法 设总体是仅取m个可能值的离散型随机变量,不 失一般性,设X的可能值是1,2,…,m,记它取值 为i的概率为p,即 P(X=i)=p,i=1,2,…,m ∑ 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 2 1.多项分布的 2 检验法 设总体是仅取m 个可能值的离散型随机变量,不 失一般性,设X 的可能值是1,2, ,m ,记它取值 为i的概率为 i p , ( ) , 1,2, , P X i p i m = = = i 1 1 m i i p = = 即 且 一、χ 2拟合优度检验
设(X1,X2,…,Xn)是从总体中抽得的简单随机样本, (x1,x2…,xn)是样本观察值。 用N表示样本(x1,x2…,x)中取值为i的个数,即 样本中出现事件{X=的频数,则N是样本的函数, 所(N1,N2,…,Nn)是随机向量,且有 ∑N=n (N1,N2,…,Nn)服从多项分布,其概率分布为 P(N1=几1 92 29 (5.12) n P 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 3 设 1 2 ( , , , ) X X X n 是从总体X 中抽得的简单随机样本, 1 2 ( , , , ) n x x x 是样本观察值。 用 Ni 表示样本 1 2 ( , , , ) n x x x 中取值为 i的个数,即 样本中出现事件X i = 的频数,则Ni 是样本的函数, 所 1 2 ( , , , ) N N Nm 是随机向量,且有 1 . m i i N n = = 1 2 ( , , , ) N N Nm 服从多项分布,其概率分布为 1 2 1 1 2 2 1 2 1 2 ( , , , ) ! ! ! ! m m m n n n m m P N n N n N n n p p p n n n = = = = (5.12)
需要检验假设 0·P2=p0 H1:P≠Pio(i=1,2,…,m) 其中po是已知数。 我们知道,频率是概率的反映。 如果总体的概率分布的确是(P10,P20…,Pno), 那么,当观察个数n愈来愈大时,频率立与之间 的差异将越来越小,因此频率与0之间的差异程 度可以反映出(P10,p2,…,Pn0)是不是总体的真分布 湘潭大学数学与计算科学学院一四4层m
湘潭大学数学与计算科学学院 上一页 下一页 4 需要检验假设 0 0 1 0 : : ( 1,2, , ) i i i i H p p H p p i m = = 其中 pi 0 是已知数。 我们知道,频率是概率的反映。 如果总体的概率分布的确是 ( , , , ) p p p 10 20 0 m , 那么,当观察个数n 愈来愈大时,频率Ni n 与 i0 p 之间 的差异将越来越小, 因此频率Ni n 与 i0 p 之间的差异程 度可以反映出 10 20 0 ( , , , ) m p p p 是不是总体的真分布
卡尔皮尔逊首先提出运用统计量 2_(N-pa)2 (523) z 来衡量一和p0之间的差异程度,这个统计量称为 皮尔逊统计量 直观上比较清楚,如果(D0,P20,…,Pm)是总体 服从的真实概率分布,统计量x2要偏小些,否则就 有偏大的趋势。因此x2可以用来作为多项分布的 检验统计量。但是还需要知道它的分布,下面的 定理给出了它的渐近分布。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 5 卡尔·皮尔逊首先提出运用统计量 2 2 0 1 0 ( ) m i i n i i N np np = − = (5.23) 来衡量 Ni n 和 i0 p 之间的差异程度,这个统计量称为 皮尔逊统计量。 直观上比较清楚,如果 10 20 0 ( , , , ) m p p p 是总体 服从的真实概率分布,统计量 2 n 要偏小些,否则就 有偏大的趋势。 因此 可以用来作为多项分布的 检验统计量。但是还需要知道它的分布,下面的 定理给出了它的渐近分布。 2 n
定理5,1当H0为真时,即(P10,p20,…,pn0)是总体 的真实概率分布时,由式(523)定义的统计量x2渐 近服从自由度为m-1的x2分布,即 lim p (N-叩o) 0 0 2 2,x>0 x(x,m-1)=122 x<0 是x2m-1)的分布密度函数。 湘潭大学数学与计算科学院一页一页6
湘潭大学数学与计算科学学院 上一页 下一页 6 定理 5.1 当 H0 为真时,即 10 20 0 ( , , , ) m p p p 是总体 的真实概率分布时,由式(5.23)定义的统计量 2 n 渐 近服从自由度为m−1的 2 分布,即 2 0 1 0 2 0 ( ) lim ( , 1) , 0 m i i n i i x N np P x np y m dy x → = − = − , 其中 3 2 2 1 1 2 2 2 1 , 0, ( , 1) 2 0, 0 m x m m x e x x m x − − − − − = 是 2 ( 1) m − 的分布密度函数
定理5.1的证明从略。 由定理51知,当n充分大时,可以近似地认为x2 近似服从x2(m-1)分布。对给定的检验水平 0<a<1,由x2分布表求出常数x2(m-1),使 P ≥y2(n a 给定一组样本值(x1,x2,…,xn),对应的 (N1,N2,…,Nn)的值为(n1,n2,…,n),由式(523) 计算出2的观察值 2=∑ n.-n i=1 0 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 7 定理5.1的证明从略。 由定理 5.1 知,当 n充分大时,可以近似地认为 2 n 近似服从 2 ( 1) m − 分布。对给定的检验水平 0 1 ,由 2 分布表求出常数 2 ( 1) m − ,使 2 2 ( 1) P n n − 给 定 一 组 样 本 值 1 2 ( , , , ) n x x x , 对 应 的 1 2 ( , , , ) N N Nm 的值为 1 2 ( , , , ) n n nm ,由式(5.23) 计算出 2 n 的观察值 2 2 0 1 0 ( ) ˆ m i i n i i n np np = − =
如果≥x2(m-1),则拒绝假设H0,即认为 总体的分布与假设H中的分布有显著差异 若2<2(m-1),则接受H,即认为总体的 分布与假设H中的分布无显著差异 例5.10将一颗骰子掷了120次。如果如下: 点数:1,2,3,4,5,6。 频数:21,28,19,24,16,12。 问这颗骰子是否匀称 (a=0.05) 解依题意,欲检验假设,m
湘潭大学数学与计算科学学院 上一页 下一页 8 如果 2 2 ˆ ( 1) n − m ,则拒绝假设H0,即认为 总体的分布与假设H0中的分布有显著差异。 若 2 2 ˆ ˆ ( 1) n − m ,则接受H0 ,即认为总体的 分布与假设H0 中的分布无显著差异。 例5.10 将一颗骰子掷了120次。如果如下: 点数:1,2,3,4,5,6。 频数:21,28,19,24,16,12。 问这颗骰子是否匀称 ? 解 依题意,欲检验假设( 0.05) =
Ho: P H1:n2≠ 616 计算得 21-120× 120× 2 28-120 19-120+)2 120× 120× 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 9 计算得 0 1 1 : 6 1 : ( 1,2, ,6) 6 i i H p H p i = = 2 2 2 2 1 21 120 6 ˆ 1 120 6 1 1 28 120 19 120 6 6 1 1 120 120 6 6 n − = − − + +
24-120 6 120 16-120 12-120× 120 120× 6 6 8.1 对a=0.05,查附表3得x5(6-1)=11.07。 因为2<x201(5),故接受假设H0, 即可认为这颗骰子是匀称的。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 10 2 2 2 1 24 120 6 1 120 6 1 1 16 120 12 120 6 6 1 1 120 120 6 6 − + − − + + = 8.1 对 = 0.05,查附表 3 得 2 0.05 (6 1) 11.07 − = 。 因为 2 2 0.05 ˆ (5) n ,故接受假设 H0 , 即可认为这颗骰子是匀称的