正在加载图片...
2°直观上有一定差异。显著性检验是把H:μ=μ。视为固定常数,依据它建立理论分布,再 来判断实际观察值X是否小概率事件;区间估计则是把观察值X视为最可能的μ的取值 点估计),再以它为中心建立一个区间,并给出母体参数μ落入这一区间的概率(置信水 3.5非参数检验I:x2检验 前边我们介绍的假设检验都属于参数检验,也就是说检验目标是判断总体参数是否等于 某一指定值,或两个总体的某一参数是否相等。本节主要介绍另一类检验,这就是非参数检 验。它检验的目标一般与参数无关,而是总体分布的某种性质,例如是否服从某种指定的分 布,两个事件是否独立等等 x2检验在非参数检验中应用相当广泛。在以前的检验中我们也用过x2分布,当时用于 检验总体的方差σ2是否等于某一指定值。而本节的用法与上述用法不同,它主要基于以下 的 Pearson定理 Pearson定理:当(P1,P2,…P)是总体的真实概率分布时,统计量 np (3.30) 随n的增加渐近于自由度为r-1的x2分布 (3.30)式的统计量也被称为 Pearson计量。其中P,P2,…P为r种不同属性出现的概 率,n为样本含量,n为样本中第i种属性出现的次数。 由于n是样本中第ⅰ种属性出现的次数,是观察值;而p是第i种属性出现的概率,因 此np可被看作是理论上该样本中第i种属性应出现的次数。这样我们就可以换一种写法 把n视为观察值O,np视为理论值T;,则(3.30)式可写成 (O1-11 (3.31) 这样一来, Pearson定理实际是说如果样本确实抽自由(P:,P2,…P)代表的总体,O和 T之间的差异就只是随机误差,则 Pearson统计量可视为服从x2分布:反之若样本不是抽自 由(P1,P2,…P)代表的总体,O和T1之间的差异就不只是随机误差,从而使计算出的统 计量有偏大的趋势。因此对上述 Pearson统计量进行上单尾检验可用于判断离散型数据的观 察值与理论值是否吻合。此时统计假设为:Ho:O1=T:;HA:O≠Tl,但检验是上单尾检验。 显然,上述数据应满足 n2∑P 另外,为了使 Pearson统计量近似服从x(r-1)分布,还要求: 1°各理论值均大于5。即:T≥5,i=1,2,…,r。如果有一个或多个T<5,会使 Pearson 统计量明显偏离ⅹ2分布,可能导致错误检验结果 2°若自由度为1,则应作连续性矫正,即把统计量改为 z=∑-列-0 T 还应注意由于 Pearson统计量的H为O=T,所以统计量值为0意味着H0严格成立,2°直观上有一定差异。显著性检验是把 H0:μ=μ0 视为固定常数,依据它建立理论分布,再 来判断实际观察值 X 是否小概率事件;区间估计则是把观察值 X 视为最可能的μ的取值 (点估计),再以它为中心建立一个区间,并给出母体参数μ落入这一区间的概率(置信水 平)。 §3.5 非参数检验 I:χ2检验 前边我们介绍的假设检验都属于参数检验,也就是说检验目标是判断总体参数是否等于 某一指定值,或两个总体的某一参数是否相等。本节主要介绍另一类检验,这就是非参数检 验。它检验的目标一般与参数无关,而是总体分布的某种性质,例如是否服从某种指定的分 布,两个事件是否独立等等。 χ2 检验在非参数检验中应用相当广泛。在以前的检验中我们也用过χ2 分布,当时用于 检验总体的方差σ2 是否等于某一指定值。而本节的用法与上述用法不同,它主要基于以下 的 Pearson 定理。 Pearson 定理:当(P1,P2,…Pr)是总体的真实概率分布时,统计量 = − = r i i i i np n np 1 2 2 ( )  (3.30) 随 n 的增加渐近于自由度为 r-1 的χ2 分布。 (3.30)式的统计量也被称为 Pearson 计量。其中 P1,P2,… Pr 为 r 种不同属性出现的概 率,n 为样本含量,ni 为样本中第 i 种属性出现的次数。 由于 ni 是样本中第 i 种属性出现的次数,是观察值;而 pi 是第 i 种属性出现的概率,因 此 npi 可被看作是理论上该样本中第 i 种属性应出现的次数。这样我们就可以换一种写法, 把 ni 视为观察值 Oi,npi 视为理论值 Ti,则(3.30)式可写成: = − = r i i i i T O T 1 2 2 ( )  (3.31) 这样一来,Pearson 定理实际是说如果样本确实抽自由(P1,P2,…Pr)代表的总体,Oi 和 Ti 之间的差异就只是随机误差,则 Pearson 统计量可视为服从χ2 分布;反之若样本不是抽自 由(P1,P2,…Pr)代表的总体,Oi和 Ti 之间的差异就不只是随机误差,从而使计算出的统 计量有偏大的趋势。因此对上述 Pearson 统计量进行上单尾检验可用于判断离散型数据的观 察值与理论值是否吻合。此时统计假设为:H0:Oi = Ti;HA:Oi ≠ TI,但检验是上单尾检验。 显然,上述数据应满足:   = = = = r i i r i Oi n p 1 1 , 1。 另外,为了使 Pearson 统计量近似服从χ2 (r–1)分布,还要求: 1°各理论值均大于 5。即:Ti ≥ 5, i = 1, 2,…,r。如果有一个或多个 Ti < 5,会使 Pearson 统计量明显偏离χ2 分布,可能导致错误检验结果。 2°若自由度为 1,则应作连续性矫正,即把统计量改为: = − − = r i i i i T O T 1 2 2 ( 0.5)  (3.32) 还应注意由于 Pearson 统计量的 H0 为 Oi = Ti,所以统计量值为 0 意味着 H0 严格成立
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有