第二章均值向量和协方差阵的检验
zf 第二章 均值向量和协方差阵的检验
假设检验的基本问题 ◆1、假设检验的基本原理 小概率事件原理 令小概率思想是指小概率事件(P<0.01或 P<0.05等)在一次试验中基本上不会发生。 反证法思想是先提出假设检验假设H),再 用适当的统计方法确定假设成立的可能性大 小,如可能性小则认为假设不成立;反之, 则认为假设成立。 2021/2/22 2 cxt
2021/2/22 2 cxt 假设检验的基本问题 ❖ 1、假设检验的基本原理 小概率事件原理 ❖ 小概率思想是指小概率事件(P<0.01或 P<0.05等)在一次试验中基本上不会发生。 反证法思想是先提出假设(检验假设H0 ),再 用适当的统计方法确定假设成立的可能性大 小,如可能性小,则认为假设不成立;反之, 则认为假设成立
◆2、假设检验的步骤 (1)提出一个原假设和备择假设 ◇例如:要对妇女的平均身高进行检验,可以 先假设妇女身高的均值等于160cm (u=160cm)。这种原假设也称为零假设 null hypothesis),记为Ho 2021/2/22 cxt
2021/2/22 3 cxt ❖ 2、假设检验的步骤 (1)提出一个原假设和备择假设 ❖ 例如:要对妇女的平均身高进行检验,可以 先假设妇女身高的均值等于 160 cm (u=160cm )。这种原假设也称为零假设 ( null hypothesis ),记为 H 0
◇与此同时必须提出对立假设,如妇女身高均 值不等于160cm。对立假设又称为备选假 设或备择假设( alternative hypothesis) 记为H1, ◆形式上,上面的关于总体均值的H0相对于 H1的检验记为: H0:u=160cm H1:u不等于160cm 2021/2/22 4 cxt
2021/2/22 4 cxt ❖ 与此同时必须提出对立假设,如妇女身高均 值不等于 160 cm 。对立假设又称为备选假 设或备择假设( alternative hypothesis ) 记为 H 1 。 ❖ 形式上,上面的关于总体均值的 H 0 相对于 H 1 的检验记为: H0: u=160cm H1: u不等于160cm
令H1:u不等于160cm的假设称为双尾检验; ◇如果备选假设为H1: U大于160cm或u小于160cm 则称为单尾检验 令实际中选择何种备选假设,需根据检验的需要决定。 令需要注意的是:计算机翰出结果中的p值是双尾 检验的概率。 ◆如果备选假设选择的是单尾检验,则要将计算机给 的p值除以2,即取p值的一半 2021/2/22 5 cxt
2021/2/22 5 cxt ❖ H1: u不等于160cm的假设称为双尾检验 ; ❖ 如果备选假设为H1: u大于160cm 或 u小于160cm 则称为单尾检验。 ❖ 实际中选择何种备选假设,需根据检验的需要决定。 ❖ 需要注意的是:计算机输出结果中的 p 值是双尾 检验的概率。 ❖ 如果备选假设选择的是单尾检验,则要将计算机给 的 p 值除以 2 ,即取 p 值的一半
(2)确定检验统计量 1有了两个假设,就要根据数据来对它们进行判断 选择适当的统计量,并在原假设H成立的条件下确 定该统计量的分布 (3)确定显著性水平a ◇根据样本所得的数据来拒绝零假设的概率应小于 005,当然也可能是0.01,0.005,0.001等 等 ◇根据统计量的分布查表,确定对应于α的临界值. 2021/2/22 6 cxt
2021/2/22 6 cxt (2)确定检验统计量 1 有了两个假设,就要根据数据来对它们进行判断: 选择适当的统计量,并在原假设H0成立的条件下确 定该统计量的分布。 (3)确定显著性水平α ❖ 根据样本所得的数据来拒绝零假设的概率应小于 0.05 ,当然也可能是 0.01 , 0.005 , 0.001 等 等。 ❖ 根据统计量的分布查表,确定对应于α的临界值
今显著性水平就是小概率水平,但小概率并不 能说明不会发生,仅仅是发生的概率很小罢 了。拒绝正确零假设的错误常被称为第一类 错误( type I error) ◆有第一类错误,就有第二类错误:那是备选 假设正确时反而说零假设正确的错误,称为 第二类错误( type I error)。 2021/2/22 cxt
2021/2/22 7 cxt ❖ 显著性水平就是小概率水平,但小概率并不 能说明不会发生,仅仅是发生的概率很小罢 了。拒绝正确零假设的错误常被称为第一类 错误( type I error )。 ❖ 有第一类错误,就有第二类错误:那是备选 假设正确时反而说零假设正确的错误,称为 第二类错误( type II error )
(4)计算检验统计量的值并进行判断 ◆根据样本观测值计算统计量的观测值,并与临 界值进行比较,从而在检验水平条件下对拒绝 或接受原假设H作出判断 值)和根据这个实现值计算冷令(t值或F 根据数据计算检验统计量的实现亻 如果口-值小于或等于a,就拒绝零假设,这 时犯错误的概率最多为a;如果p-值大于a, 就不拒绝零假设,因为证据不足。 2021/2/22 8 cxt
2021/2/22 8 cxt (4)计算检验统计量的值并进行判断 ❖ 根据样本观测值计算统计量的观测值,并与临 界值进行比较,从而在检验水平条件下对拒绝 或接受原假设H0作出判断. ❖ 根据数据计算检验统计量的实现值( t 值或F 值)和根据这个实现值计算 p值 ❖ 如果p - 值小于或等于α,就拒绝零假设,这 时犯错误的概率最多为α;如果p - 值大于α, 就不拒绝零假设,因为证据不足
令实际上,多数计算机软件仅仅给出卩-值,而不给 出a。这有很多方便之处。比如a=0.05,而假 定所得到的p-值等于0001。这时如果采用p 值作为新的显著性水平,即新的a=0.001;于是 就可以说,在显著性水平为0.001时,拒绝零假设。 这样,拒绝零假设时犯错误的概率实际只是千分之 而不是旧的a所表明的百分之五。 令在这个意义上,卩-值又称为观测的显著性水平 observed significant level 1)。在统计软件输 significant的缩写“Sig”ae”,有的用 出尸-值的位置,有的用 2021/2/22 cxt
2021/2/22 9 cxt ❖ 实际上,多数计算机软件仅仅给出 p - 值,而不给 出 α 。这有很多方便之处。比如 α= 0.05 ,而假 定所得到的 p - 值等于 0.001 。这时如果采用 p - 值作为新的显著性水平,即新的 α= 0.001 ;于是 就可以说,在显著性水平为 0.001 时,拒绝零假设。 这样,拒绝零假设时犯错误的概率实际只是千分之 一而不是旧的 α 所表明的百分之五。 ❖ 在这个意义上, p - 值又称为观测的显著性水平 ( observed significant level )。在统计软件输 出 p - 值的位置,有的用 “ p-value ” ,有的用 significant 的缩写 “Sig
◇3.关于“临界值”的问题: ◆过去的统计教科书中,使用临界值的概念进行假设 检验,不计算卩-值。只比较统计量的取值和临界 值的大小。使用临界值而不是ρ-值来判断拒绝与 否是前计算机时代的产物。当时计算尸-值不易 只采用临界值的概念。 ◇现在计算机软件一般都不给出和口临界值,但都给 出口-值和统计量的实现值,让用户自己决定显著 性水平是多少。 2021/2/22 10 cxt
2021/2/22 10 cxt ❖ 3 .关于 “ 临界值 ” 的问题: ❖ 过去的统计教科书中,使用临界值的概念进行假设 检验,不计算p - 值。只比较统计量的取值和临界 值的大小。使用临界值而不是p - 值来判断拒绝与 否是前计算机时代的产物。当时计算p - 值不易, 只采用临界值的概念。 ❖ 现在计算机软件一般都不给出α和临界值,但都给 出p - 值和统计量的实现值,让用户自己决定显著 性水平是多少