假设检验的基本问题 令1、假设检验的基本原理 小概率事件原理 令小概率思想是指小概率事件(P<0.01或 P<005等)在一次试验中基本上不会发生 反证法思想是先提出假设检验假设H),再 用适当的统计方法确定假设成立的可能性大 小,如可能性小则认为假设不成立;反之 则认为假设成立。 2021/1/21
2021/1/21 2 cxt 假设检验的基本问题 ❖ 1、假设检验的基本原理 小概率事件原理 ❖ 小概率思想是指小概率事件(P<0.01或 P<0.05等)在一次试验中基本上不会发生。 反证法思想是先提出假设(检验假设H0 ),再 用适当的统计方法确定假设成立的可能性大 小,如可能性小,则认为假设不成立;反之, 则认为假设成立
◆2、假设检验的步骤 (1)提出一个原假设和备择假设 令例如:要对妇女的平均身高进行检验,可以 先假设妇女身高的均值等于160cm (u=160cm)。这种原假设也称为零假设 ( null hypothesis),记为H0 2021/1/21 xt
2021/1/21 3 cxt ❖ 2、假设检验的步骤 (1)提出一个原假设和备择假设 ❖ 例如:要对妇女的平均身高进行检验,可以 先假设妇女身高的均值等于 160 cm (u=160cm )。这种原假设也称为零假设 ( null hypothesis ),记为 H 0
令与此同时必须提出对立假设,如妇女身高均 值不等于160cm。对立假设又称为备选假 设或备择假设( alternative hypothesis 记为H1 令形式上,上面的关于总体均值的H0相对于 H1的检验记为 Ho:u=160cm H1:u不等于160cm 2021/1/21
2021/1/21 4 cxt ❖ 与此同时必须提出对立假设,如妇女身高均 值不等于 160 cm 。对立假设又称为备选假 设或备择假设( alternative hypothesis ) 记为 H 1 。 ❖ 形式上,上面的关于总体均值的 H 0 相对于 H 1 的检验记为: H0: u=160cm H1: u不等于160cm
◇H1:U不等于160cm的假设称为双尾检验; ◆如果备选假设为H1 u大于160cm或u小于160cm 则称为单尾检验。 令实际中选择何种备选假设,需根据检验的需要决定。 ☆需要注意的是:计算机输出结果中的p值是双尾 检验的概率。 令如果备选假设选择的是单尾检验,则要将计算机给 的p值除以2,即取p值的一半 2021/1/21 cXt
2021/1/21 5 cxt ❖ H1: u不等于160cm的假设称为双尾检验 ; ❖ 如果备选假设为H1: u大于160cm 或 u小于160cm 则称为单尾检验。 ❖ 实际中选择何种备选假设,需根据检验的需要决定。 ❖ 需要注意的是:计算机输出结果中的 p 值是双尾 检验的概率。 ❖ 如果备选假设选择的是单尾检验,则要将计算机给 的 p 值除以 2 ,即取 p 值的一半
(2)确定检验统计量 1有了两个假设,就要根据数据来对它们进行判断 选择适当的统计量,并在原假设H成立的条件下确 定该统计量的分布。 (3)确定显著性水平a ◆根据样本所得的数据来拒绝零假设的概率应小于 0.05,当然也可能是0.01,005,0001等 等。 ◇根据统计量的分布查表,确定对应于α的临界值. 2021/1/21
2021/1/21 6 cxt (2)确定检验统计量 1 有了两个假设,就要根据数据来对它们进行判断: 选择适当的统计量,并在原假设H0成立的条件下确 定该统计量的分布。 (3)确定显著性水平α ❖ 根据样本所得的数据来拒绝零假设的概率应小于 0.05 ,当然也可能是 0.01 , 0.005 , 0.001 等 等。 ❖ 根据统计量的分布查表,确定对应于α的临界值
令显著性水平就是小概率水平,但小概率并不 能说明不会发生,仅仅是发生的概率很小罢 了。拒绝正确零假设的错误常被称为第一类 错误( type error)。 令有第一类错误,就有第二类错误:那是备选 假设正确时反而说零假设正确的错误,称为 第二类错误( type I error) 2021/1/21 cXt
2021/1/21 7 cxt ❖ 显著性水平就是小概率水平,但小概率并不 能说明不会发生,仅仅是发生的概率很小罢 了。拒绝正确零假设的错误常被称为第一类 错误( type I error )。 ❖ 有第一类错误,就有第二类错误:那是备选 假设正确时反而说零假设正确的错误,称为 第二类错误( type II error )
(4)计算检验统计量的值并进行判断 ◇根据样本观测值计算统计量的观测值,并与临 界值进行比较,从而在检验水平条件下对拒绝 或接受原假设H作出判断 值)和根据这个实现值计算(t值式5 ◇根据数据计算检验统计量的实现亻 如果-值小于或等于a,就拒绝零假设,这 时犯错误的概率最多为α;如果ρ-值大于α, 就不拒绝零假设,因为证据不足。 2021/1/21
2021/1/21 8 cxt (4)计算检验统计量的值并进行判断 ❖ 根据样本观测值计算统计量的观测值,并与临 界值进行比较,从而在检验水平条件下对拒绝 或接受原假设H0作出判断. ❖ 根据数据计算检验统计量的实现值( t 值或F 值)和根据这个实现值计算 p值 ❖ 如果p - 值小于或等于α,就拒绝零假设,这 时犯错误的概率最多为α;如果p - 值大于α, 就不拒绝零假设,因为证据不足
令实际上,多数计算机软件仅仅给出p-值,而不给 出a。这有很多方便之处。比如a=0.05,而假 定所得到的p-值等于0.001。这时如果采用p 值作为新的显著性水平,即新的a=0.001;于是 就可以说,在显著性水平为0001时,拒绝零假设。 这样,拒绝零假设时犯错误的概率实际只是千分之 而不是旧的α所表明的百分之五 在这个意义上,卩-值又称为观测的显著性水平 observed significant level)。在统计软件输 出p-值的位置,有的用“p-Vae”,有的用 significant的缩写“Sigi 2021/1/21 cXt
2021/1/21 9 cxt ❖ 实际上,多数计算机软件仅仅给出 p - 值,而不给 出 α 。这有很多方便之处。比如 α= 0.05 ,而假 定所得到的 p - 值等于 0.001 。这时如果采用 p - 值作为新的显著性水平,即新的 α= 0.001 ;于是 就可以说,在显著性水平为 0.001 时,拒绝零假设。 这样,拒绝零假设时犯错误的概率实际只是千分之 一而不是旧的 α 所表明的百分之五。 ❖ 在这个意义上, p - 值又称为观测的显著性水平 ( observed significant level )。在统计软件输 出 p - 值的位置,有的用 “ p-value ” ,有的用 significant 的缩写 “Sig
◆3.关于“临界值”的问题: 令过去的统计教科书中,使用临界值的概念进行假设 检验,不计算p-值。只比较统计量的取值和临界 值的大小。使用临界值而不是-值来判断拒绝与 否是前计算杋时代的产物。当时计算-值不易 只采用临界值的概念。 ◆现在计算机软件一般都不给出a和临界值,但都给 出口-值和统计量的实现值,让用户自己决定显著 性水平是多少。 2021/1/21 10 cXt
2021/1/21 10 cxt ❖ 3 .关于 “ 临界值 ” 的问题: ❖ 过去的统计教科书中,使用临界值的概念进行假设 检验,不计算p - 值。只比较统计量的取值和临界 值的大小。使用临界值而不是p - 值来判断拒绝与 否是前计算机时代的产物。当时计算p - 值不易, 只采用临界值的概念。 ❖ 现在计算机软件一般都不给出α和临界值,但都给 出p - 值和统计量的实现值,让用户自己决定显著 性水平是多少