§6总体参数的假设检验
§6 总体参数的假设检验
假设检验是统计推断的另一个重要的组成部 分。它分为参数检验与非参数检验。参数检验是 已知总体X的分布函数F(x,0)的分布形式,对总 体分布函数中的未知参数θ提出某种假设,然后 利用样本X1,X2,X提供的信息对所提出的假设 进行检验,根据检验的结果对所提出的假设作出 拒绝或接受的判断。非参数检验是指总体X的分 布函数表达式F(x)不知道时,假设总体X的分布 函数为某个指定的分布函数F(x),问怎样利用 子样X1,X2Xn提供的信息来对所提出的假设作 出判断,是拒绝或接受。随机变量X与Y之间的 独立性等问题的假设检验,也属于非参数检验
假设检验是统计推断的另一个重要的组成部 分。它分为参数检验与非参数检验。参数检验是 已知总体X的分布函数F(x,θ) 的分布形式,对总 体分布函数中的未知参数θ 提出某种假设,然后 利用样本X1 ,X2 ,…,Xn提供的信息对所提出的假设 进行检验,根据检验的结果对所提出的假设作出 拒绝或接受的判断。非参数检验是指总体X的分 布函数表达式F(x)不知道时,假设总体X的分布 函数为某个指定的分布函数F0 (x) ,问怎样利用 子样X1 ,X2 ,…,Xn 提供的信息来对所提出的假设作 出判断,是拒绝或接受。随机变量X与Y之间的 独立性等问题的假设检验,也属于非参数检验
§6.1假设检验的基本概念 本节要求理解假设检验的基本思想,掌握假设检验 的基本步骤,了解假设检验可能产生的两类错误。 例1某车间用一台包装机包装葡萄糖。包得的袋装 糖重是一个随机变量,它服从正态分布。当机器正常时, 其均值为0.5公斤,标准差为0.015公斤。某日开工后为检 验包装机是否正常,随机地抽取它所包装的糖9袋,称得 净重为(公斤):0.497,0.506,0.518,0.524,0.498 0.511,0.520,0.515,0.512.问机器是否正常? 以μ,G分别表示这一天袋装糖重总体X的均值和标准 差。由于长期实践表明标准差比较稳定,我们就设 σ=0.015。于是X-N(p,0.0152),这里μ未知。问题是根据 样本值来判断μ=0.5,还是μ≠0.5。为此,我们提出两个 相互对立的假设 H0:μ=μ=0.5和H1:≠
§6.1 假设检验的基本概念 本节要求理解假设检验的基本思想,掌握假设检验 的基本步骤,了解假设检验可能产生的两类错误。 例1 某车间用一台包装机包装葡萄糖。包得的袋装 糖重是一个随机变量,它服从正态分布。当机器正常时, 其均值为0.5公斤,标准差为0.015公斤。某日开工后为检 验包装机是否正常,随机地抽取它所包装的糖9袋,称得 净重为(公斤):0.497 , 0.506 , 0.518 , 0.524 , 0.498 , 0.511 , 0.520 , 0.515 , 0.512. 问机器是否正常? 以μ,σ分别表示这一天袋装糖重总体X的均值和标准 差。由于长期实践表明标准差比较稳定,我们就设 σ=0.015。于是X~N(μ,0.0152 ) ,这里μ未知。问题是根据 样本值来判断μ=0.5 ,还是μ≠0.5 。为此,我们提出两个 相互对立的假设 H0 : μ=μ0= 0.5 和 H1 : μ≠μ0
然后,我们给出一个合理的法则,即实际推断原理一小概率 事件在一次实际观察中几乎不会发生。根据这一法则, 利用已知样本作出决策是接受假设H(即拒绝假设H1), 还是拒绝假设H(即接受假设H1)。如果作出的决策是 接受H,则认为=,即认为机器工作是正常的,否 则,则认为是不正常的。 由于要检验的假设涉及总体均值μ,故首先想到是 否可借助样本均值一这一统计量来进行判断。我们知 是μ的无偏估计,的观察值的大小在一定程度反 映μ的大小。因 果假设H为真,则观察值 x与的偏差 般不应太大 若 过分大,我们就怀疑假设H的正确性而拒绝H,并考虑 到当H为真时 N(0,1) o/vn
然后,我们给出一个合理的法则,即实际推断原理—小概率 事件在一次实际观察中几乎不会发生。根据这一法则, 利用已知样本作出决策是接受假设H0 (即拒绝假设H1 ), 还是拒绝假设H0(即接受假设H1 )。如果作出的决策是 接受H0 ,则认为μ=μ0 ,即认为机器工作是正常的,否 则,则认为是不正常的。 由于要检验的假设涉及总体均值μ ,故首先想到是 否可借助样本均值 这一统计量来进行判断。我们知 道, 是μ 的无偏估计, 的观察值的大小在一定程度反 映μ 的大小。因此,如果假设H0为真,则观察值 与μ0的偏差 一般不应太大。若 过分大,我们就怀疑假设H0的正确性而拒绝H0 ,并考虑 到当H0为真时 。 X X X x − 0 x − 0 x ~ (0,1) / 0 N n X −
x-uc 而衡量x 的大小可归结为衡量a/n 的大小。基于上面的想法,我们可适当选定一正数k,使 当观察值 X 满足|x k /√n 时就拒绝假设H,反之,若 <k,就接 受H0。 然而,由于作出决策的依据是一个样本,当实际上 H为真时仍可能作出拒绝H的决策(这种可能性是无法 消除的),这是一种错误,犯这种错误的概率记为 P{当H为真拒绝H0}或P{拒绝H0}或PeB{拒绝H0} 记号P表示参数取时事件{的概率,P={} 表示μ取H规定的值时事件{·}的概率
而衡量 的大小可归结为衡量 的大小。基于上面的想法,我们可适当选定一正数k,使 当观察值 满足 时就拒绝假设H0,反之,若 ,就接 受H0 。 然而,由于作出决策的依据是一个样本,当实际上 H0为真时仍可能作出拒绝H0的决策(这种可能性是无法 消除的),这是一种错误,犯这种错误的概率记为 P{当H0为真拒绝H0 }或 或 记号 表示参数μ取μ0时事件{·}的概率, 表示μ取H0规定的值时事件{·}的概率。 − 0 x n x / 0 − k n x − / 0 k n x − / 0 x { } P0 拒绝H0 { } PH0 拒绝H0 {} 0 P {} 0 PH
我们无法排除犯这类错误的可能性。因此自然希望将犯 这类错误的概率控制在一定限度之内,即给出一个较小 的数(0<a<1),使犯这类错误的概率不超过a,即使 得 P{当H为真拒绝H0}≤a (1) 为了确定常数k,我们考虑统计量 由 于只允许犯 这类错误的概率最大为a,令(1)式右端取等号,即令 P(当H为真拒绝H=X-zk}=a o/
我们无法排除犯这类错误的可能性。因此自然希望将犯 这类错误的概率控制在一定限度之内,即给出一个较小 的数α(0<α<1) ,使犯这类错误的概率不超过α,即使 得 (1) 为了确定常数k,我们考虑统计量 。由 于只允许犯 这类错误的概率最大为α,令(1)式右端取等号,即令 P{当H0 为真拒绝H0 } n X / 0 − = − = k n X P H H P / { } 0 当 0 为真拒绝 0 0
由于当H,为真时, f(u) ~N(O,1) 由标准正态分布分位点的定义知 ku a/2 因而,若U的观察值满足 a/2 /√n ≥k=la/2 则拒绝H0,而若 x-ul 1.96 于是拒绝H,认为这天包装机 o/ 工作不正常
由于当H0, 为真时, 由标准正态分布分位点的定义知 k=uα/2 因而,若U的观察值满足 则拒绝H0 ,而若 则接受H0 。 例如,在本例中取α=0.05 ,则有k=u0.05/2=1.96 ,又 已知n=6,σ=0.015 ,再由样本算得 , 即有 于是拒绝H0,认为这天包装机 工作不正常。 ~ (0,1) / 0 N n X U − = / 2 0 / k u n x u = − = / 2 0 / k u n x u = − = 2.2 1.96 / 0 = − = n x u x = 0.511
上例中所采用的检验法则是符合实际推断原理的。因通常a总 是取得较小,一般a=0.01,0.05。若H为真,即当=0时, X-Hozua12 是一个小概率事件,根据实际推断原理, o/ 就可以认为,如果H为真,则由一次实验得到的观察值x,满足 不等式 /2 几乎是不会发生的。现在在一次观 察中竟然出现了满足 x-po ≥la2的x,则我们有理由 怀疑原来的假设H的正确性,因而拒绝H。若出现的观察值x x 满足 < ,此时没有理由拒绝H0,因此只能 接受假设H 在上例的做法中,我们看到当样本容量固定时,选定a后,数k X 就可以确定,然后按照统计量U 的观察值的绝对值 0/
上例中所采用的检验法则是符合实际推断原理的。因通常α 总 是取得较小,一般α =0.01,0.05。若H0为真,即当μ=μ0时, 是一个小概率事件,根据实际推断原理, 就可以认为,如果H0为真,则由一次实验得到的观察值 ,满足 不等式 几乎是不会发生的。现在在一次观 察中竟然出现了满足 的 ,则我们有理由 怀疑原来的假设H0的正确性,因而拒绝H0。若出现的观察值 满足 ,此时没有理由拒绝H0,因此只能 接受假设H0。 在上例的做法中,我们看到当样本容量固定时,选定α 后,数k 就可以确定,然后按照统计量 的观察值的绝对值 − / 2 0 / u n X x / 2 0 / u n x − / 2 0 / u n x − n X U / 0 − = / 2 0 / u n x − x x
大于等于k还是小于k来作出决策。数k是检验上述假设的一个门槛值。 如果 x-1 k 则称x与μ0的差异是显著的。 这时拒绝反之如果=x<k,则称x与 /√n 的差异是不显著的,这时接受H0。数a称为显著性水平,上面 关于x与μ有无显著差异的判断是在显著性水平a之下作出的。 统计量Us于 称为检验统计量。 o/√n 前面的检验问题通常叙述成:在显著性水平a下,检验假设 H0:=02H1:≠0 也常说成“在显著性水平a下,针对H检验H”。H称为原假设或 零假设,H1称为备择假设(意指在原假设被拒绝后可供选择的假设 或对立假设。我们要进行的工作是,根据样本,按上述检验方法作 出决策在H与H两者之间接受其一
大于等于k还是小于k来作出决策。数k是检验上述假设的一个门槛值。 如果 ,则称 与μ0 的差异是显著的。 这时拒绝H0;反之,如果 ,则称 与 μ0 的差异是不显著的,这时接受H0。数α 称为显著性水平, 上面 关于 与μ0有无显著差异的判断是在显著性水平α之下作出的。 统计量 称为检验统计量。 前面的检验问题通常叙述成:在显著性水平α下,检验假设 (2) 也常说成“在显著性水平α下,针对H1检验H0 ” 。H0称为原假设或 零假设, H1称为备择假设(意指在原假设被拒绝后可供选择的假设) 或对立假设。我们要进行的工作是,根据样本,按上述检验方法作 出决策在H0与H1两者之间接受其一。 k n x u − = / 0 x k n x u − = / 0 n X U / 0 − = 0 0 1 0 H : = ,H : x x
当检验统计量取某个区域C中的值时我们拒绝原假设H则称区 域C为拒绝域拒绝域的边界点称为临界点(临界值。而上例中拒绝域 为l≥ 而u=-un2,u=un2为临界点 由于检验法则是根据样本作出的,总有可能作出错误的决策。 如上面所说的那样,在假设H实际上为真时,我们可能犯拒绝H的 错误,称这类“弃真”的错误为第一类错误。又当H实际上不真时, 我们也有可能接受H。称这类“取伪”的错误为第二类错误。犯第 二类错误的概率(其大小用β来表示)记为 P{当H不真接受H或B=n1{按受Hb 为此,在确定检验法则时,我们应尽量使犯两类错误的概率都 较小。但是,进一步讨论可知,一般来说,当样本容量固定时,若 减少犯一类错误的概率,则犯另一类错误的概率往往增大。若要使 犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的 情况下,一般来说,我们总是控制犯第一类错误的概率,使它不大 于α。α的大小视具体情况而定,通常a取0.1,0.05,0.01,0.005等值。 这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的 概率的检验,称为显著性检验
当检验统计量取某个区域C中的值时,我们拒绝原假设H0 ,则称区 域C为拒绝域,拒绝域的边界点称为临界点(临界值)。而上例中拒绝域 为 ,而u= - uα/2,u=uα/2为临界点。 由于检验法则是根据样本作出的,总有可能作出错误的决策。 如上面所说的那样,在假设H0实际上为真时,我们可能犯拒绝H0的 错误,称这类“弃真”的错误为第一类错误。又当H0实际上不真时, 我们也有可能接受H0。称这类“取伪”的错误为第二类错误。犯第 二类错误的概率(其大小用β来表示)记为 P{当H0不真接受H0 }或 。 为此,在确定检验法则时,我们应尽量使犯两类错误的概率都 较小。但是,进一步讨论可知,一般来说,当样本容量固定时,若 减少犯一类错误的概率,则犯另一类错误的概率往往增大。若要使 犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的 情况下,一般来说,我们总是控制犯第一类错误的概率,使它不大 于α 。α 的大小视具体情况而定,通常α 取0.1,0.05,0.01,0.005等值。 这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的 概率的检验,称为显著性检验。 { } PH1 接受H0 u u / 2