《概率论数理统计》课程PPT教学课件：§6 总体参数的假设检验

假设检验是统计推断的另一个重要的组成部分。它分为参数检验与非参数检验。参数检验是已知总体X的分布函数F(x,0)的分布形式,对总体分布函数中的未知参数θ提出某种假设,然后利用样本X1,X2,Xn提供的信息对所提出的假设进行检验,根据检验的结果对所提出的假设作出拒绝或接受的判断。非参数检验是指总体X的分布函数表达式F(x)不知道时,假设总体X的分布函数为某个指定的分布函数F(x),问怎样利用子样X1X2,Xn提供的信息来对所提出的假设作出判断,是拒绝或接受。

团购合买资源类别：文库，文档格式：PPT，文档页数：58，文件大小：1.59MB

§6总体参数的假设检验

§6 总体参数的假设检验

假设检验是统计推断的另一个重要的组成部分。它分为参数检验与非参数检验。参数检验是已知总体X的分布函数F(x,0)的分布形式,对总体分布函数中的未知参数θ提出某种假设,然后利用样本X1,X2,X提供的信息对所提出的假设进行检验,根据检验的结果对所提出的假设作出拒绝或接受的判断。非参数检验是指总体X的分布函数表达式F(x)不知道时,假设总体X的分布函数为某个指定的分布函数F(x),问怎样利用子样X1,X2Xn提供的信息来对所提出的假设作出判断,是拒绝或接受。随机变量X与Y之间的独立性等问题的假设检验,也属于非参数检验

假设检验是统计推断的另一个重要的组成部分。它分为参数检验与非参数检验。参数检验是已知总体X的分布函数F(x,θ) 的分布形式，对总体分布函数中的未知参数θ 提出某种假设，然后利用样本X1 ,X2 ,…,Xn提供的信息对所提出的假设进行检验，根据检验的结果对所提出的假设作出拒绝或接受的判断。非参数检验是指总体X的分布函数表达式F(x)不知道时，假设总体X的分布函数为某个指定的分布函数F0 (x) ，问怎样利用子样X1 ,X2 ,…,Xn 提供的信息来对所提出的假设作出判断，是拒绝或接受。随机变量X与Y之间的独立性等问题的假设检验，也属于非参数检验

§6.1假设检验的基本概念本节要求理解假设检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两类错误。例1某车间用一台包装机包装葡萄糖。包得的袋装糖重是一个随机变量,它服从正态分布。当机器正常时, 其均值为0.5公斤,标准差为0.015公斤。某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(公斤):0.497,0.506,0.518,0.524,0.498 0.511,0.520,0.515,0.512.问机器是否正常? 以μ,G分别表示这一天袋装糖重总体X的均值和标准差。由于长期实践表明标准差比较稳定,我们就设 σ=0.015。于是X-N(p,0.0152),这里μ未知。问题是根据样本值来判断μ=0.5,还是μ≠0.5。为此,我们提出两个相互对立的假设 H0:μ=μ=0.5和H1:≠

§6.1 假设检验的基本概念本节要求理解假设检验的基本思想，掌握假设检验的基本步骤，了解假设检验可能产生的两类错误。例1 某车间用一台包装机包装葡萄糖。包得的袋装糖重是一个随机变量，它服从正态分布。当机器正常时，其均值为0.5公斤，标准差为0.015公斤。某日开工后为检验包装机是否正常，随机地抽取它所包装的糖9袋，称得净重为（公斤）：0.497 , 0.506 , 0.518 , 0.524 , 0.498 , 0.511 , 0.520 , 0.515 , 0.512. 问机器是否正常？以μ,σ分别表示这一天袋装糖重总体X的均值和标准差。由于长期实践表明标准差比较稳定，我们就设 σ=0.015。于是X~N(μ,0.0152 ) ，这里μ未知。问题是根据样本值来判断μ=0.5 ，还是μ≠0.5 。为此，我们提出两个相互对立的假设 H0 : μ=μ0= 0.5 和 H1 : μ≠μ0

然后,我们给出一个合理的法则,即实际推断原理一小概率事件在一次实际观察中几乎不会发生。根据这一法则, 利用已知样本作出决策是接受假设H(即拒绝假设H1), 还是拒绝假设H(即接受假设H1)。如果作出的决策是接受H,则认为=,即认为机器工作是正常的,否则,则认为是不正常的。由于要检验的假设涉及总体均值μ,故首先想到是否可借助样本均值一这一统计量来进行判断。我们知是μ的无偏估计,的观察值的大小在一定程度反映μ的大小。因果假设H为真,则观察值 x与的偏差般不应太大若过分大,我们就怀疑假设H的正确性而拒绝H,并考虑到当H为真时 N(0,1) o/vn

然后,我们给出一个合理的法则,即实际推断原理—小概率事件在一次实际观察中几乎不会发生。根据这一法则，利用已知样本作出决策是接受假设H0 (即拒绝假设H1 )，还是拒绝假设H0（即接受假设H1 ）。如果作出的决策是接受H0 ，则认为μ=μ0 ，即认为机器工作是正常的，否则，则认为是不正常的。由于要检验的假设涉及总体均值μ ，故首先想到是否可借助样本均值这一统计量来进行判断。我们知道，是μ 的无偏估计，的观察值的大小在一定程度反映μ 的大小。因此，如果假设H0为真，则观察值与μ0的偏差一般不应太大。若过分大，我们就怀疑假设H0的正确性而拒绝H0 ，并考虑到当H0为真时。 X X X x − 0 x − 0 x ~ (0,1) / 0 N n X  − 

x-uc 而衡量x 的大小可归结为衡量a/n 的大小。基于上面的想法,我们可适当选定一正数k,使当观察值 X 满足|x k /√n 时就拒绝假设H,反之,若 <k,就接受H0。然而,由于作出决策的依据是一个样本,当实际上 H为真时仍可能作出拒绝H的决策(这种可能性是无法消除的),这是一种错误,犯这种错误的概率记为 P{当H为真拒绝H0}或P{拒绝H0}或PeB{拒绝H0} 记号P表示参数取时事件{的概率,P={} 表示μ取H规定的值时事件{·}的概率

而衡量的大小可归结为衡量的大小。基于上面的想法，我们可适当选定一正数k，使当观察值满足时就拒绝假设H0，反之，若，就接受H0 。然而，由于作出决策的依据是一个样本，当实际上 H0为真时仍可能作出拒绝H0的决策（这种可能性是无法消除的），这是一种错误，犯这种错误的概率记为 P{当H0为真拒绝H0 }或或记号表示参数μ取μ0时事件{·}的概率，表示μ取H0规定的值时事件{·}的概率。 − 0 x n x / 0  −  k n x  − / 0   k n x  − / 0   x { } P0 拒绝H0 { } PH0 拒绝H0 {} 0  P {} 0  PH

我们无法排除犯这类错误的可能性。因此自然希望将犯这类错误的概率控制在一定限度之内,即给出一个较小的数(0<a<1),使犯这类错误的概率不超过a,即使得 P{当H为真拒绝H0}≤a (1) 为了确定常数k,我们考虑统计量由于只允许犯这类错误的概率最大为a,令(1)式右端取等号,即令 P(当H为真拒绝H=X-zk}=a o/

我们无法排除犯这类错误的可能性。因此自然希望将犯这类错误的概率控制在一定限度之内，即给出一个较小的数α(0<α<1) ，使犯这类错误的概率不超过α，即使得（1）为了确定常数k，我们考虑统计量。由于只允许犯这类错误的概率最大为α，令（1）式右端取等号，即令 P{当H0 为真拒绝H0 } n X / 0  −      =          − = k n X P H H P / { } 0 当 0 为真拒绝 0 0

由于当H,为真时, f(u) ~N(O,1) 由标准正态分布分位点的定义知 ku a/2 因而,若U的观察值满足 a/2 /√n ≥k=la/2 则拒绝H0,而若 x-ul 1.96 于是拒绝H,认为这天包装机 o/ 工作不正常

由于当H0，为真时, 由标准正态分布分位点的定义知 k=uα/2 因而，若U的观察值满足则拒绝H0 ，而若则接受H0 。例如，在本例中取α=0.05 ，则有k=u0.05/2=1.96 ，又已知n=6，σ=0.015 ，再由样本算得，即有于是拒绝H0，认为这天包装机工作不正常。 ~ (0,1) / 0 N n X U  −  = / 2 0 /    k u n x u  = − = / 2 0 /    k u n x u  = − = 2.2 1.96 / 0 =  − = n x u   x = 0.511

上例中所采用的检验法则是符合实际推断原理的。因通常a总是取得较小,一般a=0.01,0.05。若H为真,即当=0时, X-Hozua12 是一个小概率事件,根据实际推断原理, o/ 就可以认为,如果H为真,则由一次实验得到的观察值x,满足不等式 /2 几乎是不会发生的。现在在一次观察中竟然出现了满足 x-po ≥la2的x,则我们有理由怀疑原来的假设H的正确性,因而拒绝H。若出现的观察值x x 满足 < ,此时没有理由拒绝H0,因此只能接受假设H 在上例的做法中,我们看到当样本容量固定时,选定a后,数k X 就可以确定,然后按照统计量U 的观察值的绝对值 0/

上例中所采用的检验法则是符合实际推断原理的。因通常α 总是取得较小，一般α =0.01,0.05。若H0为真，即当μ=μ0时，是一个小概率事件，根据实际推断原理，就可以认为，如果H0为真，则由一次实验得到的观察值，满足不等式几乎是不会发生的。现在在一次观察中竟然出现了满足的，则我们有理由怀疑原来的假设H0的正确性，因而拒绝H0。若出现的观察值满足，此时没有理由拒绝H0，因此只能接受假设H0。在上例的做法中，我们看到当样本容量固定时，选定α 后，数k 就可以确定，然后按照统计量的观察值的绝对值          − / 2 0 /    u n X x / 2 0 /    u n x  − / 2 0 /    u n x  − n X U / 0  −  = / 2 0 /    u n x  − x x

大于等于k还是小于k来作出决策。数k是检验上述假设的一个门槛值。如果 x-1 k 则称x与μ0的差异是显著的。这时拒绝反之如果=x<k,则称x与 /√n 的差异是不显著的,这时接受H0。数a称为显著性水平,上面关于x与μ有无显著差异的判断是在显著性水平a之下作出的。统计量Us于称为检验统计量。 o/√n 前面的检验问题通常叙述成:在显著性水平a下,检验假设 H0:=02H1:≠0 也常说成“在显著性水平a下,针对H检验H”。H称为原假设或零假设,H1称为备择假设(意指在原假设被拒绝后可供选择的假设或对立假设。我们要进行的工作是,根据样本,按上述检验方法作出决策在H与H两者之间接受其一

大于等于k还是小于k来作出决策。数k是检验上述假设的一个门槛值。如果，则称与μ0 的差异是显著的。这时拒绝H0；反之，如果，则称与 μ0 的差异是不显著的，这时接受H0。数α 称为显著性水平，上面关于与μ0有无显著差异的判断是在显著性水平α之下作出的。统计量称为检验统计量。前面的检验问题通常叙述成：在显著性水平α下，检验假设 (2) 也常说成“在显著性水平α下，针对H1检验H0 ” 。H0称为原假设或零假设， H1称为备择假设（意指在原假设被拒绝后可供选择的假设）或对立假设。我们要进行的工作是，根据样本，按上述检验方法作出决策在H0与H1两者之间接受其一。 k n x u  − = / 0   x k n x u  − = / 0   n X U / 0  −  = 0 0 1 0 H :  =  ,H :    x x

当检验统计量取某个区域C中的值时我们拒绝原假设H则称区域C为拒绝域拒绝域的边界点称为临界点(临界值。而上例中拒绝域为l≥ 而u=-un2,u=un2为临界点由于检验法则是根据样本作出的,总有可能作出错误的决策。如上面所说的那样,在假设H实际上为真时,我们可能犯拒绝H的错误,称这类“弃真”的错误为第一类错误。又当H实际上不真时, 我们也有可能接受H。称这类“取伪”的错误为第二类错误。犯第二类错误的概率(其大小用β来表示)记为 P{当H不真接受H或B=n1{按受Hb 为此,在确定检验法则时,我们应尽量使犯两类错误的概率都较小。但是,进一步讨论可知,一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的情况下,一般来说,我们总是控制犯第一类错误的概率,使它不大于α。α的大小视具体情况而定,通常a取0.1,0.05,0.01,0.005等值。这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的概率的检验,称为显著性检验

当检验统计量取某个区域C中的值时,我们拒绝原假设H0 ,则称区域C为拒绝域,拒绝域的边界点称为临界点(临界值)。而上例中拒绝域为，而u= - uα/2,u=uα/2为临界点。由于检验法则是根据样本作出的，总有可能作出错误的决策。如上面所说的那样，在假设H0实际上为真时，我们可能犯拒绝H0的错误，称这类“弃真”的错误为第一类错误。又当H0实际上不真时，我们也有可能接受H0。称这类“取伪”的错误为第二类错误。犯第二类错误的概率（其大小用β来表示）记为 P{当H0不真接受H0 }或。为此，在确定检验法则时，我们应尽量使犯两类错误的概率都较小。但是，进一步讨论可知，一般来说，当样本容量固定时，若减少犯一类错误的概率，则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小，除非增加样本容量。在给定样本容量的情况下，一般来说，我们总是控制犯第一类错误的概率，使它不大于α 。α 的大小视具体情况而定，通常α 取0.1,0.05,0.01,0.005等值。这种只对犯第一类错误的概率加以控制，而不考虑犯第二类错误的概率的检验，称为显著性检验。 { } PH1 接受H0 u  u / 2

点击下载完整版文档（PPT格式）

共58页，可试读20页，点击继续阅读 ↓↓

点击下载（PPT格式）

浏览记录