第4章假设检验 41基本概念 4.1.1引言 关于总体特征的随机变量的概率分布的一个陈述称为 统计假设,如果这个陈述只涉及到总体的参数则称为参数 假设。否则称为非参数假设验证统计假设的方法叫做统计 假设检验。 其意义:是利用适当的统计量对总体的分布或参数做 出种种零假设H,然后根据观测信息来对H进行检验, 从而判断H是否成立。 其任务:(1)对不同的问题确定相应的方法,通过选 择适当统计量来判断H是否成立。若成立接受它,若不 成立拒绝它 (2)评价检验方法好坏的标准。 4-1
4- 1 第4章 假设检验 4.1 基本概念 4.1.1引言 关于总体特征的随机变量的概率分布的一个陈述称为 统计假设,如果这个陈述只涉及到总体的参数则称为参数 假设。否则称为非参数假设,验证统计假设的方法叫做统计 假设检验。 其意义:是利用适当的统计量对总体的分布或参数做 出种种零假设H0 ,然后根据观测信息来对H0 进行检验, 从而判断 H0 是否成立。 其任务:(1)对不同的问题确定相应的方法,通过选 择适当统计量来判断H0 是否成立。若成立接受它,若不 成立拒绝它。 (2)评价检验方法好坏的标准
其基本思想 1)实际推断原理 2)统计假设检验主要是起否定作用,其逻辑推理表 现为否定之否定(即反证法) 统计推断的另一类重要问题是根据样本的信息来判断 总体分布是否具有指定的特征。如已知样本来自正态总体, 要问它的均值是否为μo 例1.某车间用一台包装机包装葡萄糖,包得的袋装 糖重是一个随机变量,它服从正态分布。当机器正常时,其 均值为0.5公斤,标准差为0.015公斤。某日开工后为检验 包装机是否正常,随机地抽取它所包装的糖9袋,称得净重 为(公斤): 0.4970.5060.5180.5240.498 0.5110.5200.5150.512 问机器是否正常? 4-2
4- 2 其基本思想: 1)实际推断原理 2)统计假设检验主要是起否定作用,其逻辑推理表 现为——否定之否定(即反证法) 统计推断的另一类重要问题是根据样本的信息来判断 总体分布是否具有指定的特征。如已知样本来自正态总体, 要问它的均值是否为μ0。 例1. 某车间用一台包装机包装葡萄糖, 包得的袋装 糖重是一个随机变量, 它服从正态分布。当机器正常时,其 均值为0.5公斤, 标准差为0.015公斤。某日开工后为检验 包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重 为(公斤): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问机器是否正常?
解设该天的袋装糖重X, 由假设可知X~N(p,0.0152) 现在的问题是要检验μ=0.5?为此可提出假讠 H:μ=μo=0.5,和H1:μ≠μ0, 如果假I成立那么X~N(0.5,0.0152) 自然想到可来进行判断,允许有定的波 动,但与μ的偏差又不能太大。郾找一个常数 k,当|X-μ0|>k时拒绝假0,反之接受 可知即使假设是对的,我们也可能艳H0(即判 断错误,犯这类错误的概率遨α,即有 4-3
4- 3 断错误,犯这类错误的概率记为 ,即有 可知即使假设 是对的,我们也可能拒绝 即 判 ,当 时拒绝假设 ,反之接受 动,但 与 的偏差又不能太大。即要找一个常数 自然想到可用来进行判断,允许有一定的波 − ) H H ( k | X | k H H . X X 0 0 0 0 * 0 * 0 如果假设 成 立 那 么 。 和 现在的问题是要检验 为此可提出假设 由假设可知 解 设该天的袋装糖重为 H , X ~ N(0.5,0.015 ) H : 0.5, H : , 0.5? X ~ N( ,0.015 ) . X, 2 0 0 0 1 0 2 = = = ( , 0. 015 ) 2 X~N (0. 5 , 0. 015 ) 2 X~N
P{拒绝H0|H为真 =P{X-p0|k|μ=p0}= 或 ≥k}=a, 般取c=0.05或0.01等。 对于本题可用统计量X-0.5 ,由假设知 0.015 U~N(0,),于是px-0.5 >la2}=a.其中 001 0<a<1,当很小时,比如取=0.0剞时,则 4-4
4- 4 一般取 = 或 等 。 或 拒 绝 为 真 0.0 5 0.0 1 k} , n X P { P{| X | k | } . P{ H | H } 0 0 * 0 0 0 0 = − = − = = , 当 很小时,比如取 时,则 ,于是 其中 对于本题可用统计量: 由假设知 0 1 0.0 5 z . 0.015 9 X 0.5 Z ~ N(0,1) P , 0.015 9 X 0.5 Z / 2 = = − − = U U u 2
X-0.5 105x2是一个小概率事件 查表可知l025=1.96对于所给的样本算得到 x-0.5 X=0.511 22>la2=1.96,这说明小概 0015√9 率事件 X-0.5 >la2居然发生了根据实际推断 0.015 原理:"小概率事件在一次试骏是很难发生的, 因而有理由认为原假设=0.不成立,即这天包装机 的工作不正常 4-5
4- 5 的工作不正常。 因而有理由认为原假设 不成立,即这天包装机 原 理 小概率事件在一次试验中是很难发生的 率事件 居然发生了根据实际推断 , 这说明小概 查表可知 。对于所给的样本值计算得到 是一个小概率事件 0.5 : " ", z , 0.015 9 X 0.5 2.2 z 1.9 6, 0.015 9 x 0.5 x 0.511 z 1.9 6 , z , 0.015 9 X 0.5 / 2 / 2 0.025 / 2 = − = = − = = − u0.025u 2 u 2 u 2
注:假设检验所采用的方法类似一种反证法: 先假设结论成立,然后在这个结论成立的条件下进行推导 和运算,如果得到矛盾,则推翻原来的假设。 这里的矛盾是与实际推断原理的矛盾,即如果“小概率 事件在一次试验中发生了”,则认为出现了与实际情况不符 的矛盾,故原假设不成立,因此,假设检验是一种带有概率性 质的反证法。 基本概念与术语: 1.称给定的a(0<a<1)为显著性水平 2统计量=X-H0称为检验统计量 4-6
4- 6 注: 假设检验所采用的方法类似一种反证法: 先假设结论成立, 然后在这个结论成立的条件下进行推导 和运算, 如果得到矛盾, 则推翻原来的假设。 这里的矛盾是与实际推断原理的矛盾,即如果“小概率 事件在一次试验中发生了” , 则认为出现了与实际情况不符 的矛盾,故原假设不成立,因此,假设检验是一种带有概率性 质的反证法。 基本概念与术语: 1. 称给定的 (0< <1) 为显著性水平. . n X 2. Z 统计量 0 称为检验统计量 − U=
3.一般地,检验问题可鍵为: 在显著性水平下,检验假设 H0:μ≡μ,H1:p≠μo 其中H称为原假设,H称为备择假备选假设 4、当检验统计量取某个國C中的值时,则拒绝 假诞H,称C为拒绝域,拒绝域的点称为临界 点,如在上例中为Um2,U=-n2和U=la2 为临界点。 注:拒绝域的大小与显著帐平α的大小有关对于 同一组样本值在不同的显著性水下可能得到截 然相反的结如上例中取a=001,L005-=258, 22<258则应接史0,可见x的选择是很重要的。 4-7
4- 7 其 中 称为原假设, 称为备择假设备选假设。 , 在显著性水平下,检验假设 一般地,检验问题可叙述 为 H H ( ) H : H : . 3. : 0 1 0 = 0 1 0 为临界点。 点,如在上例中为 , 故 和 假 设 , 称 为拒绝域,拒绝域的边界点称为临界 当检验统计量取某个区域 中的值时,则拒绝原 /2 /2 /2 0 C | Z | z Z z Z z H C 4. C U U = − U== u 2 u 2 − u 2 则应接受 可 见 的选择是很重要的。 然相反的结论如上例中取 同一组样本值在不同的显著性水平下 可能得到截 注 拒绝域的大小与显著性水 平 的大小有关对 于 = = 2.2 2.5 8, H , , , 0.0 1, z 2.5 8, , , : . 0 u0 0. . 005 005
5.假设检验的一般步骤: 1)提出原假设及备择假设I1,如 0:μ=p0=0.5,H1:μ≠0 X-0.5 2)选择统计量,如U= 0015√9 3)求出在原假谩成立的条件下,该统量服从 的概率分布,如假设=0.5,U~N(0,1) 4)选择显著性水瑖,确定拒绝域 5)根据样本值计算统计量观察值,看观察值寿 否落入拒绝域内,作拒绝或接觉的结论。 4-8
4- 8 5. 假设检验的一般步骤: 否落入拒绝域内,作出拒绝或接受 的结论。 根据样本值计算统计量的观察值,看观察值是 选择显著性水平,确定拒绝域 的概率分布,如假设 , 求出在原假设 成立的条件下,该统计量服从 选择统计量,如 , ; 提出原假设 及备择假设 如 0 0 0 0 1 0 0 1 H 5) 4) ; 0.5 Z ~ N(0,1) ; 3) H ; 0.015 9 X 0.5 2) Z H : 0.5 H : 1) H H , = − = = = U U
4.1.2假设 在用统计方法为实际问题作决断时,常常需要做出适当 的假设,然后再根据样本提供的信息进行判断,决定是否接 受这个假设。在例1中我们要判断这批糖的重量是否合格时, 首先假设它合格,H:μ=μ0=0.5然后抽取9袋看是否存在常 数κ,是否有 x-A<k,来验证H是否成立。 对非参数分布族的假设检验的问题称为“非参数假设检验” 个假设是需要“检验”的,就是要在假设H成立的 前提下,根据样本观测值结果来判定是接受它还是拒绝它。 这样的假设H称为“零假设”或“原偎设”,它是作为检 验的前提假设,当“零假设”被拒绝时,就意味着接受一个 与之对立的假设,称为“备择假设”或“对立假设”,常用 H表示。 4-9
4- 9 4.1.2 假设 在用统计方法为实际问题作决断时,常常需要做出适当 的假设,然后再根据样本提供的信息进行判断,决定是否接 受这个假设。在例1中我们要判断这批糖的重量是否合格时, 首先假设它合格,H0 :μ=μ0= 0.5 然后抽取9 袋看是否存在常 数 k *,是否有 X − 0 k * ,来验证 H0 是否成立。 对非参数分布族的假设检验的问题称为“非参数假设检验”。 一个假设是需要“检验”的,就是要在假设 H0 成立的 前提下,根据样本观测值结果来判定是接受它还是拒绝它。 这样的假设H0称为“零假设”或“原假设”,它是作为检 验的前提假设,当“零假设”被拒绝时,就意味着接受一个 与之对立的假设,称为“备择假设”或“对立假设”,常用 H1表示
零假设通常应该受到保护的,没有充足的证据是不能被 拒绝的,而对备择假设则应取慎重态度,没有充足的理由不 能轻易接受。在例1中我们希望这批产品是合格的,没有充分 证据不想轻易将它判为是不合格的。 413检验 对给定的假设,要根据样本的取值情况来决定它是接受 还是拒绝零假设,不能等到试验结果已经得知以后来制定接 受或拒绝零假设的准则,而是应该事先规定好这种准则 即检验。对于一个假设,一个检验就是给出一个拒绝域和 个接受域 在例中接受域为:0.5 v9a2,0.540.015 0.015 拒绝域为:-∞,0.5 0.015 0.015 0.5+ a/2,+o 当X落入接受域时就接受0,否则就拒绝H0,即接受H1。 4-10
4- 10 零假设通常应该受到保护的,没有充足的证据是不能被 拒绝的,而对备择假设则应取慎重态度,没有充足的理由不 能轻易接受。在例1中我们希望这批产品是合格的,没有充分 证据不想轻易将它判为是不合格的。 4.1.3 检验 对给定的假设,要根据样本的取值情况来决定它是接受 还是拒绝零假设,不能等到试验结果已经得知以后来制定接 受或拒绝零假设的准则,而是应该事先规定好这种准则—— 即检验。对于一个假设,一个检验就是给出一个拒绝域和一 个接受域。 − 2 + 2 9 0.015 , 0.5 9 0.015 在 例1中接受域为: 0.5 u u + + − − , 9 0.015 0.5 9 0.015 拒绝域为: , 0.5 u 2 u 2 当 X 落入接受域时就接受H0 ,否则就拒绝H0 ,即接受H1