第八章 假设检验 我们将讨论不同于参数估计的另一类重要的统计推断问题, 这就是根据样本的信息检验关于总体的某个假设是否正确. 这类问题称作假设检验问题 总体分布已知,检验 参数假设检验 假设检验 关于未知参数的某个假设 非参数假设检验 总体分布未知时的 假设检验问题
假设检验 参数假设检验 非参数假设检验 这类问题称作假设检验问题. 总体分布已知, 检验 关于未知参数的某个假设 总体分布未知时的 假设检验问题 这就是根据样本的信息检验关于总体的某个假设是否正确. 第八章 —— 假 设 检 验 我们将讨论不同于参数估计的另一类重要的统计推断问题
§1基本概念 一、引例 引例1(P.168例1)某化学日用品厂用包装机包装洗衣粉.包装机 正常工作时,包装量X~N(500,2),每天开工后须先检查包装机 工作是否正常.某天开工后,在装好的洗衣粉中任取了9袋,称得 重量的平均值x=502(g).假设总体方差不变,问这天包装机工作 是否正常. 如何由抽样判断包装机工作是否正常? 由题意可设这天包装重量X~N(4,σ).如果工作正常,则X 服从的分布应与平常的一样,即X~N(500,22). 问题就转化为:由抽样结果判断假设“μ=h=500”是否成立? 为此,我们提出假设 H:4=h=500和H1:u≠4
每天开工后须先检查包装机 工作是否正常. 一、引例 §1 基 本 概 念 包装机 正常工作时, 包装量 X ~ N(500, 2 2), 引例1(P.168 例1) 某化学日用品厂用包装机包装洗衣粉. 假设总体方差不变, 问这天包装机工作 是否正常. 某天开工后, 在装好的洗衣粉中任取了 9袋, 如何由抽样判断包装机工作是否正常 ? 如果工作正常, 则 X 服从的分布应与平常的一样, 即 X ~ N(500, 2 2). 由题意可设这天包装重量 X ~ N(, 2). 重量的平均值 ─ x = 502(g). 问题就转化为:由抽样结果判断假设 “ =0 = 500”是否成立 ? 称得 为此, 我们提出假设 H0: =0 = 500 和 H1: ≠ 0
引例2(P.168例1)从高二随机抽取两个小组,在化学教学中试 验组使用启发式教学法,对照组使用传统教学法,然后统一测验. 实验组的成绩为64,58,65,56,58,45,55,63,66,69; 对照组的成绩为60,59,57,41,38,52,46,51,49,58. 问两种教学法是否有差异?(经验是启发式优于传统式) 如何判断是否有差异? 设山,h是分别为实验组和对照组学习成绩的均值, 如果启发式优于传统式,则应有山>h· 问题就转化为:由抽样结果判断假设 “4>h”是否成立? 为此,我们提出假设H:山>? 和H1:山1≤h 上述问题的共同点: 由题意对总体的未知参数或其分布形式作出假设(如例1中假设 4=500;例2中假设1h,例3中假设F(x)=F(x)等等), 然后由抽样结果判断假设是否成立
(如例1中假设 =500; 引例2(P.168 例1) 从高二随机抽取两个小组, 在化学教学中试 验组使用启发式教学法, 对照组使用传统教学法, 然后统一测验. 实验组的成绩为 64, 58, 65, 56, 58, 45, 55, 63, 66, 69 ; 问两种教学法是否有差异? 对照组的成绩为 60, 59, 57, 41, 38, 52, 46, 51, 49, 58 . (经验是启发式优于传统式) 由题意对总体的未知参数或其分布形式作出假设 例3中假设 F(x)=F0(x) 等等), 设 1 , 2 是分别为实验组和对照组学习成绩的均值, 则应有 1 > 2 . 上述问题的共同点: 如何判断是否有差异 ? 如果启发式优于传统式, 问题就转化为:由抽样结果判断假设 “ 1 > 2 ” 是否成立 ? 例2中假设 1>2 , 然后由抽样结果判断假设是否成立. 为此, 我们提出假设 H0:1 >2 和 H1:1 2
对总体的参数或分布形式作出一个假设,根据样本提供的信 息,来推断假设是否具有制定的特征一一这个过程就是假设检验 称需要判断是否为真的那个假设为原假设(零假设),记为H; 如例1中Ho:4=500;例2中Ho:h>h,例3中Ho:F(x)=F(x). 称原假设的对立假设为备择假设(对立假设)记为山. 显然,原假设与备择假设是对立的. 实际中,往住把不轻易 否定的命题作为原假设 例1与例2是参数假设检验,例3则是非参数假设检验 参数假设检验主要有三种类型:分布假设 双侧假设H0:4=4o,H1:4≠h; 单侧假设 o:u≤4o, H1:u>4% (Ho:4≥40,H1:u<4; 它们的检验分别称为双侧检验,单侧检验和分布检验
对总体的参数或分布形式作出一个假设, 根据样本提供的信 息, 来推断假设是否具有制定的特征—— 这个过程就是假设检验. 称原假设的对立假设为备择假设(对立假设), 称需要判断是否为真的那个假设为原假设(零假设), 记为 H0 ; 记为 H1 . 实际中, 往往把不轻易 否定的命题作为原假设 H0 : = 0 , H1: ≠0 ; 显然, 原假设与备择假设是对立的. H0 : 0 , H1: > 0 ; 如例1中H0: =500; 例2中H0: 1>2 , 例3中H0: F(x)=F0(x). 例1 与 例2 是参数假设检验, 例3 则是非参数假设检验. 参数假设检验主要有三种类型: H0: 0 , H1: < 0 ; 双侧假设 单侧假设 分布假设 它们的检验分别称为 双侧检验, 单侧检验和分布检验
二、假设检验的基本原理 如何对原假设进行检验? 原理? 02-500 |a2)=0.05,查表可得分位数ua2, 事件{X二>a2}是一个由样本X,,Xn构成的小概率事件 σ小"数值2是确认小概率事件是否己经发生的数量界限
需要给 出一个量的界限. 差距“较大”还是“较小”是一个相对的概念, ─ 当|X- 0| 较小时, 可以认为 H0 是成立的; ─ 当|X- 0| 较大时, 即生产已不正常. 二、假设检验的基本原理 ─ ─ 因此可以根据 与 X 的差距|X- 0| 来判断 H0 是否成立. ─ 由于0 是正态分布的期望值, 它的无偏估计量是样本均值X, 如何对原假设进行检验? 原理? 引例1(P.168 例1) H0: =0 = 500 需将其量化. 若 H0 成立, ─ 则 X ~ N(0 , 2/n), n X U / 0 ~ N(0, 1), 数值 u/2 是确认小概率事件是否已经发生的数量界限. | } / {| /2 0 u n X (| | ) 0.05 , 给定小概率 =0.05, 令 P U u /2 查表可得分位数 u/2 , 事件 是一个由样本 X1,„, Xn 构成的小概率事件. 界限应由什么原则来确定? 这需用到人们在实践中普遍采用的一个原则: 小概率事件在一次试验 中基本上不会发生 应认为 H0不成立, ??? | 1.96 2 / 9 502 500 | | | 0 0.025 U u
这需用到人们在实践中普遍采用的一个原则: 小概率事件在一次试验中基本上不会发生 若H成立,→U=X二~N(0,1), 拒绝Ho成立. 对于小概率a=0.05,令P(U>a2))=a,得分位数uu2, 则二台>a是一个由样本凡,X构成的小概率事件 比较U=二片与Wa2, 若|U>aaa11=520=3>s=1% 21N9 这表明小概率事件在一次试验中竞然发生了,不能不使人怀疑 所作的假设不能成立,即拒绝假设. 这个例子中所使用的推理方法,可以称为带概率性质的反证法, 亦称为概率反证法.它不同于一般的反证法,一般的反证法要求在 原假设成立的条件下导出的结论是绝对成立的,如果事实与之矛盾, 则完全绝对地否定原假设.概率反证法的逻辑是:如果小概率事件 在一次试验中居然发生,我们就以很大的把握否定原假设. 数值wa2就是确认小概率事件是否已经发生的数量界限
一般的反证法要求在 原假设成立的条件下导出的结论是绝对成立的, 如果事实与之矛盾, 则完全绝对地否定原假设. 不能不使人怀疑 所作的假设不能成立, 这需用到人们在实践中普遍采用的一个原则: 这表明小概率事件在一次试验中竟然发生了, 这个例子中所使用的推理方法, 可以称为带概率性质的反证法, 亦称为概率反证法. 若 H0 成立, n X U / 0 ~ N(0, 1), 数值 u/2 就是确认小概率事件是否已经发生的数量界限. ( | | ) , 对于小概率=0.05 , 令 P U u /2 得分位数 u/2 , 则 是一个由样本 X1,„, Xn 构成的小概率事件. 小概率事件在一次试验中基本上不会发生 n x U / 0 0 | } / {| /2 0 u n X 比较 与 u/2 , 若|U0|> u/2 即拒绝假设. | 3 1.96 2 / 9 502 500 | | | 0 0.025 U u 拒绝H0 成立. 它不同于一般的反证法, 概率反证法的逻辑是:如果小概率事件 在一次试验中居然发生, 我们就以很大的把握否定原假设
假设检验问题归结为对“差异”作定量的分析,以确定其性质。 差异可能是由抽样的随机性引起的,称为抽样误差或随机误差. 这种误差反映偶然、非本质的因素所引起的随机波动. 然而,这种随机性的波动是有一定限度的,如果差异超过了这个 限度,我们就不能用抽样的随机性来解释了. 必须认为这个差异反映了事物的本质差别,即反映了生产己不 正常。这种差异称作“系统误差”. 问题是,根据所观察到的差异,如何判断它究竟是由于偶然性 在起作用,还是生产确实不正常? 即差异是“抽样误差”还是“系统误差”所引起的?
如果差异超过了这个 限度, 我们就不能用抽样的随机性来解释了. 必须认为这个差异反映了事物的本质差别, 即反映了生产已不 正常. 这种差异称作“系统误差”. 然而, 这种随机性的波动是有一定限度的, 问题是, 根据所观察到的差异, 如何判断它究竟是由于偶然性 在起作用, 还是生产确实不正常? 即差异是“抽样误差”还是“系统误差”所引起的? 假设检验问题归结为对 “差异” 作定量的分析, 以确定其性质. 差异可能是由抽样的随机性引起的, 称为抽样误差 或 随机误差. 这种误差反映偶然、非本质的因素所引起的随机波动
小结■ 参数的区间估计一一正态总体置信区间的求法 假设检验」 原假设(零假设)H;备择假设(对立假设)H, 假设一一 对总体的参数或分布所作的论断、假定或设想. 假设检验一一 按一定原则,用样本来推断所作假设是否成立. 参数假设检验 总体分布已知,关于未知参数的假设检验 非参数假设检验 总体分布未知时的假设检验问题 参数假设检验主要有三种类型: 分布假设 双侧假设检验 H0:u=0, H1:u丰h; H0:≤o, H1: u>6; 单侧假设检验 Ho: 4≥40,H1:4<%· 概率反证法 假设检验的基本原则:小概率事件在一次试验中基本上不会发生 给出确认小概率事件是否已发生的数量界限一一
小结 假设 参数假设检验 非参数假设检验 总体分布已知, 关于未知参数的假设检验 总体分布未知时的假设检验问题 假设检验 —— 按一定原则, 用样本来推断所作假设是否成立. 参数的区间估计 假设检验 —— 正态总体置信区间的求法 —— 对总体的参数或分布所作的论断、假定或设想. 原假设(零假设)H 备择假设(对立假设)H1, 0 ; H0 : = 0 , H1: ≠0 ; H0 : 0 , H1: > 0 ; 参数假设检验主要有三种类型: H0: 0 , H1: < 0 . 双侧假设检验 单侧假设检验 假设检验的基本原则:小概率事件在一次试验中基本上不会发生 概率反证法 给出确认小概率事件是否已发生的数量界限 —— u/2 分布假设
现在回到我们前面装洗衣粉的例中 写引例1.168例1)Hμ=4=500, 检验统计量 在提出原假设H后如何作出接受和拒绝H的结论呢? ②U=X=N(0,1),对小概率a=0.05,令P(IU>n)=0.05, 查表得以-1.99:1903>196,号拒绝瓜,成立 2/N9 如果X的观测值x使U的值U,落入区域U>ua,则拒绝H. 否则,则接受Ho. W=U>ua W=U<ua 所依据的逻辑是:若Ho是对的,则衡量差异大小的某检验统计量U落入区 域W应是个小概率事件.如果该统计量的实测值落入了W,也就是说,设H成立, 但小概率事件发生了,故应认为H不可信而否定它.否则我们就不能否定H. 如果检验统计量的观测值落入区域W我们就拒绝H,则称区域 W为拒绝域,称币=R-W为接受域,拒绝域的边界点称为临界点. I
若 H0 是对的, 则衡量差异大小的某检验统计量U 落入区 域W应是个小概率事件. 也就是说, 设 H0 成立, 但小概率事件发生了, 故应认为H0 不可信而否定它. 则称区域 W为拒绝域, 否则, 则接受 H0 . 在提出原假设 H0后,如何作出接受和拒绝 H0的结论呢? 现在回到我们前面装洗衣粉的例中: 引例1(P.168 例1) H0: =0 = 500 , n X U / 0 ~ N(0, 1), | 3 1.96, 2 / 9 502 500 | | | 0 U (| | ) 0.05 , 对小概率 =0.05, 令 P U u /2 ─ ─ 如果 X 的观测值 x 使U 的值U0 落入区域|U|>u , 查表得 u0. 025 =1.96 , 拒绝 H0 成立. 则拒绝 H0 . 检验统计量 如果检验统计量的观测值落入区域W我们就拒绝H0 , ─ 称W=R- W 为接受域, 拒绝域的边界点称为 . 所依据的逻辑是: 如果该统计量的实测值落入了W, 否则我们就不能否定H0 . ⑤ ① ② ③ ④ 临界点 W = |U|> u , W = |U|< u
不否定H并不是肯定H,一定对,而只是说差异还不够显著, 还没有达到足以拒绝H的程度. 在假设检验中,我们称这个小概率α为显著性水平,简称水平 的选择要根据实际情况而定,常取a=0.1,a=0.01,o=0.05等. 假设检验会不会犯错误呢? 会!但错误的概率不大于. 如果H0成立,但统计量的实测值落入拒绝域,从而作出否定Ho 的结论,那就犯了“弃真”的错误.一第一类错误 如果H不成立,但统计量的实测值未落入拒绝域,从而作出接 受H的错误结论,那就犯了“取伪”的错误.一第二类错误 实际情况 H为真 H不真 拒绝Ho 第一类错误 正确 接受Ho 正确 第二类错误
从而作出接 受 H0 的错误结论, 的选择要根据实际情况而定, 从而作出否定H0 的结论, 而只是说差异还不够显著, 还没有达到足以拒绝 H0 的程度. 在假设检验中, 我们称这个小概率为显著性水平, 简称水平. 不否定 常取 =0. 1, =0.01, =0.05 等. 假设检验会不会犯错误呢? 如果H0 成立, 如果H0不成立, 但统计量的实测值落入拒绝域, 那就犯了“弃真” 的错误. 但统计量的实测值未落入拒绝域, 那就犯了“取伪”的错误. ——第一类错误 ——第二类错误 拒绝 H0 接受 H0 H0 为真 H0 不真 第一类错误 第二类错误 正确 正确 会! 但错误的概率不大于 . H0 并不是肯定 H0 一定对