第七章假设检验 统计推断的另一类重要问题是假设检验.在总体分布未知或虽知其类型但含有未知参 数的时候,为推断总体的某些未知特性,提出某些关于总体的假设.我们要根据样本所提供 的信息以及运用适当的统计量,对提出的假设作出接受或拒绝的决策,假设检验是作出这一 决策的过程 假设检验参数假设检验 非参数假设检验 参数假设检验针对总体分布函数中的未知参数提出的假设进行检验,后者针对总体分 布函数形式或类型的假设进行检验,本章主要讨论单参数假设检验问题 第一节假设检验的基本概念 分布图示 ★引言 ★引例 ★假设检验的基本思想 ★假设检验的两类错误 ★假设检验问题的提法 ★假设检验的一般步骤 ★例1 ★例2 ★多参数与非参数假设检验问题 ★内容小结 ★习题7-1 返回 内容要点 引例 设一箱中有红白两种颜色的球共100个,甲说这里有98个白球乙从箱中任取一个,发 现是红球,问甲的说法是否正确? 二、假设检验的基本思想 假设检验的基本思想实质上是带有某种概率性质的反证法.为了检验一个假设H是否 正确,首先假定该假设H正确,然后根据样本对假设H作出接受或拒绝的决策如果样本 观察值导致了不合理的现象的发生,就应拒绝假设H0,否则应接受假设H0 假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的 原则,即小概率事件在一次试验中是几乎不发生的.但概率小到什么程度才能算作“小概率 事件”,显然“小概率事件”的概率越小,否定原假设H就越有说服力.常记这个概率值 为a(0<a<1),称为检验的显著性水平.对不同的问题,检验的显著性水平a不一定相同, 但一般应取为较小的值,如0.1,0.05或001等 三、假设检验的两类错误 当假设H正确时,小概率事件也有可能发生,此时我们会拒绝假设H0,因而犯了“弃 真”的错误,称此为第一类错误.犯第一类错误的概率恰好就是“小概率事件”发生的概率α P{拒绝H|H为真}=a 反之,若假设H不正确,但一次抽样检验结果,未发生不合理结果,这时我们会接受H, 因而犯了“取伪”的错误,称此为第二类错误.记β为犯第二类错误的概率,即
第七章 假设检验 统计推断的另一类重要问题是假设检验. 在总体分布未知或虽知其类型但含有未知参 数的时候, 为推断总体的某些未知特性, 提出某些关于总体的假设. 我们要根据样本所提供 的信息以及运用适当的统计量, 对提出的假设作出接受或拒绝的决策, 假设检验是作出这一 决策的过程. 非参数假设检验 参数假设检验 假设检验 参数假设检验针对总体分布函数中的未知参数提出的假设进行检验, 后者针对总体分 布函数形式或类型的假设进行检验, 本章主要讨论单参数假设检验问题. 第一节 假设检验的基本概念 分布图示 ★ 引言 ★ 引例 ★ 假设检验的基本思想 ★ 假设检验的两类错误 ★ 假设检验问题的提法 ★ 假设检验的一般步骤 ★ 例1 ★ 例2 ★ 多参数与非参数假设检验问题 ★ 内容小结 ★习题 7-1 ★ 返回 内容要点 一、引例 设一箱中有红白两种颜色的球共 100 个, 甲说这里有 98 个白球, 乙从箱中任取一个, 发 现是红球, 问甲的说法是否正确? 二、假设检验的基本思想 假设检验的基本思想实质上是带有某种概率性质的反证法. 为了检验一个假设 H0 是否 正确, 首先假定该假设 H0 正确, 然后根据样本对假设 H0 作出接受或拒绝的决策. 如果样本 观察值导致了不合理的现象的发生, 就应拒绝假设 H0 , 否则应接受假设 H0 . 假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的 原则, 即小概率事件在一次试验中是几乎不发生的. 但概率小到什么程度才能算作“小概率 事件”, 显然, “小概率事件”的概率越小,否定原假设 H0 就越有说服力. 常记这个概率值 为 (0 1) ,称为检验的显著性水平. 对不同的问题, 检验的显著性水平 不一定相同, 但一般应取为较小的值, 如 0.1,0.05 或 0.01 等. 三、假设检验的两类错误 当假设 H0 正确时, 小概率事件也有可能发生, 此时我们会拒绝假设 H0 , 因而犯了“弃 真”的错误, 称此为第一类错误. 犯第一类错误的概率恰好就是“小概率事件”发生的概率 , 即 P{拒绝 H0 | H0 为真}= . 反之, 若假设 H0 不正确, 但一次抽样检验结果, 未发生不合理结果, 这时我们会接受 H0 , 因而犯了“取伪”的错误,称此为第二类错误. 记 为犯第二类错误的概率, 即
P{接受H。|H0不真}=B 理论上,自然希望犯这两类错误的概率都很小。当样本容量n固定时,a,β不能同时都小, 即α变小时,β就变大;而β变小时,α就变大。一般只有当样本容量n增大时,才有可能使 两者变小。在实际应用中,一般原则是:控制犯第一类错误的概率,即给定α,然后通过增 大样本容量n来减小B 关于显著性水平a的选取:若注重经济效益,a可取小些,如a=001;若注重社会效 益,a可取大些,如a=001;若要兼顾经济效益和社会效益,一般可取a=0.05 四、假设检验问题的一般提法 在假设检验问题中,把要检验的假设H称为原假设(零假设或基本假设),把原假设 的对立面称为备择假设或对立假设,记为H1 例如,有一封装罐装可乐的生产流水线,每罐的标准容量规定为30毫升.质检员每天 都要检验可乐的容量是否合格,已知每罐的容量服从正态分布,且生产比较稳定时,其标准 差σ=5毫升.某日上班后,质检员每隔半小时从生产线上取一罐,共抽测了6罐,测得容量 (单位为毫升)如下 353,345,357,339,355,360 试问生产线工作是否正常 本例的假设检验问题可简记为 H0:4=p0,H1:H≠p0,(0=350) 形如(1)式的备择假设H1,表示μ可能大于灿0,也可能小于山,称为双侧(边)备择假设.形 如(1)式的假设检验称为双侧(边)假设检验 在实际问题中,有时还需要检验下列形式的假设 Ho:H≤{0,H1:>o H0:H≥{03,H1:H<p0 形如(2)式的假设检验称为右侧(边)检验 形如(3)式的假设检验称为左侧(边)检验 右侧(边)检验和左侧(边)检验统称为单侧(边)检验 为检验提出的假设,通常需构造检验统计量,并取总体的一个样本,根据该样本提供的 信息来判断假设是否成立当检验统计量取某个区域W中的值时,我们拒绝原假设H0则称 区域W为拒绝域,拒绝域的边界占称为临界点 五、假设检验的一般步骤 (1)根据实际问题的要求充分考虑和利用已知的背景知识,提出原假设H及备择假设 H (2)给定显著性水平a以及样本容量n (3)确定检验统计量U,并在原假设H成立的前提下导出U的概率分布,要求U的分 布不依赖于任何未知参数; (4)确定拒绝域,即依据直观分析先确定拒绝域的形式,然后根据给定的显著性水平α 和U的分布,由 P{拒绝H0H为真}=a 确定拒绝域的临界值,从而确定拒绝域; (5)作一次具体的抽样,根据得到的样本观察值和所得的拒绝域,对假设H作出拒绝 或接受的判断 六、多参数与非参数假设检验问题 原则上,以上介绍的所有单参数假设检验的内容也适用于多参数与非参数假设检验问 题,只需在某些细节上作适当的调整即可,这里仅说明下列两点 (1)对多参数假设检验问题,要寻求一个包含所有待检验参数的检验统计量,使之服从
P{接受 H0 | H0 不真}= . 理论上, 自然希望犯这两类错误的概率都很小。 当样本容量 n 固定时, , 不能同时都小, 即 变小时, 就变大;而 变小时, 就变大.。一般只有当样本容量 n 增大时,才有可能使 两者变小。在实际应用中, 一般原则是: 控制犯第一类错误的概率, 即给定 , 然后通过增 大样本容量 n 来减小 . 关于显著性水平 的选取: 若注重经济效益, 可取小些, 如 = 0.01 ; 若注重社会效 益, 可取大些,如 = 0.01 ;若要兼顾经济效益和社会效益, 一般可取 = 0.05 . 四、假设检验问题的一般提法 在假设检验问题中, 把要检验的假设 H0 称为原假设(零假设或基本假设), 把原假设 H0 的对立面称为备择假设或对立假设, 记为 H1 . 例如, 有一封装罐装可乐的生产流水线, 每罐的标准容量规定为 350 毫升. 质检员每天 都要检验可乐的容量是否合格, 已知每罐的容量服从正态分布, 且生产比较稳定时,其标准 差 = 5 毫升. 某日上班后, 质检员每隔半小时从生产线上取一罐, 共抽测了 6 罐, 测得容量 (单位为毫升)如下: 353, 345, 357, 339, 355, 360. 试问生产线工作是否正常? 本例的假设检验问题可简记为: : , : ,( 350) H0 = 0 H1 0 0 = (1) 形如(1)式的备择假设 H1 , 表示 可能大于 0 , 也可能小于 0 , 称为双侧(边)备择假设. 形 如(1)式的假设检验称为双侧(边)假设检验. 在实际问题中, 有时还需要检验下列形式的假设: : , : . H0 0 H1 0 (2) : , : . H0 0 H1 0 (3) 形如(2)式的假设检验称为右侧(边)检验; 形如(3)式的假设检验称为左侧(边)检验; 右侧(边)检验和左侧(边)检验统称为单侧(边)检验. 为检验提出的假设, 通常需构造检验统计量, 并取总体的一个样本, 根据该样本提供的 信息来判断假设是否成立.当检验统计量取某个区域 W 中的值时, 我们拒绝原假设 H0 ,则称 区域 W 为拒绝域, 拒绝域的边界占称为临界点. 五、假设检验的一般步骤 (1) 根据实际问题的要求,充分考虑和利用已知的背景知识, 提出原假设 H0 及备择假设 H1 ; (2) 给定显著性水平 以及样本容量 n; (3) 确定检验统计量 U, 并在原假设 H0 成立的前提下导出 U 的概率分布, 要求 U 的分 布不依赖于任何未知参数; (4) 确定拒绝域, 即依据直观分析先确定拒绝域的形式,然后根据给定的显著性水平 和 U 的分布, 由 P{拒绝 H0 | H0 为真}= 确定拒绝域的临界值, 从而确定拒绝域; (5) 作一次具体的抽样, 根据得到的样本观察值和所得的拒绝域, 对假设 H0 作出拒绝 或接受的判断. 六、多参数与非参数假设检验问题 原则上, 以上介绍的所有单参数假设检验的内容也适用于多参数与非参数假设检验问 题, 只需在某些细节上作适当的调整即可, 这里仅说明下列两点: (1) 对多参数假设检验问题, 要寻求一个包含所有待检验参数的检验统计量, 使之服从
一个已知的确定分布 (2)非参数假设检验问题可近似地化为一个多参数建设检验问题 鉴于正态总体是统计应用中最为常见的总体,在以下两节中,我们将首先分别讨论单正 态总体与双正态总体的参数假设检验 例题选讲 例1(E01)某化学日用品有限责任公司用包装机包装洗衣粉,洗衣粉包装机在正常工作 时,装包量X~N(500,2)(单位:g),每天开工后,需先检验包装机工作是否正常.某天开 工后,在桩号的洗衣粉中任取9袋,其重量如下 505,499,502,506,498,498,497,510,503 假设总体标准差σ不变,即σ=2,试问这天包装机工作是否正常(a=0.05)? 解(1)提出假设检验:H0:=500,1:≠500 (2)以H成立为前提确定检验H的统计量及其分布U= X-500 a/m2/3 ~N(0,1) (3)对给定显著性水平a=005,确定H0的接受域W或拒绝W,取临界点为uan2=1.96 使P{U卜ln2}=a,故H0被接受与拒绝的区域分别为 W=[-1.96196],W=(-∞-1.96)U(1.96+∞) (4)由样本计算统计量U的值=502=50=3 (5)对假设H作出推断因为n∈W(拒绝域,故认为这天洗衣粉包装机工作不正常 例2某厂生产的一种螺钉,标准要求长度是68mm实际生产的产品,其长度服从正 态分布N(A,362),考虑设检验问题 设X为样本均值,按下列方式进行假设检验 当|X-68卜1时,拒绝假设Ho 当|x-68≤1时,接受假设H (1)当样本容量n=36,求犯第一类错误的概率a (2)当n=64时,求犯第一类错误的概率a (3)当H0不成立(设=70),又n=64时,按上述检验法,求犯第二类错误的概率β 解当n=36时,有R~N3人~N(1062),所以 a=P{x-68}1H0成立}=P{X69H成立 67-68 69-68 06/+/1- =Φ(-167)+[1-(1.67)
一个已知的确定分布; (2) 非参数假设检验问题可近似地化为一个多参数建设检验问题. 鉴于正态总体是统计应用中最为常见的总体, 在以下两节中,我们将首先分别讨论单正 态总体与双正态总体的参数假设检验. 例题选讲 例 1 (E01) 某化学日用品有限责任公司用包装机包装洗衣粉, 洗衣粉包装机在正常工作 时, 装包量 ~ (500,2 ) 2 X N (单位: g ), 每天开工后, 需先检验包装机工作是否正常. 某天开 工后, 在桩号的洗衣粉中任取 9 袋, 其重量如下: 505, 499, 502, 506, 498, 498, 497, 510, 503 假设总体标准差 不变,即 = 2, 试问这天包装机工作是否正常 ( = 0.05) ? 解 (1) 提出假设检验: : 500, H0 = : 500. H1 (2) 以 H0 成立为前提, 确定检验 H0 的统计量及其分布, ~ (0,1). 2/3 500 / 0 N X n X U − = − = (3) 对给定显著性水平 = 0.05, 确定 H0 的接受域 W 或拒绝 W ,取临界点为 1.96, u / 2 = 使 {| | } , P U u / 2 = 故 H0 被接受与拒绝的区域分别为 W =[−1.96,1.96], W = (−,−1.96)(1.96,+). (4) 由样本计算统计量 U 的值 3. 2 / 3 502 500 = − u = (5) 对假设 H0 作出推断因为 u W (拒绝域), 故认为这天洗衣粉包装机工作不正常. 例 2 某厂生产的一种螺钉, 标准要求长度是 68mm. 实际生产的产品, 其长度服从正 态分布 ( ,3.6 ), 2 N 考虑设检验问题 H0 : = 68 H1 : 68 设 X 为样本均值,按下列方式进行假设检验: 当 | X − 68|1 时,拒绝假设 ; H 0 当 | X − 68|1 时,接受假设 . H 0 (1)当样本容量 n = 36, 求犯第一类错误的概率 ; (2)当 n = 64 时, 求犯第一类错误的概率 ; (3)当 H 0 不成立(设 = 70) ,又 n = 64 时,按上述检验法,求犯第二类错误的概率 . 解 当 n = 36 时, 有 ( ,0.6 ), 36 3.6 ~ , 2 2 X N = N 所以 {| 68| 1| } = P X − H0成立 { 67 | } { 69| } = P X H0成立 + P X H0成立 − + − − = 0.6 69 68 1 0.6 67 68 = (−1.67) +[1− (1.67)]
21-Φ(1.67)]=2[1-0.9525]=00950 (2)当n=64时,有X~N(,0452) a=PX69H成立=07=+1-(968 0.45 0.45 =2[1-Φ(222)=2[1-0.9868]=0.0264 注:随着样本容量n的增大,得到关于总体的信息更多,从而犯弃真错误的概率越小 (3)当n=64,4=70时,~N(700452),这时,犯第二类错误的概率 B(70=P{67≤X≤694=70}=d 0.45 =b(222)-d(-667)=Φ(667)-d(222) =1-0.9868=0.0132 进一步,当n=64,u=66时,同样可计算得(66)=00132 当n=64,=685时,~N(685,0452) B(685)=P67≤X≤69=685}=d 69-68.5 67-68.5 =0l-(83) 045=0.8665-|1-0.999=0.8660 注:由(3)中可知,在样本容量确定的第件下,μ的真值越接近山=68,犯取伪错误的 概率越大
= 2[1− (1.67)] = 2[1− 0.9525] = 0.0950. (2) 当 n = 64 时, 有 ~ ( ,0.45 ), 2 X N {| 67 | } {| 69| } = P X H0成立 + P X H0成立 − + − − = 0.45 69 68 1 0.45 67 68 = 2[1− (2.22)] = 2[1− 0.9868] = 0.0264. 注: 随着样本容量 n 的增大, 得到关于总体的信息更多, 从而犯弃真错误的概率越小. (3) 当 n = 64, = 70 时, ~ (70,0.45 ), 2 X N 这时, 犯第二类错误的概率 (70) = P{67 X 69| = 70} − − − = 0.45 67 70 0.45 69 70 = (2.22) −(−6.67) = (6.67) −(2.22) =1− 0.9868 = 0.0132. 进一步, 当 n = 64, = 66 时, 同样可计算得 (66) = 0.0132; 当 n = 64, = 68.5 时, ~ (68.5,0.45 ). 2 X N (68.5) = P{67 X 69 = 68.5} − − − = 0.45 67 68.5 0.45 69 68.5 − = − 0.45 67 68.5 (1.11) = 0.8665 −[1− 0.9995] = 0.8660. 注: 由(3)中可知, 在样本容量确定的第件下, 的真值越接近 68, 0 = 犯取伪错误的 概率越大