第八章假设检验 【授课对象】理工类本科二年级 【授课时数】6学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解显著性检验的基本思想,掌握显著性检验基本步骤和可能产生的两类错 2、掌握单个及两个正态总体的均值和方差的假设检验; 3、知道总体分布假设的x2检验法。 【本章重点】单个及两个正态总体的均值和方差的假设检验 【本章难点】两个正态总体的均值和方差的假设检验;总体分布假设的x2检验法 【授课内容及学时分配】 §8.1假设检验的基本思 假设检验是统计推断的另一类问题。在总体的分布函数完全未知,或只知其形式但不知 其参数的形式的情况下,为了推断总体的某些性质,提出了关于总体的某些假设。 、显著性检验的基本思想 为了对总体的分布类型或分布中的未知参数作出推断,首先对它们提出一个假设H,称 为原假设,同时给出其对立假设H1。为判断H正确还是H1正确,需要对总体进行抽样,然 后在H为真的条件下,通过选取恰当的统计量来构造一个小概率事件,若在一次试验中,小 概率事件居然发生了,就完全有理由拒绝H的正确性,否则没有充分理由拒绝H的正确性 从而接受H,这就是假设检验的基本思想。 怎样检验一个统计假设呢!下面结合例子来说明假设检验的基本思想和做法: 引例设总体x服从正态分布N(μ1),其中仅包含一个未知参数,即数学期望μ,欲要 求检验统计假设H:μ=0? 【分析】:在这里,总体X的分布函数形式是已知的,为正态分布N(H,1),其中仅含 个未知参数μ,同时也提出了一个统计假设Hμ=0。所以它是一个参数的显著性检验问题。 怎样判断这一统计假设H(μ=0)的正确性呢?首先需要对总体进行一定次数的观察,获 得数据,也就是说抽取样本。设我们从该总体中抽取了一个容量为10的简单随机样本,其观 察值记为(x1,x2…,x0),样本来自总体,反映了总体的分布规律,因此样本中必然包含关于
1 第八章 假设检验 【授课对象】理工类本科二年级 【授课时数】6 学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解显著性检验的基本思想,掌握显著性检验基本步骤和可能产生的两类错 误; 2、掌握单个及两个正态总体的均值和方差的假设检验; 3、知道总体分布假设的 2 检验法。 【本章重点】单个及两个正态总体的均值和方差的假设检验 【本章难点】两个正态总体的均值和方差的假设检验;总体分布假设的 2 检验法。 【授课内容及学时分配】 §8.1 假设检验的基本思想 假设检验是统计推断的另一类问题。在总体的分布函数完全未知,或只知其形式但不知 其参数的形式的情况下,为了推断总体的某些性质,提出了关于总体的某些假设。 一、显著性检验的基本思想 为了对总体的分布类型或分布中的未知参数作出推断,首先对它们提出一个假设 H0 ,称 为原假设,同时给出其对立假设 H1 。为判断 H0 正确还是 H1 正确,需要对总体进行抽样,然 后在 H0 为真的条件下,通过选取恰当的统计量来构造一个小概率事件,若在一次试验中,小 概率事件居然发生了,就完全有理由拒绝 H0 的正确性,否则没有充分理由拒绝 H0 的正确性, 从而接受 H0 ,这就是假设检验的基本思想。 怎样检验一个统计假设呢!下面结合例子来说明假设检验的基本思想和做法: 引例:设总体 X 服从正态分布 N( ,1) ,其中仅包含一个未知参数,即数学期望 ,欲要 求检验统计假设 0 H : 0 = ? 【分析】:在这里,总体 X 的分布函数形式是已知的,为正态分布 N( ,1) ,其中仅含一 个未知参数 ,同时也提出了一个统计假设 0 H : 0 = 。所以它是一个参数的显著性检验问题。 怎样判断这一统计假设 0 H ( 0) = 的正确性呢?首先需要对总体进行一定次数的观察,获 得数据,也就是说抽取样本。设我们从该总体中抽取了一个容量为 10 的简单随机样本,其观 察值记为 1 2 10 ( , , , ) x x x ,样本来自总体,反映了总体的分布规律,因此样本中必然包含关于
未知参数μ的信息。但是要从样本中直接推断统计假设是否成立是困难的,还必需对样本进 行加工,把样本中包含的关于未知参数μ的信息集中起来,也就是说要构造一个适用于检验 假设H的统计量。这里μ是总体的均值,上一章已经看到,样本均值X是μ的一个无偏估计, 且x比样本的每个分量x,更集中的分布在总体均值μ的周围,如果假设H0(μ=0)是真的,则 样本均值ξ的观察值应较集中在0点附近,否则就应有偏离0点的趋势。这表明样本均值ξ 较好的集中了样本中所包含的关于μ的信息。因此利用x构造判断统计假设H0(μ=0)的方法 是合适的。 若从样本观察值计算得到x=1.01,那对假设H。(μ=0)的正确性能作出怎样的判断呢? 当假设H=0)成立时,x服从于N0D分布,由抽样分布知~N0.),因而 Px>101}=P√01010}≈21-(305别)000,这表明:如果假设H成立,那么 事件{>101实际上不大可能出现,即若在1009中,大约仅有两次使我们所观察到的样 本均值大于101。现在可否根据事件{x>101的概率很小这一理由而证实H0不成立呢?当 然不能。因为在假设H成立的条件下,事件{>101的概率虽很小,但这个事件仍可能出 现。显然我们也不能作肯定H的结论。但现在必须从“拒绝”和“接受”中选择一个较为合 理的判断作为我们的决定。一般它可以这样处理:给定一个临界概率α,如果在假设H成立 的条件下,出现观察到的事件{>对的概率小于等于a,就作拒绝假设H0的决定。一般应 取α为一个较小的数,这是因为我们给出假设H是经过细致的调查和考察的,所以对假设H 需加以保护,也就是说拒绝它应当慎重。根据小概率事件在一次试验(观察)中不可能发生 的实际推断原理,如果出现了这事件我们就有理由怀疑H不真,因为它超出了在H成立条 件下能以随机波动来解释的范围,因而作出拒绝H0的判断 、假设检验的基本步骤 1.由实际问题提出原假设H。(与备选假设H1); 2.选取适当的统计量,并在H为真的条件下确定该统计量的分布; 3.根据问题的要求确定显著性水平α(一般题目中会给定),从而得到拒绝域 4.由样本观测值计算统计量的观测值,看是否属于拒绝域,从而对H。作出判断。 两类错误 尚需指出,虽然在假设H为真时,发生作出拒绝H这一错误判断的概率很小,它小于 等于α,但这一错误还是可以发生的。在统计学上,当H。本来是正确的,但检验后作出了拒 绝H的判断,这种错误称为第一类错误,也称拒真错误。所以显著水平α是用来控制犯第
2 未知参数 的信息。但是要从样本中直接推断统计假设是否成立是困难的,还必需对样本进 行加工,把样本中包含的关于未知参数 的信息集中起来,也就是说要构造一个适用于检验 假设 H0 的统计量。这里 是总体的均值,上一章已经看到,样本均值 X 是 的一个无偏估计, 且 X 比样本的每个分量 Xi 更集中的分布在总体均值 的周围,如果假设 0 H ( 0) = 是真的,则 样本均值 X 的观察值应较集中在 0 点附近,否则就应有偏离 0 点的趋势。这表明样本均值 X 较好的集中了样本中所包含的关于 的信息。因此利用 X 构造判断统计假设 0 H ( 0) = 的方法 是合适的。 若从样本观察值计算得到 x =1.01 ,那对假设 0 H ( 0) = 的正确性能作出怎样的判断呢? 当假设 0 H ( 0) = 成立时, X 服从于 N(0,1) 分布,由抽样分布知 1 X N ~ (0, ) n ,因而 P X P X { 1.01} { 10 1.01 10} 2[1 (3.05)] 0.002 = − ,这表明:如果假设 H0 成立,那么 事件 { 1.01} X 实际上不大可能出现,即若在 1000 次中,大约仅有两次使我们所观察到的样 本均值大于 1.01。现在可否根据事件 { 1.01} X 的概率很小这一理由而证实 H0 不成立呢?当 然不能。因为在假设 H0 成立的条件下,事件 { 1.01} X 的概率虽很小,但这个事件仍可能出 现。显然我们也不能作肯定 H0 的结论。但现在必须从“拒绝”和“接受”中选择一个较为合 理的判断作为我们的决定。一般它可以这样处理:给定一个临界概率 ,如果在假设 H0 成立 的条件下,出现观察到的事件 { } X x 的概率小于等于 ,就作拒绝假设 H0 的决定。一般应 取 为一个较小的数,这是因为我们给出假设 H0 是经过细致的调查和考察的,所以对假设 H0 需加以保护,也就是说拒绝它应当慎重。根据小概率事件在一次试验(观察)中不可能发生 的实际推断原理,如果出现了这事件我们就有理由怀疑 H0 不真,因为它超出了在 H0 成立条 件下能以随机波动来解释的范围,因而作出拒绝 H0 的判断。 二、假设检验的基本步骤 1.由实际问题提出原假设 H0 (与备选假设 H1 ); 2.选取适当的统计量,并在 H0 为真的条件下确定该统计量的分布; 3.根据问题的要求确定显著性水平 (一般题目中会给定),从而得到拒绝域; 4.由样本观测值计算统计量的观测值,看是否属于拒绝域,从而对 H0 作出判断。 三、两类错误 尚需指出,虽然在假设 H0 为真时,发生作出拒绝 H0 这一错误判断的概率很小,它小于 等于 ,但这一错误还是可以发生的。在统计学上,当 H0 本来是正确的,但检验后作出了拒 绝 H0 的判断,这种错误称为第一类错误,也称拒真错误。所以显著水平 是用来控制犯第一
类错误的;同样,当H本来是不正确的,但检验后作出了接受H的判断,这种错误称为第 二类错误,也称受伪错误。对于给定的一对H和H,总可找出许多临界域,人们自然希望找 到这种临界域W,使得犯两类错误的概率都很小。奈曼一皮尔逊( Ne yman- Pearson)提出了 个原则:“在控制犯第一类错误的概率不超过指定值α的条件下,尽量使犯第二类错误β 小”,按这种法则做出的检验称为“显著性检验”,α称为显著性水平或检验水平。 §8.2參数的假设检验 我们这里仅介绍总体X的分布为正态分布时的几种显著性检验的方法。正态分布 (,2)含有两个参数和σ2,因此,这里的假设都是对这两个参数的假设。 U-检验:(在G2已知下,对μ进行检验) 设总体服从正态分布,在方差已知的条件下,若对期望进行检验,可用U-检验。 1.单总体U-检验: 设总体X~N(Ao2),其中。2已知,未知,(X1,X2…,Xn)为从X中抽取的一简单随 机样本 (1)双侧检验 要检验假设:H0:H=10,H1:≠0(双侧检验) 在前面的学习中我们知道,检验问题的关键是基于样本寻找一个合适的统计量,在这里 样本均值x很好地集中了样本中所包含的关于μ的信息。当假设H成立时,X的观察值x较 集中地分布在μ0的周围,否则就有偏离μ的趋势。所以X可以用来检验假设H。(μ=μ)。为 了查表方便,将标准化,从而统计量U=x万。在H(=以)为真时,U~N0D, 而当H0不真时,U服从均值不为0的N(…,1)分布,这表明当H不真时,的观察值有偏大 的趋势。所以对给定显著水平α,为使犯第二类错误的概率最小,查正态分布分位数表求出 μ-a/2使得 P h>-2}=P{U>u-2}+P{UH-m2,则拒绝假设H0(=), 这样我们便得到了检验的拒绝域W={>H=2},即W={u>山-2或n<-A-m2}。否则接
3 2 2 类错误的;同样,当 H0 本来是不正确的,但检验后作出了接受 H0 的判断,这种错误称为第 二类错误,也称受伪错误。对于给定的一对 H0 和 H1 , 总可找出许多临界域,人们自然希望找 到这种临界域 W , 使得犯两类错误的概率都很小。奈曼—皮尔逊 (Neyman—Pearson)提出了 一个原则:“在控制犯第一类错误的概率不超过指定值 的条件下,尽量使犯第二类错误 小”,按这种法则做出的检验称为“显著性检验”, 称为显著性水平或检验水平。 §8.2 参数的假设检验 我们这里仅介绍总体 X 的分布为正态分布时的几种显著性检验的方法。正态分布 ( , ) 2 N 含有两个参数 和 2 ,因此,这里的假设都是对这两个参数的假设。 一、 U -检验:(在 2 已知下,对 进行检验) 设总体服从正态分布,在方差已知的条件下,若对期望进行检验,可用 U -检验。 1.单总体 U -检验: 设总体 ~ ( , ) 2 X N 0 ,其中 2 0 已知, 未知, ( , , , ) X1 X2 Xn 为从 X 中抽取的一简单随 机样本。 (1)双侧检验 要检验假设: 0 0 1 0 H : = , H : (双侧检验) 在前面的学习中我们知道,检验问题的关键是基于样本寻找一个合适的统计量,在这里 样本均值 X 很好地集中了样本中所包含的关于 的信息。当假设 H0 成立时, X 的观察值 x 较 集中地分布在 0 的周围,否则就有偏离 0 的趋势。所以 X 可以用来检验假设 0 0 H ( ) = 。为 了查表方便,将 X 标准化,从而统计量 0 0 X U n − = 。在 0 0 H ( ) = 为真时, U N ~ (0,1), 而当 H0 不真时, U 服从均值不为 0 的 N( ,1) 分布,这表明当 H0 不真时, U 的观察值有偏大 的趋势。所以对给定显著水平 ,为使犯第二类错误的概率最小,查正态分布分位数表求出 1 / 2 − 使得 = + − = − − + = − { = 1− / 2 } { 1− / 2 } { 1− / 2 } 1 (1 / 2) / 2 0 0 n u P U u P U u X P U ,然后将 样本观测值代入算出 U 的观察值 u ,并比较 u 和 1 / 2 − ,若 1 / 2 u − ,则拒绝假设 0 0 H ( ) = , 这样我们便得到了检验的拒绝域 { } W = u 1− / 2 ,即 { } W = u 1− / 2或u −1− / 2 。否则接
受假设H。。 例1:糖厂用自动包装机进行包糖,要求每袋0.5公斤,假定该机器包装重量 X~N(、00152),现从生产线上随机取九袋乘重得X=0.509,问该包装机生产是否正常? 解:由题意有包装机装糖重量X~N(、00152),要检验假设 H0:4=05,H1:≠0.5,由于2=00152已知,可用U-检验,取显著水平a=05,查表 得山-a2=0=19,而阿 9(0.509-0.5) 18山-an2或u,还有一些问题, 如新工艺是否降低了产品中的次品数,此时要检验假设 H0:4≥4,H1:μA0(或μ0为例给予讨论 当G2=2为已知时,仍用U-检验。统计量U=出只有当H1:>A成立时有 变大的趋势,因此,对于给定的显著性水平α,该检验的拒绝域应取为 W={u>1-a} 同理,对于假设H0:4≥1,H1:4<在给定的显著性水平a,该检验的拒绝域应取为 {<-H1-a} 例2:设某电子产品平均寿命5000小时为达到标准,现从一大批产品中抽出12件试验 结果如下:5059,3897,3631,5050,7474,5077
4 受假设 H0。 例 1:糖厂用自动包装机进行包糖,要求每袋 0.5 公斤,假定该机器包装重量 ~ ( ,0.015 ) 2 X N ,现从生产线上随机取九袋乘重得 X = 0.509 ,问该包装机生产是否正常? 解:由题意有包装机装糖重量 ~ ( ,0.015 ) 2 X N ,要检验假设 H0 : = 0.5 , H1 : 0.5 ,由于 2 2 0 = 0.015 已知,可用 U -检验,取显著水平 = 0.05 ,查表 得 1− / 2 = 0.975 =1.96 ,而 1.8 1.96 0.015 9(0.509 0.5) = − U = 没有落入拒绝域 W 内,所以由该 样本,还没有得到足够的理由来拒绝原假设 H0 ,故接受原假设,即生产正常。 上述这种假设,其备择假设 1 0 H : 表明期望值 可能大于 0 ,也可能小于 0 ,我们 称这种检验为双侧检验。这种检验对给定的显著性水平 ,按照“使犯第二类错误的概率最 小”的原则所确定的拒绝域 { } W = u 1− / 2或u −1− / 2 ,是小于一个给定较小的数而大于一 个给定较大数的所有数值的集合,该拒绝域不能用一个区间来表示。 (2)单侧检验: 有时,我们只关心总体的期望是否增大,如产品的质量、材料的强度、元件的使用寿命 等是否随着工艺改革而比以前提高,此时需检验假设 0 0 1 0 H : , H : ,还有一些问题, 如新工艺是否降低了产品中的次品数,此时要检验假设 0 0 1 0 H : , H : ,像这种备择假设 : ( ) H1 0 或 0 表示期望值只可能大于 0 (或只能小于 0 ),这种检验称为单侧检验。对于单侧检验,最终得到的拒绝域的形式又如 何呢?下面以假设 0 0 1 0 H : , H : 为例给予讨论: 当 2 0 2 = 为已知时,仍用 U -检验。统计量 n X U 0 0 − = 只有当 1 0 H : 成立时有 变大的趋势,因此,对于给定的显著性水平 ,该检验的拒绝域应取为 { } W = u 1− 。 同理,对于假设 0 0 1 0 H : , H : 在给定的显著性水平 ,该检验的拒绝域应取为 { } W = u −1− 。 例 2:设某电子产品平均寿命 5000 小时为达到标准,现从一大批产品中抽出 12 件试验 结果如下:5059,3897,3631,5050,7474,5077
4545,6279,3532,2773,7419,5116 假设该产品的寿命X~N(,1400),试问此批产品是否合格? 解:由题意可知该产品寿命X~N(山1400),要检验假设 H0:4≥500,01:μ-1.645,故可接受H0,即认为该批产品合格。 2.两总体U-检验: 实际工作中常常需要对两个正态总体进行比较,这种情况实际上就是两个正态总体参数 的假设检验问题。 设X~N(A,a12),y~N(2,o2),其中σ12,2已知,且X与y相互独立。 (X1,X2…,Xn),(H1,Y2,…,P2)分别为来自总体X与y的两个样本 对,H2检验下面的统计假设 H0:A1=42,H1:山≠2(双侧检验)域或H0A≤2,H1:1>42(单侧检验)},由抽 样分布中的定理知:XM、162),Y~N(2a2),又F与F独立,从而有 x-~N(1-42+02-)。当原假设H0成立时,统计量 X-Y ~N(O1),否则U有增大的趋势,故对给定的显著性水平a,为使犯第 G;/n1+σ, 二类错误的概率最小,取拒绝域W={>4=2} 例3:书P213例1 T一检验(在σ2未知下,对μ进行检验) 设总体服从正态分布,由前面我们知道:在方差已知的条件下,若对期望进行检验,可 用U-检验,但如果方差未知,对期望进行检验,可用T一检验 1.单总体T一检验: 设总体X~N(,02),山a2未知,(X1,X2…Xn)为随机样本,要检验假设:
5 4545,6279,3532,2773,7419,5116 假设该产品的寿命 X ~ N(,1400) ,试问此批产品是否合格? 解:由题意可知该产品寿命 X ~ N(,1400) ,要检验假设 H0 : 5000 , H1 : 5000 ,计算知 x = 4986 , n =12 , 0 = 1400 ,则 1 296 1400 12 4986 5000 0 0 . ( ) n X U = − − = − = ,取 = 0.05 ,查得 1− = 0.95 =1.645 ,拒绝域 W {u } = −1− ,而此时-1.296>-1.645,故可接受 H0 ,即认为该批产品合格。 2.两总体 U -检验: 实际工作中常常需要对两个正态总体进行比较,这种情况实际上就是两个正态总体参数 的假设检验问题。 设 ~ ( , ) , ~ ( , ) 2 2 2 2 X N 1 1 Y N ,其中 2 2 2 1 , 已知,且 X 与 Y 相互独立。 ( , , , ) , ( , , , ) 1 2 n1 1 2 n2 X X X Y Y Y 分别为来自总体 X 与 Y 的两个样本。 对 1 2 , 检验下面的统计假设: 0 1 2 1 1 2 H : = , H : (双侧检验){或 0 1 2 1 1 2 H : , H : (单侧检验)},由抽 样 分 布 中 的定 理 知 : ) 1 ) , ~ ( , 1 ~ ( , 2 2 2 2 2 1 1 1 n Y N n X N , 又 X 与 Y 独 立 , 从而 有 ~ ( , ) 2 2 2 1 2 1 1 2 n n X Y N − − + 。当原假设 H0 成立时,统计量 ~ (0,1) 2 2 1 2 2 1 N n n X Y U + − = ,否则 U 有增大的趋势,故对给定的显著性水平 ,为使犯第 二类错误的概率最小,取拒绝域 { } W = u 1− / 2 。 例 3:书 P213 例 1 二、 T —检验(在 2 未知下,对 进行检验) 设总体服从正态分布,由前面我们知道:在方差已知的条件下,若对期望进行检验,可 用 U -检验,但如果方差未知,对期望进行检验,可用 T —检验。 1.单总体 T —检验: 设总体 ~ ( , ) 2 X N , 2 , 未知, ( , , ) X1 X2 Xn 为随机样本,要检验假设:
H0:H=,H1H≠(双侧检验){或:H≤山,H1:H>μo(单侧检验)} H:H≥{0,H1:≤o 现在总体方差σ2未知,U-检验不能使用,因为此时U=2-0中含未知参数2 它不是一个统计量,所以要选择别的统计量来进行检验。由点估计理论自然会想到用方差的 无偏估计S2=,∑(x,-x)2去代替总体方差2,从而构造出新的统计量7=又-p。 n-1 当原假设H成立时,由抽样分布定理知:T= √n~1(n-1),否则,它服从非中心t 分布,即四的观察值有偏大的趋势。若给定的显著性水平a,查1分布表可得t-mn2,使 P7>1-a2(m-1)}=a,从而得检验的拒绝域为W=州>-1-a2(n-1)} W={t-a2(n-1)} 同理,假设H0:μ≤出,H1:4>山,其检验的拒绝域为W={>t-a(n-1)} 假设H0:≥0,H1:H<闻,其检验的拒绝域为W={<-1-(n-1 例士:今有两台仪器,对九件样品测量光谱,观察结果如下 ①U(%)0.20,0.30,0.40,0.50,0.60,0.70,0.80,0.90,1.00 ②(%)0.10,0.21,0.52,0.32,0.78,0.59,0.68,0.77,0.89 取显著性水平α=001,问这两台仪器测量性能有无显著差异?(测量误差可看成是正 态的) 解:用X=U-V表示两台仪器测量的结果之差,则对X可看到9个结果: 0.10,0.09,-0.12,0.18,-0.18,0.11,0.12,0.13,0.11 可假定X~N(02)u,a2未知,由题意,要检验假设H。:H=0,H1:≠0 由于σ2未知,可用t一检验 此时,n=9,x=(010+…+…01)=006,S2=,∑(X-X)2 ∑x2-n21=01528-003241=001505 n 从而M=n(x-A)9(06-0 001505=14672,查t分位数表得
6 0 0 1 0 H : = , H : (双侧检验){或 0 0 1 0 0 0 1 0 : , : : , : H H H H (单侧检验)} 现在总体方差 2 未知, U -检验不能使用,因为此时 n X U − 0 = 中含未知参数 2 , 它不是一个统计量,所以要选择别的统计量来进行检验。由点估计理论自然会想到用方差的 无偏估计 = − − = n i Xi X n S 1 2 2 ( ) 1 1 去代替总体方差 2 ,从而构造出新的统计量 n S X T − 0 = 。 当原假设 H0 成立时,由抽样分布定理知: ~ ( 1) 0 − − = n t n S X T ,否则,它服从非中心 t − 分布,即 T 的观察值有偏大的趋势。若给定的显著性水平 ,查 t 分布表可得 1− / 2 t ,使 P{T t 1− / 2 (n −1)} = , 从 而 得 检 验 的 拒 绝 域 为 { ( 1)} W = t −t 1− / 2 n − , 即 { ( 1) ( 1)} W = t −t 1− / 2 n − 或t t 1− / 2 n − 。 同理,假设 0 0 1 0 H : , H : ,其检验的拒绝域为 { ( 1)} W = t t 1− n − 假设 0 0 1 0 H : , H : ,其检验的拒绝域为 { ( 1)} W = t −t 1− n − 例 4:今有两台仪器,对九件样品测量光谱,观察结果如下: ① U(%) 0.20,0.30,0.40,0.50,0.60,0.70,0.80,0.90,1.00 ② V (%) 0.10,0.21,0.52,0.32,0.78,0.59,0.68,0.77,0.89 取显著性水平 = 0.01 ,问这两台仪器测量性能有无显著差异?(测量误差可看成是正 态的) 解:用 X =U −V 表示两台仪器测量的结果之差,则对 X 可看到 9 个结果: 0.10,0.09,-0.12,0.18,-0.18,0.11,0.12,0.13,0.11 可假定 ~ ( , ) 2 X N 2 , 未知,由题意,要检验假设 H0 : = 0, H1 : 0 由于 2 未知,可用 t —检验: 此时,n=9, (0.10 0.11) 0.06 9 1 x = ++ = , = − − = n i Xi X n S 1 2 2 ( ) 1 1 = − = − = − = n i Xi nX n 1 2 2 [0.1528 0.0324] 0.01505 8 1 [ ] 1 1 从而 1.4672 0.01505 ( ) 9(0.06 0) 0 = − = − = S n X t ,查 t 分位数表得
-a2(n-1)=10(8)=3554,显然,H(单侧检验)} H0:1≥2;H1:p1-2 例6:(书P214例2) 在上面我们介绍了U一检验与【一检验,它们都是有关均值假设的显著性检验问题。现在 讨论有关方差假设的显著性检验问题。 先对单个正态总体而言 三、x2-检验(对单个总体G进行检验) 设(X1,X2,…Xn)取自正态总体X~N(a2)的子样,要求检验假设 H0:σ2=σ2;H1:σ2≠σ2(双侧检验) 。:a2≤a2;H1:0>00(单侧检验)} H 现在分别对未知和已知两种情形进行讨论:
7 t 1− / 2 (n −1) = t 1−0.005 (8) = 3.3554 ,显然, ( 1) t t 1− / 2 n − ,即该样本观察结果与 H0 没有显著性 差异,故在显著水平 = 0.01 下,不能认为这两台机器性能有显著性差异。 例 5:(书 P26 例 4) 2.两总体 T —检验: t—检验法还可以应用于比较两个带有未知方差,但方差相等的正态总体的均值是否相等 的问题。 设总体 ~ ( , ) , ~ ( , ) 2 2 2 X N 1 Y N ,其中 2 1 2 , , 未知, ( , , ) 1 2 n1 X X X ( , , ) 1 2 n2 Y Y Y 分别为从总体 X , Y 中抽取的简单样本,要求检验假设 0 1 2 1 1 2 H : = ; H : (双侧检验) {或 0 1 2 1 1 2 0 1 2 1 1 2 : ; : : ; : H H H H (单侧检验)} 当原假设 H0 成立时,根据抽样分布定理知: 统计量 ~ ( 2) ( 2) ( 1) ( 1) 1 2 1 2 1 2 1 2 2 2 2 2 1 1 + − + + − − + − − = t n n n n n n n n n S n S X Y T 其中 = = − − − = − = 1 2 1 2 2 2 2 1 2 1 2 1 ( ) 1 1 ( ) , 1 1 n i i n i i Y Y n X X S n S 否则, T 有增大的趋势,因而对给定的显著性水平 可取拒绝域 { } = 1− / 2 W t t 例 6:(书 P214 例 2) 在上面我们介绍了 U —检验与 t —检验,它们都是有关均值假设的显著性检验问题。现在 讨论有关方差假设的显著性检验问题。 先对单个正态总体而言: 三、 2 —检验(对单个总体 2 进行检验) 设 ( , , ) 1 2 n1 X X X 取自正态总体 ~ ( , ) 2 X N 的子样,要求检验假设 2 2 2 2 0 0 1 0 H H : ; : = (双侧检验) {或 2 0 2 1 2 0 2 0 2 0 2 1 2 0 2 0 : ; : : ; : H H H H (单侧检验)} 现在分别对 未知和 已知两种情形进行讨论:
未知 在第七章中已经看到:样本方差S2是2的最大似然估计,且ES2=2,D202, 它们都与均值μ无关。由此可见,当原假设H0成立时,S2较集中在σ2的周围波动,否则将 偏离σ。2。因此,样本方差是构造检验假设H。(σ2=∞。2)的合适的统计量,为了查表便利,将 它标准化得到x2 (n-1)S )2,由抽样分布知,在原假设H成立时统计量 X x2(n-1)。对给定的显著性水平a,为使犯第二类错误的概率近似达到最 小,取拒绝域W={x2X12(n-1)}。 2.u已知 设总体X~N(,a2),σ2未知,(X1,X2…X)为其一简单样本。在第七章中已经看到: a2的极大似然估计为G2=∑(X1-)2,当原假设H0成立时,由抽样分布知,统计量 x2(m)。对给定的显著性水平a,为使犯第二类错误的概率近似达到最 小,取拒绝域W={x2x1a2(m)}。 同理,对倡语H0:02≤O2;H1:,给定的显著性水平a下,它们检验的拒绝域 HI 分别为W={x2>x1-a(n)}和W={x2<z(n)} 例6:一自动车床加工零件的长度服从正态分布No2),原来加工精度σ2=0.18,经 过一段时间生产后,抽取这车床所加工的n=31个零件,测得数据如下所示: 长度x,10.110.310.611.211.51.812.0 频数n,1371063|1 问这一车床是否保持原来得加工精度。 解:由题意要检验假设H0:σ2=0.18;H1:a2≠0.18,此时我们只要考虑单侧的情形 由题中所给的数据计算得:x (x-x)2 445,对于给定的a=005,查自由度为 n-1=30的x2分布分位数表得临界值x093(30)=438,此时
8 2 1 2 − 2 2 1. 未知 在第七章中已经看到:样本方差 2 S 是 2 的最大似然估计,且 2 2 2 4 2 , 1 ES DS n = = − , 它们都与均值 无关。由此可见,当原假设 H0 成立时, 2 S 较集中在 2 0 的周围波动,否则将 偏离 2 0 。因此,样本方差是构造检验假设 2 2 0 0 H ( ) = 的合适的统计量,为了查表便利,将 它标准化得到 2 2 2 2 0 0 1 ( 1) ( ) n i i n S X X = − − = = ,由抽样分布知,在原假设 H0 成立时统计量 2 2 2 1 0 ( ) ~ ( 1) n i i X X n = − = − 。对给定的显著性水平 ,为使犯第二类错误的概率近似达到最 小,取拒绝域 2 2 / 2 1 / 2 W n n { ( 1) ( 1)} = − − − 或 。 2. 已知 设总体 ~ ( , ) 2 X N 0 , 2 未知, 1 2 ( , , ) X X X n 为其一简单样本。在第七章中已经看到: 2 的极大似然估计为 = = − n i Xi n 1 2 2 ( ) 1 ˆ ,当原假设 H0 成立时,由抽样分布知,统计量 = − = n i i n X 1 2 2 0 2 0 ( ) ~ ( ) 。对给定的显著性水平 ,为使犯第二类错误的概率近似达到最 小,取拒绝域 { ( ) ( )} 1 / 2 2 / 2 2 W = n 或 − n 。 同理,对假设 2 0 2 1 2 0 2 0 2 0 2 1 2 0 2 0 : ; : : ; : H H H H ,给定的显著性水平 下,它们检验的拒绝域 分别为 { ( )} 1 2 W = − n 和 { ( )} 2 W = n 例 6:一自动车床加工零件的长度服从正态分布 ( , ) 2 N ,原来加工精度 0.18 2 0 = ,经 过一段时间生产后,抽取这车床所加工的 n = 31 个零件,测得数据如下所示: 长度 i x 10.1 10.3 10.6 11.2 11.5 11.8 12.0 频数 i n 1 3 7 10 6 3 1 问这一车床是否保持原来得加工精度。 解:由题意要检验假设 : 0.18 ; : 0.18 2 1 2 H0 = H ,此时我们只要考虑单侧的情形, 由题中所给的数据计算得: = = − = 7 1 2 2 1 44.5 0.18 ( ) i i n x x ,对于给定的 = 0.05 ,查自由度为 n −1= 30 的 2 分布分位数表得临界值 (30) 43.8 2 0.95 = ,此时
>z02(30),因此拒绝原假设H0,这说明自动车床工作一段时间后精度变差。 对于单个正态总体有关方差检验的问题,我们可用x2一检验来解决,但如果要比较两个 正态总体的方差是否相等,我们就要用下面的F一检验 四、F一检验(对两个总体G2进行检验) 我们在用t一检验去检验两个总体的均值是否相等时,作了一个重要的假设就是这两个总 体方差是相等的,即σ12=σ2=σ2,否则我们就不能用t一检验。如果我们事先不知道方差 是否相等,就必须先进行方差是否相等的检验。 设(X12X2…Xn)是取自正态总体X~N(A41G12)的样本,(H1,F2,…n)是取自正态总体 y~N(22)的样本,并且(X2X2…Xn)与(F,H2…Yn)相互独立,考虑假设 H0:a1=a2;H1:1≠σ2 1.当总体的期望1,2均已知时 选取统计量F2=,其中2=1∑(x2-),52=1∑0x-),由抽样分布定 理知,在原假设H成立的条件下,F~F(m1n2),否则F的观测值彡。会有偏大或偏小的趋 势,从而对给定的显著性水平α,为使犯第二类错误的概率近似达到最小,取拒绝域 W={0F2(m1,n2) 2.当总体的期望p1,2均未知时 选取统计量F2=52,其中S:=1之 X;-H1 (X1-2)2 n2 若H成立,由抽样分布定理知F~F(n1-1,n2-1),则此时的拒绝域为 W={fF2(n1-1,n2-1)} 例6:(书P217例4) 【注】:估计理论与假设检验之间的关系: 从双侧检验的情形看:假设检验的接受域恰为参数估计的置信区间。 课后作业:1、认真阅读P1g1 2、作业:P251,4,8; 3、总复习
9 2 F 1 2 F− (30) 2 0.95 2 ,因此拒绝原假设 H0 ,这说明自动车床工作一段时间后精度变差。 对于单个正态总体有关方差检验的问题,我们可用 2 —检验来解决,但如果要比较两个 正态总体的方差是否相等,我们就要用下面的 F —检验。 四、 F —检验(对两个总体 2 进行检验) 我们在用 t —检验去检验两个总体的均值是否相等时,作了一个重要的假设就是这两个总 体方差是相等的,即 2 2 2 2 1 = = ,否则我们就不能用 t —检验。如果我们事先不知道方差 是否相等,就必须先进行方差是否相等的检验。 设 ( , , ) 1 2 n1 X X X 是取自正态总体 ~ ( , ) 2 X N 1 1 的样本, ( , , ) 1 2 n2 Y Y Y 是取自正态总体 ~ ( , ) 2 Y N 2 2 的样本,并且 ( , , ) 1 2 n1 X X X 与 ( , , ) 1 2 n2 Y Y Y 相互独立,考虑假设 2 2 2 1 1 2 2 2 0 1 H : = ; H : 1.当总体的期望 1 2 , 均已知时 选取统计量 2 2 2 1 0 S S F = ,其中 = = = − = − 1 2 1 2 2 2 2 2 1 2 1 1 2 1 ( ) 1 ( ) , 1 n i i n i i Y n X S n S ,由抽样分布定 理知,在原假设 H0 成立的条件下, ~ ( , ) F0 F n1 n2 ,否则 F0 的观测值 0 f 会有偏大或偏小的趋 势,从而对给定的显著性水平 ,为使犯第二类错误的概率近似达到最小,取拒绝域 { ( , ) ( , )} 0 / 2 1 2 0 F1 / 2 n1 n2 W f F n n f = 或 − 。 2.当总体的期望 1 2 , 均未知时 选取统计量 2 2 2 1 0 S S F = ,其中 = = − − − = − = 1 2 1 2 2 2 2 2 1 2 1 1 2 1 ( ) 1 1 ( ) , 1 1 n i i n i i X n X S n S , 若 H0 成立,由抽样分布定理知 ~ ( 1, 1) F F n1 − n2 − ,则此时的拒绝域为 { ( 1, 1) ( 1, 1)} W = f F / 2 n1 − n2 − 或f F1− / 2 n1 − n2 − 例 6:(书 P217 例 4) 【注】:估计理论与假设检验之间的关系: 从双侧检验的情形看:假设检验的接受域恰为参数估计的置信区间。 课后作业:1、认真阅读 P195-211; 2、作业:P225 1,4, 8; 3、总复习