第二讲区间估计、正态总体均值与方差的区间估计 I.授课题目(章节) §7.4区间估计 §7.5正态总体均值与方差的区间估计 Ⅱ.教学目的与要求 1.理解置信区间的基本概念: 2.掌握正态总体均值和方差的置信区间的求法. Ⅲ.教学重点与难点: 重点:置信区间的基本概念的理解 难点:正态总体均值和方差在给定置信水平条件下的置信区间的求法 V.讲授内容: §7.4区间估计 对于一个未知量,人们在测量或计算时,常不以得到近似值为满足,还需估计误 即要求知道近似值的精确程度(亦即所求真值所在的范围).类似地,对于未知参数θ, 除了求出它的点估计外,我们还希望估计出一个范围,并希望知道这个范围包含参 数O真值的可信程度,这样的范围通常以区间的形式给出,同时还给出此区间包含参 数日真值的可信程度.这种形式的估计称为区间估计,这样的区间即所谓置信区间。 置信区间设总体X的分布函数F(x,)含有 个未知参数0,0∈⊙(⊙是0 能取值的范围),对于给定值a(0<α<I),若由来自X的样本X,X2,.,X,确定 的两个统计量0=旦(X,X2,.,Xn)和0=0(X1,X2,X)(0<0),对于任意 0∈⊙满足 P{0(X,X2,.,Xn)<0<0(X,X2,.,Xn)}≥1-a, 则称随机区间(日,0)是0的置信水平为1-α的置信区间,Q和0分别称为置信水 平为1-α的双侧置信区间的置信下限和置信上限,1-α称为置信水平. 例1.设总体设X~N(4,o2),σ2为已知,4为未知,设X,X2,.,Xn是来 自X的样本,求4的置信水平为1-α的置信区间. 解 X是的无偏估计,且有 二N.买二兰所服从的分布 GI Gln N(0,1)不依赖于任何未知参数,按标准正态分布的上α分位点的定义,有 Pl-ul 2a12=1-a, 即 t万al-a. 这样,我们得到了“的一个置信水平为1-α的置信区间
第二讲区间估计、正态总体均值与方差的区间估计 Ⅰ.授课题目(章节) §7.4 区间估计 §7.5 正态总体均值与方差的区间估计 Ⅱ.教学目的与要求 1. 理解置信区间的基本概念; 2. 掌握正态总体均值和方差的置信区间的求法. Ⅲ.教学重点与难点: 重点:置信区间的基本概念的理解 难点:正态总体均值和方差在给定置信水平条件下的置信区间的求法 Ⅳ.讲授内容: §7.4 区间估计 对于一个未知量,人们在测量或计算时,常不以得到近似值为满足,还需估计误 差, 即要求知道近似值的精确程度(亦即所求真值所在的范围).类似地,对于未知参数 , 除了求出它的点估计 ˆ 外,我们还希望估计出一个范围,并希望知道这个范围包含参 数 真值的可信程度,这样的范围通常以区间的形式给出,同时还给出此区间包含参 数 真值的可信程度.这种形式的估计称为区间估计,这样的区间即所谓置信区间. 置信区间 设总体 X 的分布函数 F(x; ) 含有一个未知参数 ,, ( 是 可 能取值的范围),对于给定值 (0 1) ,若由来自 X 的样本 X1 , X Xn , , 2 确定 的两个统计量 = ( X1 , X Xn , , 2 )和 = ( X1 , X Xn , , 2 )( ),对于任意 满足 P { ( X1 , X Xn , , 2 ) ( X1 , X Xn , , 2 ) } 1− , 则称随机区间( , )是 的置信水平为 1− 的置信区间, 和 分别称为置信水 平为 1− 的双侧置信区间的置信下限和置信上限, 1− 称为置信水平. 例 1.设总体设 X ~ N ( , 2 ), 2 为已知, 为未知,设 X1 , X Xn , , 2 是来 自 X 的样本,求 的置信水平为 1− 的置信区间. 解 X 是 的无偏估计, 且有 n X / − ~ N (0,1). n X / − 所服从的分布 N (0 ,1)不依赖于任何未知参数,按标准正态分布的上 分位点的定义,有 − / 2 / z n X P =1− , 即 − / 2 + / 2 z n z X n P X =1− . 这样,我们得到了 的一个置信水平为 1− 的置信区间
x-G a, P+。 nal 这样的置信区间常写成 通过例1,可以看到寻求未知参数日的置信区间的具体做法如下 1.寻求一个样本X1,X2,.,X的函数: W=W(X,X2,.,X;0), 它包含待估参数0,而不含其它未知参数,并且W的分布已知且不依赖于任何未知 参数(当然不依赖于待估参数日): 2.对于给定的置信水平1-a,定出常数a,b,使 P{a<WX,X2,.,Xn0)<b} ≥1-a: 3.若能从a<W(X,X2,.,Xn;0)<b得到等价的不等式日<0<0,其中 日=日(X,X2,X),0=0(X,X2,.,X)都是统计量,那么(日,0)就是0的 一个置信水平为1-α的置信区间. §7.5正态总体均值与方差的区间估计 一、单个总体N(μ,σ2)的情况 设已经定置信水平为1-a,并设X,X2,Xn为总体N(4,。2)的样本X, S2分别是样本均值和样本方差。 1.均值4的置信区间 (a)o2为已知 此时由例1采用 X-上~N(O,1)的函数,已得到u的一个置信水平为1-Q Gln 的置信区间为 ±品 (b)σ2为未知. 因其中含未知参数σ,考虑到S2是σ2的无偏估计,由第六章定理三,知 X-4~tn-) S/√n 并且右边的分布(n一1)不依赖于任何未知参数.可得 P-tan(n-l)< -<m-ll-a, SIn
− / 2 + / 2 , z n z X n X . 这样的置信区间常写成 / 2 z n X . 通过例 1,可以看到寻求未知参数 的置信区间的具体做法如下. 1.寻求一个样本 X1 , X Xn , , 2 的函数: (X ,X , ,X ; ) W =W 1 2 n , 它包含待估参数 ,而不含其它未知参数,并且 W 的分布已知且不依赖于任何未知 参数(当然不依赖于待估参数 ); 2. 对 于 给 定 的 置 信 水 平 1− , 定 出 常 数 a,b , 使 P{a (X ,X , ,X ; ) W 1 2 n b} 1− ; 3.若能从 a (X ,X , ,X ; ) W 1 2 n b 得到等价的不等式 ,其中 = ( X1 , X Xn , , 2 ), = ( X1 , X Xn , , 2 )都是统计量,那么( , )就是 的 一个置信水平为 1− 的置信区间. §7.5 正态总体均值与方差的区间估计 一、单个总体 N ( , 2 )的情况 设已经定置信水平为 1− ,并设 X1 , X Xn , , 2 为总体 N ( , 2 )的样本. X , S 2 分别是样本均值和样本方差。 1. 均值 的置信区间 (a) 2 为已知. 此时由例 1 采用 n X / − ~ N (0,1)的函数,已得到 的一个置信水平为 1− 的置信区间为 / 2 z n X (b) 2 为未知. 因其中含未知参数 .考虑到 2 S 是 2 的无偏估计,由第六章定理三,知 S n X / − ~ t(n −1) 并且右边的分布 t(n −1) 不依赖于任何未知参数.可得 − − − − ( 1) / ( 1) / 2 t / 2 n S n X P t n =1−
即 -j1-a. PlX- 这样,我们得到了μ的一个置信水平为1-α的置信区间 (±a- 例1.有一大批糖果。现从中随机地取16袋,称得重量(以克计)如下 508499503504510497512 505493496506502509496 设袋装糖果的重近似地服从正态分布,试求总体均值4的置信水平为0.95的置信区 间. 解这里1-a=0.95,a/2=0.025,n-1=15,too2s(15)=2.1315,由给出的数 据 算得x=503.75,s=62022.由此总体均值μ的置信水平为0.95的置信区间为 503.75±6202×21315) √16 即 (500.4,507.1). 这就是说估计袋装糖果重量的均值在500.4克与507.1克之间,这个估计的可信 程度为95%.若以此区间内任一值作为“的近似值,其误差不大于 62022.1316×2 16 6.61(克),这个误差估计的可信程度为95% 2.方差σ2的置信区间 此处,根据实际问题的需要,只介绍4未知的情况。 。的无偏估计为S,由第6章S2定理二知1-1S ~x2(n-1),并且此式 右端的分布不依赖于任何未知参数,故有 P左a2m-)<m- -<zi(-D)=1-a (2n-<o2<-s2) p (n-1)s2 =1-a Zian2(n-1) 这就得到方差σ2的一个置信水平为1-:的置信区间 (n-1)S2 (n-10S2 gn-)'不enn-)
即 − ( −1) + ( −1) / 2 t / 2 n n S t n X n S P X =1− . 这样,我们得到了 的一个置信水平为 1− 的置信区间 ( −1) t / 2 n n S X . 例 1.有一大批糖果。现从中随机地取 16 袋,称得重量(以克计)如下: 508 499 503 504 510 497 512 505 493 496 506 502 509 496 设袋装糖果的重近似地服从正态分布,试求总体均值 的置信水平为 0.95 的置信区 间. 解 这里 1− =0.95, / 2 = 0.025, n −1=15,t 0.025 (15) = 2.1315,由给出的数 据 算得 x = 503.75, s = 6.2022 .由此总体均值 的置信水平为 0.95 的置信区间为 2.1315 16 6.2022 503.75 , 即 (500.4, 507.1). 这就是说估计袋装糖果重量的均值在 500.4 克与 507.1 克之间,这个估计的可信 程 度 为 95%. 若 以 此 区 间 内 任 一 值 作 为 的 近 似 值 , 其 误 差 不 大 于 16 6.2022 2.1315 2= 6.61(克),这个误差估计的可信程度为 95%. 2.方差 2 的置信区间 此处,根据实际问题的需要,只介绍 未知的情况。 2 的无偏估计为 S 2 ,由第 6 章§2 定理二知 2 2 ( 1) n − S ~ ( 1) 2 n − , 并且此式 右端的分布不依赖于任何未知参数,故有 P = − − − − − ( 1) 1 ( 1) ( 1) 2 2 2 2 2 1 / 2 n n S n 即 P = − − − − − − 1 ( 1) ( 1) ( 1) ( 1) 2 1 / 2 2 2 2 2 2 n n S n n S 这就得到方差 2 的一个置信水平为 1 − 的置信区间 − − − − − ( 1) ( 1) , ( 1) ( 1) 2 1 / 2 2 2 2 2 n n S n n S
同时,还容易得到标准差σ的一个置信水平为1一α的置信区间 n-1S √n-lS z(1)vi( 注意,在密度函数不对称时,如X分布和F分布,习惯上仍是取对称的分位点来确 定置信区间 例2求例1中总体标准差0的置信水平为0.95的置信区间. 解现在a/2-0.025,1-ax/2=0.975,n-1=15,查表得x62s(15)=27.488 X7s(15)=6.262,又s=6.2022,由此得所求的标准差σ的一个置信水平为0.95的置信 区间为(4.58,9.60). 二、两个总体N(4,σ),N(2,o)的情况 在实际中常遇到下面的问题,已知产品的某一质量指标服从正态分布,但由于原 料,设备条件,操作人呐不同,式工艺过程的改变等因素,引起总体均值,总体方差 有所改变,我们需要知道这些变化有多大,这就需要考虑两个正态总体均值差式方差 比的估计问题. 设已经定置信水平为1-a,并设X,X2,X,是来自第一总体的样本:Y, Y,.,Y是来自第二总体的样本,这两个样本相互独立.且设灭,了分别为第一、二 个总体的样本均值,S2,S分别是第一、二个总体的样本方差。 1.两个总体均值差41一4的置信区间 (a)o,o均为已知. 因X,了分别为4,2的无偏估计,故X-了是4,4的无偏估计.由X,了的 独 立性以及X~N(4,m),了~N(4,o1n)得 x-了~N(44,mn i+)
同时,还容易得到标准差 的一个置信水平为 1 − 的置信区间 ( ) ( ) − − − − − 1 1 , 1 1 2 1 / 2 2 2 n n S n n S . 注意,在密度函数不对称时,如 2 分布和 F 分布,习惯上仍是取对称的分位点来确 定置信区间. 例2 求例 1 中总体标准差 的置信水平为 0.95 的置信区间. 解 现在 /2=0.025,1 − / 2 = 0.975, n −1=15 ,查表得 (15) 27.488 2 0.025 = , (15) 6.262 2 0.975 = ,又 s=6.2022, 由此得所求的标准差 的一个置信水平为 0.95 的置信 区间为 (4.58,9.60). 二、两个总体 N ( 1 , 2 1 ), N ( 2 , 2 2 )的情况 在实际中常遇到下面的问题,已知产品的某一质量指标服从正态分布,但由于原 料,设备条件,操作人呐不同,式工艺过程的改变等因素,引起总体均值,总体方差 有所改变,我们需要知道这些变化有多大,这就需要考虑两个正态总体均值差式方差 比的估计问题. 设已经定置信水平为 1− ,并设 X1 , 1 , , X2 Xn 是来自第一总体的样本; Y1 , 2 , , Y2 Yn 是来自第二总体的样本,这两个样本相互独立.且设 X ,Y 分别为第一、二 个总体的样本均值, 2 1 S , 2 2 S 分别是第一、二个总体的样本方差. 1. 两个总体均值差 1 - 2 的置信区间 (a) 2 1 , 2 2 均为已知. 因 X , Y 分别为 1 , 2 的无偏估计,故 X -Y 是 1 - 2 的无偏估计.由 X ,Y 的 独 立性以及 X ~ N ( 1 , 1 2 1 / n ),Y ~ N ( 2 , 2 2 2 / n )得 X -Y ~ N ( 1 - 2 , 1 2 1 n + 2 2 2 n )
或 (区-)-4=)N0,) o2σ n n2 即得4,~4,的一个定置信水平为1-α的置信区间 x-了aymn)】 (b)σ2=o3=σ2,但σ2为为未知. 由第六章§2定理四 区-)-4,=4)一m+m,-2) 从而可得4,2的一个定置信水平为1-α的置信区间 (灭-了士inm+n-25.m+】 L+1 其中32=a-s+2s,3-、 %+n2-2 例3.为了比较I,Ⅱ两种型号步枪子弹的枪口速度,随机地取I型子弹10发,得到 枪口速度的平均值为x=500(m/s),标准差s,=1.10(m/s),随机地取Ⅱ型子弹20 发,得到枪口速度的平均值为x2=496(m/s),标准差52=1.20(/s),假设两总体都 可认为近似地服从正态分布.且由生产过程可认为方差相等。求两总体均值差凸~凸, 的一个置信水平为0.95的置信区间。 解按实际情况,可认为分别来自两个总体的样本是相互独立的。又因由假设两总 体的方差相等,但数值未知,故可用上面情况(b)的结果来求均值差的置信区间.由于 1-a=0.95,a/2=0.025,m=10,h,=20,%+n-2=28,a2s(28)-2.0484, s号=(9×1.102+19×1.202)/28,5,=5=1.1688,故所求的两总体均值差
或 2 2 2 1 2 1 1 2 ( ) ( ) n n X Y + − − − ~ N (0,1) 即得 1 - 2 的一个定置信水平为 1− 的置信区间 − + 2 2 2 1 2 1 / 2 n n X Y z . (b) 2 1 = 2 2 = 2 ,但 2 为为未知. 由第六章§2 定理四 1 2 1 2 1 1 ( ) ( ) n n S X Y + − − − ~ ( 2) t n1 + n2 − 从而可得 1 - 2 的一个定置信水平为 1− 的置信区间 − + − + 1 2 / 2 1 2 1 1 ( 2) n n X Y t n n S . 其中 2 ( 1) ( 1) 1 2 2 2 2 2 2 1 1 + − − + − = n n n S n S S , S = 2 S . 例3. 为了比较Ⅰ,Ⅱ两种型号步枪子弹的枪口速度,随机地取Ⅰ型子弹10 发,得到 枪口速度的平均值为 x1 = 500 (m/s),标准差 s1 =1.10 ( m/s), 随机地取Ⅱ型子弹 20 发,得到枪口速度的平均值为 x2 = 496 (m/s),标准差 s2 =1.20 ( m/s),假设两总体都 可认为近似地服从正态分布.且由生产过程可认为方差相等。求两总体均值差 1 - 2 的一个置信水平为 0.95 的置信区间. 解 按实际情况,可认为分别来自两个总体的样本是相互独立的。又因由假设两总 体的方差相等,但数值未知,故可用上面情况(b)的结果来求均值差的置信区间.由于 1- = 0.95, / 2 = 0.025 , n1 =10 , n2 = 20 , n1 + n2 − 2 = 28 , 0.025 t (28)=2.0484, (9 2 s = ×1.10 2 +19×1.20 2 )/28, s = 2 s =1.1688, 故所求的两总体均值差
4一42的一个置信水平为0.95的置信区间是 x-属±5x1m28620 1.1 =(4±0.93), 即 (3.07,4.93) 2.两个总体方差比σ2/σ的置信区间 仅讨论总体均值4,42为未知的情况,由第六章§2定理四 s1S经一Fm-lnm-), aila 并且分布F(n,-1,n2-1)不依赖于任何未知参数,故有 PF-or(1)IS o21o3 <Fa2(n1-1,n2-l)}=1-d 即 1 1 S Fan(m -1ng-1)S F-m(m -1.m-1) =1-a 这就得到方差σ2的一个置信水平为1-α的置信区间 S 1S2 1 S2Fa2(n-1,n2-l)'SF-a12(m1-1,n2-l) 例4.假设人体身高服从正态分布,今抽测甲、乙两地区18岁~25岁女青年身高得 数据如下:甲地区抽取10名,样本均值1.64米,样本标准差0.2米,乙地区抽取10名,样 本均值1.62米.样本标准差0.4米.求: (1)两正态总体方差比的99%的置信区间: (2)两正态总体均值差的99%的置信区间. 解:)因为F=So2 F-L儿-)则的9%的置信区间为 S22/o22 S 1 1 S2 Far (n -1.n-1)'S:F-ar2 (m-1.n-1)) 查表得Fm-L-)=R(99)=654S-02_1 5220.44故的99%的置得 021
1 − 2 的一个置信水平为 0.95 的置信区间是 (4 0.93), 20 1 10 1 (28) 1 2 0.025 = x −x s t + 即 (3.07, 4.93). 2. 两个总体方差比 2 1 / 2 2 的置信区间 仅讨论总体均值 1 , 2 为未知的情况,由第六章§2 定理四 2 2 2 1 2 2 2 1 / / S S ~ ( 1, 1) F n1 − n2 − , 并且分布 ( 1, 1) F n1 − n2 − 不依赖于任何未知参数,故有 P = − − − − ( −1, −1) 1 / / ( 1, 1) 2 / 2 1 2 2 2 1 2 2 2 1 1 / 2 1 2 F n n S S F n n . 即 P = − − − − − − 1 ( 1, 1) 1 ( 1, 1) 1 1 / 2 1 2 2 2 2 1 2 2 2 1 / 2 1 2 2 2 2 1 S F n n S S F n n S . 这就得到方差 2 的一个置信水平为 1 − 的置信区间 − − − ( −1, −1) 1 , ( 1, 1) 1 1 / 2 1 2 2 2 2 1 / 2 1 2 2 2 2 1 S F n n S S F n n S . 例 4.假设人体身高服从正态分布, 今抽测甲、乙两地区 18 岁 ~ 25 岁女青年身高得 数据如下: 甲地区抽取 10 名, 样本均值 1.64 米, 样本标准差 0.2 米; 乙地区抽取 10 名, 样 本均值 1.62 米, 样本标准差 0.4 米. 求: (1) 两正态总体方差比的 99%的置信区间; (2)两正态总体均值差的 99%的置信区间. 解: (1) 因为 2 2 2 2 2 1 2 1 S S F = ~ ( 1, 1) F n1 − n2 − , 则 2 2 2 1 的 99% 的置信区间为: − − − ( −1, −1) 1 , ( 1, 1) 1 1 / 2 1 2 2 2 2 1 / 2 1 2 2 2 2 1 S F n n S S F n n S . 查表得 ( 1, 1) (9,9) 6.54, 1 2 0.005 2 F n − n − = F = 2 2 2 1 S S = 4 1 (0.4) (0.2) 2 2 = , 故 2 2 2 1 的 99%的置信
区间为 S21S21 =0.03822.635265) S:Fan (m -1.n-1)'S:F-an2 (m -1.n2-1) ②因为-“-2a+-2.其中3.2=a-sS 11 n1+n2-2 Seyn n 故41-4,的99%的置信区间为: (x-7士aam+*n-25-元+元 11 经计算可得 32=a-s2+m-S.9x02+9x0-01 m1+n2-2 18 查表得12(n1+n2-2)=1oos(18)=2.878,于是所求的41-42的99%的置信区间为: -1a%-s{@2x后 即 (-0.3877,0.42707 V.小结与提问: 小结:首先要理解置信区间的基本概念,其次要掌握不同情况下正态总体均值和方 差在给定置信水平条件下的置信区间的求法 提问. 思考题1:寻求未知参数日的置信区间的具体步骤有哪几步? 思考题2:不同情况下正态总体均值和方差在给定置信水平为1-:条件下的置 信区间分别是怎样? I.课外作业: 乃31014,15 118,20
区间为 − − − ( −1, −1) 1 , ( 1, 1) 1 1 / 2 1 2 2 2 2 1 / 2 1 2 2 2 2 1 S F n n S S F n n S =(0.038 22 .635265) (2) 因为 1 2 1 2 1 1 ( ) ( ) n n S X Y + − − − ~ ( 2) t n1 + n2 − , 其中 2 ( 1) ( 1) 1 2 2 2 2 2 2 1 1 + − − + − = n n n S n S S . 故 u1 − u2 的 99%的置信区间为: − + − + 1 2 / 2 1 2 1 1 ( 2) n n X Y t n n S , 经计算可得 2 ( 1) ( 1) 1 2 2 2 2 2 2 1 1 + − − + − = n n n S n S S = 0.1 18 9 (0.2) 9 (0.4) 2 2 = + , 查表得 ( 1 2 2) 0.005 (18) 2.878 2 t n + n − = t = ,于是所求的 u1 − u2 的 99%的置信区间为: − + − + 1 2 / 2 1 2 1 1 ( 2) n n X Y t n n S = + 10 1 10 1 0.02 2.878 0.1 , 即 (−0.3877, 0.42707). Ⅴ. 小结与提问: 小结:首先要理解置信区间的基本概念,其次要掌握不同情况下正态总体均值和方 差在给定置信水平条件下的置信区间的求法 提问: 思考题 1:寻求未知参数 的置信区间的具体步骤有哪几步? 思考题 2:不同情况下正态总体均值和方差在给定置信水平为 1− 条件下的置 信区间分别是怎样? Ⅵ.课外作业: P210 14, 15 P211 18, 20