§6.3参数的区间估计 定义67设总体X的分布函数为F(x;O),为未知参数,(x1X2,Xxn)是来 自总体X的样本。如果存在两个统计量6(X1,X2,xn)和62(x1X2,Xn),对 于给定的a(0<a<1),使得 (x1,x2,x,)≤0≤01(x1,x2xy=1-a(614) 则称区间,]为参数O的置信度为1-a的置信区间,称为置信下限,2称 为置信上限。本节仅讨论正态总体下参数的区间估计问题。 631数学期望的置信区间 1.已知方差σ2,求山的置信区间 设总体XN(xa2),a2已知,求总体均值的区间估计 设X1,2,,Xn是来自总体X的一个样本,自然用X对作点估计,因为x 故 N(0) o/n 由正态分布表(附表2)可知,对于给定的a,存在一个值un2,使得 u 其中2是标准正态分布a/2上侧分位数。于是 ≤l 即 sH≤X+la2n 故的置信度为1-a的置信区间为
§ 6.3 参数的区间估计 定义 6.7 设总体 X 的分布函数为 F(x;θ ),θ 为未知参数,( ) X X Xn , ,..., 1 2 是来 自总体 X 的样本。如果存在两个统计量 ( ) X X Xn , ,..., ˆθ 1 1 2 和 2 ˆθ ( ) X X Xn , ,..., 1 2 ,对 于给定的α( ) 0 <α < 1 ,使得 P{θ ˆ 1 ( ) X1 , X2 ,..., Xn ≤ θ ≤ θ ˆ 2 (X1 , X2 ,..., Xn )}= 1−α (6.14) 则称区间[ ] 1 2 ˆ , ˆθ θ 为参数θ 的置信度为1−α 的置信区间, 称为置信下限, 称 为置信上限。本节仅讨论正态总体下参数的区间估计问题。 1 ˆθ 2 ˆθ 6.3.1 数学期望的置信区间 1. 已知方差σ2 ,求µ 的置信区间 设总体 X~ ( ) 2 N µ,σ ,σ2 已知,求总体均值µ 的区间估计。 设 X1 , X 2 ,..., X n 是来自总体 X 的一个样本,自然用 X 对 µ 作点估计,因为 X ~ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ n N 2 , σ µ ,故 U n X def σ / − µ ~ N(0,1) 由正态分布表(附表 2)可知,对于给定的α ,存在一个值uα / 2 ,使得 P{ } U ≤ uα / 2 = 1−α 其中u2 /α 是标准正态分布α / 2 上侧分位数。于是 α σ µ α = − ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ≤ − 1 / u / 2 n X P 即 { } α σ µ σ − α / 2 ≤ ≤ + α / 2 = 1− n X u n P X u 故µ 的置信度为 1 −α 的置信区间为 1
X+ 若给定a=005,查正态分布表知u0a5=1.96,于是得的置信度度95%置信区 间为 这意味着总体均值μ以95%的概率落在该区间内,粗略地说,如果做100次抽样, 可有式(616)算出一百个区间,则有95个区间都包含着4。这样,在实际应 用中,做一次抽样算出的置信区间,我们就认为它包含了,即是4的区间估计 当然,也可能遇到算出的区间不含μ的偶然情形,但这种情况出现的可能性很小 (约为5%)此外由式(6.13)可知 这表明当方差已知时,用X作为μ的点估计,其绝对误差以95%的概率不超过 1.96σ/√n,由此便确定了点估计的估计精度和误差范围。 值得注意的是,在总体的分布未知,只要n充分大,仍可用 +la/2 作为总体均值的置信区间,这是因为,由中心 极限定理可知,无论X服从什么分布,当n充分大时,随机变量 X U 近似服从正态分布。至于n多大才算充分大,没有绝对标准,一般认为n不 应小于50,最好大于100 例6,21某车间生产的滚珠直径X服从正态分布N(4,006),现从某天生产的产品 中抽取6个,测得直径分别为(单位:mm) 14615.114.914,815.215.1 试求平均直径置信度95%的置信区间
⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + n X u n X u σ σ α / 2 α / 2 , (6.15) 若给定α = 0.05,查正态分布表知u0.025 = 1.96 ,于是得µ 的置信度度 95%置信区 间为 ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + n X n X σ σ 1.96 , 1.96 (6.16) 这意味着总体均值µ 以 95%的概率落在该区间内,粗略地说,如果做 100 次抽样, 可有式(6.16)算出一百个区间,则有 95 个区间都包含着µ 。这样,在实际应 用中,做一次抽样算出的置信区间,我们就认为它包含了µ ,即是µ 的区间估计。 当然,也可能遇到算出的区间不含µ 的偶然情形,但这种情况出现的可能性很小 (约为 5%)此外由式(6.13)可知 1.96 = 95% ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ − ≤ n P X σ µ 这表明当方差已知时,用 X 作为µ 的点估计,其绝对误差以 95%的概率不超过 1.96σ / n ,由此便确定了点估计的估计精度和误差范围。 值得注意的是,在总体的分布未知,只要 n 充分大,仍可用 ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + n X u n X u σ σ α / 2 α / 2 , 作为总体均值 µ 的置信区间,这是因为,由中心 极限定理可知,无论 X 服从什么分布,当n充分大时,随机变量 n X U σ / − µ = 近似服从正态分布。至于 多大才算充分大,没有绝对标准,一般认为 不 应小于 50,最好大于 100。 n n 例 6.21 某车间生产的滚珠直径 X 服从正态分布 N( , µ 0.06),现从某天生产的产品 中抽取 6 个,测得直径分别为(单位:mm) 14.6 15.1 14.9 14,8 15.2 15.1 试求平均直径置信度 95%的置信区间. 2
解:置信度1-a=0.95,a=0.05,un=l05196 又由样本值x=1495,n=6G=√05,由式(614)有 置信下限x-07=1495-196061475 置信上限x+n9=1495+、61515 06 √m 所以平均直径u的置信度为95%的置信区间为471515 若取a=001则可算出的置信度为99的置信区间为469152 2.未知方差a2,求M的置信区间 设总体x服从正态分布N(ua2),a2未知,求的区间估计。 设X1,X2,Xn是来自总体的样本,由于a2未知,若仍用上述U的分布求的 置信区间时,因置信上下限包含σ而无法计算。此时,自然想到用样本标准差S 来代替σ,再考虑到式(542),有 从而,对给定的置信区间1-a,存在ta2(n-1),使得 ≤n2(-1)=1-a 其中lan2(n-1)是自由度为n-1的t分布关于a/2的上侧分位数,它可由 附表3查得,于是有 X sS/√ ≤n2(n-) BX-ta2s≤X+t 故μ的置信度为1-a的置信区间为
解: 置信度 0.025 2 1 0.95, 0.05,u u 1.96, −α = = α α = 又由样本值 x n = = 14.95, 6,σ = 0.05, 由式(6.14)有 置信下限 2 0.06 14.95 1.96 14.75 6 x u n α σ − = − ≈ 置信上限 2 0.06 14.95 1.96 15.15 6 x u n α σ + = + ≈ . 所以平均直径µ 的置信度为 95%的置信区间为[14.75,15.15]. 若取α = 0.01,则可算出µ 的置信度为 99%的置信区间为[14.69,15.21]. 2. 未知方差σ2 ,求µ 的置信区间 设总体 X 服从正态分布 ( ) 2 N µ,σ ,σ2 未知,求µ 的区间估计。 设 X1 , X 2 ,..., X n 是来自总体的样本,由于σ2 未知,若仍用上述U 的分布求 µ 的 置信区间时,因置信上下限包含σ 而无法计算。此时,自然想到用样本标准差 来代替 ∗ Sn σ ,再考虑到式(5.42),有 T S n X def n / ∗ − µ ~ t(n −1) 从而,对给定的置信区间1−α ,存在 ( 1) tα / 2 n − ,使得 P{T ≤ tα / 2 ( ) n −1 }= 1−α 其中 t / 2 (n −1) α 是自由度为n −1 的t 分布关于α / 2 的上侧分位数,它可由 附表 3 查得,于是有 ( ) α µ α = − ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ≤ − − ∗ 1 1 / t / 2 n S n X P n 即 = ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ − ≤ ≤ + ∗ ∗ n S X t n S P X t n n α / 2 µ α / 2 1−α 故µ 的置信度为1−α 的置信区间为 3
X-ta2√n 例622某糖厂用自动包装机装糖设每包糖的重量服从正态分布N(,a2),某 日开工后测得9包糖的重量分别为(单位:kg) 99.398.7100.5101298.3997995102.1100.5 试求每包糖平均重量的的置信度为95%的置信区间 解:置信度1-a=095a=005,查附表3得t(n-1)=1025(8)=2306,由样本 值算得x=99978,S=147,故 置信下限x- =99978-2306 147 99.046 置信上限x+0=998+2306 9=100.91 所以的置信度为9%的置信区间为99046,10091 63,2正态总体方差的区间估计. 设总体XNa2),a2未知,x1,x2,xn,是来自总体x的样本,现 求总体方差2或标准差的区间估计。 考虑用S:估计σ2,由定理58知 (n-)S 于是,对于给定的置信度1-a,可选择c,d,使得P(e≤x2≤d)=1-a 但满足上式的c,d有很多对,究竟如何选取呢? 通常采用的方法是选取龙2(m-1和x2a2(n-1)(如图6所示),使 2 于是就有
⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + ∗ ∗ n S X t n S X t n n / 2 / 2 , α α (6.16) 例 6.22 某糖厂用自动包装机装糖,设每包糖的重量服从正态分布 2 N( , µ σ ) ,某 日开工后测得 9 包糖的重量分别为(单位: kg ) 99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5 试求每包糖平均重量µ 的的置信度为 95%的置信区间. 解: 置信度1− = α 0.95,α = 0.05,查附表 3 得 2 0.025 t n( 1) t (8) 2.306 α − = = ,由样本 值算得 2 * 99.978, 1.47, n x = = S 故 置信下限 * 2 1.47 99.978 2.306 99.046 9 S x t n − = α − = 置信上限 * 2 1.47 99.978 2.306 100.91 9 S x t n + = α + = . 所以µ 的置信度为 95%的置信区间为[99.046,100.91]. 6.3.2 正态总体方差的区间估计. 设总体 X ~ ( ) 2 N µ,σ , µ,σ2 未知, X1 , X 2 ,..., X n ,是来自总体 X 的样本,现 求总体方差σ2 或标准差σ 的区间估计。 考虑用 估计 ,由定理 5.8 知 2 ∗ Sn 2 σ 2 χ def ( ) 2 2 1 σ n n − Sn ~ ( 1) 2 χ n − 于是,对于给定的置信度1−α ,可选择c, d ,使得 ( ≤ χ ≤ ) = 1−α 2 P c d 但满足上式的c, d 有很多对,究竟如何选取呢? 通常采用的方法是选取 ( 1) 2 χα/ 2 n− 和 2 χ 1−α / 2 (n −1)(如图 6.1 所示),使 P { } ( ) 2 1 2 / 2 2 α χ > χ α n − = P { } ( ) 2 1 2 1 / 2 2 α χ < χ −α n − = 于是就有 4
P(2(-)sx2≤x2n2(-l)=1-a 故将式(6.18)代入上式,得 或P z2(-1)0=1 (6.20) 1-a 例623从自动机床加工的同类零件中抽取16件测得长度值分别为单位:cm) 12.1512.1212011208120912.1612.0612.13 120712.11120812011203120112031206 假设零件的长度服从正态分布N(A,a2),分别求零件长度方差a2和标准差的的 置信度为95%的置信区间 解:根据题意 n=16,a=0.95a=005,查附表4得x21(15)=27,x2n(15)=626,又 x=12.08,(n-1)Sn=0.037, 置信下限 (n-1)Sn0.037 0.0013 x2(n-1)275 置信上限 (n-1)S0.037 0.0059 x2a2(n-1)6.26 所以a2的置信度为95%的置信区间为[0001.0059,a的置信度为95%的置 信区间为[003607 633两个正态总体均值差的区间估计 设有两个总体x~N(12),Y~N(2,o3),x与Y相互独立且a2=但 未知。X1x2,X和1F2,分别是来自总体X和Y的样本,求两个总体的 均值差1-H2的区间估计。 由式(543)知 T def x-y)-(a4-2) Swv1/n,+l/n
P { ( ) 1 ( 1)} 2 1 / 2 2 2 χ α / 2 n − ≤ χ ≤ χ −α n − = 1−α (6.19) 故将式(6.18)代入上式,得 或 ( ) ( ) ( ) ( ) α χ σ χ α α = − ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ − − ≤ ≤ − − − 1 1 1 1 1 2 1 / 2 2 2 / 2 2 2 n n S n n S P n n n n (6.20) 例 6.23 从自动机床加工的同类零件中抽取 16 件,测得长度值分别为(单位: cm ): 12.15 12.12 12.01 12.08 12.09 12.16 12.06 12.13 12.07 12.11 12.08 12.01 12.03 12.01 12.03 12.06 假设零件的长度服从正态分布 2 N( , µ σ ) ,分别求零件长度方差 2 σ 和标准差σ 的的 置信度为 95%的置信区间. 解: 根据题意 n = = 16,α 0.95,α = 0.05,查附表 4 得 χ χ 0. 2 025 (15) = = 27.5, 0. 2 975 (15) 6.26,又 2 * 12.08,( 1) 0.037, n x n = − S = 置信下限 2 * 2 2 ( 1) 0.037 0.0013, ( 1) 27.5 n n S n χα − = ≈ − 置信上限 2 * 2 1 2 ( 1) 0.037 0.0059, ( 1) 6.26 n n S n χ −α − = ≈ − 所以 2 σ 的置信度为 95%的置信区间为[0.0013,0.0059], σ 的置信度为 95%的置 信区间为[0.036,0.077] . 6.3.3 两个正态总体均值差的区间估计 设有两个总体 X ~ ( ) 2 1 1 N µ ,σ ,Y ~ ( ) 2 2 2 N µ ,σ ,X 与Y 相互独立且 但 未知。 和 分别是来自总体 2 2 2 σ 1 = σ 1 , ,..., 1 2 n X X X 2 , ,..., Y1 Y2 Yn X 和Y 的样本,求两个总体的 均值差µ1 − µ 2 的区间估计。 由式(5.43)知 T ( ) ( ) 1 2 1 2 S 1/ n 1/ n X Y def W + − − µ − µ ~ ( 2) t n1 + n2 − 5
其中 1S+n2S2(n1-1)S2+(n2-1)S S v n,+n2-2 于是,对给定的置信度1-a,存在L12(n+n2-1),使得 {≤nm2(n+n2-1)=1-a P{(x-)-n(+n2-2 ≤A-2≤(x-)+ +n2-2,x2小 从而得1-H2的置信度为1-a的置信区间为 F)-tn2(x+n2-2)S x-y)+tn2(x+n2-2 例6.24机床厂某日从两台机床加工的零件中,分别抽取若干个样品,测得零件 尺寸分别如下(单位:cm) 第一台机器62576.5606358576.060586.0 第二台机器5659565758605.5575.5 假设两台机床加工的零件均服从均匀分布,且方差相等,试求两台机床加工的零件 平均尺寸之差的区间估计(a=0.05) 解:用X表示第一台机床加工的零件尺寸,:用Y表示第二台机床加工的零件尺 寸由题设n1=11n2=9,a=0055(18)=2.1009,经计算 x=60(n1-1S2=∑x-nx=064 y=5(2-1)S2=∑y2-ny=0.24 (n-1)S2+(n2-1 64+024 =0.2211 n+n2-2 11+9-2 置信下限x-y-(81+12=0912 Vn, n2 置信上限x-y+oa(8)Sw会=05088
其中 ( ) ( ) 2 1 1 2 1 2 1 1 2 2 1 2 2 2 2 2 1 1 2 2 + − − + − = + − + = ∗ ∗ n n n S n S n n n S n S Sw 于是,对给定的置信度1−α ,存在 ( 1) t α / 2 n1 + n2 − ,使得 P{ } T ≤ tα / 2 ( ) n1 + n2 −1 = 1−α 即 ( ) α ( ) µ µ ( ) α ( ) = −α ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ − − + − + ≤ − ≤ − + + − + 1 1 1 2 1 1 2 1 2 1 2 / 2 1 2 1 2 / 2 1 2 n n X Y t n n S n n P X Y t n n Sw w 从而得µ1 − µ 2 的置信度为1−α 的置信区间为 ( ) ( ) ( ) ( ) ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − − + − + − + + − + 1 2 / 2 1 2 1 2 / 2 1 2 1 1 , 2 1 1 2 n n X Y t n n S n n X Y tα n n Sw α w . 例 6.24 机床厂某日从两台机床加工的零件中,分别抽取若干个样品,测得零件 尺寸分别如下(单位:cm ): 第一台机器 6.2 5.7 6.5 6.0 6.3 5.8 5.7 6.0 6.0 5.8 6.0 第二台机器 5.6 5.9 5.6 5.7 5.8 6.0 5.5 5.7 5.5 假设两台机床加工的零件均服从均匀分布,且方差相等,试求两台机床加工的零件 平均尺寸之差的区间估计.(α = 0.05). 解:用X表示第一台机床加工的零件尺寸, :用Y表示第二台机床加工的零件尺 寸, 由题设 1 2 0.025 n n = = 11, 9,α = 0.05,t (18) = 2.1009,经计算: 1 1 2 *2 2 1 1 1 1 2 *2 2 2 2 2 1 *2 *2 1 1 2 2 1 2 6.0,( 1) 0.64 5.7,( 1) 0.24 ( 1) ( 1) 0.64 0.24 0.2211 2 11 9 2 n i i n i i W x n S x n x y n S y n y n S n S S n n = = = − = − = = − = − = − + − + = = + − + − ∑ ∑ = 置信下限 0.025 1 2 1 1 (18) 0.0912, W x y t S n n − − + = 置信上限 0.025 1 2 1 1 (18) 0.5088, W x y t S n n − + + = 6
故所求A1-2的置信度为95%的置信区间为00912,0.5088 634两个正态总体方差比的区间估计 设有两个正态总体X~M1,o1)和y~N(2a2),x与Y相互独立, H1,u2012,a2未知,X1,X2,Xn和H,H2,,n是分别来自总体X和Y的样本 现对两个总体的方差比2/a2作区间估计。 自然可用S和S2分别作为a2和a2的点估计。根据式(544)知 SioL-Fn2-l,n (621) S;"σ 于是,给定置信度1-a,选取c,d使得 P≤F≤d} 满足上式的cd有许多对,一般采用的方法是选取FaA2(n2-1,n1-1)和 F=n/2(m2-1n1-1),(如图62)所示使得 P )} 从而 P{a2(2-1n-1)≤F≤F2(2-1n1-l 将式(622)代入上式,得 故a2σ2的置信度为1-a的置信区间为 F-al(n (n2-1,n1-1) (6.22) 例6.25为了考察温度对某物体断裂强力的影响在70°C与80°C分别重复作了8 次试验测得断裂强力的数据如下(单位MPa)
故所求µ1 − µ2的置信度为 95%的置信区间为[0.0912,0.5088]. 6.3.4 两个正态总体方差比的区间估计 设有两个正态总体 X ~ ( ) 2 1 1 N µ ,σ 和 Y ~ ( ) 2 2 2 N µ ,σ , X 与 相互独立, 未知, 和 是分别来自总体 X 和 Y 的样本, 现对两个总体的方差比 作区间估计。 Y 2 2 2 1 2 1 µ ,µ ,σ ,σ X X X n , ,..., 1 2 Y Y Yn , ,..., 1 2 2 2 2 1 σ /σ 自然可用 和 分别作为 和 的点估计。根据式(5.44)知 2 1 ∗ S 2 2 ∗ S 2 σ 1 2 σ 2 F def 2 1 2 2 2 1 2 2 σ σ ∗ ∗ S S ~ ( 1, 1) F n2 − n1 − (6.21) 于是,给定置信度1−α ,选取c, d 使得 P{ } c ≤ F ≤ d = 1−α 满足上式的c, d 有许多对,一般采用的方法是选取 ( 1, 1) Fα / 2 n2 − n1 − 和 F1−α / 2 ( 1, 1 n2 − n1 − ),(如图 6.2)所示使得 { } ( ) 2 / 2 2 1, 1 1 α P F > F α n − n − = { } ( ) 2 1 / 2 2 1, 1 1 α P F < F −α n − n − = 从而 P{F1−α / 2 ( ) n2 −1,n1 −1 ≤ F ≤ Fα / 2 (n2 −1,n1 −1)}= 1−α 将式(6.22)代入上式,得 ( ) ( ) α σ σ α α = − ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ − − ≤ ≤ − − ∗ ∗ ∗ ∗ − 1, 1 1, 1 2 1 2 2 2 2 1 2 / 2 2 1 2 2 1 2 1 1 / 2 2 1 S S F n n S S P F n n 故σ 1 2 /σ 2 2 的置信度为1−α 的置信区间为 ( ) ( ) ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ − − − − ∗ ∗ ∗ ∗ − 2 2 2 2 2 1 / 2 2 1 2 1 1 / 2 2 1 1, 1 , 1, 1 S S F n n S S F n n α α (6.22) 例 6.25 为了考察温度对某物体断裂强力的影响,在 与 分别重复作了 8 次试验,测得断裂强力的数据如下(单位:MPa): 0 70 C 0 80 C 7
70°C:20.518819820.921.519.521021.2 80°C:17720.320.018.819020.120219.1 假定70C与80C的断裂强力分别用X和Y表示,且X~N(1,1),Y~N(2,2,) X与Y相互独立试求方差比a12/G2的置信度为95%的置信区间 解:由样本值计算得 n=8,x=20.4,S1=0.8857, n2=8,y=194,S2=0.8286, 由1-a=0.90,a=0.L,查附表5得F2(7,7)=3.79, Fs(77)=~1 0.2639, F05(7,7)3.79 将以上结果代入式F-A(nN(2-1-)3得到/的置 信度为95%的置信区间为025998851,30828哪02821.40512 0.8857 0.8286
0 70 C : 20.5 18.8 19.8 20.9 21.5 19.5 21.0 21.2 0 80 C : 17.7 20.3 20.0 18.8 19.0 20.1 20.2 19.1 假定700 C 与800 C 的断裂强力分别用X和Y表示,且 2 2 ~ ( 1 1 2 2, X N µ ,σ µ ),Y ~ N( ,σ ) , X 与 Y 相互独立.试求方差比 2 2 σ1 σ 2 的置信度为 95%的置信区间. 解:由样本值计算得 *2 1 1 *2 2 2 8, 20.4, 0.8857, 8, 19.4, 0.8286, n x S n y S = = = = = = 由1 0 − = α .90,α = 0.1, 查附表 5 得 0 05 F 。(,7 7)=3.79, 0.95 0.05 1 1 (7,7) 0.2639, (7,7) 3.79 F F = = = 将以上结果代入式 ( ) ( ) ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ − − − − ∗ ∗ ∗ ∗ − 2 2 2 2 2 1 / 2 2 1 2 1 1 / 2 2 1 1, 1 , 1, 1 S S F n n S S F α n n α 得到 2 2 σ1 σ 2 的置 信度为 95%的置信区间为 0.8857 0.8857 0.2639 ,3.79 0.8286 0.8286 ⎡ ⎤ × × ⎢ ⎥ ⎣ ⎦ ,即[0.2821,4.0512]. 8