Lec7:区间估计(一):置信区间 张伟平 2011年3月28日 区间估计的基本概念 一、参数的区间估计问题 使用点估计(X)估计9()的缺点是:单从所给出的估计值上,无法看出它的精度有多大.当 然你可以定义某种指标,如估计的均方误差之类去刻画它的精度,但也还是间接的.更直接的方 法是指出了一个误差限d(X),而把估计写成(X)士d(X)的形式.这实际上就是一种区间估计, 即估计g()的取值在(X)-d(X),(X)+d(X)】之内.将其一般化,给出区间估计的下列定义 定义1设有一个参数分布族多={f(x,),0∈日},g()是定义在参数空间日的一个已 知函数,X=(X1,·,Xn)是从分布族中某总体f(x,)中抽取的样本,令g1(X)和2(X)为定 义在样本空间2上,取值在日上的两个统计量,且g1(X)≤2(X),则称随机区间[1(X),2(X)】 为g(g)的一个区间估计(nterval estimation). 根据这个定义,从形式上看,任何一个满足条件1≤2的统计量1,2都可构成g()的一 个区间估计[©1,2].既然一个未知参数的区间估计有很多种,如何从中挑选一个好的区间估计 呢?这就涉及到评价一个区间估计优劣的标准问题.评价一个区间估计优劣的标准有两个要素: 可靠性与精确度(也称精度).可靠性是指待估参数g()被包含在[©1,2]内的可能性有多大.可能 性越大,可靠性越高.精确度可由随机区间的平均长度来度量.长度越短,精确度越高 不言而喻,我们希望所作的区间估计既有高的可靠性,又有高的精确度.但这二者往往是彼 此矛盾的,不可能同时都很高.当样本大小固定时,若精确度提高了,可靠性就降低了:反之,若 可靠度提高了,则精确度就降低了. 如何构造尽可能高的可靠性和高精确度的区间估计呢?通常采用的方法是在保证一定可靠 度的前提下选择精确度尽可能高的区间估计.这就是著名统计学家Neyman提出的一种妥协方 案 当然,如果在应用中人们要求可靠性和精度都很高,则必须加大样本容量,也就是说要多做 一些试验,才可能实现 二、置信区间 为书写简单计,本节以下假定被估计的g()就是9自身,这与一般情况没有原则区别
Lec7: ´mO(ò): ò&´m ‹ï² 2011 c 3 28 F 1 ´mOƒVg ò!ÎÍ´mOØK ¶^:Ogˆ(X)Og(θ)":¥: ¸l§â—Oä˛, Ã{w—ß°›kıå. ,\å±½¬,´çI, XO˛êÿÉaèxß°›, èÑ¥m. çÜê {¥ç— òáÿÅd(X), rO§gˆ(X) ± d(X)/™. ˘¢S˛“¥ò´´mO, =Og(θ) ä3[ˆg(X) − d(X), gˆ(X) + d(X)] ÉS. ÚŸòÑz, â—´mOe½¬. ½¬1 kòáÎÍ©ŸxF = {f(x, θ), θ ∈ Θ}, g(θ) ¥½¬3ÎÍòmΘ òáÆ ºÍ, X = (X1, · · · , Xn) ¥l©Ÿx•,oNf(x, θ) •ƒ, -gˆ1(X) ⁄gˆ2(X) è½ ¬3òmX ˛, ä3Θ ˛¸á⁄O˛, Ögˆ1(X) ≤ gˆ2(X), K°ëÅ´m[ˆg1(X), gˆ2(X)] èg(θ) òá´mO(Interval estimation). ä‚˘á½¬, l/™˛w, ?¤òá˜v^ágˆ1 ≤ gˆ2 ⁄O˛gˆ1, gˆ2 —å§g(θ) ò á´mO[ˆg1, gˆ2]. Q,òáôÎÍ´mOkÈı´, X¤l•]¿òá–´mO Q? ˘“9µdòá´mO`IOØK. µdòá´mO`IOk¸ááÉ: åÇ5Ü°(›(è°°›). åÇ5¥çñÎÍg(θ) ù¹3[ˆg1, gˆ2] SåU5kıå. åU 5å, åÇ5p. °(›ådëÅ´m²˛›5›˛. ›·, °(›p. ÿÛ í, ·ÇF"§ä´mOQkpåÇ5, qkp°(›. ˘ˆ ¥* dgÒ, ÿåU”û—Èp. å½û, e°(›Jp , åÇ5“¸$ ; áÉ, e åÇ›Jp , K°(›“¸$ . X¤E¶åUpåÇ5⁄p°(›´mOQ? œ~Ê^ê{¥3yò½åÇ ›cJe¿J°(›¶åUp´mO. ˘“¥Õ¶⁄OÆ[Neyman J—ò´˛ê Y. ,, XJ3A^•<Çá¶åÇ5⁄°›—Èp, K7L\åN˛, è“¥`áıâ ò £, ‚åU¢y. !ò&´m è÷{¸O, !±eb½Og(θ) “¥θ g, ˘ÜòÑú¹vkK´O.
1.置信度 设X为样本,[©1(X),2(X)】是9的一个区间估计.由于9是未知的,且样本是随机的,我们 不能保证在任何情况下(即对任何具体的样本值),区间[©1,2]必定包含9,而只能以一定的概率 保证它.希望随机区间1,2]包含0的概率P(01≤9≤02)越大越好.这个概率就是我们前面 所说的可靠性,数理统计学上称这个概率为置信度.一般说来,这个概率与0有关,假如一个区间 估计对某个81∈日其置信度大,而对另一个2∈日其置信度小,那么这种区间估计的适应性要 差一些,不能认为是一个好的区间估计.若对参数空间日中的任一9,其置信度都很大,则此种区 间估计就是一种好的区间估计.因此有如下定义 定义2设随机区间©1,2]为参数0的一个区间估计,则称置信度在参数空间日上的下确 界 inf Po(a1≤e≤2) 0∈e 为该区间估计的置信系数(Confidence coef伍cient) 显然,一个区间估计的置信度越大越好.为了计算置信度和置信系数,需要利用统计量的精 确分布或渐近分布.可见抽样分布在评价和构造区间估计中发挥重要作用. 2.精确度 精确度的概念我们在前面已说过.精确度的标准不止一个.这里介绍其中最常见的一个标 准,即随机区间©1,2]的平均长度E(2-9).平均长度越短,精确度越高,这也是符合实际的 一项要求.为说明精确度和置信度及其关系,请看下例, 例1设样本X=(X1,·,Xn)来自正态总体N(4,σ2),其中-00.4 和σ2的估计量分别是样本均值了和样本方差S2=点∑1(化:-X)2,我们用[区-kS引V元,X+ kS/√可作为总体均值μ的区间估计.考虑其置信度和精确度. 解上述区间估计的置信度为 P.(r-kS/V元≤4≤X+kS/Vm=P.(目V(R-)/Sl≤k) =P(IT≤k): 其中T=√元(了-)/S~tn-1,其分布与4无关,因而区间估计的置信系数为P(T|≤k).显然k 越大,区间的置信系数越大,区间就越可靠 由于(n-1)S2/o2~X品-1,所以区间的平均长度为 lk=2kE(s)/V元= 2v2ko I(n/2) Vn(n-1)(n-1)/2) 显然,k越大,区间也越长,也就越不精确」 由此例可以看到,在样本容量给定后,为了提高置信度,需要增加k值,从而放大了区间, 降低了精确度.反过来,为了提高精确度,需要减小k值,从而缩短了区间,降低了置信度.置信 度与精确度互相制约着.如前所述,面对这一矛盾,著名统计学家Neyman建议采取如下方案:在 保证置信系数达到指定要求的前提下,尽可能提高精确度.这一建议导致引入如下置信区间的概 念,由于是Neyman建议的,通常也称置信区间为Neyman置信区间, 2
1. ò&› X è, [ˆθ1(X), ˆθ2(X)] ¥θ òá´mO. duθ ¥ô, Ö¥ëÅ, ·Ç ÿUy3?¤ú¹e(=È?¤‰Nä), ´m[ ˆθ1, ˆθ2] 7½ù¹θ , êU±ò½V« yß. F"ëÅ´m[ ˆθ1, ˆθ2] ù¹θ V«Pθ( ˆθ1 ≤ θ ≤ ˆθ2) å–. ˘áV«“¥·Çc° §`åÇ5, Ín⁄OÆ˛°˘áV«èò&›. òÑ`5, ˘áV«Üθ k', bXòá´m OÈ,áθ1 ∈ Θ Ÿò&›å, È,òáθ2 ∈ Θ Ÿò&›, @o˘´´mO·A5á ò , ÿU@è¥òá–´mO. eÈÎÍòmΘ •?òθ, Ÿò&›—Èå, Kd´´ mO“¥ò´–´mO. œdkXe½¬. ½¬2 ëÅ´m[ ˆθ1, ˆθ2] èÎÍθ òá´mO, K°ò&›3ÎÍòmΘ ˛e( . inf θ∈Θ Pθ ˆθ1 ≤ θ ≤ ˆθ2 èT´mOò&XÍ(Confidence coefficient) w,, òá´mOò&›å–. è Oéò&›⁄ò&XÍ, Iá|^⁄O˛° (©Ÿ½ÏC©Ÿ. åу©Ÿ3µd⁄E´mO•uûáä^. 2. °(› °(›Vg·Ç3c°Æ`L. °(›IOÿéòá. ˘p0Ÿ•Å~ÑòáI O, =ëÅ´m[ ˆθ1, ˆθ2] ²˛›Eθ( ˆθ2 − ˆθ1). ²˛›·, °(›p, ˘è¥Œ‹¢S òëá¶. è`²°(›⁄ò&›9Ÿ'X, ûwe~. ~1 X = (X1, · · · , Xn) 5goNN(µ, σ2 ), Ÿ•−∞ 0. µ ⁄σ 2 O˛©O¥˛äX¯ ⁄êS 2 = 1 n−1 Pn i=1(Xi−X¯) 2 , ·Ç^[X¯−kS/√ n, X¯+ kS/√ n] äèoN˛äµ ´mO. ƒŸò&›⁄°(›. ) ˛„´mOò&›è Pµ X¯ − kS/√ n ≤ µ ≤ X¯ + kS/√ n = Pµ √ n(X¯ − µ)/S ≤ k = P(|T| ≤ k), Ÿ•T = √ n(X¯ − µ)/S ∼ tn−1, Ÿ©ŸÜµ Ã', œ ´mOò&XÍèP(|T| ≤ k). w,k å, ´mò&XÍå, ´m“åÇ. du(n − 1)S 2/σ2 ∼ χ 2 n−1 , §±´m²˛›è lk = 2kE(s)/ √ n = 2 √ 2kσ Γ(n/2) p n(n − 1) Γ((n − 1)/2) . w,,k å,´mè,è“ÿ°(. dd~å±w, 3N˛n â½, è Jpò&›, IáO\k ä, l òå ´m, ¸$ °(›. áL5, è Jp°(›, Iá~k ä, l †· ´m, ¸$ ò&›. ò& ›Ü°(›pÉõX. Xc§„, °È˘ògÒ, Õ¶⁄OÆ[Neyman ÔÆÊXeêY: 3 yò&XÍàç½á¶cJe, ¶åUJp°(›. ˘òÔÆó⁄\Xeò&´mV g,du¥Neyman ÔÆ, œ~è°ò&´mèNeyman ò&´m. 2
定义3设01(X),02(X)】是参数0的一个区间估计,若对给定的0u(X)} 是互不相容的,“三个事件之并”为“必然事件”.再考虑到 P(0u(X)=1-P(0≤(X)≤a2, 因此有 P(a(X)≤6≤iu(X)=1-P(giu(X)) 3
½¬3 [ ˆθ1(X), ˆθ2(X)] ¥ÎÍθ òá´mO, eÈâ½0 ˆθU (X) o ¥pÿÉN, /náØáÉø0è/7,Øá0. 2ƒ Pθ θ ˆθU (X) = 1 − Pθ θ ≤ ˆθU (X) ≤ α2, œdk Pθ ˆθL(X) ≤ θ ≤ ˆθU (X) = 1 − Pθ θ ˆθU (X) 3
≥1-(a1+a2) 引理得证, 四、置信域 以上讨论的置信区间和置信上、下限都是假定参数0是一维的,可以将其推广到参数9是k 维(k≥2)的情形,就得如下定义的置信域, 定义5设有一个参数分布族多={f(x,),0∈日},日是参数空间.其中0=(01,·,0x)∈ 日CRk,k≥2.X=(X1,·,Xn)是来自分布族中某总体f(z,)的样本.若S(X)满足 (①)对任一样本X,S(X)是日的一个子集: ()对给定的0<a<1,P(0∈S(X)≥1-a,一切0∈9: 则称S(X)是9的置信水平为1-a的置信域(Confidence region)或置信集,而Pa(9∈S(X) 称为置信系数。 在多维场合,置信域S(X)的形状可以是各种各样的,但实用上只限于一些规则的几何图形 如其各面与坐标平面平行的长方体、球、椭球等.特别当置信集是长方体(其面与坐标平面平 行),则称其为联合置信区间 五、构造区间估计的方法 目前应用最广泛的区间估计的形式是Neyman的置信区间.本章第二节和第三节将介绍这 一方法,这一方法的关键是基于点估计去构造枢轴变量,因此也称为枢轴变量法.另外一种构 造区间估计的重要方法是利用假设检验构造置信区间,它与枢轴变量法同属于一个理论体系, 即Neyman的关于置信区间和假设检验的理论.利用假设检验构造置信区间的方法将在下一章 有专门的一节介绍. 本章的最后两节将介绍区间估计的其它两种方法,即Fser的信仰推断方法和容忍区间和 容忍限。 用Bayes方法求区间估计的内容将放在本书的最后一章介绍. 2 枢轴变量法一正态总体参数的置信区间 一、引言 这个方法的基本要点,就是在参数的点估计基础上,去找它的置信区间.由于点估计是由样 本决定的,是最有可能接近真参数之值.因此,围绕点估计值的区间,包含真参数值的可能性也 就要大一些.请看下面的例子,是如何构造置信区间的, 例1设X=(X1,·,X)是从总体N(4,σ)中抽取的简单随机样本,此处σ2已知,求4 的置信系数为1-α的置信区间和置信上、下限. 4
≥ 1 − (α1 + α2). ⁄ny. o!ò&ç ±˛?ÿò&´m⁄ò&˛!eÅ—¥b½ÎÍθ ¥òë, å±ÚŸÌ2ÎÍθ ¥k ë(k ≥ 2) ú/, “Xe½¬ò&ç. ½¬5 kòáÎÍ©ŸxF = {f(x, θ), θ ∈ Θ}, Θ¥ÎÍòm. Ÿ•θ = (θ1, · · · , θk) ∈ Θ ⊂ Rk, k ≥ 2. X = (X1, · · · , Xn) ¥5g©Ÿx•,oNf(x, θ) . eS(X) ˜v (i) È?òX, S(X) ¥Θ òáf8; (ii)Èâ½0 < α < 1, Pθ θ ∈ S(X) ≥ 1 − α, òÉθ ∈ Θ; K°S(X) ¥θ ò&Y²è1 − α ò&ç(Confidence region) ½ò&8, inf θ∈Θ Pθ θ ∈ S(X) °èò&XÍ. 3ıë|‹, ò&çS(X) /Gå±¥à´à, ¢^˛êÅuò 5KA¤„/, XŸà°ÜãI²°²1êN!•!˝•. AOò&8¥êN(Ÿ°ÜãI²°² 1) , K°ŸèÈ‹ò&´m. !E´mOê{ 8cA^Å2ç´mO/™¥Neyman ò&´m. Ÿ1!⁄1n!Ú0˘ òê{, ˘òê{'Ö¥ƒu:OEÕ¶C˛, œdè°èÕ¶C˛{. , ò´ E´mOáê{¥|^buEò&´m, ßÜÕ¶C˛{”·uòánÿNX, =Neyman 'uò&´m⁄bunÿ. |^buEò&´mê{Ú3eòŸ k;Äò!0. ŸÅ¸!Ú0´mOŸß¸´ê{, =Fisher &̉ê{⁄N=´m⁄ N=Å. ^Bayes ê{¶´mOSNÚò3÷ÅòŸ0. 2 Õ¶C˛{—oNÎÍò&´m ò!⁄Û ˘áê{ƒá:, “¥3ÎÍ:Oƒ:˛, Èßò&´m. du:O¥d ˚½, ¥ÅkåUC˝ÎÍθÉä. œd, å7:Oä´m, ù¹˝ÎÍäåU5è “áåò . ûwe°~f, ¥X¤Eò&´m. ~1 X = (X1, · · · , Xn) ¥loNN(µ, σ2 ) •ƒ{¸ëÅ, d?σ 2 Æ, ¶µ ò&XÍè1 − α ò&´m⁄ò&˛!eÅ. 4
解显然,μ的一个良好的点估计是X=员∑1X,其分布为X~N(山,2/m,将其标准 化得 U=-四N0,1, 其分布与μ无关.由于正态分布的对称性,可得 V(X-四 =1-a 此处u。/2为标准正态分布的上侧a/2分位数.经不等式等价变形,可知 Pu(8-uon<<+on)=1-a. 因此[下-4a2,X+4a/2]为μ的置信系数1-a的置信区间. 由本例可知构造置信区间的步骤如下: 1.找待估参数4的一个良好点估计.此例中这个点估计是T(X)=. 2.构造一个T(X)和μ的函数(T,),使其满足: ()其表达式与待估参数μ有关: ()其分布与待估参数μ无关, 则称随机变量p(T,)为枢轴变量.本例中这一变量即为U=√(下-)/o,它的表达式与μ有 关,但其分布N(0,1)与μ无关.因此U为枢轴变量. 3.对给定的0<a<1,决定两个常数a和b,使得 Pu(a≤p(T,m)≤b)=1-a. 解括号中的不等式得到虹(X)≤4≤u(X),则有 P.(iu(X)≤μ≤w(X)=1-a. 这表明[2z(X),u(X)】]是μ的置信水平为1-a的置信区间. 例4.21中的μ的置信区间[下-ou2/V元,X+au2/V同就是通过上述三个步骤获得的. 其中最关键的步骤是第二步,即构造枢轴变量(T,),这个变量一定和μ的一个良好的点估计有 关这种构造置信区间的方法称为枢轴变量法. 二、单个正态总体参数的置信区间 正态分布N(4,σ)是常用的分布.寻求它的两个参数μ和σ2的置信区间是实际中常遇到的 的问题,下面将分几种情况分别加以讨论.这里总假设X=(X1,·,X)是从正态总体N(山,o) 抽取的简单随机样本.记 m1 =1 即灭和S2分别为样本均值和样本方差
) w,, µ òá˚–:O¥X¯ = 1 n Pn i=1 Xi , Ÿ©ŸèX¯ ∼ N(µ, σ2/n), ÚŸIO z U = √ n(X¯ − µ) σ ∼ N(0, 1), Ÿ©ŸÜµ Ã'. du©ŸÈ°5, å Pµ √ n(X¯ − µ) σ ≤ uα/2 = 1 − α, d?uα/2 èIO©Ÿ˛˝α/2 ©†Í. ²ÿ™dC/, å Pµ X¯ − σ √ n uα/2 < µ < X¯ + σ √ n uα/2 = 1 − α. œd X¯ − √σ n uα/2, X¯ + √σ n uα/2 èµ ò&XÍ1 − α ò&´m. d~åEò&´m⁄½Xe: 1. ÈñÎ͵ òá˚–:O. d~•˘á:O¥T(X) = X¯. 2. EòáT(X) ⁄µ ºÍϕ(T, µ), ¶Ÿ˜v: (i) ŸLà™ÜñÎ͵ k'; (ii) Ÿ©ŸÜñÎ͵ Ã'. K°ëÅC˛ϕ(T, µ) èÕ¶C˛. ~•˘òC˛=èU = √ n(X¯ − µ)/σ, ßLà™Üµ k ', Ÿ©ŸN(0, 1) ܵ Ã'. œdU èÕ¶C˛. 3. Èâ½0 < α < 1, ˚½¸á~Ía ⁄b, ¶ Pµ (a ≤ ϕ(T, µ) ≤ b) = 1 − α. ))“•ÿ™µˆL(X) ≤ µ ≤ µˆU (X) , Kk Pµ (ˆµL(X) ≤ µ ≤ µˆU (X)) = 1 − α. ˘L² µˆL(X), µˆU (X) ¥µ ò&Y²è1 − α ò&´m. ~4.2.1•µ ò&´m X¯ − σuα/2/ √ n, X¯ + σuα/2/ √ n “¥œL˛„ná⁄½º. Ÿ•Å'Ö⁄½¥1⁄, =EÕ¶C˛ϕ(T, µ), ˘áC˛ò½⁄µ òá˚–:Ok '.˘´Eò&´mê{°èÕ¶C˛{. !¸áoNÎÍò&´m ©ŸN(µ, σ2 ) ¥~^©Ÿ. œ¶ß¸áÎ͵ ⁄σ 2 ò&´m¥¢S•~ë ØK, e°Ú©A´ú¹©O\±?ÿ. ˘pobX = (X1, · · · , Xn) ¥loNN(µ, σ2 ) ƒ{¸ëÅ. P X¯ = 1 n Xn i=1 Xi , S2 = 1 n − 1 Xn i=1 (Xi − X¯) 2 , =X¯ ⁄S 2 ©Oè˛ä⁄ê. 5
1.σ2已知,求4的置信区间 这就是例4.2.1讨论过的问题.4的置信系数为1-a的置信区间为 [-/e+小 (2.1) 区间的长度为ln=2oua/2/√元.由此可以看出 (1)样本容量越大,该区间越短,精确度就越高 (2)σ越大,则越大,精确度越低.这是因为方差越大,随机影响也就越大,精确度就会低 下来 (3)置信系数1-a越大,则α越小,从而ua2就越大,ln越长,精确度就越低 由此可见在o和α固定的情形下,要提高精确度,只有增加样本容量.例如,置信系数1-a 固定,要使上述置信区间的长度,≤lo,l0为给定的常数,则n≥[(2au2/lo)],其中[国表示实 数x的整数部分. 例2设某车间生产零件的长度X~N(4,0.09),若得到一组样本观察值为 12.6,13.4,12.8,13.2 求零件平均长度μ的95%的置信区间. 解由样本观察值算得=13,n=4,0=0.3,查表求得0.025=1.96,ua/2/V冗= 0.3×1.96/2=0.294,由公式(2.1)可知μ的95%的置信区间 2-元2,+元a2=2.71,13.29 2.σ2未知,求4的置信区间 在这种情况下,4的良好的点估计仍为灭,基于灭构造枢轴变量 T=r-四 S 由推论2.4.2可知T~tn-1.可见T的表达式与μ有关,而其分布与μ无关.故T为枢轴变量.由 于t分布关于原点对称,令 P.IT≤c)=P -csvn-se) 1-a 则c=tn-1(a/2).将括号中的不等式经过等价变形得4的置信系数为1一a的置信区间为 [--am,+-a例 2.2) 此处tn-1(a/2)是自由度n-1的t分布的上侧a/2分位数. 例3为测得某种溶液中的甲醛浓度,取样得4个独立测定值的平均值X=8.34%,样本标 准差S=0.03%,并设被测总体近似服从正态分布,求总体均值4的95%的置信区间. 6
1. σ 2 Æ, ¶µ ò&´m ˘“¥~4.2.1?ÿLØK. µ ò&XÍè1 − αò&´mè h X¯ − σ √ n uα/2, X¯ + σ √ n uα/2 i . (2.1) ´m›èln = 2σuα/2 / √ n. ddå±w— (1)N˛n å,T´m·,°(›“p. (2) σ å, Kln å, °(›$. ˘¥œèêå, ëÅKèè“å, °(›“¨$ e5. (3)ò&XÍ1 − α å, Kα ,l uα/2 “å,ln ,°(›“$. ddåÑ3σ ⁄α ½ú/e, áJp°(›, êkO\N˛. ~X, ò&XÍ1 − α ½, ᶲ„ò&´m›ln ≤ l0, l0 èâ½~Í, Kn ≥ 2σuα/2/l0 2 , Ÿ•[x] L´¢ Íx Í‹©. ~2 ,êm)"á›X ∼ N(µ, 0.09), eò|* äè 12.6, 13.4, 12.8, 13.2 ¶"á²˛›µ 95%ò&´m. ) d* äéX¯ = 13, n = 4, σ = 0.3 , L¶u0.025 = 1.96, σuα/2 / √ n = 0.3 × 1.96/2 = 0.294, d˙™(2.1)åµ 95%ò&´m h x¯ − σ √ n uα/2, x¯ + σ √ n uα/2 i = [12.71, 13.29]. 2. σ 2 ô, ¶µ ò&´m 3˘´ú¹e, µ ˚–:OEèX, ¯ ƒuX¯ EÕ¶C˛ T = √ n(X¯ − µ) S . dÌÿ2.4.2åT ∼ tn−1. åÑT Là™Üµ k', Ÿ©ŸÜµ Ã'. T èÕ¶C˛. d ut ©Ÿ'u:È°, - Pµ(|T| ≤ c) = P − c ≤ √ n(X¯ − µ) S ≤ c = 1 − α, Kc = tn−1(α/2). Ú)“•ÿ™²LdC/µ ò&XÍè1 − α ò&´mè X¯ − S √ n tn−1(α/2), X¯ + S √ n tn−1(α/2) , (2.2) d?tn−1(α/2) ¥gd›n − 1 t ©Ÿ˛˝α/2 ©†Í. ~3 èˇ,´Mó•`fl›, 4á’·ˇ½ä²˛äX¯ = 8.34%, I OS = 0.03% , øˇoNCq—l©Ÿ, ¶oN˛äµ 95%ò&´m. 6
解因为1-a=0.95,n=4,查表得tn-1(a/2)=t3(0.025)=3.182,故有Stn-1(a/2)/V元= 0.03×3.182/2=0.0477,X=8.34,由公式(2.2)可知μ得置信系数为95%的置信区间为 [-号-a+-o [8.292%,8.388% 3.μ4已知,求σ2的置信区间 当μ已知时,σ2的一个良好的无偏估计为S号=是∑1(X:-)2,且nS2/o2~X品.则 取T=nS/a2为枢轴变量,其表达式与o2有关,但其分布与o2无关,找c1和c2使得 P-(c1≤ns号/o2≤2=1-a. 满足上式要求的c1和c2有无穷多对,其中有一对c1和c2,使区间的长度最短,但这样一对c1和c2 不易求得,且表达式复杂,应用不方便.一般令c1和c2满足下列要求 P-(ns/o2c2)=a/2. 由X2分布的上侧分位数表可知c1=X品(1-a/2),c2=X品(a/2),即有 P-(x21-a/2)≤ns号/a2≤x2(a/2)=1-a. 最后利用不等式的等价变形,得到σ2的置信系数为1-α的置信区间为 nST nS2 「∑1(X-42(X:-21 x2(a/2'x2(1-a/②]= X2(a/2) X2(1-a/2)]1 (2.3) 此处X品(a/2)和X品(1-a/2)分别是自由度为n的x2分布的上侧a/2和1-a/2分位数。 例4为了解一台测量长度的仪器的精度,对一根长30mm的标准金属棒进行了6次测量, 结果(单位:mm)是 30.1,29.9,29.8,30.3,30.2,29.6 假如测量值服从正态分布N(30,σ2),要求σ2的置信水平为0.95的置信区间. 解此处n=6,4=30,易得出∑=1(X:-)2=0.35,a=0.05,查表得x(0.025)= 14.4494X(0.975)=1.2375,由公式(2.3)可算得 2=∑(X:-m2/X2(a/2)=0.35/14.494=0.0242, 2=∑(X:-42/X21-a/2)=0.35/1.2375=0.2828. 因此σ2的置信水平为95%的置信区间为[2,2]=[0.0242,0.2828] 4.4未知,求σ2得置信区间 记9=(山,o2).此时S2=品∑=1(化:-)2是σ2的良好估计,它是无偏的.且由定 理2.23可知(n-1)S2/o2~X2-1·取T=(n-1)S2/a2为枢轴变量,其表达式与2有关,而其 分布与σ2无关.找d1和d2,使得 P(d≤(n-1)S2/o2≤d)=1-a 7
) œè1−α = 0.95, n = 4,Ltn−1(α/2) = t3(0.025) = 3.182, kStn−1(α/2)/ √ n = 0.03 × 3.182/2 = 0.0477, X¯ = 8.34, d˙™(2.2)åµ ò&XÍè95%ò&´mè X¯ − S √ n tn−1(α/2), X¯ + S √ n tn−1(α/2) = [8.292%, 8.388%]. 3. µ Æ, ¶σ 2 ò&´m µ Æû, σ 2 òá˚–ÆOèS 2 n = 1 n Pn i=1(Xi − µ) 2 , ÖnS2/σ2 ∼ χ 2 n . K T = nS2 n/σ2 èÕ¶C˛, ŸLà™Üσ 2 k', Ÿ©ŸÜσ 2 Ã', Èc1 ⁄c2 ¶ Pσ2 c1 ≤ nS2 n σ 2 ≤ c2 = 1 − α. ˜v˛™á¶c1 ⁄c2 kðıÈ, Ÿ•kòÈc1⁄c2 , ¶´m›Å·, ˘òÈc1 ⁄c2 ÿ¥¶, ÖLà™E,, A^ÿêB. òÑ-c1 ⁄c2 ˜veᶠPσ2 nS2 n σ 2 c2 = α/2. dχ 2©Ÿ˛˝©†ÍLåc1 = χ 2 n (1 − α/2), c2 = χ 2 n (α/2), =k Pσ2 χ 2 n (1 − α/2) ≤ nS2 n σ 2 ≤ χ 2 n (α/2) = 1 − α. Å|^ÿ™dC/, σ 2 ò&XÍè1 − α ò&´mè nS2 n χ2 n α/2 , nS2 n χ2 n 1 − α/2 = Pn i=1(Xi − µ) 2 χ2 n (α/2) , Pn i=1(Xi − µ) 2 χ2 n (1 − α/2) , (2.3) d?χ 2 n (α/2) ⁄χ 2 n (1 − α/2) ©O¥gd›èn χ 2©Ÿ˛˝α/2 ⁄1 − α/2 ©†Í. ~4 è )òˇ˛›§Ï°›, Èòä30 mm IO7·ï?1 6gˇ˛, (J(¸†:mm)¥ 30.1, 29.9, 29.8, 30.3, 30.2, 29.6 bXˇ˛ä—l©ŸN(30, σ2 ), á¶σ 2 ò&Y²è0.95ò&´m. ) d?n = 6, µ = 30,¥— P6 i=1(Xi − µ) 2 = 0.35, α = 0.05, Lχ 2 6 (0.025) = 14.4494, χ2 6 (0.975) = 1.2375, d˙™(2.3)åé σb 2 L = Xn i=1 (Xi − µ) 2 . χ 2 n (α/2) = 0.35/14.4494 = 0.0242, σb 2 U = Xn i=1 (Xi − µ) 2 . χ 2 n (1 − α/2) = 0.35/1.2375 = 0.2828. œdσ 2 ò&Y²è95%ò&´mè σb 2 L , σb 2 U = [0.0242, 0.2828]. 4. µ ô, ¶σ 2 ò&´m Pθ = (µ, σ2 ). dûS 2 = 1 n−1 Pn i=1(Xi − X¯) 2 ¥σ 2 ˚–O, ߥÆ. Öd½ n2.2.3å(n − 1)S 2/σ2 ∼ χ 2 n−1 . T = (n − 1)S 2/σ2 èÕ¶C˛, ŸLà™Üσ 2 k', Ÿ ©ŸÜσ 2 Ã'. Èd1 ⁄d2, ¶ Pθ d1 ≤ (n − 1)S 2 σ 2 ≤ d2 = 1 − α. 7
类似于3中确定c1和c2的理由和方法,取d=X品-1(1-a/2),d2=X况-1(a/2),故有 P(Xa-11-a/2)≤(m-1)S2/a2≤x元-1(a/2)=1-a 最后再利用不等式的等价变形,得出σ2的置信系数为1-α的置信区间为 ]- (2.4) 若把这个随机区间的两个端点开平方,得到σ的置信系数为1-α的置信区间如下: [(x-/-aa)(x-xr/k--a)] 例5求例3中总体方差σ2及σ的置信系数为95%的置信区间. 解如同例3,n-1=3,a/2=0.025,1-a=0.975.查表求得X3(0.025)=9.348,X(0.975)= 0.216,S2=0.0009,由公式(2.4)可知σ2的置信系数为95%的置信区间为 [(m-1)S2/X元(a/2),(m-1)S2/X元(1-a/2)]=[0.00029,0.0125], σ的置信系数为95%的置信区间为 [(a-1sk2-a2),(a-1s/2--a/2) =[0.017,0.112] 5.二维参数0=(,o2)的置信水平为1-α的置信域 在正态分布情况下,下和S2分别为4和σ2的无偏估计,且为充分统计量,它们之间还相互 独立.取枢轴变量为 √元(-4)/a~N(0,1): (n-1)S2/o2~x2-1 对给定的置信水平1-α,可以通过标准正态分布和自由度为n-1的x2分布找出三个数:c,d山1 和d2,使得 P(v(-l/o≤c=-a, P(d≤(n-1)S2/a2≤d2)=V1-a 令V-a=1-%,则取c=u/2,d=X品-1(1-y/2),d山=X品-1/2).由于了和S2独立,有 -s是器ss ≤21-7②)=1-a 所以9=(4,σ2)的置信水平为1-a的置信域为 {-rsag器ss阿} (n-1)S21 8
aqu3•(½c1 ⁄c2 nd⁄ê{, d1 = χ 2 n−1 (1 − α/2), d2 = χ 2 n−1 (α/2), k Pθ χ 2 n−1 (1 − α/2) ≤ (n − 1)S 2 σ 2 ≤ χ 2 n−1 (α/2) = 1 − α. Å2|^ÿ™dC/, —σ 2 ò&XÍè1 − α ò&´mè (n − 1)S 2 χ2 n (α/2) , (n − 1)S 2 χ2 n (1 − α/2) = Pn i=1(Xi − X¯) 2 χ 2 n−1 (α/2) , Pn i=1(Xi − X¯) 2 χ 2 n−1 (1 − α/2) . (2.4) er˘áëÅ´m¸á‡:m²êßσò&XÍè1 − α ò&´mXeµ Xn i=1 (Xi − X¯) 2 . χ 2 n−1 (α/2)1/2 , Xn i=1 (Xi − X¯) 2 . χ 2 n−1 (1 − α/2)1/2 . ~5 ¶~3•oNêσ 29σò&XÍè95%ò&´m. ) X”~3, n−1 = 3, α/2 = 0.025, 1−α = 0.975.L¶χ 2 3 (0.025) = 9.348, χ2 3 (0.975) = 0.216, S2 = 0.0009,d˙™(2.4)åσ 2ò&XÍè95%ò&´mè (n − 1)S 2 χ 2 n (α/2), (n − 1)S 2 χ 2 n (1 − α/2) = [0.00029, 0.0125], σ ò&XÍè95% ò&´mè (n − 1)S 2 χ 2 n−1 (α/2)1/2 , (n − 1)S 2 χ 2 n−1 (1 − α/2)1/2 = [0.017, 0.112]. 5. ëÎÍθ = (µ, σ2 ) ò&Y²è1 − αò&ç 3©Ÿú¹e, X¯ ⁄S 2 ©Oèµ ⁄σ 2 ÆO, Öèø©⁄O˛, ßÇÉmÑÉp ’·. Õ¶C˛è √ n(X¯ − µ)/σ ∼ N(0, 1), (n − 1)S 2 /σ2 ∼ χ 2 n−1 . Èâ½ò&Y²1 − α, 屜LIO©Ÿ⁄gd›èn − 1 χ 2 ©ŸÈ—náÍ: c, d1 ⁄d2, ¶ Pθ | √ n(X¯ − µ)| σ ≤ c = √ 1 − α, Pθ d1 ≤ (n − 1)S 2 σ 2 ≤ d2 = √ 1 − α. - √ 1 − α = 1 − γ, Kc = uγ/2, d1 = χ 2 n−1 (1 − γ/2), d2 = χ 2 n−1 (γ/2). duX¯ ⁄S 2 ’·, k P (X¯ − µ) 2 ≤ σ 2u 2 γ/2 n, (n − 1)S 2 χ 2 n−1 (γ/2) ≤ σ 2 ≤ (n − 1)S 2 χ 2 n−1 (1 − γ/2) = 1 − α. §±θ = (µ, σ2 ) ò&Y²è1 − α ò&çè (µ, σ2 ) : (X¯ − µ) 2 ≤ σ 2u 2 γ/2 n, (n − 1)S 2 χ 2 n−1 (γ/2) ≤ σ 2 ≤ (n − 1)S 2 χ 2 n−1 (1 − γ/2) . 8
三、两个正态总体参数的置信区间 设X1,·,Xm是自正态总体N(a,o)抽取的简单随机样本,Yi,·,Yn是自正态总 体N(6,σ)抽取的简单随机样本,且合样本独立.设,Y和S保,S子分别为这两组样本的样 本均值和样本方差,其中S=m二一∑严1(X:-)2,S号=马∑1(Y-了)2.下面分两种情况 讨论两个正态总体均值差和方差比的置信区间问题. 1.均值差b-a的置信区间 分下列几种情况: (1)当m=n时,令Z=Y-X,i=1,2,…,n,且记立=b-a,2=o+,则有 Zi心N(立,),i=1,2,…,n. 这就转化为单个正态总体当2未知,求其均值立的置信区间问题.显见Z=卫一了是立的一个 良好的无偏估计,枢轴变量 T2=(Z-)/Sz心tn-1: 此处S=马∑1(Z:-2)2,T2的表达式与立=b-a有关,但其分布与产无关,因此取Tz为 枢轴变量.由前面已讨论过的情形的结果,可知立=b-a的置信系数为1-α的置信区间为 2-装-am,2+号是-1a2创 (2.5) (2)当a子和σ号已知时,我们知道Y-为b-a的一个良好的无偏估计,枢轴变量 Tu= 卫-x-(b-a) N(0,1), Vai/m+az/n 故有 ..voi 1亚--(b-a) =1-a. 再用不等式的等价变形得到b-a的置信系数为1-α的置信区间为 [--a/2√o/m+a/m,了-x+ua2yai/m+a/m (2.6) (3)当σ1=号=σ2未知时,令 1 S2= m+n-2 (m-1)S子+(m-1)s号 m+-22x-P+-] 显然7-是b-a的无偏估计,由推论2.4.3可知枢轴变量 卫-x-(b-a mn S. ~tn+m-2; Vm+n 9
n!¸áoNÎÍò&´m X1, · · · , Xm ¥goNN(a, σ2 1 ) ƒ{¸ëÅ, Y1, · · · , Yn ¥go NN(b, σ2 2 ) ƒ{¸ëÅ, Ö‹’·. X, ¯ Y¯ ⁄S 2 X, S2 Y ©Oè˘¸| ˛ä⁄ê, Ÿ•S 2 1 = 1 m−1 Pm i=1(Xi − X¯) 2 , S2 2 = 1 n−1 Pn i=1(Yi − Y¯ ) 2 . e°©¸´ú¹ ?ÿ¸áoN˛ä⁄ê'ò&´mØK. 1. ˛äb − a ò&´m ©eA´ú¹: (1) m = n û, -Zi = Yi − Xi , i = 1, 2, · · · , n, ÖPµ˜ = b − a, σ˜ 2 = σ 2 1 + σ 2 2 , Kk Zi ∼ N(˜µ, σ˜ 2 ), i = 1, 2, · · · , n. ˘“=zè¸áoNσ˜ 2 ô, ¶Ÿ˛äµ˜ ò&´mØK. wÑZ¯ = Y¯ − X¯ ¥µ˜ òá ˚–ÆO, Õ¶C˛ TZ = √ n(Z¯ − µ˜) SZ ∼ tn−1, d?S 2 Z = 1 n−1 Pn i=1(Zi − Z¯) 2 , TZ Là™Üµ˜ = b − a k', Ÿ©ŸÜµ˜ Ã', œdTZè Õ¶C˛. dc°Æ?ÿLú/(J, 嵘 = b − a ò&XÍè1 − α ò&´mè Z¯ − √ SZ n tn−1(α/2),Z¯ + √ SZ n tn−1(α/2) . (2.5) (2) σ 2 1 ⁄σ 2 2 Æû, ·ÇY¯ − X¯ èb − a òá˚–ÆO, Õ¶C˛ TU = Y¯ − X¯ − (b − a) p σ 2 1 /m + σ 2 2 /n ∼ N(0, 1), k Pa,b Y¯ − X¯ − (b − a) p σ 2 1 /m + σ 2 2 /n ≤ uα/2 = 1 − α. 2^ÿ™dC/b − a ò&XÍè1 − α ò&´mè h Y¯ − X¯ − uα/2 q σ 2 1 /m + σ 2 2 /n, Y¯ − X¯ + uα/2 q σ 2 1 /m + σ 2 2 /n i . (2.6) (3) σ 2 1 = σ 2 2 = σ 2 ôû, - S 2 ω = 1 m + n − 2 (m − 1)S 2 1 + (n − 1)S 2 2 = 1 m + n − 2 Xm i=1 (Xi − X¯) 2 + Xn i=1 (Yi − Y¯ ) 2 , w,Y¯ − X¯ ¥b − a ÆO, dÌÿ2.4.3åÕ¶C˛ T = Y¯ − X¯ − (b − a) Sω r mn m + n ∼ tn+m−2, 9
它的表达式与b-a有关,但其分布与b-a无关,取T为枢轴变量.故有 P 卫-x-(b-a) mn S. ≤tm+n-2(a/2)) =1-a m+n 由不等式的等价变形,可得b-a的置信系数为1-a的置信区间为 [P--nn-()V+-+nn-()+月 (2.7) 其中tm+n-2(a/2)为自由度m+n-2的t分布的上侧a/2分位数。 (4)当σ/o子=入,入已知时,基于b-a的无偏估计乎-京的枢轴变量及其分布为 T- mn(m+n-2)--(b-a) m入+n VQi+Q2/X tn+m-2, 此处Q=(m-1)S=∑m1(X:-)2,Q号=(m-1)S号=∑”1(Y-)2.故有 mn(m+n-2) 卫--(b-a) m入+n ≤tm+n-2(a/2)=1-a. VQ+Q3/X 由不等式的等价变形,得到b-a的置信系数1-α的置信区间为 7-元-tm+n-2(a/2)1 m入+n mn(m+n-2) VQ:+Q3/X, 卫-+tm+n-2(a/2)1 m入+n mn(m+n-2) VQi+Q3/X (5)当o子≠o且皆未知时,要求b-a的置信区间问题.这是著名的Behrens--Fisher问题 它是Behrens在1929年从实际应用提出的问题,它的几种特殊情况如上所述,已获圆满解决,但 一般情况至今还有文献在讨论.Fisher首先研究了这个问题,并对一般情况给出近似解法.随后 许多著名统计学家,如Scheffe和Welch等也研究过这个问题.至今还得不出简单、精确的解法. 只提出一些近似的解法.下面给出两种近似结果。 ()当m与n都充分大时可用大样本方法,由于 亚--(b-a) ~N(0,1) (2.8) Voi/m+a3/n 且S?P,S号P2,将(2.8)中的子和2分别用S和S号代入,得 --6-@乡N(0,1). VS2/m+S2/n 因此,当m,n充分大时b-a的置信系数近似为1-a的置信区间是 下-x-2VS/m+53/m,Y-x+u2√s/m+5号/m: (2.9) ()一般情形,即m和n都不是充分大的情形.令 S2=S/m+S2/n. 10
ßLà™Üb − a k', Ÿ©ŸÜb − a Ã', T èÕ¶C˛. k P Y¯ − X¯ − (b − a) Sω r mn m + n ≤ tm+n−2(α/2) = 1 − α, dÿ™dC/, åb − a ò&XÍè1 − α ò&´mè Y¯ − X¯ − Sωtm+n−2 α 2 r 1 m + 1 n , Y¯ − X¯ + Sωtm+n−2 α 2 r 1 m + 1 n , (2.7) Ÿ•tm+n−2(α/2) ègd›m + n − 2 t©Ÿ˛˝α/2 ©†Í. (4) σ 2 2/σ2 1 = λ, λ Æû, ƒub − a ÆOY¯ − X¯ Õ¶C˛9Ÿ©Ÿè T = r mn(m + n − 2) mλ + n · Y¯ − X¯ − (b − a) p Q2 1 + Q2 2 /λ ∼ tn+m−2, d?Q2 1 = (m − 1)S 2 1 = Pm i=1(Xi − X¯) 2 , Q2 2 = (n − 1)S 2 2 = Pn i=1(Yi − Y¯ ) 2 . k P r mn(m + n − 2) mλ + n · Y¯ − X¯ − (b − a) p Q2 1 + Q2 2 /λ ≤ tm+n−2(α/2) = 1 − α. dÿ™dC/, b − a ò&XÍ1 − α ò&´mè Y¯ − X¯ − tm+n−2(α/2)s mλ + n mn(m + n − 2) · q Q2 1 + Q2 2 /λ, Y¯ − X¯ + tm+n−2(α/2)s mλ + n mn(m + n − 2) · q Q2 1 + Q2 2 /λ . (5) σ 2 1 6= σ 2 2 Öôû, á¶b − a ò&´mØK. ˘¥Õ¶Behrens-Fisher ØK. ߥBehrens 31929cl¢SA^J—ØK, ßA´Aœú¹X˛§„, ƺ˜)˚, òÑú¹ñ8Ñk©z3?ÿ. FisherƒkÔƒ ˘áØK, øÈòÑú¹â—Cq){. ë NıÕ¶⁄OÆ[, XScheffe ⁄Welch èÔƒL˘áØK. ñ8Ñÿ—{¸!°(){. êJ—ò Cq){. e°â—¸´Cq(J. (i) m Ün —ø©åûå^åê{, du Y¯ − X¯ − (b − a) p σ 2 1 /m + σ 2 2 /n ∼ N(0, 1), (2.8) ÖS 2 1 P −→ σ 2 1 , S2 2 P −→ σ 2 2 , Ú(2.8)•σ 2 1 ⁄σ 2 2 ©O^S 2 1 ⁄S 2 2 ì\, Y¯ − X¯ − (b − a) p S 2 1 /m + S 2 2 /n L −→ N(0, 1). œd, m, n ø©åûb − a ò&XÍCqè1 − α ò&´m¥ h Y¯ − X¯ − uα/2 q S 2 1 /m + S 2 2 /n, Y¯ − X¯ + uα/2 q S 2 1 /m + S 2 2 /n i . (2.9) (ii) òÑú/, =m ⁄n —ÿ¥ø©åú/. - S 2 ∗ = S 2 1 /m + S 2 2 /n. 10