Lec3:指数族和充分完备统计量 张伟平 2011年9月12日 1指数族 在统计理论问题中,许多统计推断方法的优良性,对一类范围广泛的统计模型(亦称为分布 族),有较满意的结果.这类分布族称为指数族.常见的分布,如正态分布、二项分布、Poissor如 分布、负二项分布、指数分布和Gamma分布等都属于这类分布族,这些表面上看来各不相同 的分布,其实它们都可以统一在一种包罗更广的一类称为指数族的模式中.当然引进这种分布 族的理由,主要不在于谋求形式上的统一,而在于这种统一抓住了它们的共性,因此许多统计理 论问题,对指数族获得较彻底的解决.本节介绍指数族的定义及简单性质, 一、定义与例子 定义1.设多={f(x,):0∈日}是定义在样本空间见上的样本分布族,其中日为参数空间. 若其概率函数f(红,)可表示成如下形式 f(z.0)=C(0)cxp{>Q.(0)T.(=)h(). 则称此样本分布族为指数型分布族(简称指数族(Exponential family),.其中k为自然数,C(0)> 0和Q()(i=1,2·,)都是定义在参数空间日上的(可测)函数,h(x)>0和T(x)(i= 1,2,…,)都是定义在见上的可测)函数. 指数族的一个性质是族中的所有分布具有共同的支撑集(G(x)称为概率函数p(x)的支撑集, 若G(x)={x:p(x)>0})由定义可见指数族支撑集{x:f(x,)>0}={x:h(x)>0}与0无 关.任一分布族若其支撑集与0有关,则族中分布不再具有共同支撑集,因而必不是指数族 例1.正态分布族{N(4,σ2):-000}是指数族 Proof.设X=(X1,·,Xn)为从正态分布N(μ,o2)中抽取的简单样本,X的联合密度为 fx%9=(V2o)"e即{-2ac:- (1.1) 4 记0=(4,o2),则参数空间为日={0=(4,o2):-00}将(1.1)改写为 =(2a可"。岁m总4-到
Lec3: çÍx⁄ø©⁄O˛ ‹ï² 2011 c 9 12 F 1 çÍx 3⁄OnÿØK•, Nı⁄Ỏê{`˚5, Èòaâå2ç⁄O. (½°è©Ÿ x), k˜ø(J. ˘a©Ÿx°èçÍx. ~Ñ©Ÿ, X©Ÿ!ë©Ÿ!Poisson ©Ÿ!Kë©Ÿ!çÍ©Ÿ⁄Gamma ©Ÿ—·u˘a©Ÿx, ˘ L°˛w5àÿÉ” ©Ÿ, Ÿ¢ßÇ—å±⁄ò3ò´ù¤ç2òa°èçÍx™•. ,⁄?˘´©Ÿ xnd, Ãáÿ3u*¶/™˛⁄ò, 3u˘´⁄ò84 ßÇ5, œdNı⁄On ÿØK, ÈçÍxºî.)˚. !0çÍx½¬9{¸5ü. ò!½¬Ü~f ½¬ 1. F = {f(x, θ) : θ ∈ Θ} ¥½¬3òmX ˛©Ÿx, Ÿ•Θ èÎÍòm. eŸV«ºÍf(x, θ) åL´§Xe/™ f(x, θ) = C(θ) exp nX k i=1 Qi(θ)Ti(x) o h(x), K°d©ŸxèçÍ.©Ÿx({°çÍx (Exponential family). Ÿ•kèg,Í, C(θ) > 0 ⁄Qi(θ) (i = 1, 2 · · · , k) —¥½¬3ÎÍòmΘ ˛(åˇ) ºÍ, h(x) > 0 ⁄Ti(x) (i = 1, 2, · · · , k) —¥½¬3X ˛(åˇ) ºÍ. çÍxòá5ü¥x•§k©Ÿ‰k”|†8( G(x) °èV«ºÍp(x)|†8, eG(x) = {x : p(x) > 0} ). d½¬åÑçÍx|†8{x : f(x, θ) > 0} = {x : h(x) > 0} Üθ à '. ?ò©ŸxeŸ|†8Üθ k', Kx•©Ÿÿ2‰k”|†8, œ 7ÿ¥çÍx. ~1. ©Ÿx{N(µ, σ2 ) : −∞ 0}¥çÍx. Proof. X = (X1, · · · , Xn)èl©ŸN(µ, σ2 )•ƒ{¸, XÈ‹ó›è f(x; µ, σ2 ) = √ 2πσ−n exp n − 1 2σ 2 Xn i=1 (xi − µ) 2 o . (1.1) Pθ = (µ, σ2 ), KÎÍòmèΘ = {θ = (µ, σ2 ) : −∞ 0}.Ú(1.1) Uè f(x, θ) = √ 2πσ−n e − nµ2 2σ2 expn µ σ 2 Xn i=1 xi − 1 2σ 2 Xn i=1 x 2 i o 1
=C(a)exp{Q1(0)T(x)+Q2(0)T2(x)}h(x), (1.2) 此处C(0)=(N2a)ne器,Q1(0)=μ叫a2,Q2(0)=-京,(x)=∑”14,T2(x)= ∑1,h(x)三1.因此由定义可知正态分布族N(山,2)是指数族. ▣ 例2.二项分布族{b(n,):00}不是指数族。 Proof.由指数族的定义可知,其支撑集为{x:p(x,)>0}={x:h(x)>O},它与9无关.而 均匀分布族{U(0,),0>0}的支撑集为{x:p(x,)>0}=(0,)与0有关,因此它不是指数 族。 口 二、指数族的自然形式及自然参数空间 在指数族的定义C0)ep{名Q:oz(ah()中,若用p:代替Q.(o,而将C0表成p 的函数C(.=(o,p2,…,p,故其表达式变为C(9))e即{名Z工(回}h.再改, 为9,i=12,,k则上式即为:C(0)ep(三,Z(},此式称为指数族的自然形式(或 称为标准形式).故有下列定义 定义2.如果指数族有下列形式 f(z.0)=C(0)erp>0:T:(z)h(z). (1.5) 则称为指数族的自然形式Natural form).此时集合 日={0,,…,6s):exp{∑0,z(}(<∞} (1.6) 称为自然参数空间(Natural parametric space)) 例4.将正态分布族表示为指数族的自然形式,并求出其自然参数空间 2
= C(θ) exp{Q1(θ)T1(x) + Q2(θ)T2(x)}h(x), (1.2) d?C(θ) = (√ 2πσ) −ne − nµ2 2σ2 , Q1(θ) = µ/σ2 , Q2(θ) = − 1 2σ2 , T1(x) = Pn i=1 xi , T2(x) = Pn i=1 x 2 i , h(x) ≡ 1 . œdd½¬å©ŸxN(µ, σ2 ) ¥çÍx. ~2. ë©Ÿx{b(n, θ) : 0 0} ÿ¥çÍx. Proof. dçÍx½¬åߟ|†8è{x : p(x, θ) > 0} = {x : h(x) > 0}, ßÜθ Ã'. ˛!©Ÿx{U(0, θ), θ > 0} |†8è{x : p(x, θ) > 0} = (0, θ) Üθ k', œdßÿ¥çÍ x. !çÍxg,/™9g,ÎÍòm 3çÍx½¬C(θ) exp P k i=1 Qi(θ)Ti(x) h(x) •, e^ϕi ìOQi(θ), ÚC(θ) L§ϕ ºÍC ∗ (ϕ), ϕ = (ϕ1, ϕ2, · · · , ϕk), ŸLà™CèC ∗ (ϕ) exp P k i=1 ϕiTi(x) h(x). 2Uϕi èθi , i = 1, 2, · · · , k, K˛™=è: C(θ) exp P k i=1 θiTi(x) h(x), d™°èçÍxg,/™(½ °èIO/™). ke½¬ ½¬ 2. XJçÍxke/™ f(x, θ) = C(θ)expnXn i=1 θiTi(x) o h(x), (1.5) K°èçÍxg,/™(Natural form). dû8‹ Θ ∗ = n (θ1, θ2, · · · , θk) : Z X exp X k i=1 θiTi(x) h(x)dx < ∞ o (1.6) °èg,ÎÍòm (Natural parametric space). ~4. Ú©ŸxL´èçÍxg,/™, ø¶—Ÿg,ÎÍòm. 2
Proof.由 的-()c器华-云} 参数空间日={(4,o2):-0<μ<0,0<2<∞.令1=川a2,2=-a,解出a= 站,1:2=i-,因此有(京)“e器-(V器)”e全c(,p=(e,p2, 故 fx,p)=C(p)ep{p∑+p2∑}h(x) i=1 1 =C(p)expfpTi(x)+2T2(x)}h(x). 再改p:为0(i=1,2),上式变为 f(x,)=C*()exp{0T(x)+2T2(x)}h(x) (1.7) 此为其自然形式.其自然参数空间为 日*={(01,02):-00<01<+o,-0∞<2<0} 0 三、指数族的性质 定理1.在指数族的自然形式下,自然参数空间为凸集. 证明的方法如下:设任给)=(©,…,),0o=(,…,)皆属于自然参数空间日*, 设0<a<1,令9=a8)+(1-a)9o(即9:=a8+(1-a)9,i=1,2,…,k),若能证明9∈日*, 则按凸集的定义,定理得证. 定理2.设指数族的自然形式中,自然参数空间有内点,9g(工)是任一有界可积函数,则对 c0=/aem{空o,.c)scy. 有 "c8=/"taam{空5ahatoju amG(0) 其中∑=1m=m,即对G()关于日的任意阶偏导数可在积分下求得。 此定理的更一般的形式及其证明查看参考文献[1]P21定理1.2.1. 2充分统计量 我们知道,统计量是对样本的简化,希望达到:()简化的程度高;()信息的损失少.一个统 计量能集中样本中信息的多少,与统计量的具体形式有关,也依赖于问题的统计模型.最好的情 3
Proof. d f(x; µ, σ2 ) = 1 √ 2πσ n e − nµ2 2σ2 exp n µ σ 2 Xn i=1 xi − 1 2σ 2 Xn i=1 x 2 i o , ÎÍòmΘ = {(µ, σ2 ) : −∞ < µ < ∞, 0 < σ2 < ∞}.-ϕ1 = µ/σ2 , ϕ2 = − 1 2σ2 , )—σ = q − 1 2ϕ2 , µ2/σ2 = ϕ 2 1 (− 1 2ϕ2 ), œdk √ 1 2πσ n e − nµ2 2σ2 = q−2ϕ2 2π n e nϕ2 1 4ϕ2 4 = C ∗ (ϕ), ϕ = (ϕ1, ϕ2), f(x, ϕ) = C ∗ (ϕ) exp ϕ1 Xn i=1 xi + ϕ2 Xn i=1 x 2 i h(x) = C ∗ (ϕ) exp{ϕ1T1(x) + ϕ2T2(x)}h(x). 2Uϕi èθi (i = 1, 2), ˛™Cè f(x, θ) = C ∗ (θ) exp{θ1T1(x) + θ2T2(x)}h(x). (1.7) dèŸg,/™. Ÿg,ÎÍòmè Θ ∗ = {(θ1, θ2) : −∞ < θ1 < +∞, −∞ < θ2 < 0}. n!çÍx5ü ½n 1. 3çÍxg,/™e, g,ÎÍòmè‡8. y²ê{Xeµ?âθ (1) = (θ 1 1 , · · · , θ1 k ), θ(0) = (θ 0 1 , · · · , θ0 k ) ·ug,ÎÍòmΘ∗ , 0 < α < 1, -θ = αθ(1) + (1−α)θ (0) (=θi = αθ1 i + (1−α)θ 0 i , i = 1, 2, · · · , k),eUy²θ ∈ Θ∗ , KU‡8½¬, ½ny. ½n 2. çÍxg,/™•, g,ÎÍòmkS:, g(x) ¥?òk.建Í, KÈ G(θ) = Z X g(x) exp nX k j=1 θjTj (x) o h(x)dx, k ∂ mG(θ) ∂θm1 1 · · · ∂θmk k = Z X ∂ m ∂θm1 1 · · · ∂θmk k h g(x) exp nX k j=1 θjTj (x) o h(x) i dx, Ÿ• Pk j=1 mj = m, =ÈG(θ) 'uθ ?ø†Íå3»©e¶. d½nçòÑ/™9Ÿy²wΩz[1] P21½n1.2.1. 2 ø©⁄O˛ ·Ç, ⁄O˛¥È{z, F"à: (i) {zß›p; (ii) &Eõî. òá⁄ O˛U8••&Eı, Ü⁄O˛‰N/™k', èù6uØK⁄O.. Å–ú 3
况是统计量把样本中的全部信息都集中起来,也就是说信息无损失,我们称这样的统计量为充分 统计量。 关于样本X=(X1,X2,·,Xn)的信息可以设想成如下的公式: {样本X中包含参数的信息}={统计量T(X)中所含参数的信息} +{在知道T(X)后样本X尚含有关于参数的剩余信息} 故T(X)为充分统计量的要求归结为:要求后一项信息为0.用统计的语言来描述,即要 求P%(XT=t)与无关.因此我们得到如下的定义: 定义1.设样本X的分布族{F6(x,日∈日},0为分布的参数.设T=T(X)为一统计量,若在已 知T的条件下,样本X的条件分布与0无关,则称T(X)为充分统计量(Su历cient statistic以. 实际应用时条件分布用条件概率(离散情形)或条件密度(连续情形)来代替: 例1.设X=(X1,X2,·,Xn)为从0-1分布中抽取的简单样本,则T(X)=∑=1X,为充分统 计量. Poof按定义我们只要证明下列条件概率与8无关 P(X1=z1,...,Xn=InT(x)=to) P=1/),当2-t。 P(T()=to) i=1 当∑≠t0, =1 上述条件概率与无关,因此T(X)=∑1X;为充分统计量. ▣ 例2.设X=(X1,X2,…,Xn)为从正态总体N(0,1)中抽取的简单样本,则T(X)=是∑1X:= 灭为充分统计量 Proof.再做正交变换 班= =1 ak,j=2,,n 二1 由正态总体下样本均值和样本方差的分布导出过程可知∑”1Y2=∑=1X2,且Y,Y2,…,Y是 相互独立的,Y~N(万0,1),Y~N(0,1),i=2,…,n.因此(Yi,…Yn)的联合密度为 f儿n,…h)=(2m)广号e2好-a-va0e 再由Y的密度函数为 k()=1 e-(g1-Vm0)2 2 知在给定Y时,(Y,·,Yn)的条件密度是 fn,…,nlbn)=fnnl=2m学ea听 (2.1) fy() 与0无关
¹¥⁄O˛r•‹&E—8•Â5, è“¥`&EÃõî, ·Ç°˘⁄O˛èø© ⁄O˛. 'uX = (X1, X2, · · · , Xn)&Eå±é§Xe˙™: X•ù¹ÎÍ&E = ⁄O˛T(X)•§¹ÎÍ&E + 3T(X)Xˇ¹k'uÎÍê{&E T(X)èø©⁄O˛á¶8(è: á¶òë&Eè0. ^⁄OäÛ5£„, =á ¶Pθ(X|T = t)ÜθÃ'. œd·ÇXe½¬: ½¬ 1. X©Ÿx{Fθ(x), θ ∈ Θ}, θè©ŸÎÍ. T = T(X)èò⁄O˛, e3Æ T^áe, X^á©ŸÜθÃ', K°T(X)èø©⁄O˛ (Sufficient statistic). ¢SA^û^á©Ÿ^^áV«(l—ú/) ½^áó›(ÎYú/) 5ìO. ~1. X = (X1, X2, · · · , Xn)èl0 − 1©Ÿ•ƒ{¸, KT(X) = Pn i=1 Xièø©⁄ O˛. Proof. U½¬·Çêáy²e^áV«ÜθÃ'. P(X1 = x1, · · · , Xn = xn|T(x) = t0) = P (X1=x1,··· ,Xn=xn,T =t0 ) P (T(x)=t0 ) = 1 n t0 , Pn i=1 xi = t0 0, Pn i=1 xi 6= t0. ˛„^áV«ÜθÃ',œdT(X) = Pn i=1 Xièø©⁄O˛. ~2. X = (X1, X2, · · · , Xn)èloNN(θ, 1)•ƒ{¸, KT(X) = 1 n Pn i=1 Xi = X¯ èø©⁄O˛. Proof. 2âCÜ ( y1 = √ 1 n Pn i=1 xi , yj = Pn k=1 ajkxk, j = 2, · · · , n. doNe˛ä⁄ê©Ÿ—Lßå Pn i=1 Yi 2 = Pn i=1 Xi 2 ,ÖY1, Y2, · · · , Yn¥ Ép’·, Y1 ∼ N( √ nθ, 1), Yi ∼ N(0, 1), i = 2, · · · , n. œd(Y1, · · · Yn)È‹ó›è f(y1, · · · yn) = (2π) − n 2 e − 1 2 Pn i=2 y 2 i − 1 2 (y1− √ nθ) 2 . 2dY1ó›ºÍè fY1 (y1) = 1 √ 2π e − 1 2 (y1− √ nθ) 2 3â½Y1û, (Y1, · · · , Yn)^áó›¥ f(y1, · · · , yn|y1) = f(y1, · · · , yn) fY1 (y1) = (2π) − n−1 2 e − 1 2 Pn i=2 y 2 i (2.1) ÜθÃ'. 4
这里利用了下列事实:曲面{(…Y):Yi=vt=}是由曲面{(X1,·,Xn):T(X)= t}经正交旋转而来,曲面保持不变.因此在曲面{(X1,·,Xn):T(X)=t}上的条件概率与在曲 面{Y,·,Y):Y=y1}上的条件概率相同.故有 f儿a…T=)=fn,…,X=n=2学。4会听 与无关,所以T(X)=是充分统计量 二、充分性的判别准则—因子分解定理 因子分解定理是由R.A.Fisher在二十世纪二十年代提出来,它的最一般形式和严格数学证 明,是Halmos和Savage在1949年作出来的. 定理3.(因子分解定理)设样本X=(X1,·,Xn)的概率函数f(x,9)=f(x1,·,xn:)依 赖于参数日,T=T(X)=(T1(X),·,Tk(X)是一个统计量,则T为充分统计量的充要条件 是f(x,)可以分解为 f(x,9)=g(T(x),)h(x) (2.2) 的形状.注意此处函数h(x)=h(x1,·,工n)不依赖于0 这里概率函数是指:若X为连续型,则f(x,)是其密度函数;若X是离散型,则f(x,)= Pa(X1=x1,·,Xn=xn),即样本X的概率分布. 推论1.设T=T(X)为0的充分统计量,S=(T)是单值可逆函数,则S=(T)也是0的充分统 计量。 例3.设X=(X1,·,Xn)为从正态总体N(a,o2)中抽取的简单样本,令0=(a,o2),则T(X)= (=1X,∑1X)为充分统计量. Proof.样本X的联合密度为 k=(2a)”m-aa-r =1 =(a高)”m-(宫-2如空+m》 =g(T(x),)·h(x) 此处(x)三1,故由因子分解定理可知T(X)=(∑=1X,∑1X)为充分统计量。 由于(∑”1X,∑”1X)与(下,S2)为一一对应的变换,由推论可知(X,S2)也是充分统计量. 例4.设X=(X1,…,Xn)为从总体b(1,)中抽取的简单样本,则T(X)=∑1X:是充分统计 量 Proof.样本X的联合分布是 f(x,θ)=P%(X1=x1,…,Xn=xn) =0点(1-”-三“=g(T(x),0)h(x. 此处h(x)三1,故由因子分解定理可知T(X)=∑1X,为充分统计量. 0 5
˘p|^ eØ¢: °{(Y1 · · · Yn) : Y1 = √ nt = y1}¥d°{(X1, · · · , Xn) : T(X) = t}²^= 5,°±ÿC. œd3°{(X1, · · · , Xn) : T(X) = t}˛^áV«Ü3 °{Y1, · · · , Yn) : Y1 = y1} ˛^áV«É”. k f(x1, · · · , xn|T = t) = f(y1, · · · , yn|Y1 = y1) = (2π) − n−1 2 e − 1 2 Pn i=2 y 2 i ÜθÃ', §±T(X) = X¯¥ø©⁄O˛. !ø©5OOK—œf©)½n œf©)½n¥dR.A. Fisher 3õVõcìJ—5,ßÅòÑ/™⁄ÓÇÍÆy ², ¥Halmos ⁄Savage31949cä—5. ½n 3. ( œf©)½n) X = (X1, · · · , Xn)V«ºÍf(x, θ) = f(x1, · · · , xn; θ) ù 6uÎÍθ, T = T(X) = (T1(X), · · · , Tk(X)¥òá⁄O˛, KTèø©⁄O˛øá^á ¥f(x, θ)屩)è f(x, θ) = g(T(x), θ)h(x) (2.2) /G.5ød?ºÍh(x) = h(x1, · · · , xn)ÿù6uθ. ˘pV«ºÍ¥ç: eXèÎY., Kf(x, θ)¥Ÿó›ºÍ; eX¥l—., Kf(x, θ) = Pθ(X1 = x1, · · · , Xn = xn), =XV«©Ÿ. Ìÿ 1. T = T(X)èθø©⁄O˛, S = ϕ(T)¥¸äå_ºÍ, KS = ϕ(T)è¥θø©⁄ O˛. ~3. X = (X1, · · · , Xn)èloNN(a, σ2 )•ƒ{¸, -θ = (a, σ2 ), KT(X) = ( Pn i=1 Xi , Pn i=1 X2 i )èø©⁄O˛. Proof. XÈ‹ó›è f(x, θ) = 1 √ 2πσ n expn − 1 2σ 2 Xn i=1 (xi − a) 2 o = 1 √ 2πσ n expn − 1 2σ 2 Xn i=1 x 2 i − 2a Xn i=1 xi + na2 o = g(T(x), θ) · h(x). d?h(x) ≡ 1, dœf©)½nåT(X) = (Pn i=1 Xi , Pn i=1 X2 i )èø©⁄O˛. du( Pn i=1 Xi , Pn i=1 X2 i )Ü(X, S ¯ 2 )èòòÈACÜ, dÌÿå(X, S ¯ 2 )è¥ø©⁄O˛. ~4. X = (X1, · · · , Xn)èloNb(1, θ)•ƒ{¸, KT(X) = Pn i=1 Xi¥ø©⁄O ˛. Proof. XÈ‹©Ÿ¥ f(x, θ) = Pθ(X1 = x1, · · · , Xn = xn) = θ Pn i=1 xi (1 − θ) n− Pn i=1 xi = g(T(x), θ)h(x). d?h(x) ≡ 1, dœf©)½nåT(X) = Pn i=1 Xièø©⁄O˛. 5
三、极小充分统计量* 一个分布族多的充分统计量往往不止一个,那么在使用中应该如何挑选呢?我们知道,统 计量是由样本加工而来的,如本章引言所述,对样本的加工显然可以提出两条要求:(1)在加 工中,样本所含参数的信息损失越少越好.若加工中此种信息毫无损失,那就是充分性的要求 (2)加工中,所得统计量愈简化越好,简化的程度可以用统计量的维数来衡量,也可以用函数关 系来表示.例如对一个二维统计量T(X)=(∑巴1X,∑m+1X),再进一步加工得到一维统 计量工2=∑”1X.直观上容易看出,T2比工简化.而且可以看出,乃是工的函数.一般来说, 若T与s是两个统计量,且T是S的函数,即T=q(S),那么由函数的定义可知,T比S简化, 定义2.设T是分布族多的充分统计量,若对乎的任一充分统计量S(X),存在一个函数qs()使 得T(X)=qs(S(X),则称T(X)是此分布族的极小充分统计量. 3完全统计量 定义1.设多={F(x),0∈日}为一分布族,日是参数空间.设T=T(X)为一统计量,若对任一 实函数p(),由 E9p(T(X))=0,一切0∈日, (3.1) 总可推出 Pa(p(T(X)=0)=1,一切0∈日, (3.2) 则称T(X)是一完全统计量(Complete Statistic. 由定义可见,若T(X)是完全统计童,则它的任一实函数g(T)也是完全统计量 注1.统计量T(X)的完全性不仅取决于T的形状,还取决于样本X的分布族.完全性(亦称完备 性)这个名称,是来源于正交函数理论中的一个类似概念.为简单计,设统计量T(X)有密度函 数g(t),则(3.1)式可写为 (e)9(t)dt=0,-切6∈日. (3.3) 积分∫(t)9(t)dt=0形式上可看成“p与g。正交”·于是,条件(3.1)可说成是“p与函数 系{9,9∈日}正交”.在正交函数论,若M表示一正交函数系,且不存在与M正交的非零函数, 则称M为完全正交系.由(3.3)看出,我们这里的完全性正好与此相当.不过我们不称密度函数 系{g,0∈Θ}完全,而称统计量T完全.由于{g,0∈日}是由统计量T决定的,这种称呼不影响实 质。 例1.设X=(X1,·,Xn)为从总体b(1,)中抽取的简单样本,则T(X)=1X:是完全统计 量 Poof显然,T(X)~b(n,),故有 P(T(X)=)= (()*1-0n-6,k=0,12…,n 设p(t)为任一实函数,满足Eap(T)=0,一切0<0<1,此即
n!4ø©⁄O˛∗ òá©ŸxFø©⁄O˛ ÿéòá, @o3¶^•ATX¤]¿Q? ·Ç, ⁄ O˛¥d\Û 5, XŸ⁄Û§„, È\Ûw,å±J—¸^á¶: (1) 3\ Û•, §¹ÎÍθ&Eõî–. e\Û•d´&EŒÃõî, @“¥ø©5á¶. (2) \Û•, §⁄O˛ï{z–, {zß›å±^⁄O˛ëÍ5Ô˛, èå±^ºÍ' X5L´. ~XÈòáë⁄O˛T1(X) = (Pm i=1 Xi , Pn i=m+1 Xi),2?ò⁄\Ûòë⁄ O˛T2 = Pn i=1 Xi . Ü*˛N¥w—, T2'T1{z. Öå±w—, T2¥T1ºÍ. òÑ5`, eTÜs¥¸á⁄O˛, ÖT¥S ºÍ, =T = q(S), @odºÍ½¬å, T'S{z. ½¬ 2. T¥©ŸxFø©⁄O˛, eÈF?òø©⁄O˛S(X), 3òáºÍqS (·)¶ T(X) = qS (S(X)), K°T(X)¥d©Ÿx4ø©⁄O˛. 3 ⁄O˛∗ ½¬ 1. F = {Fθ(x), θ ∈ Θ}èò©Ÿx, Θ¥ÎÍòm.T = T(X)èò⁄O˛, eÈ?ò ¢ºÍϕ(·),d Eθϕ(T(X)) = 0, òÉ θ ∈ Θ, (3.1) oåÌ— Pθ(ϕ(T(X)) = 0) = 1, òÉ θ ∈ Θ, (3.2) K°T(X)¥ò⁄O˛ (Complete Statistic). d½¬åÑ, eT(X)¥⁄O˛, Kß?ò¢ºÍg(T)è¥⁄O˛. 51. ⁄O˛T(X)5ÿ=˚uT/G, Ñ˚uX©Ÿx. 5(½° 5) ˘á¶°, ¥5 uºÍnÿ•òáaqVg. è{¸O, ⁄O˛T(X)kó›º Ígθ(t),K(3.1)™åè Z ϕ(t)gθ(t)dt = 0, òÉ θ ∈ Θ. (3.3) »© R ϕ(t)gθ(t)dt = 0/™˛åw§/ϕÜgθ0. u¥, ^á(3.1)å`§¥/ϕÜºÍ X{gθ, θ ∈ Θ}0. 3ºÍÿ, eML´òºÍX, Öÿ3ÜMö"ºÍ, K°MèX. d(3.3) w—, ·Ç˘p5–ÜdÉ. ÿL·Çÿ°ó›ºÍ X{gθ, θ ∈ Θ}, °⁄O˛T. du{gθ, θ ∈ Θ}¥d⁄O˛T˚½, ˘´°ÿKè¢ ü. ~1. X = (X1, · · · , Xn)èloNb(1, θ)•ƒ{¸, KT(X) = Pn i=1 Xi¥⁄O ˛. Proof. w,, T(X) ∼ b(n, θ), k P(T(X) = k) = n k θ k (1 − θ) n−k , k = 0, 1, 2, · · · , n. ϕ(t)è?ò¢ºÍ, ˜vEθϕ(T) = 0, òÉ0 < θ < 1,d= Xn k=0 ϕ(k) n k θ k (1 − θ) n−k = 0 ⇐⇒ 6
三因(2广-80<9 令0/(1-0)=6,则上式等价于 =0,0<6<∞. 上式左边是的多项式,故必有 =0,k=0,1,2,…,n. 即p(因=0,k=0,1,2,…,n.这就证明了T(X)=∑1X:是完全统计量 口 例2.设X=(X1,X2,·,Xn)为从正态总体N(0,1)中抽取的简单样本,则T(X)=为完全统 计量 Proof.显然T(X)=X=青∑1X:~N(0,1/m),设p()为t的任一实函数,满足Egp(T)=0, 对一切-0<0<0.此即 V医eg平=√层ee学e学em=0 所以 e0e-9.eat=0,-<0< 令z=n0,则 Ge)=e-号et 将z视为复数,G(z)为全平面上的解析函数,且G(z)当z取实数时为0,由解析函数的唯一性定理, G(z)在整个复平面上为0,特别取z=iμ,则 G()= (t)e-号.e-=0. 由Fourier变换的逆变换公式,可知 p(t)e-nt/2=0. 故有(t)=0,<o∞,因此T(X)=为完全统计量. 0 二、指数族中统计量的完全性 定理4.设样本X=(X1,X2,·,X)的概率函数 fx,)=Co)ep1∑Q.(oz(x}hx,0e日 为指数族.令T(X)=(T(X),·,T(X),若自然参数空间日*作为R的子集有内点,则T(X)是 完全统计量
Xn k=0 ϕ(k) n k θ 1 − θ k = 0, 0 ¥δıë™, 7k ϕ(k) n k = 0, k = 0, 1, 2, · · · , n. =ϕ(k) = 0, k = 0, 1, 2, · · · , n. ˘“y² T(X) = Pn i=1 Xi¥⁄O˛. ~2. X = (X1, X2, · · · , Xn)èloNN(θ, 1)•ƒ{¸, KT(X) = X¯è⁄ O˛. Proof. w,T(X) = X¯ = 1 n Pn i=1 Xi ∼ N(θ, 1/n), ϕ(t)èt?ò¢ºÍ, ˜vEθϕ(T) = 0, ÈòÉ−∞ < θ < ∞. d= r n 2π Z ∞ −∞ ϕ(t)e − n(t−θ) 2 2 dy = r n 2π Z ∞ −∞ ϕ(t)e − nt2 2 · e − nθ2 2 · e ntθdt = 0. §± Z ∞ −∞ ϕ(t)e − nt2 2 · e ntθdt = 0, −∞ < θ < ∞ -z = nθ,K G(z) = Z ∞ −∞ ϕ(t)e − nt2 2 e tzdt. Úz¿èEÍ, G(z)è²°˛)¤ºÍ, ÖG(z)z¢Íûè0, d)¤ºÍçò5½n, G(z)3áE²°˛è0, AOz = iµ,K G(µ) = Z ∞ −∞ ϕ(t)e − nt2 2 · e −iµtdt = 0. dF ourierCÜ_CÜ˙™, å ϕ(t)e −nt2/2 = 0. kϕ(t) = 0, |t| < ∞, œdT(X) = X¯è⁄O˛. !çÍx•⁄O˛5 ½n 4. X = (X1, X2, · · · , Xn)V«ºÍ f(x, θ) = C(θ)expnX k i=1 Qi(θ)Ti(x) o h(x), θ ∈ Θ èçÍx. -T(X) = (T1(X), · · · , Tk(X)), eg,ÎÍòmΘ∗äèRkf8kS:, KT(X)¥ ⁄O˛. 7
例3.设X=(X1,…,Xn)是从均匀分布U(0-1/2,9+1/2)中抽取的简单样本,则T(X)= (X(1),X(n)是充分统计量,但不是完全统计量. Proof.T(X)=(X(1),Xm)的充分性在例2.7.9中已证.下面来证明它不是完全的 要证明一个统计量T(X)不是完全的,只要找到一个实函数p(t)使得E(T)=0,但 “p(T)=0,a.e.P。”是不成立的即可. 令Z=X(m-X,Y=X-(0-1/2),i=1,2,…,n,则,…,Ynii.d.~U(0,1),与无 关.而此时Z=Xm-Xa=Ym-Ya的分布也与无关.找常数ab)>0. 定义 1,Zb, 0,其它. 则易见p(t)满足:Egp(T)=0,但p()丰0(即P(p()≠0)>0).按定义T(X)=(X(1,X)不是 完全统计量. ☐ 三、有界完全统计量及其性质 定义2.若对任何满足 E0p(T(X)=0,对一切9∈日 的有界(a.e.有界)的函数p()都有 P(T(X)=0)=1,对一切0∈9, 则称T(X)为有界完全统计量】 由定义可见:一个“完全统计量”必为“有界完全统计量”,反之不必对。 定理5.(Basu定理设多={Fa(r),0∈O}为一分布族,日是参数空间.样本X=(X1,…,Xn)是 从分布族多中抽取的简单样本,设T(X)是一有界完全统计量,且是充分统计量.若π..V(X)的 分布与0无关,则对任何0∈日,V(X)与T(X)独立. 例4.设X=(X,…,Xn)是从N(0,1)中抽取的简单样本,R(X)=Xm)-X)称为极差, 则T(X)==∑=1X,与R(X)独立. Poof由于正态分布N(0,1)为指数族,自然参数空间日*={0:-∞<0<o}作为R1的子集有 内点.故T(X)为充分完全统计量 令Y=X:-9,则Y~N(0,1),i=1,2,·,n.因此Y,…,Ynii.d.~N(0,1),与9无关.从 而Y(m-Y(u的分布也与无关.故 R(X)=X(m)-X(L)=Y(m)-Y() 之分布与0无关,由推论2.8.1可知T(X)与R(X)独立 口 8
~3. X = (X1, · · · , Xn)¥l˛!©ŸU(θ − 1/2, θ + 1/2)•ƒ{¸, KT(X) = (X(1), X(n))¥ø©⁄O˛, ÿ¥⁄O˛. Proof. T(X) = (X(1), X(n))ø©53~2.7.9•Æy. e°5y²ßÿ¥. áy²òá⁄O˛T(X)ÿ¥, êáÈòᢺÍϕ(t)¶Eθϕ(T) = 0, /ϕ(T) = 0, a.e. Pθ0¥ÿ§·=å. -Z = X(n) − X(1), Yi = Xi − (θ − 1/2), i = 1, 2, · · · , n,KY1, · · · , Yn i.i.d. ∼ U(0, 1),Üθà '. dûZ = X(n) − X(1) = Y(n) − Y(1)©ŸèÜθÃ'. È~Ía b) > 0. ½¬ ϕ(t) = 1, Z b, 0, Ÿß. K¥Ñϕ(t)˜v:Eθϕ(T) = 0, ϕ(t) 6≡ 0 (=P(ϕ(t) 6= 0) > 0). U½¬T(X) = (X(1), X(n))ÿ¥ ⁄O˛. n!k.⁄O˛9Ÿ5ü ½¬ 2. eÈ?¤˜v Eθϕ(T(X)) = 0, ÈòÉ θ ∈ Θ k.(½a.e.k.)ºÍϕ(·) —k Pθϕ(T(X) = 0) = 1, ÈòÉ θ ∈ Θ, K°T(X)èk.⁄O˛. d½¬åÑ: òá/⁄O˛07è/k.⁄O˛0, áÉÿ7È. ½n 5. ( Basu½n F = {Fθ(x), θ ∈ Θ}èò©Ÿx, Θ¥ÎÍòm.X = (X1, · · · , Xn)¥ l©ŸxF•ƒ{¸, T(X)¥òk.⁄O˛,Ö¥ø©⁄O˛. er.v. V (X) ©ŸÜθÃ', KÈ?¤θ ∈ Θ, V (X)ÜT(X)’·. ~4. X = (X1, · · · , Xn)¥lN(θ, 1)•ƒ{¸, R(X) = X(n) − X(1)°è4, KT(X) = X¯ = 1 n Pn i=1 XiÜR(X) ’·. Proof. du©ŸN(θ, 1)èçÍx, g,ÎÍòmΘ∗ = {θ : −∞ < θ < ∞}äèR1f8k S:. T(X)èø©⁄O˛. -Yi = Xi − θ,KYi ∼ N(0, 1), i = 1, 2, · · · , n. œdY1, · · · , Yn i.i.d. ∼ N(0, 1),ÜθÃ'.l Y(n) − Y(1)©ŸèÜθÃ'. R(X) = X(n) − X(1) = Y(n) − Y(1) É©ŸÜθ Ã', dÌÿ2.8.1åT(X)ÜR(X)’·. 8