§6.4充分统计量 我们先分析一下上节中导出的罗一克拉美不等式中等号成立的充要条件(626)。 三80K-0 de 其中K不依赖于51,52,,5,而可能依赖于日。对这等式两端求对日的积分 2ab8f:0=4i0n+B0+C(51,点2,,5n) d0 或者 10gL=1OgΠfx;)=A0)y+B)+C(x1,X2,…,Xn)(6.43y 这里y=U(X1,X2,…,Xn)。由此得出,似然函数L(X,,X2,…,Xn)有形 L5e48,+B0h(X1X2…,Xn) (6.44) 这里方X1,X2…,Xn)=eC6不依赣于0,48)和B0)只是日的函 数,所以使罗一克拉美不等式中等号成立的条件有下列两个: (1)似然函数L能分解成两个因子,即 L(0X1,…Xn)=gy:0)h(X1,x2,…,Xn) (6.45) 其中第一个因子只依赖于y和0,第二个因子在y值已知时不依赖于O: (2)第一个因子有指数型分布 g:0)=e4(o,+BO (6.46) 满足条件()的统计量门称为参数O的充分统计量。满足条件(②)的)的分布为指数型分 布。反过来,如果一个无偏估计是充分的,且其分布为指数型,那么这个就是一个有效估计。 下面我们将分别研究充分统计量和指数型分布。 在引入充分统计量的概念以前,我们先说明了的直观含义。 我们知道统计量是子样的函数,它把子样中所含的有关所研究问题的信息集中起来作为 我们进行统计推断的依据。由于统计量有很多,那么怎样的统计量是最佳的呢?直观的想法 是,一方面要尽可能地简单,另一方面又要能提供子样所含的“全部信息”。 怎样理解“全部信息”呢?在数理统计学中,子样51,52,…,5,给我们提供了母 体的信息。如果母体的概率函数依赖于参数日,子样当然也包含日的信息,但是依赖于子 样的统计量门却不一定包含日的全部信息。例如在一般情形下,子样的联合概率函数(即似 然函数)能分解成 L(0;x1,…,Xm)=gy;)h(X1,X2,…,Xn)
§6.4 充分统计量 我们先分析一下上节中导出的罗—克拉美不等式中等号成立的充要条件(6.26)。 = n i 1 log f ( ; ) i =K( - ) 其中 K 不依赖于 1 , 2 ,…, n 而可能依赖于 。对这等式两端求对 的积分, d f ; n i i = 1 log ( ) = A() + B() + C ( 1 , 2 ,…, n ) 或者 logL=log = n i f x; 1 ( ) = A( ) y + B( ) + C ( x 1 ,x 2 ,… ,x n ) (6.43) 这里 y=u(x 1 ,x 2 ,… ,x n )。由此得出,似然函数 L(x 1 ,x 2 ,… ,x n )有形 状 L=e A( ) B( ) y + h(x 1 ,x 2 ,… ,x n ) (6.44) 这里 h(x 1 ,x 2 ,… ,x n )= C((x, ,x )n e 不依赖于 ,A( )和 B( )只是 的函 数,所以使罗—克拉美不等式中等号成立的条件有下列两个: (1)似然函数 L 能分解成两个因子,即 L( ;x 1 ,…,x n )=g(y; )h(x 1 ,x 2 ,… ,x n ) (6.45) 其中第一个因子只依赖于 y 和 ,第二个因子在 y 值已知时不依赖于 ; (2)第一个因子有指数型分布 g(y; )= A( ) B( ) y e + (6.46) 满足条件(1)的统计量 称为参数 的充分统计量。满足条件(2)的 的分布为指数型分 布。反过来,如果一个无偏估计是充分的,且其分布为指数型,那么这个就是一个有效估计。 下面我们将分别研究充分统计量和指数型分布。 在引入充分统计量的概念以前,我们先说明了的直观含义。 我们知道统计量是子样的函数,它把子样中所含的有关所研究问题的信息集中起来作为 我们进行统计推断的依据。由于统计量有很多,那么怎样的统计量是最佳的呢?直观的想法 是,一方面要尽可能地简单,另一方面又要能提供子样所含的“全部信息”。 怎样理解“全部信息”呢?在数理统计学中,子样 1 , 2 ,…, n 给我们提供了母 体的信息。如果母体的概率函数依赖于参数 ,子样当然也包含 的信息,但是依赖于子 样的统计量 却不一定包含 的全部信息。例如在一般情形下,子样的联合概率函数(即似 然函数)能分解成 L( ;x 1 ,…,x n )=g(y; )h(x 1 ,x 2 ,… ,x n )
五(X,X…,Xn;O)是条件门=y下的条件概率函数,它一般是依赖于0的函数。如 果未知,五(X,XXn;)也就不可能知道,这时统计量并没有反映子样所含有的 “全部信息”,只有在不依赖于日时,统计量刀才反映了子样的“全部信总”。正因为这一点, 费歇命名这种反映“全部信息”的统计量为充分统计量。 例6.15(略) 从上面(6.44)式和例6.15看到,刀为0的一个充分统计量,子样的联合概率函数L 应该分解成两个因子,一个因子与?的概率函数有关,它可以依赖于未知参数日,而另一个 因子应该是1条件下子样51,52,…,5,的条件概率函数,它与日无关。由此我们 引出充分统计量的定义。 定义6.7设51,52,…,5m是取自具有概率函数f(x),日∈Θ的母体5 的一个容量为n的子样。设门=(51,52,,5m)是一个统计量,有概率函数gy) 若 fx8fs:6)-f.0=hK1X) (647》 gx,…,xn上0 成立,且每当yuX,,…,Xn)取一固定值时,刀习发生条件下的条件概率函数五 (X1Xxn)不依赖于0,则称n为0的一个充分估计量。 例6.16设母体5有密度函数 [e--,0<x<o,0eΘ=(-o0,o) f(x,0)= 0,其他 和5)<5(2)<<5()是取自这个母体的子样的次序统计量。 由第五章定理5.5系2知最小次序统计量5()的密度函数为 fne m-0<y<o gy0)= 0,其他 于是 o/00.-2+0-2 80r0 ne-wmn),(1<in) (6.48)
h(x 1 ,x…,x n ; )是条件 =y 下的条件概率函数,它一般是依赖于 的函数。如 果 未知,h(x 1 ,x…,x n ; )也就不可能知道,这时统计量 并没有反映子样所含有的 “全部信息”,只有在不依赖于 时,统计量 才反映了子样的“全部信息”。正因为这一点, 费歇命名这种反映“全部信息”的统计量为充分统计量。 例 6.15(略) 从上面(6.44)式和例 6.15 看到, 为 的一个充分统计量,子样的联合概率函数 L 应该分解成两个因子,一个因子与 的概率函数有关,它可以依赖于未知参数 ,而另一个 因子应该是 条件下子样 1 , 2 ,…, n 的条件概率函数,它与 无关。由此我们 引出充分统计量的定义。 定义 6.7 设 1 , 2 ,…, n 是取自具有概率函数 f (x; ) , ∈ 的母体 的一个容量为 n 的子样。设 =u( 1 , 2 ,…, n )是一个统计量,有概率函数 g( y; ) 。 若 [ ( , , ); ] ( ; ) ( ; ) ( ; ) 1 1 2 n n g u x x f x f x f x =h(x 1 ,…,x n ) (6.47) 成立,且每当 y=u(x 1 ,… ,x n )取一固定值时, =y 发生条件下的条件概率函数 h (x 1 ,x…,x n )不依赖于 ,则称 为 的一个充分估计量。 例 6.16 设母体 有密度函数 = − = − − 0,其他 , , ( , ) ( ; ) ( ) e x f x x 和 (1) < (2) <…< (n) 是取自这个母体的子样的次序统计量。 由第五章定理 5.5 系 2 知最小次序统计量 (1) 的密度函数为 g( y; ) = − − 0,其他 , ( ) ne y n y 于是 (min ) 1 ( ) 1 2 1 ( ; ) ( ; ) ( ; ) ( ; ) i n x n i i n y n i i n ne e x ne e x n g y f x f x f x − = − − = − = − + = ,(1<i<n) (6.48)
由于对一切i,户1,2,,n,x,≥y=minx,所以当yinx,取固定值时,(6.48)右端的式 子不依赖于日,且x,的值域x,≥y也不依赖于日。从而证明了刀=5)是日的充分统计量。 例6.17(略) 定理6.2设5,52,,5m是取自具有概率函数f(x),0∈日的母体5 的一个子样,则统计量门=,(51,…,5m)一是个充分统计量的充要条件是存在两个非 负函数K,和K,使得等式 fx;0)fx2;0)…f(x) =K[41(X1…,Xn50]K2(X1…,Xn)(6.48) 成立,并且当y,u,(心,…,Xn)取一定值时,函数K2(X,…,Xn)不依赖于0.。 (证明略) 例6.18(略) 例6.19(略) 我们知道达到罗一克拉美不等式下界的统计量的分布有指数形状。下面我们来研究形 式略为普遍一点的的指数分布族。这种分布族包括正态分布族,二分布族,单参数分布族等 许多常见的重要分布族,而且以后还会见到它们所含的参数具有充分统计量,因此在许多近 代数理统计理论中起若重要作用。在这里我们只介绍单参数情形。 个分布族{fx0):0∈⊙},日={9r<0<8},其中r和6是常数,称做单参 数指数族分布,如果存在定义在日上的实值函数(日)、dO)和定义在空间a<x<b上的实 值函数T(x)、S(x)使得 [exp[d(0)T(x)+d(0)+S(x)].a<x<b f(x)= 0,其他 (6.52) 这里f(x,)为概率函数。 注意:这里T(x)和Sx)可以不唯一,但要强调的是a和b不能依赖于参数日 例6.20(略) 例6.21(略) 定理6.3设随机变量5具有单参数指数族分布(6.52)。51,52,,5m为取 自母体5的一个子样,则统计量∑T(5)是参数0充分统计量。(证明书略) 定理6.4设母体5具有概率函数f(x),0e⊙,51,52,,5n为取 自这一母体的子样。若未知参数0有一个充分统计量门=51,52,,5n)存在
由于对一切 i,i=1,2, …,n,x i ≥y=minx j ,所以当 y=minx j 取固定值时,(6.48)右端的式 子不依赖于 ,且 x i 的值域 x i ≥y 也不依赖于 。从而证明了 = (1) 是 的充分统计量。 例 6.17(略) 定理 6.2 设 1 , 2 ,…, n 是取自具有概率函数 f (x; ) , ∈ 的母体 的一个子样,则统计量 =u 1 ( 1 ,…, n )一是个充分统计量的充要条件是存在两个非 负函数 K 1 和 K 2 ,使得等式 ( ; ) f x1 ( ; ) f x2 … f (x; ) = K 1 [ u 1 ( x 1 … ,x n ); ] K 2 ( x 1 … ,x n ) (6.48) 成立,并且当 y 1 =u 1 (x 1 ,… ,x n )取一定值时,函数 K 2 ( x 1 … ,x n )不依赖于 。 (证明略) 例 6.18(略) 例 6.19(略) 我们知道达到罗—克拉美不等式下界的统计量的分布有指数形状。下面我们来研究形 式略为普遍一点的的指数分布族。这种分布族包括正态分布族,二分布族,单参数分布族等 许多常见的重要分布族,而且以后还会见到它们所含的参数具有充分统计量,因此在许多近 代数理统计理论中起着重要作用。在这里我们只介绍单参数情形。 一个分布族 f (x;): , =:r ,其中 r 和 是常数,称做单参 数指数族分布,如果存在定义在 上的实值函数 c( )、d( )和定义在空间 a<x<b 上的实 值函数 T(x)、S(x)使得 + + = 0,其他 exp[ ( ) ( ) ( ) ( )], ( ; ) c T x d S x a x b f x (6.52) 这里 f (x; ) 为概率函数。 注意:这里 T(x)和 S(x)可以不唯一,但要强调的是 a 和 b 不能依赖于参数 。 例 6.20(略) 例 6.21(略) 定理 6.3 设随机变量 具有单参数指数族分布(6.52)。 1 , 2 ,…, n 为取 自母体 的一个子样,则统计量 = n i T i 1 ( ) 是参数 充分统计量。(证明书略) 定理 6.4 设母体 具有概率函数 f (x; ) , ∈ , 1 , 2 ,…, n 为取 自这一母体的子样。若未知参数 有一个充分统计量 =u( 1 , 2 ,…, n )存在
则似然方程 8-0 (6.53) 的解一定是=(X,X2,…,Xn)的函数。(证明略)
则似然方程 0 log = L (6.53) 的解一定是 y=u(x 1 ,x 2 ,… ,x n )的函数。(证明略)