§2.2充分统计量与完备统计量 充分统计量 在数理统计中,由样本来推断总体的前提是:样本 包含了总体分布的信息。样本中包含的关于总体分布 的信息可分为: 1、关于总体结构的信息,即反映总体分布的类型。 如总体服从正态分布,则来自该总体的样本相互独 立并均服从该正态分布,即样本包含了总体分布为 正态分布的信息。 2、关于总体未知参数的信息,这是由于样本的分 布中包含了总体分布中的未知参数。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 1 §2.2 充分统计量与完备统计量 一 充分统计量 在数理统计中,由样本来推断总体的前提是:样本 包含了总体分布的信息。样本中包含的关于总体分布 的信息可分为: 1、关于总体结构的信息,即反映总体分布的类型。 如总体服从正态分布,则来自该总体的样本相互独 立并均服从该正态分布,即样本包含了总体分布为 正态分布的信息。 2、关于总体未知参数的信息,这是由于样本的分 布中包含了总体分布中的未知参数
为了推断总体分布的未知参数,需要把样本中关于 未知参数的信息“提炼“出来,即构造合适的统计量, 显然,一个“好”的统计量应该能够将样本中所包含 的关于未知参数的信息全部提炼出来,而不没有任何 有用信息损失,这就是英国著名统计学家 Fisher于 1922年提出的一个重要的概念—一充分统计量。 定义设X,X,…,X为来自总体X的样本,X的分 布函数为F(x;0),T=T(X1,X2,,X)为一个统计量, 当给定T=t时,如果样本(X,X,…,X)的条件分布 (离散总体时为条件概率,连续总体时为条件密度) 与参数6无关,则称T为参数O的充分统计量。 湘潭大学数学与计算科学学院一四2层m
湘潭大学数学与计算科学学院 上一页 下一页 2 为了推断总体分布的未知参数,需要把样本中关于 未知参数的信息“提炼“出来,即构造合适的统计量, 显然,一个“好”的统计量应该能够将样本中所包含 的关于未知参数的信息全部提炼出来,而不没有任何 有用信息损失,这就是英国著名统计学家Fisher于 1922年提出的一个重要的概念-----充分统计量。 定义 设 X X X n , , , 1 2 为来自总体 X 的样本,X 的分 布函数为F(x; ),T=T(X X X n , , , 1 2 )为一个统计量, 当给定 T=t 时,如果样本(X X X n , , , 1 2 )的条件分布 (离散总体时为条件概率,连续总体时为条件密度) 与参数 无关,则称 T 为参数 的充分统计量
对统计量T,如果已知它的值以后,样本的条件分布 与6无关,就意味着样本的剩余部分中已不再包含关于 的信息,也就是在T中已包含有关的全部信息。因此, 对θ的统计推断只需要从T出发即可,不再需要样本数据。 例设总体X服从两点分布B(,),即 P(X=x)=p(1-p),x=0,1 其中0X是参数p的充分统计量 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 3 对统计量 T,如果已知它的值以后,样本的条件分布 与 无关,就意味着样本的剩余部分中已不再包含关于 的信息,也就是在 T 中已包含有关 的全部信息。因此, 对 的统计推断只需要从 T 出发即可,不再需要样本数据。 例. 设总体 X 服从两点分布 B p (1, ) ,即 P(X=x)= 1 (1 ) x x p p − − ,x=0,1, 其中 0<p<1, (X X X n , , , 1 2 )为来自总体 X 一个样本, 试证: 1 1 n i i X X n = = 是参数 p 的充分统计量
证明:因为x~B(p,所以nX=∑X,-B(m,P),即有 P(nX=k)=Cp(1-p)”,k=0,1,…,n 设(x,x2,…,x,为样本观测值,其中x=0,1.如果已 知X=则样本(X1,X2…,X)的条件概率 k P(X=X,X X=xx= P(X1=x1,X2=x2 3n=n,F、h k P(X 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 4 证明:因为 Xi B p (1, ),所以 1 ( , ) n i i nX X B n p = = ,即有 ( ) (1 ) , 0,1, , . k k n k P nX k C p p k n n − = = − = 设( ) x x xn , , , 1 2 ,为样本观测值,其中 0,1 . i x = 如果已 知 n k X = 则样本( ) X X Xn , , , 1 2 的条件概率 1 1 2 2 1 1 2 2 ( , , , ) ( , , , , ) ( ) n n n n k P X x X x X x X n k P X x X x X x X n k P X n = = = = = = = = = =
P(X=X,X2=x,,,Xn=xn) ,如果∑x,=k, P(nX=k) 0,如果∑x1≠k, k Cp(1-p)”k 如果∑ 0,如果∑x,≠k, 1如果∑x O,如果∑x≠k 与p无关,所以X为p的充分统计量 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 5 1 1 2 2 1 1 ( , , , ) , ( ) 0 , n n n i i n i i P X x X x X x x k P n X k x k = = = = = = = = 如 果 , 如 果 , 1 1 1 1 (1 ) , (1 ) 0 , n n i i i i x n x n k k n k i n i n i i p p x k C p p x k = = − − = = − = = − 如 果 , 如 果 , 1 1 1 , 0, n k i n i n i i x k C x k = = = = 如果 , 如果 , 与 p 无关,所以 X 为 p 的充分统计量
二、因子分解定理 根据充分统计量的含义,在对总体未知参数 进行推断时,应在可能的情况下尽量找出关于未 知参数的充分统计量。但从定义出发来判别一个 统计量是否是充分统计量是很麻烦的。为此,需 要一个简单的判别准则。下面给出一个定理 因子分解定理,运用这个定理,判别甚至寻找 个充分统计量有时会很方便。 湘潭大学数学与计算科学院一页一页]6
湘潭大学数学与计算科学学院 上一页 下一页 6 二、 因子分解定理 根据充分统计量的含义,在对总体未知参数 进行推断时,应在可能的情况下尽量找出关于未 知参数的充分统计量。但从定义出发来判别一个 统计量是否是充分统计量是很麻烦的。为此,需 要一个简单的判别准则。下面给出一个定理—— 因子分解定理,运用这个定理,判别甚至寻找一 个充分统计量有时会很方便
定理23(因子分解定理) (1)连续型情况:设总体X具有分布密度 f(x;O),(X1,X2,…,Xn)是一样本,T(X1,X2,…,X)是一个统 计量,则T为0的充分统计量的充要条件是:样本的联合分布 密度函数可以分解为 L(f(x;))=(x,x,…x)(r(x,x,…,x,)) 其中h是x1,x,…,x的非负函数且6无关,g仅通过T依赖 于x1,x2,…,x,。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 7 定理 2.3 (因子分解定理) (1)连续型情况:设总体 X 具有分布密度 ( ; ),( , , , ) x X1 X2 X n f 是一样本, ( , , , ) T X1 X2 X n 是一个统 计量,则T 为 的充分统计量的充要条件是:样本的联合分布 密度函数可以分解为 = = n i i n n L f x h x x x g T x x x 1 1 2 1 2 ( ) ( ; ) ( , ,, ) ( ( , ,, ); ) , (2.3) 其中 h是x x x n , , , 1 2 的非负函数且 无关,g仅通过 T 依赖 于x x x n , , , 1 2
2)离散型情况:设总体X的分布律为P{X=x} =p(x;:0)i=12,…)T(X,2X2,…,X)一个统计量,则T是的充 分统计量的充要条件是:样本的联合分布律可表示为 PX,=x,,x,=x2 X=x, AIPX=x,) =h(x1,x2,…,x)g(T(x1,x2,…,xn):6) (24 其中h是x,x2,…,x的非负函数且与无关,g仅通过T依 赖于x1,x,…,xn。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 8 2)离散型情况:设总体 X 的分布律为 P X x = i i 1 2 n = = p(x ; )(i 1,2, ),T(X , X , , X ) 一个统计量,则T 是 的充 分统计量的充要条件是:样本的联合分布律可表示为 = = = = = n i n n i P X x X x X x P X x 1 1 1 2 2 , ,, ( , , , ) ( ( , , , ); ) = h x1 x2 x n g T x1 x2 x n (2.4) 其中h是x x x n , , , 1 2 的非负函数且与 无关,g仅通过 T 依 赖于 x x x n , , , 1 2
例24根据因子分解定理证明例23。 证明样本的联合分布律为 PX =x,,X X=x =(1-p)"( 若取T(x,x”人1 ∑ n 1~2 g(T(x,x,…,x);p)=(1-p)(Py 则有 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 9 例2.4 根据因子分解定理证明例2.3。 证明 样本的联合分布律为 − = = = = = = − n i i N I i x n x P X x X x X n x n p p 1 1 , , , (1 ) 1 1 2 2 − = − = n i xi n p p p 1 ) 1 (1 ) ( 若取 = = n i n xi n T x x x 1 1 2 1 ( , ,, ) h(x1 , x2 , , x n ) = 1 n nT n p p g T x x x p p ) 1 ( ( , , , ); ) (1 ) ( 1 2 − = − 则有
P{X1=x,X2=x2,…,X=x,} =h(x1,x2,…,xn)g(T(x1,x2,…,xn);P) 由因子分解定理知,T(X,x,…,x)=1∑x=x是的 充分统计量。 例25设X1,X2…,X是来自泊松分布P(4)的一个样本, 试证明样本均值X是的充分统计量。 证明样本(X1,X2,…,X,)的联合分布律为 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 10 PX1 = x1 , X2 = x2 , , X n = x n ( , , , ) ( ( , , , ); ) = h x1 x2 x n g T x1 x2 x n p 由因子分解定理知, = = = n i n Xi X n T X X X 1 1 2 1 ( , ,, ) 是p 的 充分统计量。 例 2.5 设X X Xn , , , 1 2 是来自泊松分布P() 的一个样本, 试证明样本均值X 是 的充分统计量。 证明 样本( , , , ) X1 X2 X n 的联合分布律为