§5.2统计量及其分布 上一节中知道子样是母体的反映,但是子样所含作息不能直接用于解决我们所要研究的 问题,而需要把子样所含的信息进行数学上的加工使其浓缩起来,从而解决我们的问题。这 在数理统计学中往往通过构造一个合适的依赖于子样的函数一统计量一来达到的。 定义5.1一个统计量是子样的一个函数,如果子样容量为m,它也就是m个随机变量 函数,并且要求这个函数是不依赖于任何未知参数的随机变量。统计量的分布称为抽样分 布 按照这一定义,随机变量刀=∑5是一个统计量,前一节中提到的经验分布函数F(x) 也是一个统计量,但当4、。2未知时,刀,=二少就不是一个统计量,这是51, 52,,5是一个子样,必须指出的是,尽管一个统计量不依赖于任何未知参数,但 是它的分布可能是依赖于未知参数的。 下面我们定义一些常用的统计量 定义5.2设51,52,…,5n是由母体5取出的容量为n的子样,统计量 (5.3) 称做子样均值:统计量 s-空--空- (5.4) 称做子样的方差:统计量 F-2 5.5 称做子样的k阶矩:统计量 m,26- (5.6) 称做子样的k阶中心矩:统计量 若(X1,X2,…,Xm)是子样51,52,…,5,的一组观测值,则 2 5.7)
§5.2 统计量及其分布 上一节中知道子样是母体的反映,但是子样所含作息不能直接用于解决我们所要研究的 问题,而需要把子样所含的信息进行数学上的加工使其浓缩起来,从而解决我们的问题。这 在数理统计学中往往通过构造一个合适的依赖于子样的函数—统计量—来达到的。 定义 5.1 一个统计量是子样的一个函数,如果子样容量为 n,它也就是 n 个随机变量 的函数,并且要求这个函数是不依赖于任何未知参数的随机变量。统计量的分布称为抽样分 布。 按照这一定义,随机变量 = i=1 i 是一个统计量,前一节中提到的经验分布函数 F n (x) 也是一个统计量,但当 n 、 2 未知时, i = i − 就不是一个统计量,这是 1 , 2 ,…, n 是一个子样,必须指出的是,尽管一个统计量不依赖于任何未知参数,但 是它的分布可能是依赖于未知参数的。 下面我们定义一些常用的统计量。 定义 5.2 设 1 , 2 ,…, n 是由母体 取出的容量为 n 的子样,统计量 = n n i i =1 (5.3) 称做子样均值;统计量 2 n S = = − n i i n 1 2 ( ) 1 = 2 1 1 2 − = n i i n (5.4) 称做子样的方差;统计量 k = n 1 = n i k i 1 (5.5) 称做子样的 k 阶矩;统计量 m k = k n i i n ( ) 1 1 − = (5.6) 称做子样的 k 阶中心矩;统计量 若(x 1 ,x 2 ,… ,x n )是子样 1 , 2 ,…, n 的一组观测值,则 x = n 1 = n i i x 1 (5.7) 和
S-2-2- (5.8) n行 分别为子样均值方差S的观测值。 统计量是子样的函数,它的抽样分布函数可以从子样的联合分布函数推出,设5, 52,…,5n和,2,,nn是取自正态母体W(0,1)的容量分别为n和m的两 个子样,那么 n n∑n N /n m2 都是统计量。根据前面§3.4,它们的抽样分布分别为x2(n)分布、t()分布、F(m,n) 分布。这些抽样分布今后在分设检验和区间估计中不止一次地要用到。 由于子样均值专与子样方差S这两个统计量在数理统计学中的重要作用,我们将详 细地推导它们的分布,先给出它们不依赖于母体分布具体形式的两个性质。 定理5,1设母体5的分布函数F(x)具有二阶矩,即E5=1<0。若51 52,,5,是取自这一母体的一个子样,则子样均值号的数学期望与方差分别为 E=M (5.9) D2-g: (5.10) n 若假设母体的原点矩u4=E5*和中心矩4:=E(传-心)次,k与1,2,3,4都 存在,则子样方差的数学期望和方差依次为 ES片4 S).4-E4.22,4- n2 (5.10a) n 并且子样均值与子样方差的协方差为
2 n S = = − n i i x x n 1 2 ( ) 1 = 2 1 1 2 x x n n i i − = (5.8) 分别为子样均值方差 2 n S 的观测值。 统计量是子样的函数,它的抽样分布函数可以从子样的联合分布函数推出,设 1 , 2 ,…, n 和 1,2 ,…, m 是取自正态母体 N(0,1)的容量分别为 n 和 m 的两 个子样,那么 2 == n i i 1 , t= n 2 1 , F= = = n i i m i i m n 1 2 1 2 都是统计量。根据前面§3.4,它们的抽样分布分别为 2 (n)分布、t(n)分布、F(m,n) 分布。这些抽样分布今后在分设检验和区间估计中不止一次地要用到。 由于子样均值 与子样方差 2 n S 这两个统计量在数理统计学中的重要作用,我们将详 细地推导它们的分布,先给出它们不依赖于母体分布具体形式的两个性质。 定理 5.1 设母体 的分布函数 F(x)具有二阶矩,即 E = < 。若 1 , 2 ,…, n 是取自这一母体的一个子样,则子样均值 的数学期望与方差分别为 E = (5.9) D = n 2 (5.10) 若假设母体的原点矩 k = E k 和中心矩 k = E k ( ) −1 ,k=1,2,3,4 都 存在,则子样方差的数学期望和方差依次为 E( 2 n S )= 2 1 n n − D( 2 n S )= 2 2 4 2 n − - 2 2 4 2 2( 2 ) n − + 3 2 4 2 3 n − (5.10a) 并且子样均值与子样方差的协方差为 Cov( , 2 n S )= 2 2 1 n n −
一个随机向量5'=(51,52,…,5,)经过一个线性变换得到一个随机向量门= (,2,乃,,刀。),这两个随机向量的数学期望和相关矩陈之间的关系由下列定理 给出。 定理5.2设5'=(51,52,,5n)7=(,2,,…,n)为 两个随机向量,且设刀=AS,其中A=(a)为一个n×n阶方阵,则有 E5=A(E5) D=A()A' (5.11 定理53设母体5服从正态分布N(从,。人(证明略 现在我们来推导子样方差的分布。 定理54设5,5,,5。是正造得体N(,子)的一-个子样其子样 均值与子样方差分别为 空2升 则 (1)5与S相互独立: Q)。二S罪从自由度为1的72-分布,(证明略) 系1设51,52,,5n为取自正态母体N(4,σ2)的一个子样,5与S号 分别为子样均值与子样方差,则 店-n-可 (5.18) 是自由度为-1的t一分布。(证明略) 系2设51,52,,5n和n,2,,…,刀n分别是从正态母体N(μ, o12)和N(μ,622)抽取的两个子样,且51,52,,51和n,n2,,…
一个随机向量 '=( 1 , 2 ,…, n )经过一个线性变换得到一个随机向量 ' = ( 1,2 ,3,…, n ),这两个随机向量的数学期望和相关矩陈之间的关系由下列定理 给出。 定理 5.2 设 '=( 1 , 2 ,…, n ),' = ( 1,2 ,3 ,…, n )为 两个随机向量,且设 =A ,其中 A=(a ij )为一个 n n 阶方阵,则有 E =A(E ) D =A(D ) A' (5.11) 定理 5.3 设母体 服从正态分布 N( , n 2 )。(证明略) 现在我们来推导子样方差的分布。 定理 5.4 设 1 , 2 ,…, n 是正态母体 N( , n 2 )的一个子样,其子样 均值与子样方差分别为 = n 1 = n i i 1 和 2 n S = 2 1 ( ) 1 − = n i i n 则 (1) 与 2 n S 相互独立; (2) 2 n 2 n S 服从自由度为 n-1 的 2 ―分布。(证明略) 系 1 设 1 , 2 ,…, n 为取自正态母体 N( , 2 )的一个子样, 与 2 n S 分别为子样均值与子样方差,则 n S ( − ) n −1 (5.18) 是自由度为 n-1 的 t―分布。(证明略) 系 2 设 1 , 2 ,…, n 和 1,2 ,3,…, n 分别是从正态母体 N( , 2 1 )和 N( , 2 2 )抽取的两个子样,且 1 , 2 ,…, n1 和 1,2 ,3 ,…
7公相亚独立,并设S2- 15,-}与Sa-m2 ,_2(仞,-刀}分别为这两个子样的 子样方能.石=上立5与=上立分别为这两个千样的的流.于是 nil n2台 2.(m2-1)o F-nS (-1)a (5.21) 服从F(n,-L,n,-)分布。 系3设51,52,,5n为取自正态母体N(4,G2)的一个子样,,2, n,,1为取自正态母体N(4,。2)的子样,并且这两个子样相互独立,则随机变 量 (5-0-(4-4) 阳 (5.22) 服从自由度m,+n22的一分布,其中5和门2分别为这两个子样的子样均值,Sm S,分别为这两个子样的子样方差,且 S2_,S+h,S经 %+n2-2 (证明略)》
n2 相互独立,并设 2 1n1 S = 2 1 1 ( ) 1 1 − = n i i n 与 2 2n2 S = 2 1 ( ) 2 1 2 − = n i i n 分别为这两个子样的 子样方差。 = 1 1 n = 1 1 n i i 与 2 = 2 1 n = 2 1 n i i 分别为这两个子样的均值,于是 F= 2 2 2 2 1 1 2 1 n n n S n S ˙ 2 1 2 2 2 2 ( 1) ( 1) − − n n (5.21) 服从 F(n 1 -1, n 2 -1)分布。 系 3 设 1 , 2 ,…, n 为取自正态母体 N( 1, 2 )的一个子样, 1,2 , 3,…, n 为取自正态母体 N( 2, 2 )的子样,并且这两个子样相互独立,则随机变 量 1 2 1 2 1 1 ( ) ( ) n n S + − − − (5.22) 服从自由度 n 1 + n 2 -2 的 t―分布,其中 和 2 分别为这两个子样的子样均值,S 2 1n1 , S 2 1n2 分别为这两个子样的子样方差,且 2 S = 1 2 2 2 2 2 2 1 1 1 2 + − + n n n S n n S n (证明略)