第三节抽样分布 分布图示 ★抽样分布 ★单正态总体的抽样分布 ★例1 ★例2 ★例3 ★例4 ★双正态总体的抽样分布 ★例6 ★例7 ★一般总体抽样分布的极限分布 ★内容小结 ★课堂练习 ★习题5-3 ★返回 内容要点 、抽样分布 有时,总体分布的类型虽然已知,但其中含有未知参数,此时需对总体的未知参数或对 总体的重要数字特征(如数学期望、分差等)进行统计推断,此类问题称为参数统计推断在 参数统计推断问题中,常需利用总体的样本构造出合适的统计量,并使其服从或渐近地服从 已知的总体分布.统计学中泛称统计量分布为抽样分布 讨论抽样分布的途径有两个.一是精确地求出抽样分布,并称相应的统计推断为小样本 统计推断;另一种方式是让样本容量趋于无穷,并求出轴样分布的极限分布然后在样本容 量充分大时,再利用该极限分布作为抽样分布的近似分布,进而对未知参数进行统计推断 称与此相应的统计推断为大样本统计推断.这里重点讨论正态总体的抽样分布,属小样本统 计范畴;此外,也简要介绍一般总体的某些抽样分布的极限分布,属大样本统计范畴。 二、单正态总体的抽样分布 设总体X的均值,方差为a2,X12…,Xn是取自X的一个样本,与S2分别为该样 本的样本均值与样本方差,则有 E(X=u, D(X) 而E(S)=E1∑x2-n ∑E(x2)-nE(X2) (G2+x2)-n(a2/n+2) 故有下列定理 定理1设总体X~N(a2),x1,X2…,X是取自X的一个样本,R与S2分别为该样 本的样本均值与样本方差,则有 (1)X~N(A,a2/m) (2)U= N(0,1) F/vn 定理2设总体X~N(以o2),x1,X2…,Xn是取自x的一个样本,与S2分别为该样 本的样本均值与样本方差,则有 (1)x2==s2=2(X1-)2~x2(m-1) (2)X与S2相互独立 定理3设总体X~N(,a2),x12M2…,Xn是取自X的一个
第三节 抽样分布 分布图示 ★ 抽样分布 ★ 单正态总体的抽样分布 ★ 例1 ★ 例2 ★ 例3 ★ 例4 ★ 例5 ★ 双正态总体的抽样分布 ★ 例6 ★ 例7 ★ 一般总体抽样分布的极限分布 ★ 内容小结 ★ 课堂练习 ★ 习题 5-3 ★ 返回 内容要点 一、抽样分布 有时, 总体分布的类型虽然已知, 但其中含有未知参数,此时需对总体的未知参数或对 总体的重要数字特征(如数学期望、分差等) 进行统计推断, 此类问题称为参数统计推断.在 参数统计推断问题中, 常需利用总体的样本构造出合适的统计量, 并使其服从或渐近地服从 已知的总体分布. 统计学中泛称统计量分布为抽样分布. 讨论抽样分布的途径有两个. 一是精确地求出抽样分布, 并称相应的统计推断为小样本 统计推断; 另一种方式是让样本容量趋于无穷, 并求出轴样分布的极限分布.然后,在样本容 量充分大时, 再利用该极限分布作为抽样分布的近似分布, 进而对未知参数进行统计推断, 称与此相应的统计推断为大样本统计推断. 这里重点讨论正态总体的抽样分布, 属小样本统 计范畴;此外, 也简要介绍一般总体的某些抽样分布的极限分布, 属大样本统计范畴。 二、单正态总体的抽样分布 设总体 X 的均值 ,方差为 2 , X X Xn , , , 1 2 是取自 X 的一个样本, X 与 2 S 分别为该样 本的样本均值与样本方差, 则有 ( ) , ( ) , 2 E X = D X = 而 − − = = n i Xi nX n E S E 1 2 2 2 1 1 ( ) ( ) ( / ) . 1 1 ( ) ( ) 1 1 2 1 2 2 2 2 1 2 2 = + − + − = − − = = = n i n i i n n n E X nE X n 故有下列定理: 定理1 设总体 ~ ( , ), 2 X N X X Xn , , , 1 2 是取自X 的一个样本, X 与 2 S 分别为该样 本的样本均值与样本方差, 则有 (1) ~ ( , / ) 2 X N n ; (2) ~ (0,1). / N n X U − = 定理2 设总体 ~ ( , ), 2 X N X X Xn , , , 1 2 是取自X 的一个样本, X 与 2 S 分别为该样 本的样本均值与样本方差, 则有 (1) 2 = ( ) ~ ( 1); 1 1 2 1 2 2 2 2 = − − − = S X X n n n i i (2) X 与 2 S 相互独立. 定理 3 设总体 ~ ( , ), 2 X N X X Xn , , , 1 2 是取自 X 的一个
样本,与S2分别为该样本的样本均值与样本方差,则有 ()x2=1(x1-m)2-x(m (2)7sX-(m-1 S/√n 三、双正态总体的抽样分布 定理4设X~N(A,2)与Y~N(2,a2)是两个相互独立的正态总体,又设 x1X2…X是取自总体X的样本,X与S2分别为该样本的样本均值与样本方差 H1,Y2,…,Y是取自总体Y的样本,F与S2分别为此样本的样本均值与样本方差.再记S是 S2与S2的加权平均,即 则(1)U= (x-)-(-2-No ~F(n1-1,n2-1) 7≈(F- S 2~1(m1+n2-2 四、一般总体抽样分布的极限分布 定义1设F(x)为随机变量Xn的分布函数,F(x)为随机变量X的分布函数,并记C(F) 为由F(x)的全体连续点组成的集合,若 F(x)=F( 则称随机变量Xn依分布收敛于X,简记为 Xn—X或F(x)-F(x) 命题设随机变量X有连续的分布函数,且有 Xn XY 定理5设x1,2,…Xn为总体X的样本并设总体X的数学期望与方差均存在记为 EX=,DX=a2记统计量 T 其中星与S分别表示上述样本的样本均值与样本方差,则有 (1)FU(x)->o(x),(2)Fr.(x) 以上Fn(x),F(x)与x)分别表示Un2Tn与标准正态分布的分布函数 注:定理4成立的条件只是总体的方差存在,这样当样本的容量n充分大时,Un和Tn 都近似地服从标准正态分布,因此在G2已知时,可用Un对进行统计推断;在a2未知时 可用T对μ进行统计推断。 例题选讲
样本, X 与 2 S 分别为该样本的样本均值与样本方差, 则有 (1) ( ) ~ ( ) 1 2 1 2 2 2 X n n i i = = − (2) ~ ( 1). / − − = t n S n X T 三、双正态总体的抽样分布 定 理 4 设 ~ ( , ) 2 X N 1 1 与 ~ ( , ) 2 Y N 2 2 是两个相互独立的正态总体, 又 设 1 , , , X1 X2 Xn 是取自总体 X 的样本, X 与 2 1 S 分别为该样本的样本均值与样本方差. 2 , , , Y1 Y2 Yn 是取自总体Y的样本, Y 与 2 2 S 分别为此样本的样本均值与样本方差. 再记 2 Sw 是 2 1 S 与 2 2 S 的加权平均, 即 . 2 ( 1) ( 1) 1 2 2 2 2 2 2 1 1 + − − + − = n n n S n S Sw 则 (1) ~ (0,1); / / ( ) ( ) 2 2 1 2 2 1 1 2 N n n X Y U + − − − = (2) ~ ( 1, 1); 1 2 2 2 2 1 2 1 2 − − = F n n S S F (3) 当 2 2 2 2 1 = = 时, ~ ( 2). 1/ 1/ ( ) ( ) 1 2 1 2 1 2 + − + − − − = t n n S n n X Y T w 四、一般总体抽样分布的极限分布 定义 1 设 F (x) n 为随机变量 Xn 的分布函数, F(x) 为随机变量 X 的分布函数,并记 C(F) 为由 F(x) 的全体连续点组成的集合, 若 lim F (x) F(x), x C(F), n n = → 则称随机变量 Xn 依分布收敛于 X, 简记为 X X d n ⎯→ 或 F (x) F(x) d n ⎯→ . 命题 设随机变量 X 有连续的分布函数,且有 ⎯→ , ⎯→1, P n d Xn X Y 则 X Y X. d n n ⎯→ 定理 5 设 X X Xn , , , 1 2 为总体 X 的样本,并设总体 X 的数学期望与方差均存在, 记为 ; . 2 EX = DX = 记统计量 , / , / S n X T n X Un n − = − = 其中 X 与 S 分别表示上述样本的样本均值与样本方差,则有 (1) ( ) ( ), (2) ( ) ( ), 0 0 F x x F x x d T d Un n ⎯→ ⎯→ 以上 F (x) Un , F (x) Tn 与 (x) 分别表示 Un Tn , 与标准正态分布的分布函数. 注: 定理 4 成立的条件只是总体的方差存在,这样当样本的容量 n 充分大时, Un和Tn 都近似地服从标准正态分布,因此在 2 已知时,可用 Un 对 进行统计推断;在 2 未知时, 可用 Tn 对 进行统计推断。 例题选讲
单正态总体的抽样分布 例1(E01)设X~N(21,2),x1,x2,…,X25为X的一个样本求 (1)样本均值X的数学期望与方差;(2)PX-21k024} 解(1)由于X~N(212),样本容量n=25 所以X~M22于是E(X)=2L,D(X) 0 (2)由x~N(21042).得X-21 故P{|x-21k0.24}=P ≤06}=20.6)-1=04514 0.4 例2(E02)假设某物体的实际重量为4,但它是未知的现在用一架天平去称它,共称 了n次得到X1,X2…,Xn假设每次称量过程彼此独立且没有系统误差,则可以认为这些测 量值都服从正态分布N(A,a2),方差a2反映了天平及测量过程的总精度,通常我们用样本 均值X去估计u,根据定理1,X~M9再从正态分布的3性质知 PlIx-uk 3c.7% 这就是说,我们的估计值x与真值的偏差不超过30/√m的概率为99%,并且随着称量次 数n的增加,这个偏差界限3/√n愈来愈小例如若a=0,n=10.则 1x-k、3×0=P又一k092997%, 10 于是我们以997%的概率断言,X与物体真正重量μ的偏差不超过0.09.如果将称量次数n 增加到100,则 3×0.1 1-k00=Px-k00y297 这时,我们以同样的概率断言,X与物体真正重量山的偏差不超过003 例3(F03)在设计导弹发射装置时,重要事情之一是研究弹着点偏离目标中心的距离的 方差对于一类导弹发射装置,弹着点偏离目标中心的距离服从正态分布N(,a2),这里 a2=100米2,现在进行了25次发射试验,用S2记这25次试验中弹着点偏离目标中心的距 离的样本方差试求S2超过50米2的概率 解根据定理2,有(-)5-x2(m-1,于是 P{S2>50}=P (24) =P{x2(24)>12}>Px2(24)>1240l}=0975(查表
单正态总体的抽样分布 例 1(E01) 设 ~ (21,2 ), 2 X N 1 2 25 X , X , , X 为 X 的一个样本,求: (1) 样本均值 X 的数学期望与方差; (2) P{| X − 21| 0.24}. 解 (1) 由于 ~ (21,2 ), 2 X N 样本容量 n = 25, 所以 , 25 2 ~ 21, 2 X N 于是 E(X) = 21, 0.4 . 25 2 ( ) 2 2 D X = = (2) 由 ~ (21,0.4 ), 2 X N 得 ~ (0,1), 0.4 21 N X − 故 − − = 0.6 0.4 21 {| 21| 0.24} X P X P = 2(0.6) −1= 0.4514. 例 2 (E02) 假设某物体的实际重量为 , 但它是未知的. 现在用一架天平去称它, 共称 了n次,得到 X X Xn , , , 1 2 . 假设每次称量过程彼此独立且没有系统误差, 则可以认为这些测 量值都服从正态分布 ( , ) 2 N , 方差 2 反映了天平及测量过程的总精度, 通常我们用样本 均值 X 去估计 , 根据定理 1, ~ , . 2 n X N 再从正态分布的 3 性质知 99.7%. 3 | | − n P X 这就是说, 我们的估计值 X 与真值 的偏差不超过 3 / n 的概率为 99.7%,并且随着称量次 数 n 的增加, 这个偏差界限 3 / n 愈来愈小. 例如若 = 0.1, n =10 . 则 {| | 0.09} 99.7%, 10 3 0.1 | | = − P X − P X 于是我们以 99.7%的概率断言, X 与物体真正重量 的偏差不超过 0.09. 如果将称量次数 n 增加到 100, 则 {| | 0.03} 99.7%. 100 3 0.1 | | = − P X − P X 这时, 我们以同样的概率断言, X 与物体真正重量 的偏差不超过 0.03. 例 3 (E03) 在设计导弹发射装置时, 重要事情之一是研究弹着点偏离目标中心的距离的 方差.对于一类导弹发射装置, 弹着点偏离目标中心的距离服从正态分布 ( , ) 2 N , 这里 2 2 =100米 , 现在进行了 25 次发射试验, 用 2 S 记这 25 次试验中弹着点偏离目标中心的距 离的样本方差. 试求 2 S 超过 50 米2 的概率. 解 根据定理 2, 有 ~ ( 1), ( 1) 2 2 2 − − n n S 于是 − − = 2 2 2 2 ( 1) ( 1)50 { 50} n S n P S P = 100 25 50 (24) 2 P { (24) 12} 2 = P { (24) 12.401} 2 P = 0.975. (查表)
于是我们可以以超过975%的概率断言,S2超过50米2 例4从正态总体N(052)中抽取容量为10的样本X1X2,…,X10X是样本的均值,若 未知,计算概率 )2>168与P∑(X-X)2 解计算与随机变量有关的事件的概率,必须知道该随机变量的分布 若未知,由X~N(4,052),以及定理2和定理3,有(x1-)/0.5~N(01) )2~x2(10) 0.5 12 0.5 x2-)2168}=P4x2-m)2672 P∑(X1-x)2285}=1-P∑(X1-x)2285}=1-4∑(x-x)214 查x2分布表知:x25(10)=6737,x25(9)=114, 所以 P∑(X1-m)2168}=075,P∑(X1-X)30.615}
于是我们可以以超过 97.5% 的概率断言, 2 S 超过 50 米 2 . 例 4 从正态总体 ( ,0.5 ) 2 N 中抽取容量为10的样本 , , , . X1 X2 X10 X 是样本的均值, 若 未知, 计算概率 − = ( ) 1.68 10 1 2 i P Xi 与 − = ( ) 2.85 10 1 2 i P Xi X . 解 计算与随机变量有关的事件的概率, 必须知道该随机变量的分布. 若 未知,由 ~ ( ,0.5 ), 2 X N 以及定理 2 和定理 3, 有 (X )/ 0.5 ~ N(0,1), i − 4 ( ) ~ (10), 0.5 2 10 1 2 2 10 1 = = = − − i i i i X X 4 ( ) ~ (9), 0.5 2 10 1 2 2 10 1 = = = − − i i i i X X X X 故 ( ) 1.68 4 ( ) 6.72 , 10 1 2 10 1 2 = − − = i= i i P Xi P X = − − − = = 10 1 2 10 1 2 ( ) 2.85 1 ( ) 2.85 i i i P Xi X P X X 1 4 ( ) 11.4 . 10 1 2 = − − i= P Xi X 查 2 分布表知: (10) 6.737, 2 0.75 = (9) 11.4, 2 0.25 = 所以 ( ) 1.68 0.75; 10 1 2 = − i= P Xi ( ) 2.85 1 0.25 0.75. 10 1 2 = − = − i= P Xi X 例 5 从正态总体 ~ ( , ) 2 X N 中抽取容量为 16 的一个样本, 2 X, S 分别为样本的均值 和方差. 若 2 , 均未知, 求 2 S 的方差 2 DS 及概率 2.041 2 2 S P . 解 因为 ~ ( , ), 2 X N 由定理 2, 得 ~ ( 1), ( 1) 2 1 2 2 2 − − = − = n n S X X n i i 所以 1, ( 1) 2 2 = − − n n S E 2( 1), ( 1) 2 2 = − − n n S D 于是 ( ) , 2 2 E S = ( ) 2 /( 1). 2 4 D S = n − 当 n = 16 时, ( ) 2 /15, 2 4 D S = 且 { / 2.041} {15 / 30.615} 2 2 2 2 P S = P S 1 {15 / 30.615} 2 2 = − P S
=1-0.01=0.99(x60(15)=30.578) 双正态总体的抽样分布 例6E04)设两个总体X与Y都服从正态分布N(20,3),今从总体x与y中分别抽得容 量n1=10,n2=15的两个相互独立的样本,求P{x-F|0.3} 解由题设及定理4,知(x-1)=(20=-20)=x=N0 33 V1015 于是 P1xF03=1-P15FJ05 2-2c(042)=06744 例7(E05)设总体X和y相互独立且都服从正态分布N(30,32),x1…,X20;H1,…,Y2 分别来自总体X和Y的样本,X,,S2和S2分别是这两个样均值和方差,求 PS2/S2≤04 解因σ1=a2=32,由定理4,S2/S2~F(20-125-1),即S2/S2~F(1924) 因F分布表中没有n1=19,但由F分布的性质,知S2/S2~F(24,19), 于是P{S2S2≤04}=P{S2S2≥2.5} 查表有F025(2419)=245,即P(F(2419)>245}=0025,故PS2/S2≤04}≈0.025 课堂练习 设X,X2,…15为正态总体N(0,32)的一个样本,X为样本均值,求 ≤∑(X1-X)2 2.设x1,X2,…,Xn为总体x~N(A,a2)的一个样本,和S2为样本均值和样本方差 又设新增加一个试验量Xn+1,xn与x1,…,Xn也相互独立,求统计量 U n+ 的分布
=1− 0.01 = 0.99 ( (15) 30.578). 2 0.01 = 双正态总体的抽样分布 例 6(E04) 设两个总体 X 与 Y 都服从正态分布 N(20,3) ,今从总体 X 与 Y 中分别抽得容 量 n1 =10, n2 =15 的两个相互独立的样本, 求 P{| X −Y | 0.3}. 解 由题设及定理 4, 知 ~ (0,1), 0.5 15 3 10 3 ( ) (20 20) N X Y X −Y = + − − − 于是 P{| X −Y | 0.3} − = − 0.5 0.3 0.5 1 X Y P − = − 1 0.5 0.3 1 2 = 2 − 2(0.42) = 0.6744. 例 7 (E05) 设总体X 和 Y 相互独立且都服从正态分布 (30,3 ); 2 N 1 20 1 25 X , , X ; Y , ,Y 分别来自总体 X 和 Y 的样本, X ,Y , 2 1 S 和 2 2 S 分别是这两个样 均值和方差, 求 { / 0.4}. 2 2 2 P S1 S 解 因 3 , 2 1 = 2 = 由定理 4, / ~ (20 1,25 1), 2 2 2 S1 S F − − 即 / ~ (19,24). 2 2 2 S1 S F 因 F 分布表中没有 19, n1 = 但由 F 分布的性质, 知 / ~ (24,19), 2 1 2 S2 S F 于是 { / 0.4} { / 2.5} 2 1 2 2 2 2 2 P S1 S = P S S 查表有 (24,19) 2.45, F0.025 = 即 P{F(24,19) 2.45}= 0.025, 故 { / 0.4} 0.025. 2 2 2 P S1 S 课堂练习 1. 设 1 2 15 X , X , , X 为正态总体 (0,3 ) 2 N 的一个样本, X 为样本均值, 求: 36.65 ( ) 235 . 15 1 2 − i= P Xi X 2. 设 X X X n , , , 1 2 为总体 ~ ( , ) 2 X N 的一个样本, X 和 2 S 为样本均值和样本方差. 又设新增加一个试验量 1 1 , X n+ X n+ 与 X Xn , , 1 也相互独立, 求统计量 1 1 + − = + n n S X X U n 的分布