§5.2中心极限定理 数限理
§52中心极限定理 人们已经知道,在自然界和生产实践中遇到的大量随机 变量都服从或近似服从正态分布,正因如此,正态分布占有 广特别重要的地位。那么,如何判断一个随机变量服从正态分 布显得尤为重要。如经过长期的观测,人们已经知道,很多 时工程测量中产生的误差都是服从正态分布的随机变量。分 可析起来,造成误差的原因有仪器偏差Ⅺ、大气折射偏差X 温度变化偏差X3、估读误差造成的偏差X4等等,这些偏差X 广对总误差X=∑X的影响都很微小,没有一个起到特别突出 的影响,虽然每个X的分布并不知道,但X=∑却服从正态 分布。类似的例子不胜枚举。 设{X为一随机变量序列,其标准化随机变量 上页
§5.2 中心极限定理 人们已经知道,在自然界和生产实践中遇到的大量随机 变量都服从或近似服从正态分布,正因如此,正态分布占有 特别重要的地位。那么,如何判断一个随机变量服从正态分 布显得尤为重要。如经过长期的观测,人们已经知道,很多 工程测量中产生的误差X都是服从正态分布的随机变量。分 析起来,造成误差的原因有仪器偏差X1、大气折射偏差X2, 温度变化偏差X3、估读误差造成的偏差X4等等,这些偏差Xi 对总误差 的影响都很微小,没有一个起到特别突出 的影响,虽然每个Xi的分布并不知道,但 却服从正态 分布。类似的例子不胜枚举。 设 为一随机变量序列,其标准化随机变量 X =Xi X =Xi { } Xn
∑x,-E(∑x,) √O空x,) (5-6) 在什么条件下mP5x=m(x),这是十八世纪以来概率论研究 的中心课题,因而,从二十世纪二十年代开始,习惯上把研究 随机变量和的分布收敛到正态分布的这类定理称为中心极限定 广理( Central limit theorems)。这里仅介绍独立同分布场合 下的中心极限定理。 定理52(林德伯格莱维( Lindeberg-Levy)中心极限定 不理)设x)是一相互独立同分布随机变量序列 EX1=,DX1=2,0<σ2<+∞,i=1,2,… 则对任意的实数,总有 上页
. (5-6) 在什么条件下, , 这是十八世纪以来概率论研究 的中心课题,因而,从二十世纪二十年代开始,习惯上把研究 随机变量和的分布收敛到正态分布的这类定理称为中心极限定 理(Central Limit Theorems)。这里仅介绍独立同分布场合 下的中心极限定理。 定理5.2 (林德伯格—莱维(Lindeberg-Lévy)中心极限定 理) 设 是一相互独立同分布随机变量序列, 则对任意的实数,总有 ( ) ( ) 1 1 1 = = = − = n i i n i n i i i n D X X E X Y lim PY x (x) n n = → { } Xn EXi = , DX i = 2 , 0 2 +, i = 1, 2,
∑X-E∑X ∑X-mH lim P i=l ≤x}= lim Pi .<x ∫e=d=(x) n→ n→)00 no 丌 ∑X (5-7) 本定理的证明在20世纪20年代由林德伯格和莱维给出,因 证明较复杂,在此从略。 由定理52可知,当n充分大时 ∑X-m 近似 工工工 N(0,1) 12o (5-8) 从而 近似 ∑X1~N(n,n2) 上页
. (5-7) 本定理的证明在20世纪20年代由林德伯格和莱维给出,因 证明较复杂,在此从略。 由定理5.2可知,当n充分大时, , (5-8) 从而, 2 1 1 1 2 1 1 lim lim d ( ) 2 n n n i i i x t i i i n n n i i X E X X n P x P x e t x n D X − = = = → → − = − − = = = ~ (0,1) 1 N n X n n i i 近似 = − ~ ( , ) 2 1 X N n n n i i 近似 =
或 近似 2 ∑X~NA,y) 二另外,对于任意的实数aMa<b和较大的n,由(58)可知 ∑ X-nu Pa ≤b≈(b)-da) (5-10) 定理5.2在概率论中占有特别重要的地位,由于它对{Xn}的 分布形式没有要求,因而得到广泛使用,对于应用吉来讲,只 c要能把问题抽象为独立同分布的随机变量之和,且这些随机变 量的均值和方差均存在,便可用(59)式近以计算概率。 上页
或 另外,对于任意的实数 和较大的n,由(5-8)可知 . (5-10) 定理5.2在概率论中占有特别重要的地位,由于它对 的 分布形式没有要求,因而得到广泛使用。对于应用者来讲,只 要能把问题抽象为独立同分布的随机变量之和,且这些随机变 量的均值和方差均存在,便可用(5-9)式近似计算概率。 ~ ( , ) 1 2 1 n X N n n i i 近似 = a,b( a b ) ( ) ( ) 1 b b a n X n P a n i i − − = { } Xn
推论1(棣莫佛拉普拉斯( De moivre- Laplace)定理) 设X为相互独立的随机变量序列,且XBLp,0<p<1, i=12,n,则对任意实数x,有 ∑X-m lim p. ≤x}= e2dt=Φ(x n-+ np(1-p) 2T (5-11) 证明只需将EX=PPx=p(1-p),=,2…,n…,代入(5-7) 二式便得(51)式 这是历史上最早的中心极限定理,棣莫佛在1716年证明了 P=2的情形,后来拉普拉斯将结果推广到一般情形。对较大 的n,由(511)或(5-8)可知 上页
推论1 (棣莫佛—拉普拉斯(De Moivre - Laplace)定理) 设 为相互独立的随机变量序列,且 ,0<p<1 , ,则对任意实数 ,有 . (5-11) 证明 只需将 , , ,代入( 5-7 ) 式便得(5-11)式. 这是历史上最早的中心极限定理,棣莫佛在1716年证明了 的情形,后来拉普拉斯将结果推广到一般情形。对较大 的n,由(5-11)或(5-8)可知 { } Xn X ~ B(1, p) i i = 1, 2, ,n, x d ( ) 2 1 (1 ) lim 1 2 2 x e t x np p X np P x t n i i n = = − − − − = → EXi = p DX p(1 p) i = − i = 1, 2, ,n, 2 1 p =
∑ X1-mp近似 np(I-p (5-12) 令∑X,则Zn~B(mp.于是,对于任意的实数ab(a<b和较 大的n,有 {a<zn≤b}= < mp(1-p)√mp(1-p)√mp(1-p 士士 ≈d(b1)-d(a1) (5-13) 其中 a-nD b np(l-p vnp(l-p 因为对较大的nP=a和Pzn=b的值很小可忽略不计所以 我们还有
. (5-12) 令 , 则 . 于是,对于任意的实数 和较 大的n,有 , (5-13) 其中 . 因为对较大的n, 和 的值很小,可忽略不计,所以 我们还有 (1 ) 1 np p X np n i i − − = ~ N(0,1) 近似 = = n i Zn Xi 1 Z ~ B(n, p) n a,b,(a b) − − − − − − = (1 ) (1 ) np(1 p) b np np p Z np np p a np P a Z b P n n ( ) ( ) b1 − a1 (1 ) , (1 ) 1 1 np p b np b np p a np a − − = − − = P{Z a} n = P{Z b} n =
P{≤Zn≤b}≈Φ(b1)-d(a1) P{≤Zn时,常用正态分布 做二项分布的近似计算。 王页下
, , . 关于这些近似公式的使用,现作如下说明: (1)注意到 ,则(5-13)表明,对固定的p和较 大的n,二项分布可用正态分布逼近; (2)“较大的n”是一个较为模糊的概念,究竟多大才是较 “大”要依据实际问题来定。一般地,如果n≥50(有时亦可放 宽到n≥30),就可认为是较大的n; (3)第二章泊松定理表明,当p很小(可设想成p随n的变 化趋于0)、n较大且np不太大时,二项分布可用泊松分布逼 近。在实际中,当p≤0.1、n较大且np≤5时,常用泊松分布 (见附表1)逼近二项分布;当n较大且np>5时,常用正态分布 做二项分布的近似计算。 Pa Zn b ( ) ( ) b1 − a1 Pa Zn b ( ) ( ) b1 − a1 Pa Zn b ( ) ( ) b1 − a1 Z ~ B(n, p) n
c最后,我们指出大数定律与中心极限定理的区别: 设{Xn)为独立同分布随机变量序列,且EX=,DX=02>0, 则由定理5.1的推论1,对于任意的>0有 imP∑x,-0及某固定的n有 1∑ nE X1-4<E}=P Ino na r由于2 因此,在所给条件下,中心极限定理不 仅给出了概率的近似表达式,而且也能保证了其极限是1,可 见中心极限定理的结论更为深入。 上页
最后,我们指出大数定律与中心极限定理的区别: 设 为独立同分布随机变量序列,且 , , 则由定理5.1的推论1,对于任意的ε>0有 . 大数定律并未给出 的表达式,但保证了其极限是1. 而在以上条件下,中心极限定理5.2(林德伯格—莱维)亦 成立,这时,对于任意的ε>0及某固定的n,有 . 由于 ,因此,在所给条件下,中心极限定理不 仅给出了概率的近似表达式,而且也能保证了其极限是1,可 见中心极限定理的结论更为深入。 { } Xn EXi = 0 2 DX i = 1 1 lim 1 = − = → n i i n X n P − = n i Xi n P 1 1 − = − = n n X n X P n P n i i i 1 1 2 −1⎯ ⎯→1 n→ n