4.3中心极限定理 在前一章介绍正态分布时曾经特别强调了正态分布在概率论 与数理统计中的地位与作用。为什么许多随机变量会遵循正 态分布?仅仅是一些人的经验猜测还是确有理论依据,这当 然是一个重要的问题。我们已经知道,高斯在研究误差理论 时已经用到了正态分布,现在不妨来考察一下“误差”是怎 样的一个随机变量?以炮弹的射击误差为例,设靶心是坐标 原点,多次射击的结果,炮弹的着地点(称为弹着点)的坐 标为(E,1),它是一个二维的随机变量,一般认为它服从 二维正态分布。读者已经知道,它的每间一个分量E与1都
是正态分布的随机变量,这到底是为什么?我们知道与门 分别表示弹着点与靶心的横向与纵向误差。要搞清楚误差是 什么样的随机变量,有必要先研究一下造成误差的原因是什 么?即炮身在瞄准后不再改变,那么在每次射击以后,它也 会因为震动而造成微小的偏差5,每发炮弹外形上的细小差 别而引起空气阻力不同而出现的误差52,在每发炮弹的炸药 的数量或质量上的微小差异引起的误差,炮弹在前进时遇 到的空气流的微小扰动而造成弹着点的误差等许多原因
每种原因引起一个微小的误差,有的为正,有的为负,都是 随机的,而弹着点的总误差飞(或门)是这许多随机小误差 的总和,即 gjzsj 而且这许多小误差,可以看成彼此间是相互独立的。因此 要讨论号的分布就要讨论独立随机变量和的分布问题,而$ 4.1中讨论的大数定律部分地也是独立随机变量和的问题(如 果{传}是独立的随机变序列),现在我们就来研究独立随机
变量和当 ∑员当n→w时的统计规律。为了使问题有意义, i.1 有必要先研究一下问题的提法!你是否觉得奇怪,提问题还要 注意“提法”以贝努里大数定律中的=∑:为例,当 i-l n→o时, ]i山m∑:可以取值c0,这种情形就没有什么意 格→0 i-1 义,因为我们讨论的只是取有限值的随机变量。贝努里大数 定律告诉我们: h→00
这是因为先进行了“中心化”,并且在分母有一个因子n,它比 分子的取值增长得快,所以整个分式依概率收敛于0。显然, 如果把分母换成n+(60),则上述结论仍然成立,因为 这时分母增长得更快,讨论这种情形也就没有什么意义了。 由此得到启示,在讨论独立随机变量和的分布当n→0时的 极限行为时,为了使问题有意义,可以先进行“中心化”,然 后在分母中放上一个增长得不快不慢的因子,这个因子如何 选取呢?让我们回忆一下前面的标准化方法,仍以 从=∑为例,即考虑: i-1
这时,对任意的n,都有ESx=0,DSx=l.因而当n→co时, S不至于发生趋向于c0或0这种情形,这时讨论它的分布函 数的极限才有意义(请读者与例4.4对照)。如果物(=1, 2,…)服从参数为p的二点分布的独立随机变量序列,有下 述历史上颇为有名的德莫佛拉普拉斯极限定理。 定理4.8在n重贝努里试验中,事件A在每次试验中 出现的概率为p(0<p<1),4为n次试验中事件A出现的 次数,则 (4.10)
这个定理只是下述林德贝尔格勒维定理的特例。现在我们引 出下述定理。 定理48若气,52,5,…是一列独立同分布的随 机变量,且 E5ka,D5k=2(G2>0),k=1,2,… 则有gizsj -加 lim P “e2dt σ√a x字 2π (4.11)
从定理可知,德莫佛-拉普拉斯定理比眉心努里大数定律更 强,也更有用。 例4.3 某单位内部有260架电话分机,每个分机有4 %的时间要用外线通话,可以认为各个电话分 机用不用外线是相互独立的,问总机要备有多 少条外线才能以的把握保证各个分机在用外 线时不必等候。 解令gjzs 「1,第:个分机要用外线 1h= i=1,2,…,260 0,第个分机不用外线 则 P(乃=1)=0.04=p (g=1-p=0.960
如果260架分机中同时要求使用外线的分机数为L260,显 然有gjzs 260 儿260-27 i-1 据题意是要求确定最小的整数x,使得 P(L260<x) ≥0.95 成立。因为n=20较大,所以有 P(儿260<x)=P 0-2602<-2602 √/26029 √2602g 1 2dt
其中b= x-2602. 查N(0,1)分类,知道④(1.65) √/260pg 0.9505>0.95,故取b=1.65,于是b·√2602g+260p 水p=0.04,q4=0.96及b=1.65代入,即可求得 815.61 取最接近的整=16。所以总机至少应备有16条外线,才能 有95%以上的把握保证各个分机在使用外线时不必等候