§4.3中心极限定理 在前一章介绍正态分布时曾经特别强调了正态分布在概率论与数理统计中的地位与作用。为 什么许多随机变量会遵循正态分布?仅仅是一些人的经验 还是确有理论依据, 当然是 个重要的问题。我们已经知道,高斯在研究误差理论时已经用到了正态分布,现在不妨来 考察一下“误差”是怎样的一个随机变量?以炮弹的射击误差为例,设靶心是坐标原点,多 次射击的结果,炮弹的者地点(称为弹着点)的坐标为(£,刀),它是一个二维的随机变 量,一般认为它服从二维正态分布。读者已经知道,它的每间一个分量£与门都是正态分布 的随机变量,这到底是为什么?我们知道£与刀分别表示弹者点与靶心的横向与纵向误差。 要搞清楚误差是什么样的随机变量,有必要先研究一下造成误差的原因是什么?即炮身在瞄 准后不再改变,那么在每次射击以后,它也会因为震动而造成微小的偏差,每发炮弹外 形上的细小差别而引起空气阻力不同而出现的误差52,在每发炮弹的炸药的数量或质量上 的微小差异引起的误差5,炮弹在前进时遇到的空气流的微小扰动而造成弹着点的误差4 等许多原因。每种原因引起一个微小的误差,有的为正,有的为负,都是随机的,而弹者点 的总误差5(或门)是这许多随机小误差的总和,即 e=∑5 而且这许多小误差5,可以看成彼此间是相互独立的。因此要讨论:的分布就要讨论独立 随机变量和的分布问题,而§4.1中讨论的大数定律部分地也是独立随机变量和的问题(如 果{佔}是独立的随机变量序列),现在我们就来研究独立随机变量和当∑5,当n→∞时的 统计规律。为了使问题有意义,有必要先研究一下问题的提法你是否觉得奇怪,提问题还 要注意“提法”以贝努里大数定律中的P。=∑n,为例,当n→o时,im∑n,可以取 值0,这种情形就没有什么意义,因为我们讨论的只是取有限值的随机变量。贝努里大数 定律告诉我们: n-2E)h→0,n→∞ 这是因为先进行了“中心化”,并且在分母有一个因子它比分子的取值增长得快,所以整 个分式依概率收敛于0。显然,如果把分母换成+6(6>),则上述结论仍然成立,因为 这时分母增长得更快,讨论这种情形也就没有什么意义了。由此得到启示,在讨论独立随机 变量和的分布当→∞时的极限行为时,为了使问题有意义,可以先进行“中心化”,然后 在分母中放上一个增长得不快不慢的因子,这个因子如何选取呢?让我们回忆一下前面的标
§4.3 中心极限定理 在前一章介绍正态分布时曾经特别强调了正态分布在概率论与数理统计中的地位与作用。为 什么许多随机变量会遵循正态分布?仅仅是一些人的经验猜测还是确有理论依据,这当然是 一个重要的问题。我们已经知道,高斯在研究误差理论时已经用到了正态分布,现在不妨来 考察一下“误差”是怎样的一个随机变量?以炮弹的射击误差为例,设靶心是坐标原点,多 次射击的结果,炮弹的着地点(称为弹着点)的坐标为( , ),它是一个二维的随机变 量,一般认为它服从二维正态分布。读者已经知道,它的每间一个分量 与 都是正态分布 的随机变量,这到底是为什么?我们知道 与 分别表示弹着点与靶心的横向与纵向误差。 要搞清楚误差是什么样的随机变量,有必要先研究一下造成误差的原因是什么?即炮身在瞄 准后不再改变,那么在每次射击以后,它也会因为震动而造成微小的偏差 1 ,每发炮弹外 形上的细小差别而引起空气阻力不同而出现的误差 2 ,在每发炮弹的炸药的数量或质量上 的微小差异引起的误差 3 ,炮弹在前进时遇到的空气流的微小扰动而造成弹着点的误差 4 等许多原因。每种原因引起一个微小的误差,有的为正,有的为负,都是随机的,而弹着点 的总误差 (或 )是这许多随机小误差的总和,即 =i i 而且这许多小误差 i ,可以看成彼此间是相互独立的。因此要讨论 的分布就要讨论独立 随机变量和的分布问题,而§4.1 中讨论的大数定律部分地也是独立随机变量和的问题(如 果 i 是独立的随机变量序列),现在我们就来研究独立随机变量和当 = n i i 1 当 n → 时的 统计规律。为了使问题有意义,有必要先研究一下问题的提法!你是否觉得奇怪,提问题还 要注意“提法”!以贝努里大数定律中的 n == n i i 1 为例,当 n → 时, lim n→ = n i i 1 可以取 值 ,这种情形就没有什么意义,因为我们讨论的只是取有限值的随机变量。贝努里大数 定律告诉我们: E n n i i n i i ( ) 1 1 = = − ⎯⎯→0 p , n → 这是因为先进行了“中心化”,并且在分母有一个因子 n,它比分子的取值增长得快,所以整 个分式依概率收敛于 0。显然,如果把分母换成 n 1+ ( >0),则上述结论仍然成立,因为 这时分母增长得更快,讨论这种情形也就没有什么意义了。由此得到启示,在讨论独立随机 变量和的分布当 n → 时的极限行为时,为了使问题有意义,可以先进行“中心化”,然后 在分母中放上一个增长得不快不慢的因子,这个因子如何选取呢?让我们回忆一下前面的标
准化方法,仍以”。=∑n,为例,即考虑: s,-2m-2m/2n)-2m-mm网 这时,对任意的n,都有ES,0,DS,=l。因而当n→0时,S,不至于发生趋向于o或0 这种情形,这时讨论它的分布函数的极限才有意义(请读者与例4.4对照)。如果(=1, 2,…)服从参数为p的二点分布的独立随机变量序列,有下述历史上领为有名的德莫佛 拉普拉斯极限定理。 定理4.8在n重贝努里试验中,事件A在每次试验中出现的概率为p(00),k=l,2,… 则有 25-a lim P -<x (4.11) 从定理可知,德莫佛-拉普拉斯定理比眉心努里大数定律更强,也更有用。 例4.3某单位内部有260架电话分机,每个分机有4%的时间要用外线通话,可以 认为各个电话分机用不用外线是相互独立的,问总机要备有多少条外线才能 以的把握保证各个分机在用外线时不必等候。 解令 「L第个分机要用外线 10.第个分机不用外线 i1,2,…,260 多 P(7,=1)=0.04=p(ql-p=0.96) 如果260架分机中同时要求使用外线的分机数为山260,显然有
准化方法,仍以 n == n i i 1 为例,即考虑: S n = ( ) ( ) 1 1 1 = = = − n i i n i i n i i E D = np npq n i i − =1 这时,对任意的 n,都有 ES n =0,DS n =1。因而当 n → 时,S n 不至于发生趋向于 或 0 这种情形,这时讨论它的分布函数的极限才有意义(请读者与例 4.4 对照)。如果 n (i=1, 2,…)服从参数为 p 的二点分布的独立随机变量序列,有下述历史上颇为有名的德莫佛- 拉普拉斯极限定理。 定理 4.8 在 n 重贝努里试验中,事件 A 在每次试验中出现的概率为 p(00),k=1,2,… 则有 lim n→ P − = x n na n k k 1 = e dt x t − − 2 2 2 1 (4.11) 从定理可知,德莫佛-拉普拉斯定理比眉心努里大数定律更强,也更有用。 例4.3 某单位内部有 260 架电话分机,每个分机有 4%的时间要用外线通话,可以 认为各个电话分机用不用外线是相互独立的,问总机要备有多少条外线才能 以的把握保证各个分机在用外线时不必等候。 解 令 i = 第 个分机不用外线 第 个分机要用外线 i i 0, 1, i=1,2,…,260 则 P( i =1)= 0.04 = p (q=1-p =0.96) 如果 260 架分机中同时要求使用外线的分机数为 260 ,显然有 260 == 260 i 1 i
据题意是要求确定最小的整数x,使得 P(h260<x)≥0.95 成立。因为n=260较大,所以有 P(4260)=p4-2602<=2602 260pg e 其中b-260P。查N(0,1)分类,知道中165)*09505095,故取b时165,于是 260pq x=b·√260p9+260p 以p=0.04,q=0.96及b=1.65代入,即可求得 x≈15.61 取最接近的整x=16。所以总机至少应备有16条外线,才能有95%以上的把握保证各个分 机在使用外线时不必等候
据题意是要求确定最小的整数 x,使得 P( 260 0.95,故取 b=1.65,于是 x=b· 260pq + 260p 以 p=0.04,q=0.96 及 b=1.65 代入,即可求得 x 15.61 取最接近的整 x=16。所以总机至少应备有 16 条外线,才能有 95%以上的把握保证各个分 机在使用外线时不必等候