第二讲中心极限定理 I.授课题目(章节) §5.2中心极限定理 Ⅱ.教学目的与要求, 会用中心极限定理求概率 Ⅲ.教学重点与难点: 重点:独立同分布的中心极限定理,德莫佛一拉普拉斯定理。 难点:了解独立同分布的中心极限定理和德莫佛一拉普拉斯定理(仁项分布以正态分布 为极限分布)的应用条件和结论,并会用相关定理近似计算有关随机事件的概率。 V.讲授内容: 在客观实际中有许多随机变量,它们是由大量的相互独立的随机因素的综合影响所形成 的。而其中每一个别因素在总的影响中所起的作用都是微小的。这种随机变量往往折地服 从正态分布。这种现象就是中心极限定理的客观背景。本节只介绍三个常用的中心极限定理 定理一(独立同分布的中心极限定理)设随机变量X,X,.,X,.相互独立,服从 同一分布,且具有数学期望和方差:E(X)=4,D(X)=o2>0(k=1,2,),则随机变 之和:的标准化变品 名位到名w ②x 的分布函数F(x)对于任意x满足 lim F.(x)=lim p -L%=》 证明略。 这就是说,均值为4,方差为σ2>0的独立同分布的随机变量X,,X2,.,X,和 会X,的标准靴变量。当加充分大时。有 x. 似地=N(0,1). √no (2.2) 在一般情况下,很难求出n个随机变量之和工X:的分布函数,(2.2)式表明,当n充
第二讲中心极限定理 Ⅰ.授课题目(章节) §5.2 中心极限定理 Ⅱ.教学目的与要求: 会用中心极限定理求概率 Ⅲ.教学重点与难点: 重点:独立同分布的中心极限定理,德莫佛—拉普拉斯定理。 难点:了解独立同分布的中心极限定理和德莫佛—拉普拉斯定理(二项分布以正态分布 为极限分布)的应用条件和结论,并会用相关定理近似计算有关随机事件的概率。 Ⅳ.讲授内容: 在客观实际中有许多随机变量,它们是由大量的相互独立的随机因素的综合影响所形成 的。而其中每一个别因素在总的影响中所起的作用都是微小的。这种随机变量往往近似地服 从正态分布。这种现象就是中心极限定理的客观背景。本节只介绍三个常用的中心极限定理。 定理一(独立同分布的中心极限定理) 设随机变量 X1, X2 ,., X n ,.相互独立,服从 同一分布,且具有数学期望和方差: ( ) , ( ) 0( 1,2, ) E Xk = D Xk = 2 k = ,则随机变 量之和 = n k X K 1 的标准化变量: n X n D X X E X Y n k k n k k n k n k k k n − = − = = = = = 1 1 1 1 的分布函数 F (x) n 对于任意 x 满足 ( ) 2 1 lim ( ) lim 1 2 2 x e dt x n X n F x p x t n k K n n n = = − = − − = → → . (2.1) 证明略。 这就是说,均值为 ,方差为 0 2 的独立同分布的随机变量 X1, X2 ,., X n 和 = n k X k 1 的标准化变量,当 n 充分大时,有 n X n k k =1 近似地=N(0,1). (2.2) 在一般情况下,很难求出 n 个随机变量之和 = n k X k 1 的分布函数,(2.2)式表明,当 n 充
分大时,可以通过(x)给出其近似的分布。这样,就可以利用正态分布对∑X。作理论分 析或作实际计算,其好处是明显的。 将式(2.2)左端改写成” 空-“又,这所,上选销果可写度当充分大 玉二兰近似地NOl或近似地N,23) 这是独立同分布中心极限定结果的另一个形式。这就是说,均值为4,方差为σ2>0的 独立同分布的随机变量X,名一名,的第术平约不一之x,当充分大时近地 服从均值为4,方差为“人的正态分布。这一结果是数理统计中大样本统计推断的基础。 定理二(李雅普诺夫(Liapunov)定理)设随机变量X,X2,,X。,.相互独立,它 们具有数学期望和方差: E(Xx)=4k,DXx)=oR>0,k=12,. 记 -2 者存在氨香,低得当n→时产化-0 则随机变量之和三X,的标准化变量: 2位.名x宫 2x B 的分布函数F。=()对于任意x,满足 imF.(x)=Iim P 区2s小-应e0 B。 证明略。 定理二表明,在定理的条件下,随机变量
分大时,可以通过 (x) 给出其近似的分布。这样,就可以利用正态分布对 = n k X k 1 作理论分 析或作实际计算,其好处是明显的。 将式(2.2)左端改写成 n X n X n n k k − = − =1 1 ,这样,上述结果可写成:当 n 充分大时, 近似地N(0,1) n X − 或 ( ) n X N 2 近似地 , .(2.3) 这是独立同分布中心极限定结果的另一个形式。这就是说,均值为 ,方差为 0 2 的 独立同分布的随机变量 X1, X2 ,., X n 的算术平均 = = n k X k n X 1 1 ,当 n 充分大时近似地 服从均值为 ,方差为 n 2 的正态分布。这一结果是数理统计中大样本统计推断的基础。 定理二(李雅普诺夫(Liapunov)定理) 设随机变量 X1, X2 ,., X n ,.相互独立,它 们具有数学期望和方差: ( ) , ( ) 0, 1,2, , E X K = K D X K = K 2 k = 记 = = n k Bn k 1 2 2 若存在正数 ,使得当 n → 时, = + + − → n k k k n E X B 1 2 2 0, 1 则随机变量之和 = n k X k 1 的标准化变量: n n k k n k k n k k n k n k k k n B X D X X E X Z = = = = = − = − = 1 1 1 1 1 的分布函数 F (x) n = 对于任意 x,满足 ( ) ( ) − − = = → → = = − = x t n n k k n k k n n n x e dt x B X F x P . 2 1 lim lim 1 1 2 2 (2.4) 证明略。 定理二表明,在定理的条件下,随机变量
B. 当n很大时,近似地服从正态分布N(0,),由此,当n很大时,三X:=B,乙,+∑4 近似地服从正态分布N之山,B这就是说,无论各个随机变量Xx伥=12.)服从什 么分布,只要满足定理的条件,那么它们的和∑Xk当很大时,就近似地服从正态分布。 这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因。在很多问题中,所考 虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的 耗电量是大量用户耗电量的总和:一个物理实验的测量误差是由许多观察不到的、可加的微 小误差所合成的,它们往往近似地服从正态分布。 下面介绍另一个中心极限定理,它是定理一的特殊情况。 定理三(棣莫弗一拉普拉斯(De Moivre-Laplace)定理)设随机变量(n=l,2)服从 参数为n,p(0<p<1)的二项分布,则对于任意x,有 imp.mp 5-上应z烟 (2.5) np(1-p) 证:由第四章S2例6知可以将刀,分解成为n个相互独立服从同一(0-)分布的诸随机变 量X,X2,.Xn之和,即有 %-店x 其中X(k=1,2,)的分布律为 P(X:=i=p(1-p)i=0.1 由于E(X)=p,DX)=p1-pk=1,2,.,n),由定理一得 小小点 这个定理表明,正态分布是二项分布的极限分布,当充分大时,我们可以利用(2.5) 式来计算二项分布的概率。下面举几个关于中心极限定理应用的例子。 例1设X,X2,X。.为相互独立的随机变量序列,且x(位=1,2),服从参数为元的泊
n n k n k k k n B X Z = = − = 1 1 当 n 很大时,近似地服从正态分布 N (0,1) ,由此,当 n 很大时, = = = + n k n n k n k X k B Z 1 1 近似地服从正态分布 = 2 1 , n n k N k B 。这就是说,无论各个随机变量 X (k =1,2, ) K 服从什 么分布,只要满足定理的条件,那么它们的和 = n k X k 1 当 n 很大时,就近似地服从正态分布。 这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因。在很多问题中,所考 虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的 耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微 小误差所合成的,它们往往近似地服从正态分布。 下面介绍另一个中心极限定理,它是定理一的特殊情况。 定理三(棣莫弗—拉普拉斯(De Moivre-Laplace)定理)设随机变量 (n =1,2, ) n 服从 参数为 n,p(0<p<1)的二项分布,则对于任意 x,有 ( ) ( ) − − → = = − − x t n n x e dt x np p np P 2 2 2 1 1 lim (2.5) 证:由第四章§2 例 6 知可以将 n 分解成为 n 个相互独立服从同一 (0 1− ) 分布的诸随机变 量 X1, X2 ,., X n 之和,即有 = = n k n Xk 1 , 其中 X (k n) k =1,2, , 的分布律为 (1 ) , 0,1. 1 = = − = − P X i p p i i i k 由于 E(X ) p D(X ) p( p)(k n) k k = , = 1− =1,2, , ,由定理一得 ( ) ( ) x e dt (x) np p X np x P np p np P x t n k k n n n = = − − = − − − − = → → 1 2 2 2 1 1 lim 1 lim 这个定理表明,正态分布是二项分布的极限分布,当 n 充分大时,我们可以利用(2.5) 式来计算二项分布的概率。下面举几个关于中心极限定理应用的例子。 例 1 设 1 2 , ,., . X X X n 为相互独立的随机变量序列,且 x i i ( =1, 2,. ,) 服从参数为 的泊
∑X,-n1 松分布,求1mP 解将E(X)=2,D(X)=元,(1=1,2,)代入独立同分布的中心极限定理得 例2设在某中重复独立试验中,每次试验事件A发生的概率为,问能以0.9997的概 率保证在1000次试验中A发生的领率与,相差多少?此时A发生的次数在哪个范围之 内? 解设n,为n重贝努利试验中事件A发生的次数,p是在各次试验中事件A发生的概率。 则m,-b(n,p),当n很大时,由棣莫弗一拉普拉斯定理,有n,近似服从N(p,p(1-p): 从而 品可 ne 从而由题设n=100,p=年B=0.997, 面要球P-=09冲的 n 表得60362故=362×P P0-D-362×,D25x0币-00496 1000 例3一加法器同时收到20个噪声电压V(k=1,2,.,20),设它们是相互独立的随机变量
松分布,求 1 lim n i i n X n p x n = → − 的值。 解 将 E X D X i ( i i ) = = = , , 1, 2,. ( ) ( ) 代入独立同分布的中心极限定理得 2 1 2 1 lim 2 n i t x i n X n p x e dt n − = → − − = 例 2 设在某中重复独立试验中,每次试验事件 A 发生的概率为 1 4 ,问能以 0.9997 的概 率保证在 1000 次试验中 A 发生的频率与 1 4 相差多少?此时 A 发生的次数在哪个范围之 内? 解 设 A n 为 n 重贝努利试验中事件 A 发生的次数, p 是在各次试验中事件 A 发生的概率。 则 n b n p A ( , ) ,当 n 很大时,由棣莫弗—拉普拉斯定理,有 A n 近似服从 N np np p ( , 1 , ( − )) 从而 A A n p p p np n n np n n = − = − + (111 ) ( ) ( ) A n n n np p np p np p np p − − = −−− ( ) ( ) ( ) 2 1 1 1 1 n n n np p np p p p − − = − − − − 从而由题设 1 1000, , 0.9997 4 n p = = = , 而 要求 0.9997 . A n p p n − = 中的 由于 ( ) 2 1 0.9997 1 A n n p p n p p − = − = − ,故 ( ) 0.9999 1 n p p = − 查表得 ( ) (1 ) 0.25 0.75 3.62, 3.62 3.62 0.0496 1 1000 n p p p p n − = = = = − 故 。 例3 一加法器同时收到20个噪声电压 V (k =1,2, ,20) k ,设它们是相互独立的随机变量
且都在区间(0,10)上服从均匀分布。记V=之y,求P105}的近似值。 =1 解易知E)=5,D)=100/12(k=1,2,.,20),由定理一,随机变量 y-20x5 V-20×5 7= V100/12V2ōV100/12V20 近似服从正态分布N(O,1),于是 P{W>105}=P V-20×5 105-20×5 V-100 0N元0N元P1 0/iN2元>0387 =1-P i后≤0371-2c=1-0387列-0348 V-100 即有 P>105}≈0.348. 例4一船在某海区航行已知每造受一次波浪的冲击,纵摇角大于”的概率为P号 若船舶遭受了90000次波浪冲击,问其中有29500~30500次纵摇角度大于3°的概率是 名少? 解我们将船舶每遭受一次波浪冲击看作是一次试验,并假定各次试验是独立的.在90000 次波浪冲击中纵摇角度大于3°的次数记为X,则X是一个随机变量,且有X~b(90000,⅓)。 其分布律为 = ,k=0.1,.,90000 所求的概率为 P{29500≤X≤30500}= 要直接计算是麻烦的,我们利用棣莫弗一拉普拉斯定理来求它的近似值。即有 P29500≤X≤30500}=P 29500-p」 X-p<30500-厘 m0-方m0-可m-方j 0500- 30500-p 29500-厘 气√p0-p)Vp-p 其中n=90000,p=1/3。即有 P29500≤X≤30500}≈5v2/2-(52/2)=0.9995
且都在区间(0,10)上服从均匀分布。记 = = 20 k 1 V Vk ,求 P{V>105}的近似值。 解 易知 E(V ) = 5,D(V ) =100 12(k =1,2, ,20) k k ,由定理一,随机变量 100 12 20 20 5 100 12 20 20 5 20 1 − = − = = V V Z k k 近似服从正态分布 N(0,1),于是 ( ) ( ) ( ) ( ) ( ) 2 0387 2 20 5 105 20 5 100 105 0.387 10 12 20 10 12 20 10 12 20 100 1 1 0.387 1 1 0.387 0.348. 10 12 20 2 t V V P V P P V P e dt − − − − − = = − = − − = − = 即有 PV 105 0.348. 例 4 一船舶在某海区航行,已知每遭受一次波浪的冲击,纵摇角大于 0 3 的概率为 1 3 p = , 若船舶遭受了 90 000 次波浪冲击,问其中有 29 500~30 500 次纵摇角度大于 0 3 的概率是 多少? 解 我们将船舶每遭受一次波浪冲击看作是一次试验,并假定各次试验是独立的。在 90 000 次波浪冲击中纵摇角度大于 0 3 的次数记为 X,则 X 是一个随机变量,且有 X~b(90 000, 3 1 )。 其分布律为 ( ) , 0,1, ,90000. 3 2 3 1 90000 90000 = = = − P X k k k k k 所求的概率为 ( ) . 3 2 3 1 29500 30500 90000 30500 29500 90000 = − = k k k k P X 要直接计算是麻烦的,我们利用棣莫弗—拉普拉斯定理来求它的近似值。即有 ( ) ( ) ( ) ( ) ( ) ( ) ( ) . 1 29500 1 30500 2 1 1 30500 1 1 29500 29500 30500 1 30500 1 29500 2 2 − − − − − = − − − − − − = − − − − − np p np np p np e dt np p np np p X np np p np P X P n p p n p n p p n p t 其中 n=90000,p=1/3。即有 P29500 X 30500 (5 2 2)−(− 5 2 / 2) = 0.9995
例5对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长 1名家长、2名家长来参加会议的概率分别为,若学校共有400名学生,设各学生参加会议 的家长数相互独立,且服从同一分布。(1)求参加会议的家长数X超过450的概率:(2)求 有1名家长来参加会议的学生数不多于340的概率。 解(1)以X,(k=1,2,.,400)记第k个学生来参加会议的家长数,则X的分布律为 12 P0.050.80.15 易知E(X)=1.1D(X)=0.19,k=1240.而X=X·由定理一,随机变量 艺X-01 X-400x1.1 √400V0.19 V4000.19 近似服从正态分布N(O,1),于是 P4K>450y=pX-400x1L≥450-400x1四=1-pX-400x1s1147 400y0.19 N400√0.19 (V400v0.19 ≈1-1.147)=0.1357 (2)以Y记有一名家长来参加会议的学生数,则Y~b(400,0.8),由定理三得 Py≤340} =py-400x0.8 340-400×0.8 √400x0.8×0. ≤J400×0.8×0.2 =py-400x0.8 V400x08x02≤25 ≈2.5)=0.9938. V.小结与提问: 中心极定理表明,在相当一铅的条件下,当种立随机弯量的个数增加时,其和的分布 趋于正态分布。这一事实阐明了正态分布的重要 。中心极限定 里也揭示了为什么 实际应 用中会经常遇到正态分布,也就是揭示了产生正态分布变量的源泉。另一方面,它提供了独 立同分布随机变量之和∑X。(其中X,的方差存在)的近似分布,只要和式中加项的个数 充分大,就可以不必考虑和式中的随机变量服从什么分布,都可以用正态分布来近似,这在 应用上是有效和重要的。 中心极限定理的内容包含极限,因而称它为极限定理是很自然的。又由于它在统计中 的重要性,称它为中心极限定理,这是Po1ya在1920年取的名字
例 5 对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长, 1 名家长、2 名家长来参加会议的概率分别为。若学校共有 400 名学生,设各学生参加会议 的家长数相互独立,且服从同一分布。(1)求参加会议的家长数 X 超过 450 的概率;(2)求 有 1 名家长来参加会议的学生数不多于 340 的概率。 解 (1)以 X (k =1,2, ,400) k 记第 k 个学生来参加会议的家长数,则 X k 的分布律为 X k 0 1 2 Pk 0.05 0.8 0.15 易知 E(Xk ) =1.1,D(Xk ) = 0.19,k =1, 2,.400. 而 = = 400 k 1 X X k .由定理一,随机变量 400 0.19 400 1.1 400 0.19 400 1.1 400 1 − = − = X X k k 近似服从正态分布 N (0,1) ,于是 1 (1.147) 0.1357 1.147 400 0.19 400 1.1 1 400 0.19 450 400 1.1 400 0.19 400 1.1 450 − = − = − − − = X P X P X P (2)以 Y 记有一名家长来参加会议的学生数,则 Y~b(400,0.8),由定理三得 (2.5) 0.9938. 2.5 400 0.8 0.2 400 0.8 400 0.8 0.2 340 400 0.8 400 0.8 0.2 400 0.8 340 = − = − − = Y P Y P P Y Ⅴ. 小结与提问: 中心极限定理表明,在相当一般的条件下,当独立随机变量的个数增加时,其和的分布 趋于正态分布。这一事实阐明了正态分布的重要性。中心极限定理也揭示了为什么在实际应 用中会经常遇到正态分布,也就是揭示了产生正态分布变量的源泉。另一方面,它提供了独 立同分布随机变量之和 = n k X k 1 (其中 X k 的方差存在)的近似分布,只要和式中加项的个数 充分大,就可以不必考虑和式中的随机变量服从什么分布,都可以用正态分布来近似,这在 应用上是有效和重要的。 中心极限定理 的内容包含极限,因而称它为极限定理是很自然的。又由于它在统计中 的重要性,称它为中心极限定理,这是 Polya 在 1920 年取的名字
疑难解答: 大数定理和中心极限定理之间有什么联系? 答:大数定理是研究随机变量序列{X}依概率收敛的极限问题,而中心极限定理是研 究随机变量序列{X}依分布收敛的极限定理。它们都是讨论大量的随机变量之和的极限行 为。当X,X2,X。相互独立又同分布:并且有大于0的有限方差时,大数定理和中心 极限定理同时成立: 设E(X)=4,D(X,)=o2>0,则由契比雪夫大数定律知,对于任意给定的e>0,有 -P2x,- 而由同分布的中心极限定理有 空x-小小-px-小s } 可见,在所假设的条件下,中心极限定理比大数定律更为精确 T.课外作业: 4习题五
疑难解答: 大数定理和中心极限定理之间有什么联系? 答:大数定理是研究随机变量序列 X n 依概率收敛的极限问题,而中心极限定理是研 究随机变量序列 X n 依分布收敛的极限定理。它们都是讨论大量的随机变量之和的极限行 为。当 1 2 , ,., . X X X n 相互独立又同分布;并且有大于 0 的有限方差时,大数定理和中心 极限定理同时成立: 设 ( ) ( ) 2 , 0, E X D X i i = = 则由契比雪夫大数定律知,对于任意给定的 0, 有 ( ) 1 1 lim 1 n i n i p X n → = − = 而由同分布的中心极限定理有 ( ) ( ) 1 1 1 1 2 1 n n i i i i n p X p X n n n n n = = − = − − − = − 可见,在所假设的条件下,中心极限定理比大数定律更为精确。 Ⅵ.课外作业: P154 习题五