
大数定律与中心极限定理ANSWER本章要解决的问题1.为何能以某事件发生的频率大数作为该事件的概率的估计?定律2.为何能以样本均值作为总体期望的估计?3.为何正态分布在概率论中占中心极有极其重要的地位?限定理4.大样本统计推断的理论基础是什么?
大数定律与中心极限定理 本章要解决的问题 1. 为何能以某事件发生的频率 作为该事件的 概率的估计? 2. 为何能以样本均值作为总体 期望的估计? 3. 为何正态分布在概率论中占 有极其重要的地位? 4. 大样本统计推断的理论基础 是什么? ANSWER 大数 定律 中心极 限定理

大数定律和中心极限定理是概率论的重要基本理论,它们揭示了随机现象的重要统计规律,在概率论与数理统计的理论研究和实际应用中都具有重要的意义。迄今为止,人们已发现很多大数定律(lawsoflargenumbers)所谓大数定律,简单地说,就是大量数目的随机变量所呈现出的规律,这种规律一般用随机变量序列的某种收敛性来刻画。本章仅介绍几个最基本的大数定律。下面,先介绍一个重要的不等式
⚫ 大数定律和中心极限定理是概率论的重要基本理 论,它们揭示了随机现象的重要统计规律,在概率 论与数理统计的理论研究和实际应用中都具有重要 的意义。 ⚫ 迄今为止,人们已发现很多大数定律(laws of large numbers) 所谓大数定律,简单地说,就是大量数目的随机变量所呈现 出的规律,这种规律一般用随机变量序列的某种收敛性来刻 画。 ⚫ 本章仅介绍几个最基本的大数定律。下面,先介绍一个 重要的不等式

切尔谢夫不等式重要不等式不等式马尔可夫(Markov)设非负随机变量X的期望E(X)存在,则对于任意实数ε>0,E(X)P(X ≥)≤8
设非负随机变量 X 的期望 E( X )存在, 则对于任意实数 > 0, ( ) ( ) E X P X 马尔可夫(Markov) 不等式 重要不等式 切尔谢夫不等式

推论2一一切贝雪夫(chebyshev)不等式设随机变量X的方差D(X)存在,则对于任意实数ε>0,D(X)P(IX-E(X)≥)≤P(I X-E(X)6)≥1- D(X)或26
设随机变量 X 的方差 D ( X )存在, 则对于任意实数 > 0, 2 ( ) (| ( )| ) D X P X − E X 推论 2 ——切贝雪夫( chebyshev )不等式 或 2 ( ) (| ( )| ) 1 D X P X − E X −

示意图≤DED(x)xEsE-6E&+c
示意图 Ex− Ex Ex+ j(x) x Dx/ 2

例设有一大批种子,其中良种占1/6.试估计在任选的6000粒种子中,良种所占比例与1/6比较上下小于1%的概率解设X表示6000粒种子中的良种数X~ B (6000,1/6)--注:二项分布5000E(X) =1000, D(X)6XP<0.01500066000836≥10.7685= P(I X-1000 < 60)1602108
例 设有一大批种子,其中良种占1/6. 试估计 在任选的 6000 粒种子中, 良种所占比例与 1/6 比较上下小于1%的概率. 解 设 X 表示 6000 粒种子中的良种数 , X ~ B (6000,1/6 ) -注:二项分布 − 0.01 6 1 6000 X P 6 5000 E(X ) =1000, D(X ) = = P(| X −1000 | 60) 2 60 6 5000 1− 0.7685 108 83 = =

实际精确计算:XL<0.01= P(940< X<1060)600066000-k10595ChZ=0.959036600066k=941用Poisson分布近似计算取=1000HP<0.01= P(940< X <1060)66000-10001000k1059eZ=0.937934k!k=941
实际精确计算: = P(940 X 1060) − 0.01 6 1 6000 X P = − = 1059 941 6000 6000 6 5 6 1 k k k k C = 0.959036 用Poisson 分布近似计算: = P(940 X 1060) − 0.01 6 1 6000 X P = 0.937934 = − = 1059 941 1000 ! 1000 k k k e 取 = 1000

例设每次试验中,事件A发生的概率为0.75.试用Chebyshev 不等式估计,n多大时,才能在 n 次独立重复试验中,事件A出现的频率在0.74~0.76之间的概率大于0.90?解设X表示n次独立重复试验中事件A发生的次数,则X ~ B(n,0.75)E(X) = 0.75n, D(X) = 0.1875n事件A发生的概率X要使Pl0.74<<0.76l≥0.90,求nn
例 设每次试验中,事件 A 发生的概率为 0.75, 试用 Chebyshev 不等式估计, n 多大时, 才 能在 n 次独立重复试验中, 事件 A 出现的 频率在0.74 ~ 0.76 之间的概率大于 0.90? 解 设 X 表示 n 次独立重复试验中事件A 发生 的次数 , 则 X ~ B(n,0.75) E(X) = 0.75n, D(X) = 0.1875n 0.74 0.76 0.90 n X 要使 P ,求 n 事件A发生 的概率

即 P(0.74 n<X<0.76n)≥ 0.90即 P( X-0.75nk0.01n)≥0.90由Chebyshev不等式,ε=0.01n,故0.1875nP( X-0.75nk 0.01n)≥1- (0.01n)令0.1875n≥0.90(0.01n)解得n≥18750
即 P(0.74n X 0.76n) 0.90 即 P(| X − 0.75n | 0.01n) 0.90 由 Chebyshev 不等式, = 0.01n ,故 ( ) 2 (0.01 ) 0.1875 | 0.75 | 0.01 1 n n P X − n n − 令 0.90 (0.01 ) 0.1875 1 2 − n n 解得 n 18750

1切比雪夫不等式说明,DX越小,则J PLX-EX≥S!越小,PIIX-EX越太,也就是说,随机变量X取值基本上集中在E附近,这进一步说明了方差的意义2切比雪夫不等式给出了概率PIIX-EX的e个上界,该上界并不涉及随机变X的具体概率分布,而只与其方差DX和有关
1 切比雪夫不等式说明,DX越小,则 越小, 越大,也就是说,随机变量X取值基 本上集中在EX附近,这进一步说明了方差的意义。 2 切比雪夫不等式给出了概率 的一个上界,该上界并不涉及随机变X 的具体概率分布,而只与其方差DX和ε有关。 P{| X − EX | } P{| X − EX | } P{| X − EX | }