事四章大数定律与中心极限定理 4.1大数定理 在本课程一开始引入概率这个概念时,我们曾经指出,频率是概率的反映,随着观察沙 数的增大,频率将会逐渐稳定到概*。还曾经指出,当■很大时,频率会概率是会非常 “靠近”的,某些读者可能早就有了疑问:这里说的“逐渐稳定”和非常“靠近”究竞是什 么意思?与数学分析中的极限概念有关系吗?这个问题提得非常好,前面提到的“逐渐稳定” 和非常“靠 ”都只是一种直观的说法,它的严格的数学家意义确实需要我们进一步阐明 本章就是要讨论这一类问题。 若事件A在一次试验中发生的概率为p,如果观察了次这样的试验(也就是一个 重贝努里试验),事件A共发生了n次,则事件A在n次观察中的频率为4n/n,当n增 大时频率逐渐稳定到(或“靠近”)概率,是否就是数学分析中的极限?也就是是否有 limp 成立呢?如果是这样,为什么不说“频率以概率为极限”,岂不干脆利落!但是读者应该觉 察到,上述这种极限关系是不成立的,因为这个极限关系意味者,对任给的£>0,存在充 分大的整数N,使对一切n>N都有 (4.1) 成立。而我们知道,频率4./加是随着试验结果而变的,在n重贝努里试验中,下面的试验 结果 A,A,…,A(n个A出现) 还是可能发生的,当出现这样的结果时,。=n,于是4/n=l,从而当6很小时(0K6<1-p, 不论N多大,也不能得到当nN时,都有 怡-<8 成立,所以形如(41)极限关系并不成立。但是当n很大时事件(台-小发生的可能 性是很小的。例如上述的4=n, 即(=发生的可能性为 P告-队m -P在n次独立试验中A出现n次” 显然,当→∞时这个概率趋向于零。所以,频率“靠近”概奉不是意味者极限关系式(41)
第四章 大数定律与中心极限定理 §4.1 大数定理 在本课程一开始引入概率这个概念时,我们曾经指出,频率是概率的反映,随着观察次 数 n 的增大,频率将会逐渐稳定到概率。还曾经指出,当 n 很大时,频率会概率是会非常 “靠近”的,某些读者可能早就有了疑问:这里说的“逐渐稳定”和非常“靠近”究竟是什 么意思?与数学分析中的极限概念有关系吗?这个问题提得非常好,前面提到的“逐渐稳定” 和非常“靠近”都只是一种直观的说法,它的严格的数学家意义确实需要我们进一步阐明, 本章就是要讨论这一类问题。 若事件 A 在一次试验中发生的概率为 p,如果观察了 n 次这样的试验(也就是一个 n 重贝努里试验),事件 A 共发生了 n 次,则事件 A 在 n 次观察中的频率为 n n ,当 n 增 大时频率逐渐稳定到(或“靠近”)概率,是否就是数学分析中的极限?也就是是否有 lim n→ n n =p 成立呢?如果是这样,为什么不说“频率以概率为极限”,岂不干脆利落!但是读者应该觉 察到,上述这种极限关系是不成立的,因为这个极限关系意味着,对任给的 0 ,存在充 分大的整数 N,使对一切 n>N 都有 − p n n (4.1) 成立。而我们知道,频率 n n 是随着试验结果而变的,在 n 重贝努里试验中,下面的试验 结果: A,A,…,A (n 个 A 出现) 还是可能发生的,当出现这样的结果时, n =n,于是 n n =1,从而当 很小时(0N 时,都有 p n n − < 成立,所以形如(4.1)极限关系并不成立。但是当 n 很大时,事件 − p n n 发生的可能 性是很小的。例如上述的 n =n,即 = 1 n n 发生的可能性为 P = 1 n n =P( n =n) =P(在 n 次独立试验中 A 出现 n 次)=p n 显然,当 n → 时这个概率趋向于零。所以,频率“靠近”概率不是意味着极限关系式(4.1)
而是意味着 P怡-s0.a 其中£是任一大于零的常数,这就是下面的贝努里定理。 贝努里定理:设4,是重贝努里试验中事件A出现的次数,又在每次试验中出现 的概率为p(0p0,有 mP格-小 (4.2) 频率“靠近”概率是可以直接观察到的一种客观现象,而上述贝努里定理则从理论上给了这 贝努里大数定律的实质是是讨论了形如 ∑-∑E, n 的随机变量,当n→0时的统计规律,其中传}是独立的服从同一个子0一一1分布的随机 变量。由此得到启发,我们引入下述更一般的大数定律的定义。 定义41若5,52,5,…,5。,…是随机变量序列,如果存在常数列a1,a1,…, 使对任意的£>0,有 (4.3) 成立,则称随机变量序列,}服从大数定律。 由些可知,贝努里大数定律只是上述一般大数定律的一个特例,下面介绍一个比贝努里 大数定律更广泛一些的契贝晓夫大数定律。 切贝晓夫大数定律:设5,52,5,…,5。,…是一列两两不相关的随机变量 又设它们的方差有界,即存在常数C>0,使有 D5,≤C,iel,2,… 则对任意的8>0,有 mP2-2小 (4.4) 例4.1设5,52,5,…是独立同分布随机变量序列,均服从参数为入的普哇松分布
而是意味着 P → 0 − p n n ,n → 其中 是任一大于零的常数,这就是下面的贝努里定理。 贝努里定理: 设 n 是 n 重贝努里试验中事件 A 出现的次数,又在每次试验中出现 的概率为 p(00,有 lim n→ P =1 − p n n (4.2) 频率“靠近”概率是可以直接观察到的一种客观现象,而上述贝努里定理则从理论上给了这 种现象以更加确切的含意。由于贝努里定理说明了大数次重复试验下呈现的客观规律,所以 也称为贝努里大数定律。 贝努里大数定律的实质是是讨论了形如 n E n i n i i i = = − 1 1 的随机变量,当 n → 时的统计规律,其中 i 是独立的服从同一个子 0——1 分布的随机 变量。由此得到启发,我们引入下述更一般的大数定律的定义。 定义 4.1 若 1 , 2 , 3 ,…, n ,…是随机变量序列,如果存在常数列 a 1 ,a 2 ,…, 使对任意的 >0,有 lim n→ P 1 1 = − = n n i i a n (4.3) 成立,则称随机变量序列 i 服从大数定律。 由些可知,贝努里大数定律只是上述一般大数定律的一个特例,下面介绍一个比贝努里 大数定律更广泛一些的契贝晓夫大数定律。 切贝晓夫大数定律: 设 1 , 2 , 3 ,…, n ,…是一列两两不相关的随机变量, 又设它们的方差有界,即存在常数 C>0,使有 D i ≤C,i=1,2,… 则对任意的 >0,有 lim n→ P 1 1 1 1 1 = − = = n i i n i i E n n (4.4) 例 4.1 设 1 , 2 , 3 ,…是独立同分布随机变量序列,均服从参数为 的普哇松分布
在第2章中已经求得E5:=入,D5,=元(i=1,2,…),因而满足定理4.2(契贝晓夫大数定律) 即的条件,由(4.4)式知有 m空-小 可以看出贝努里大数定律是契贝晓夫大数定律的特例,在它们的证明中,都是以契贝晓夫大 数定律为基础 所以要求随机变量具有方差,从但是进一步的研究表 明,方差存在这个条 件并不是必要的,下面我们介绍一下一个独立同分布的辛铁大数定律。 辛软大或定律,设,点2,5,…是一列独立同分布的随机变量,且数学期望存在: E5,=8i=l,2,… 则对任意的£>0,有 mP心2-小- (4.5) 成立。 前面说过贝努里大数定律表明了当很大时,事件发生的频率会“靠近”概率,而这 里的幸饮大数定律表男。当很大时。能机变量在次观中的算术平均位之会“ 近”它的期望,这就为寻找随机变量的期组提供了一条实际可行的途径。例如要估计某地风 小麦的平均亩产量,只要收制一部分有代表性的地块,计算它们的平均亩产量,这个平均亩 产是之,在比大的时候它可以作为全区干药产,即直产量的:的 个近似。我们己经说过,这种近似和“靠近”并不是数学分析是已为大家熟悉的极限关系, 而是(4.5)式表示的那种“极限”。借用数学分析中已为大家所熟悉的“收敛”、“极限”这 些术语,我们把(4.5)多所表示的关系记成 im2山加 (n-) 并且称!之:低橱率收效于a。按照这一记号和说法,贝努里大数定律表明了领率4,加 依概率收敛于p,即 4n/mP→p(n→0)
在第 2 章中已经求得 E i = ,D i = (i=1,2,…),因而满足定理 4.2(契贝晓夫大数定律) 即的条件,由(4.4)式知有 lim n→ P 1 1 1 = − = n i i n 可以看出贝努里大数定律是契贝晓夫大数定律的特例,在它们的证明中,都是以契贝晓夫大 数定律为基础的,所以要求随机变量具有方差,从但是进一步的研究表明,方差存在这个条 件并不是必要的,下面我们介绍一下一个独立同分布的辛钦大数定律。 辛钦大数定律: 设 1 , 2 , 3 ,…是一列独立同分布的随机变量,且数学期望存在: E i =a, i=1,2,… 则对任意的 >0,有 lim n→ P 1 1 1 = − = a n n i i (4.5) 成立。 前面说过贝努里大数定律表明了当 n 很大时,事件发生的频率会“靠近”概率,而这 里的辛钦大数定律表明。当 n 很大时,随机变量在 n 次观察中的算术平均值 = n i i n 1 1 会“靠 近”它的期望,这就为寻找随机变量的期望提供了一条实际可行的途径。例如要估计某地区 小麦的平均亩产量,只要收割一部分有代表性的地块,计算它们的平均亩产量,这个平均亩 产量就是 = n i i n 1 1 ,在 n 比较大的时候它可以作为全区平均亩产量,即亩产量的期望 a 的一 个近似。我们已经说过,这种近似和“靠近”并不是数学分析是已为大家熟悉的极限关系, 而是(4.5)式表示的那种“极限”。借用数学分析中已为大家所熟悉的“收敛”、“极限”这 些术语,我们把(4.5)多所表示的关系记成 lim n→ = n i i n 1 1 ⎯⎯→p a 或 = n i i n 1 1 ⎯⎯p→ a (n → ) 并且称 = n i i n 1 1 依概率收敛于 a。按照这一记号和说法,贝努里大数定律表明了频率 n n 依概率收敛于 p,即 n n ⎯⎯→p p (n → )