§6大数定律和中心极限定理 、问题的提出 事件发生的频率为什么能作为事件概率的估计? 样本均值为什么可以作为总体期望的估计? 在概率统计中,正态分布为什么极其重要? 统计推断的理论基础是什么?
1 §6 大数定律和中心极限定理 一、问题的提出 事件发生的频率为什么能作为事件概率的估计? 样本均值为什么可以作为总体期望的估计? 在概率统计中,正态分布为什么极其重要? 统计推断的理论基础是什么?
定义:设{5n}(即5,52,…,5;…)为随机变量序列, 若对于Vg>0,成立limP(0 设ξ是随机变量,若n-5>0, 则称{5n}依概率收敛于ξ,记为5n→>5 定理(依概率收敛性质):设5n→>A,mn→>B, 且二元函数∫在点(4,B)处连续, 则∫(5n,mn)→>f(A,B)
2 设 { } n (即 1 2 , , , , n )为随机变量序列, 若对于 0 , 成立 定义: lim ( ) 1 n n P 则称随机变量序列 { } n 依概率收敛于 0, 记为 0 . n 设 ξ 是随机变量,若 0 , P n 则称 { } n 依概率收敛于 ξ ,记为 . P n 定理(依概率收敛性质):设 , P n A , P n B 且二元函数 f 在点 (A , B)处连续, 则 ( , ) ( , ) . P n n f f A B
大数定律 1、切比雪夫( Chebyshev)不等式 若随机变量ξ具有数学期望Eξ和方差D, 若对于VE>0,成立 P(-E分F)D和P(5-El<21-25 切比雪夫不等式的意义: 反映的是随机变量X的取值落在其数学期望的 E邻域内的概率不小于1-σ2/2.它的意义在于 当随机变量的数学期望和方差已知时,可以估 计随机变量X落在以数学期望为中心的某一区〓 间内的概率的一个下限
3 二、大数定律 1、切比雪夫(Chebyshev)不等式: 若随机变量ξ 具有数学期望 Eξ 和方差 Dξ , 若对于 0 , 成立 2 ( ) D P E 和 2 ( ) 1 . D P E 切比雪夫不等式的意义: 反映的是随机变量 X 的取值落在其数学期望的 ε 邻域内的概率不小于 1-σ 2 / ε 2 . 它的意义在于 当随机变量的数学期望和方差已知时,可以估 计随机变量 X落在以数学期望为中心的某一区 间内的概率的一个下限
证明:仅对离散型随机变量证明, 设ξ是一个离散型随机变量,其分布律为 P(5=xk)=P(k=1,2,…) 则P(5-E8)=∑P(5=x)=∑ ≥E xk-E5≥E ∑ (x-E)2 xk-E2≥E ∑ (x-E5) 2 ≥1 2∑(x-E)p=D5 8 k21 且P(-E5)=1-P(-E引26)21235
4 2 2 1 ( ) k k k x E p 证明:仅对离散型随机变量证明, 设 ξ 是一个离散型随机变量, 其分布律为 ( ) ( 1, 2, ) P x p k k k 则 ( ) ( ) k k x E P E P x k k x E p 2 2 ( ) k k k x E x E p 2 2 1 1 ( ) k k k x E p 2 1 D 且 2 ( ) 1 ( ) 1 . D P E P E
例1、在每次试验中,事件A发生的概率为0.75,利用 切比雪夫不等式,求n需要多大时才能使得在n次 重复独立试验中事件A出现的频率在0.74~0.76之 间的概率至少为0.90
5 例1、在每次试验中,事件 A 发生的概率为0.75,利用 切比雪夫不等式,求 n 需要多大时才能使得在 n 次 重复独立试验中事件 A 出现的频率在0.74 ~ 0.76之 间的概率至少为0.90
2、切比雪夫( Chebyshev)大数定律: 设5,52,…,5n;…是相互独立的随机变量序列 (即对每个正整数n≥2,5,52,…,5n是相互独立的) 相应的数学期望依次为E1,E2,…,E5n;…, 方差依次为D51,D52,…,D5n,…,若D5;≤L(i=1,2,…), 这里L是与i无关的常数,则对于VE>0,成立 limp(lin ∑5一∑E<a=1 n→0 证明:∵5,52,…,5n相互独立,所以 ∑5=n∑D5≤ E∑5=∑E i=1 i=1
6 2、切比雪夫(Chebyshev)大数定律: 设 1 2 , , , , n 是相互独立的随机变量序列 (即对每个正整数 n ≥ 2 , 1 2 , , , n 是相互独立的) 相应的数学期望依次为 1 2 , , , , , E E E n 方差依次为 1 2 , , , , , D D D n 若 ( 1, 2, ) , D L i i 这里 L 是与 i 无关的常数,则对于 0 , 成立 1 1 1 1 lim 1 n n i i n i i P E n n 证明: 1 2 , , , n 相互独立,所以 1 1 n i i D n 2 1 1 n i i D n 2 1 nL n L n 1 n i i E 1 1 n i i E n
由切比雪夫不等式得,对于VE>0,成立 Iy 1>p|1 ∑5-∑E50,成立 mP∑-叫<a n→ n
7 由切比雪夫不等式得, 对于 0 , 成立 1 1 1 1 1 n n i i i i P E n n 1 2 1 1 n i i D n 2 1 L n 令 n → ∞ ,由极限的夹逼性得 1 1 1 1 lim 1 . n n i i n i i P E n n 推论: 2 , ( 1, 2, ) , E D i i i 设 { } n 是相互独立、具有相同分布的随机变量 序列,且 则对于 0 , 成立 1 1 lim 1 . n i n i P n
3、辛钦大数定律: 设{}是相互独立、具有相同分布的随机变量 序列,且E5;=H(i=1,2,…), 则对于va>0,成立P∑5-0,成立lim <a
8 3、辛钦大数定律: 设 { } n 是相互独立、具有相同分布的随机变量 序列,且 ( 1, 2, ) , E i i 则对于 0 , 成立 1 1 lim 1 . n i n i P n 4、Bernoulli大数定律: 设 ξ 为 n 重 Bernoulli 试验中事件 A 发生的次数, 则当 n 无限增大时,事件 A 发生的频率 依 n 依概率收敛于 A 发生的概率 p P A ( ) , 即对于 0 , 成立 lim 1 . n P p n
大数定律的意义: 大数定律深刻地揭示了随机事件概率与频率间的 关系,大数定律从大量独立重复试验中测量值的平均 值出发,以严格的数学形式证明了平均值和频率的稳 定性,同时表达了这种稳定性的含义。 具有相同数学期望和方差的独立随机序列的算术平均 值依概率收敛于数学期望。 当n足够大时,算术平均值几乎是一常数。 算术 数学 可近似代替 均值 期
9 大数定律的意义: 大数定律深刻地揭示了随机事件概率与频率间的 关系,大数定律从大量独立重复试验中测量值的平均 值出发,以严格的数学形式证明了平均值和频率的稳 定性,同时表达了这种稳定性的含义。 具有相同数学期望和方差的独立随机序列的算术平均 值依概率收敛于数学期望。 当 n 足够大时,算术平均值几乎是一常数。 算术 均值 数学 期望 可近似代替
例2、设随机变量X,X2,…,Xn,…相互独立,服从相 同的分布,E(X1)=0,D(X1)=σ2,且 E(X4)(i=1,2,…)存在, 试证明:对VE>0,有 ∑X X2-a21<|=1 n→0 n 10
10 例2、设随机变量 X1 , X2 , …,Xn , …相互独立,服从相 同的分布,E(Xi ) = 0, D(Xi ) = σ2,且 4 ( ) ( 1, 2, ) E X i i 存在, 对 0 , 有 2 2 1 1 lim 1 . n i n i P X n 试证明: