概率论第10讲 相互独立随机变量的和 相关系数 本文件可从网址 http://math.vip.sina.com 上下载 (单击ppt讲义后选择工程数学子目录) 2021/2/20
2021/2/20 1 概率论第10讲 相互独立随机变量的和 相关系数 本文件可从网址 http://math.vip.sina.com 上下载 (单击'ppt讲义'后选择'工程数学'子目录)
当一个随机变量服从零-壹分布时,它 的分布密度如下表所示 0 (0<p<1) 概率1-p 因此,E20×(1-p)+1xpp E2=02×(1-p)+12×p=p D2E2-(E22=p-p2=p(1-p) 现在设随机变量5与,…,相互独立且每个 都服从同一个零一分布,来求出 7n=1+2+…+E的分布 2021/2/20
2021/2/20 2 当一个随机变量x服从零-壹分布时, 它 的分布密度如下表所示 x 0 1 概率 1-p p (0<p<1) 因此, Ex=0(1-p)+1p=p Ex 2=02(1-p)+12p=p Dx=Ex 2-(Ex) 2=p-p 2=p(1-p) 现在设随机变量x1 ,x2 ,...,xn相互独立且每个 都服从同一个零一分布, 来求出 hn =x1+x2+...+xn的分布
这里,每个只能取0,1(÷=1,2,…,n).因此, 7n只能取0,1,2,…,n.设为这些数字中的 任一个.mn取连等于说与,与,…,E中恰好有a 个值取1而其余的取0.在51,2,,En中计个 取1而其余取0的共有种方式这些 方式两两互斥按诸与的相互独立性,每 种方式出现的概率为p(1-p)".因此 P{n=li}=p(1-p)”(i=0.1,2,…,n 即mn服从,z(m,p) 3 2021/2/20
2021/2/20 3 这里, 每个xi只能取0,1(i=1,2,...,n). 因此, hn只能取0,1,2,...,n. 设i为这些数字中的 任一个. hn取i等于说x1 ,x2 ,...,xn中恰好有i 个值取1而其余的取0. 在x1 ,x2 ,...,xn中i个 取1而其余取0的共有 种方式,这些 i n 方式两两互斥. 按诸xi的相互独立性, 每 种方式出现的概率为p i (1-p) n-i . 因此 { } (1 ) ( 0,1,2, , ) i n i n n P i p p i n i h - = = - = 即hn服从B (n,p)
因为n=51+2++5n且5,,,相互独 立,E2=p,Dp(1-p),÷=1,2,…,n,所以 En=E1+E2+…+EEn=p D7n=D51+D22+…+DE7=mp(1-p) 2021/2/20
2021/2/20 4 因为hn =x1+x2+...+xn且x1 ,x2 ,...,xn相互独 立, Exi =p, Dxi =p(1-p), i=1,2,...,n, 所以 Ehn =Ex1+Ex2+...+Exn =np Dhn =Dx1+Dx2+...+Dxn =np(1-p)
中心极限定律 设随机变量,2,.5n相互独立,均值和 方差都一样,设E=八DFQ2,i=1,2,…,n, 则当n很大时(通常在100以上),它们的和 7n=1+52+,+近似服从正态分布Nm4 no) 推论 当n很大时,二项分布,(mn,)近似服从 正态分布Nnp,mp(1-p) (隶莫佛-拉普拉斯中心极限定理) 5 2021/2/20
2021/2/20 5 中心极限定律: 设随机变量x1 ,x2 ,...,xn相互独立, 均值和 方差都一样, 设Exi =m, Dxi =s2 , i=1,2,...,n, 则当n很大时(通常在100以上), 它们的和 hn =x1+x2+...+xn近似服从正态分布N(nm, ns2 ) 推论: 当n很大时, 二项分布B (n,p)近似服从 正态分布N(np,np(1-p)) (隶莫佛-拉普拉斯中心极限定理)
第三节相关系数 6 2021/2/20
2021/2/20 6 第三节 相关系数
,线性回归回归系数 在研究实际问题时,会遇到一些相互制 约的量,即它们之间存在一定的联系.这 些联系中有一类是大家所熟悉的函数关 系,即所谓确定性关系.譬如,自由落体 运动中,物体下落的距离s与所需的时间t 的关系为 g 7 2021/2/20
2021/2/20 7 一, 线性回归 回归系数 在研究实际问题时, 会遇到一些相互制 约的量, 即它们之间存在一定的联系. 这 些联系中有一类是大家所熟悉的函数关 系, 即所谓确定性关系. 譬如, 自由落体 运动中, 物体下落的距离s与所需的时间t 的关系为 1 2 2 s gt =
但是,经常还会遇到两个随机变量,它们 并不具有函数关系.例如,一族人的身长 与体重之间就是这样,一般说来,身高者, 体亦重.但这种联系不是确定性的,一个 人的体重并不能完全确定其身高.对于 这样两个随机变量,,希望用的某个 线性函数a+b(a,b都是常数)来近似表达 7当然问题是如何选取ab,使得在某种 含义上近似程度尽可能好. 8 2021/2/20
2021/2/20 8 但是, 经常还会遇到两个随机变量, 它们 并不具有函数关系. 例如, 一族人的身长 与体重之间就是这样, 一般说来, 身高者, 体亦重. 但这种联系不是确定性的, 一个 人的体重并不能完全确定其身高. 对于 这样两个随机变量x,h, 希望用x的某个 线性函数ax+b(a,b都是常数)来近似表达 h. 当然问题是如何选取a,b, 使得在某种 含义上近似程度尽可能好
以a+b近似表达时的均方误差为 E[n-(a2+b)]2 =El(n-En-as-E5+(En-aE5-b)12 E[(n-Em)2+a2(2E2)2+(EaEb)2 2a(n-Ens-E$+2(n-Enen-aEs-b 2a(s-Es(En-aE5-b)] -E(n-En2+aE(S-E52+(en-aE5-b)2 2aE(-En(s-esI 为了表达方便,令 (5,) E[(-Em)-E) ()o() 9 2021/2/20
2021/2/20 9 以ax+b近似表达h时的均方误差为 E[h-(ax+b)]2 =E[(h-Eh)-a(x-Ex)+(Eh-aEx-b)]2 =E[(h-Eh) 2+a 2 (x-Ex) 2+(Eh-aEx-b) 2 -2a(h-Eh)(x-Ex)+2(h-Eh)(Eh-aEx-b) -2a(x-Ex)(Eh-aEx-b)] =E(h-Eh) 2+a 2E(x-Ex) 2+(Eh-aEx-b) 2 -2aE[(h-Eh)(x-Ex)]. 为了表达方便, 令 [( )( )] ( , ) . (1) ( ) ( ) E E E h h x x x h s x s h - - =
Eln(a5+b)]2 E(n-En+ae(s-Es+(En-aEs-b) 2aE[(n}Em)(-E)] p(,7) E[(7-Em)-E) ()a() E[-(a5+b)]=a(m)+ao2() -2ap(,m)(2)o(n)+(E7-aE2-b)2 O a-(5,)Q(m +a2()1-p2(,m+(En-aE+b)2 2021/2/20
2021/2/20 10 E[h-(ax+b)]2 =E(h-Eh) 2+a 2E(x-Ex) 2+(Eh-aEx-b) 2 -2aE[(h-Eh)(x-Ex)]. [( )( )] ( , ) . (1) ( ) ( ) E E E h h x x x h s x s h - - = 2 2 2 2 2 2 2 2 2 2 [ ( )] ( ) ( ) 2 ( , ) ( ) ( ) ( ) ( ) ( ) ( , ) ( ) ( )[1 ( , )] ( ) E a b a a E aE b a E aE b h x s h s x x h s x s h h x s h s x x h s x s h x h h x - + = + - + - - = - + - + - -