第二讲方差协方差及相关系数 【授课题目(章节): §4.2方差§4.3协方差及相关系数 Ⅱ教学目的与要求: 理解方差的定义,掌握方差的性质,掌握方差的求法: 2.知道协方差及相关系数的概念。 Ⅲ教学重点与难点: 重点:方差的概念及求法 难点:相关系数 V讲授内容: 、方差 1.方差的定义 设X是一个随机变量,若E{X-E(X)}存在,则称E{X-E(X)}为X的方 差,记为D(X)或Var(X)。即D(X)=ar(X)=E{X-E(X)}。 并称√D(X灯为X的标准差或均方差。 随机变量X的方差表达了X的取值与其均值的偏离程度。 按此定义,若X是离散型随机变量,分布律为 P{X=x}=Pk=l2,. 则D(X)=∑[x4-E(X)P =l 若X是连续型随机变量,密度函数为∫(x),则 D(X)=[x-E(x)f(x)dx 方差常用下面公式计算:DX)=E(X2)-[E(X) 事实上DX)=E{LX-E(X)}=E{X2-2XE(X)+E2(X)} =E(X2)-2E(X)E(X)+E2(X)=E(X2)-E2(X) 例1三人射击,随机变量X,Y,Z分别表示三人的命中环数,其分布律分别为: X8910 Bo.10.8o.1 y8910 p0.40.20.4 Z8910 p0.2o.60.2 问三人谁的技术好? 解E(X)=9 E(Y)=9E(Z)=9
第二讲 方差 协方差及相关系数 Ⅰ 授课题目(章节): §4.2 方差 §4.3 协方差及相关系数 Ⅱ 教学目的与要求: 1. 理解方差的定义,掌握方差的性质,掌握方差的求法; 2. 知道协方差及相关系数的概念。 Ⅲ 教学重点与难点: 重点:方差的概念及求法 难点:相关系数 Ⅳ 讲授内容: 一、方差 1.方差的定义 设 X 是一个随机变量,若 2 E X E X [ ( )] − 存在,则称 2 E X E X [ ( )] − 为 X 的方 差,记为 D X( ) 或 Var X( ) 。即 D X( ) = Var X( ) = 2 E X E X [ ( )] − 。 并称 D X( ) 为 X 的标准差或均方差。 随机变量 X 的方差表达了 X 的取值与其均值的偏离程度。 按此定义,若 X 是离散型随机变量,分布律为 , 1,2, P X x p k = = = k k . 则 2 1 ( ) [ ( )] k k K D X x E X p = = − 若 X 是连续型随机变量,密度函数为 f x( ) ,则 2 D X x E X f x dx ( ) [ ( )] ( ) + − = − 方差常用下面公式计算: 2 2 D X E X E X ( ) ( ) [ ( )] = − 事实上 D X( ) = 2 E X E X [ ( )] − 2 2 = − + E X XE X E X 2 ( ) ( ) 2 2 2 2 = − + = − E X E X E X E X E X E X ( ) 2 ( ) ( ) ( ) ( ) ( ) 例1 三人射击,随机变量 X Y Z , , 分别表示三人的命中环数,其分布律分别为: 甲 X 8 9 10 k p 0.1 0.8 0.1 乙 Y 8 9 10 k p 0.4 0.2 0.4 丙 Z 8 9 10 k p 0.2 0.6 0.2 问三人谁的技术好? 解 E X( ) 9 = E Y( ) 9 = E Z( ) 9 =
又E(X2)=82×0.1+92×0.8+102×0.1=81.2 所以D(X)=E(X2)-[E(X)P=81.2-81=0.2 类似可得D(Y)=0.8D(Z)=0.4 从稳定性上说,甲技术最好。 例2设连续型随机变量X的概率密度函数为f(x)= A20<x<2,试求 0 其它 E(X),D(X)· 解因为f达=达=A=I 所数4号 0<x<2 0 其它 B0-广d=景 2 0-广h-是=号 所议x0=9-BXr-号-=易 2.方差的性质 (1)D(C)=0(C是常数) (2)D(CX)=C2D(X)(C是常数) (3)DX+C)=DX)(C是常数) (4)D(X+)=D(X)+D(Y)-2E(X-E(X)Y-E(Y)] 特别如随机变量X、Y相互独立,则D(X+Y)=D(X)+D(Y) 3.几种重要分布的方差 (1)0-1分布D(X)=pg (2)二项分布D(X)=pg (3)泊松分布D(X)=1 (4)均匀分布D()=b-a 12 (5)指数分布D(X)=02 (6)正态分布D(X)=o2 例3设随机变量X、Y相互独立,X~N(10,1),Y~N(7,2) 求E5X+2Y-),E5X-2Y-)
又 2 2 2 2 E X( ) 8 0.1 9 0.8 10 0.1 81.2 = + + = 所以 2 2 D X E X E X ( ) ( ) [ ( )] = − = − = 81.2 81 0.2 类似可得 D Y( ) 0.8 = D Z( ) 0.4 = 从稳定性上说,甲技术最好。 例2 设连续型随 机变量 X 的概率密度 函数为 2 0 2 ( ) 0 Ax x f x = 其它 ,试求 E X D X ( ), ( )。 解 因为 2 2 0 8 ( ) 1 3 f x dx Ax dx A + = = = - 所以 3 8 A = 3 2 0 2 ( ) 8 0 x x f x = 其它 E X( ) 2 3 0 3 3 ( ) 8 2 xf x dx x dx + = = - = 2 E X( ) 2 2 4 0 3 12 ( ) 8 5 x f x dx x dx + = = - = 所以 2 2 D X E X E X ( ) ( ) [ ( )] = − 12 3 3 2 ( ) 5 2 20 = − = 2.方差的性质 (1) D C( ) 0 = ( C 是常数) (2) 2 D CX C D X ( ) ( ) = ( C 是常数) (3) D X C D X ( ) ( ) + = ( C 是常数) (4) D X Y D X D Y E X E X Y E Y ( ) ( ) ( ) 2 [( ( ))( ( ))] + = + − − − 特别 如随机变量 X 、Y 相互独立,则 D X Y D X D Y ( ) ( ) ( ) + = + 3.几种重要分布的方差 (1)0——1 分布 D X pq ( ) = (2)二项分布 D X npq ( ) = (3)泊松分布 D X( ) = (4)均匀分布 2 ( ( ) 12 b a D X − = ) (5)指数分布 2 D X( ) = (6)正态分布 2 D X( ) = 例3 设随机变量 X 、Y 相互独立, 2 X N Y N ~ (10,1), ~ (7,2 ) 求(1) 1 ( 2 1) 3 E X Y + − , 1 ( 2 1) 3 E X Y − −
(②)D5X+2Y-1),D5X-2Y-I) 解E(写X+2Y-)=,E(X)+2E)-1=,x10+2×7-1=16 写X-2Y-)=号0-2500-1=3x10-2x7-1=-35 3 Dx+2r-)=DX0+4D-=g+4x4=16g D写x-2Y-)=gD)+4D0=写+4x4=16g 例4设随机变量X具有数学期望E(X)=4,方差D(X)=o2≠0, 记X=二L,则EX)=0,D(X)=1 解E(X)=EX-川=[E(X)-川=0 D(X)=E(X)-E(X)= =X-g 称X为X的标准化变量。 注意:这里X不一定是正态随机变量。对正态随机变量,结论也成立 例5设话塞的直径(以cm计)X~N(22.40,0.032),气缸的直径Y~W(22.50,0.042), X、Y相互独立。任取一只活塞,任取一只气缸,求活塞能装入气缸的概率。 解按题意需求P{X<Y=P{X-Y<0} 由于X-Y-N(-0.10,0.0025) 故有PKx<y=PX-y<0y=pK-门-0100-010) √0.0025 V0.00251 -808-a-09m 结论设随机变量X,~N(4,o),1=1,2,.n,且它们相互独立,则它们的线性组合 GX+G,X2+.cnX~N(∑c4,∑c2a2) =1 4.切比雪夫不等式 定理设随机变量X具有数学期望E(X)=4,方差D(X)=G2,则对于任意正数6, 不等就PX-小成立
(2) 1 ( 2 1) 3 D X Y + − , 1 ( 2 1) 3 D X Y − − 解 1 ( 2 1) 3 E X Y + − 1 1 1 ( ) 2 ( ) 1 10 2 7 1 16 3 3 3 = + − = + − = E X E Y 1 ( 2 1) 3 E X Y − − 1 1 35 ( ) 2 ( ) 1 10 2 7 1 3 3 3 = − − = − − = − E X E Y 1 ( 2 1) 3 D X Y + − 1 1 1 ( ) 4 ( ) 4 4 16 9 9 9 = + = + = D X D Y 1 ( 2 1) 3 D X Y − − 1 1 1 ( ) 4 ( ) 4 4 16 9 9 9 = + = + = D X D Y 例4 设随机变量 X 具有数学期望 E X( ) = ,方差 2 D X( ) = 0, 记 x X − = ,则 E X D X ( ) 0, ( ) 1 = = 解 1 1 E X E X E X ( ) ( ) [ ( ) ] 0 = − = − = 2 2 2 2 2 2 2 ( ) ( ) [ ( )] [( ] 1 [( ) ] 1 X D X E X E X E E X − = − = = − = = ) 称 X 为 X 的标准化变量。 注意:这里 X 不一定是正态随机变量。对正态随机变量,结论也成立。 例5 设活塞的直径(以 cm 计) 2 X N ~ (22.40,0.03 ) ,气缸的直径 2 Y~N(22.50,0.04 ) , X 、Y 相互独立。任取一只活塞,任取一只气缸,求活塞能装入气缸的概率。 解 按题意需求 P X Y P X Y = − 0 由于 X Y N − −( 0.10,0.0025) 故有 P X Y P X Y = − 0 ( ) ( 0.10) 0 ( 0.10) 0.0025 0.0025 X Y P − − − − − = 0.10 ( ) (2) 0.9772 0.05 = = = 结论 设随机变量 2 ( , ), 1,2, X N i i i i = .n ,且它们相互独立,则它们的线性组合 1 1 2 2 c X c X + + . n n c X ~ 2 2 1 1 ( , ) n n i i i i i i N c c = = 4.切比雪夫不等式 定理 设随机变量 X 具有数学期望 E X( ) = ,方差 2 D X( ) = ,则对于任意正数 , 不等式 2 2 P X − 成立;
或PK-4<≥1-a 二协方差及相关系数 1定义称E[X-E(X)[Y-E(Y)]}为随机变量X与Y的协方差。记为Cov(X,Y), Cov(X,Y)=E[X-E(X)][Y-E(Y)] Cov(X,Y) 而P灯= 称为随机变量X与Y的相关系数。 D(X)DOY) 2协方差的性质 (1)Cov(X,Y)=Cov(Y,X),Cov(X,X)=D(X) (2)Cov(X,Y)=E(XY)-E(X)E(Y) 我们常用这一式子计算协方差。 (3)Cov(aX,bY)=abCov(X,Y) (4)Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z) 3相关系数的性质 (1)Px≤1 (2)P=1的充要条件是,存在常数a,b,使PY=a+bX=1 P的大小表征着X与Y的线性相关程度。当Pg较大时,则X与Y的线性相关 程度较好:当Pg较小时,则X与Y的线性相关程度较差。 当Pg=0时,称X与Y不相关。 当X与Y相互独立时,X与Y不相关。反之,若X与Y不相关,X与Y却不一定 相互独立 例6箱子中有12件产品,其中2件是次品,每次从箱子中取一件产品,共取两次。定 义随机变量X、Y如下: 0若第一次取出正品 0若第二次取出正品 X= Y= 1若第一次取出次品 若第二次取出次品 求下面两种情形下的协方差与相关系数: 放回抽样: (2 )不放回抽样。 解 (1)写出联合分布律为: P.i 25 5 5 36 36 6 5 1 1 36 36 6 6 6 E(X)=0x +1x1 6 66
或 2 2 P X 1 − − 二 协方差及相关系数 1 定义 称 E X E X Y E Y {[ ( )][ ( )]} − − 为随机变量 X 与 Y 的协方差。记为 Cov X Y ( , ) , 即 Cov X Y ( , ) = E X E X Y E Y {[ ( )][ ( )]} − − 而 ( , ) ( ) ( ) XY Cov X Y D X D Y = 称为随机变量 X 与 Y 的相关系数。 2 协方差的性质 (1) Cov X Y ( , ) =Cov Y X ( , ) ,Cov X X D X ( , ) ( ) = (2) Cov X Y E XY E X E Y ( , ) ( ) ( ) ( ) = − 我们常用这一式子计算协方差。 (3) Cov aX bY abCov X Y ( , ) ( , ) = (4) Cov X Y Z Cov X Z Cov Y Z ( , ) ( , ) ( , ) + = + 3 相关系数的性质 (1) 1 XY (2) 1 XY = 的充要条件是,存在常数 a b, ,使 P Y a bX { } 1 = + = XY 的大小表征着 X 与 Y 的线性相关程度。当 XY 较大时,则 X 与 Y 的线性相关 程度较好;当 XY 较小时,则 X 与 Y 的线性相关程度较差。 当 0 XY = 时,称 X 与 Y 不相关。 当 X 与 Y 相互独立时, X 与 Y 不相关。反之,若 X 与 Y 不相关, X 与 Y 却不一定 相互独立。 例6 箱子中有 12 件产品,其中 2 件是次品,每次从箱子中取一件产品,共取两次。定 义随机变量 X 、Y 如下: 0 1 X = 若第一次取出正品 若第一次取出次品 0 1 Y = 若第二次取出正品 若第二次取出次品 求下面两种情形下的协方差与相关系数: (1) 放回抽样; (2)不放回抽样。 解 (1)写出联合分布律为: Y X 0 1 j p 0 25 36 5 36 5 6 1 5 36 1 36 1 6 i p 5 6 1 6 5 1 1 ( ) 0 1 6 6 6 E X = + =
Bn=0x名+1xgg Cov(XY)=E(XY)-E(X)E(Y) 0×0×36 +0x1 1x0×36 25 +1×1 36 3666 所以Pg=0 (2)联合分布律为 1 p 45 10 66 66 6 10 66 6 P. 1 6 45+1x0 +01x+1x66 11 E(XY)=0×0 6 66 66 Cov(X)=E(XY)-E(X)EY)=x 6666396 6 5 Cov(XY) 396 1 Px=- DVD元55=-0.091 V36V36 例7设连续型随机变量(X,Y)的概率密度为 12y2 f(x,y)= 0≤y≤x≤1 0 其它 求pg 解)=fx,y)d= 012yd=4x20≤x≤1 0 其它 B-x4x=号
5 1 1 ( ) 0 1 6 6 6 E Y = + = Cov XY E XY E X E Y ( ) ( ) ( ) ( = − ) 25 5 5 1 1 1 0 0 1 0 0 1 1 1 0 36 36 36 36 6 6 = + + + - = 所以 0 XY = (2) 联合分布律为 Y X 0 1 j p 0 45 66 10 66 5 6 1 10 66 1 66 1 6 i p 5 6 1 6 1 ( ) 6 E X = 1 ( ) 6 E Y = 45 10 10 1 1 ( ) 0 0 1 0 0 1 1 1 66 66 66 66 66 E XY = + + + = 1 1 5 ( ) ( ) ( ) ( 6 6 396 Cov XY E XY E X E Y = − − = − 1 )= 66 2 2 1 1 ( ) 1 6 6 E X + = 2 5 =0 6 2 1 ( ) 6 E Y = 所以 1 1 5 2 ( ) ( ) 6 6 36 D X = − = 5 ( ) 36 D Y = 5 ( ) 1 396 0.091 ( ) ( ) 5 5 11 36 36 XY Cov XY D X D Y − = = = − = − 例7 设连续型随机变量 (X Y, ) 的概率密度为 2 12 0 1 ( ) 0 y y x f x y = , 其它 ,求 XY 。 解 2 3 0 12 4 0 1 ( ) ( , ) 0 x x y dy x x f x f x y dy + − = = = 其它 1 3 0 4 ( ) 4 5 E x x x dx = =
f(y)=[f(x,y)dx= 12y2dk=12y20-y)0≤y≤1 0 其它 E)=012y20-d=亏 3 E(x)=fdfxy2dy=d= 1 Cov(xY)=E(XY)-E(X)E(Y)=1_4x31 25550 又c)=r4= 质以=-E号-房 75 E0)=2r0-y=2-yh-号 1 Po=- Cov(XY) 50 .6 D(X)D(Y) 21 4 V75V25 三矩 定义设X和Y是随机变量, 若E(X),k=1,2,.存在,称它为X的k阶原点矩,简称k阶矩。 若E[X-E(X)]},k=2,3,.存在,称它为X的k阶中心矩。 若E(X*y),k,1=1,2,.存在,称它为X和Y的k+I阶混合矩。 若E{[X-E(X][Y-E(Y)),k,1=1,2,.存在,称它为X和Y的k+1阶混合中 心矩 X的一阶原点矩即为数学期望,二阶中心矩即为方差:X和Y的二阶混合中心矩即 为协方差。 V小结与提问: 小结:方差D(X)=E[X-E(X)}描述随机变量X与它自己的数学期望E(X) 的偏离程度:我们常用公式D(X)=E(X)-[E(X)计算方差,注意E(X)和[E(X)户 的区别。计算协方差常用公式Cov(X,Y)=E(XY)-E(X)E(Y). Ⅵ课外作业: P141 21.25.28
1 2 2 12 12 (1 ) 0 1 ( ) ( , ) 0 y y y dx y y y f y f x y dx + − = − = = 其它 1 2 0 3 ( ) 12 (1 ) 5 E y y y ydy = − = 1 1 2 5 0 0 0 1 ( ) 12 3 2 x E xy dx xy y dy x dx = = = 4 3 1 ( ) ( ) ( ) ( 5 5 50 Cov XY E XY E X E Y = − − = 1 )= 2 又 1 2 2 3 0 2 ( ) 4 3 E x x x dx = = 所以 2 2 2 2 4 2 ( ) ( ) ( ) ( ) 3 5 75 D x E x E x = − = − = 1 1 2 2 2 4 5 0 0 2 ( ) 12 (1 ) 12 ( ) 5 E y y y y dy y y dy = − = − = 2 2 2 2 3 1 ( ) ( ) ( ) ( ) 5 5 25 D y E y E y = − = − = 1 ( ) 6 50 ( ) ( ) 2 1 4 75 25 XY Cov XY D X D Y = = = 三 矩 定义 设 X Y 和 是随机变量, 若 ( ), 1,2, k E X k = .存在,称它为 X 的 k 阶原点矩,简称 k 阶矩。 若 {[ ( )] }, 2,3, k E X E X k − = .存在,称它为 X 的 k 阶中心矩。 若 ( ), , 1,2, k l E X Y k l = .存在,称它为 X Y 和 的 k l + 阶混合矩。 若 {[ ( )] [ ( )] }, , 1,2, k l E X E X Y E Y k l − − = .存在,称它为 X Y 和 的 k l + 阶混合中 心矩。 X 的一阶原点矩即为数学期望,二阶中心矩即为方差; X Y 和 的二阶混合中心矩即 为协方差。 Ⅴ 小结与提问: 小结:方差 D X( ) = 2 E X E X [ ( )] − 描述随机变量 X 与它自己的数学期望 E X( ) 的偏离程度;我们常用公式 2 2 D X E X E X ( ) ( ) [ ( )] = − 计算方差,注意 2 E X( ) 和 2 [ ( )] E X 的区别。计算协方差常用公式 Cov X Y E XY E X E Y ( , ) ( ) ( ) ( ) = − 。 Ⅵ 课外作业: P141 21.25. 28