第三节协方差和相关系数
第三节 协方差和相关系数
、协方差 如果X与Y相互独立,则 EX-EOIIY-E(DIEX-E(XJE-EODI=O 因此,对于任意两个随机变量X与Y,若 E{[X-E(X)YE(}≠0, 则随机变量X与Y不相互独立,从而说明X与Y之间有 定联系,因而给出如下定义。 定义44设(X,刀为二维随机变量,若 E{X-E(X川IYE(Y}存在,则称它是随机变量X与Y的 协方差,记为Cov(X,,即 COV(,Y=ERIX-E(XIIY-E(nD (4.15 显然有Cov(XX=D(X
一、协方差 如果X与Y相互独立,则 E{[X-E(X)][Y-E(Y)]}=E[X-E(X)]E[Y-E(Y)]=0 因此,对于任意两个随机变量X与Y,若 E{[X-E(X)][Y-E(Y)]}≠0, 则随机变量X与Y不相互独立,从而说明X与Y之间有一 定联系,因而给出如下定义。 定义4.4 设(X,Y)为二维随机变量,若 E{[X-E(X)][Y-E(Y)]}存在,则称它是随机变量X与Y的 协方差,记为Cov(X,Y),即 Cov(X,Y)=E{[X-E(X)][Y-E(Y)]} (4.15) 显然有Cov(X,X)=D(X)
协方差C0v(X,Y,实际上就是计算二维随机变量 (X,的函数g(XY)=XE(别¥E(Y)的数学期望。 若(X,万)为二维离散型随机变量,联合分布律为 X-x y=yip 则由 Cov(X,1)=∑∑|x-E(X)川,-E()pn(416) 若(X,为二维连续型随机变量,联合概率密度为 fr,v), ++ Cov(X, r)= [x-E(X)IIy-E(Y)If(x, y)dxdy(4. 17
协方差Cov(X,Y),实际上就是计算二维随机变量 (X,Y)的函数g(X,Y)=[X-E(X)][Y-E(Y)]的数学期望。 Cov( , ) [ ( )][ ( )] . (4.16) 1 1 i j i j E Y pij X Y x E X y 则由 若(X,Y)为二维离散型随机变量,联合分布律为 P{X=xi, Y=yj}=pij, i=1,2, … , j=1,2, … , 若(X,Y)为二维连续型随机变量,联合概率密度为 f(x,y), Cov( , ) [ ( )][ ( )] ( , )d d . (4.17) X Y x E X y E Y f x y x y
为便于计算协方差Cov(X,Y),常采用以下公式 COV(X,Y=E(XY-E(E(n 证Cov(XY)=E{X-E(X)川y-E(} FE XY-XE(Y-YE(+E(E(nI =E(XDE(YE(XE(E(Y+E(XE(Y FE(XD-EOEY 协方差具有下列性质。 性质1Cov(X,)=Cov(YX) 性质2Cov(aX+c,bY+=mbC0v(X,刀),这里a,b,C 均为常数。 推论Cov(aX,bY)= above(X,),a,b为常数
为便于计算协方差Cov(X,Y),常采用以下公式 Cov(X,Y)=E(XY)-E(X)E(Y). 证 Cov(X,Y)=E{X-E(X)][Y-E(Y)]} =E[XY-XE(Y)-YE(X)+E(X)E(Y)] =E(XY)-E(Y)E(X)-E(X)E(Y)+E(X)E(Y) =E(XY)-E(X)E(Y). 协方差具有下列性质。 性质1 Cov(X,Y)=Cov(Y,X). 性质2 Cov(aX+c,bY+d)=abCov(X,Y), 这里a,b,c,d 均为常数。 推论 Cov(aX,bY)=abCov(X,Y), a,b为常数
性质3Co(X1+X2,Y=Cov(X1,Y)+C0v(X2,) 推论Cov(X+X2,Y1+Y2)=Cov(X1,Y1)+Cov(X1,Y2) +Cov(X2, 1+Cov (X2, Y2). 性质4若X与Y相互独立,则Cov(XY)=0 推论1若X与Y相互独立,则D(X±刀)=D(X)+D(Y 性质5D(X+)=D(X)+D(Y)+2Cov(X,Y 推论2D(X)=D(X)+D(Y-2C0v(X
性质3 Cov(X1+X2 ,Y)=Cov(X1 ,Y)+Cov(X2 ,Y). 性质4 若X与Y相互独立,则Cov(X,Y)=0. 推论2 D(X-Y)=D(X)+D(Y)-2Cov(X,Y). 推论 Cov(X1+X2 ,Y1+Y2)=Cov(X1 ,Y1)+Cov(X1 ,Y2) +Cov(X2 ,Y1)+Cov(X2 ,Y2). 性质5 D(X+Y)=D(X)+D(Y)+2Cov(X,Y). 推论1 若X与Y相互独立,则D(X±Y)=D(X)+D(Y)
二、相关系数 定义45若D(X)>0,D(Y)>0,则称数值 Cov(X, Y) 为随机变量X与Y的线性相关系数,简称相 D()yD(r) 关系数,记为xy,即 Cov(X,Y) D(X)√D(Y X与Y的相关系数a实际上为X,Y的标准化随机变 量的协方差
二、相关系数 关系数,记为 即 为随机变量 与 的线性相关系数,简称相 定义 若 则称数值 , ( ) ( ) Cov( , ) 4.5 ( ) 0, ( ) 0, XY X Y D x D Y X Y D X D Y . ( ) ( ) Cov( , ) D X D Y X Y XY X与Y的相关系数XY实际上为X,Y的标准化随机变 量的协方差
若r*≤X-E(X ,P*Y-E(r ,分别为X与Y的标 D(X) √D(Y) 准化,则X与y的协方差 Cov(X,r COV(X-E(X,Y-E(n) √D(X)√D(Y) Cov(X,Y D(X)ND(Y) XY°
准化,则 与 的协方差 若 分别为 与 的标 * * * * , ( ) ( ) , ( ) ( ) X Y X Y D Y Y E Y Y D X X E X X . ( ) ( ) Cov( , ) ( ) ( ) Cov( ( ), ( )) Cov( , ) * * XY D X D Y X Y D X D Y X E X Y E Y X Y
例1设X~N,a2),Y~N(,a2,且X与Y相互独立, 求U=ax+BY,V=aXB的相关系数(其中a,B是不为零 的常数。 解由已知有D(X)=D(Y)=a2.由于X与相互独立, 从而有 D(UD(ax+Br=a2D()+B2D(r=(az+B2)o2, D(=D(ax-Br=a2D(A)+B2D(r=(a2+B2)02 根据协方差性质, Cov(U,v=Cov(ax+Bl, ax-Bn)
例1 设X~N(,2), Y~N(,2), 且X与Y相互独立, 求U=X+Y, V=X-Y的相关系数(其中,是不为零 的常数。) 解 由已知有D(X)=D(Y)=2 . 由于X与Y相互独立, 从而有 D(U)=D(X+Y)=2D(X)+2D(Y)=(2+2)2 , D(V)=D(X-Y)=2D(X)+2D(Y)=(2+2)2 . 根据协方差性质, Cov(U,V)=Cov(X+Y,X-Y)
a Cov(X, X)-aBCov(,n) +aBCov(Y, X)-B2Cov(,y a2D(X)B2D(n (a2-B2) 从而有 Cov(U,) DQU)D(V) (a2-B2)a2 (a2+f2)a2 a-B a2+B2
. ( ) ( ) ( ) ( ) ( , ) 2 2 2 2 2 2 2 2 2 2 D U D V Cov U V UV =2D(X)-2D(Y) =(2-2)2 . =2Cov(X,X)-Cov(X,Y) +Cov(Y,X)-2Cov(Y,Y) 从而有
定义4.6若ay=0,称X与Y不相关。否则,称为相 关,其中,若ay>0,称X与Y正相关;若Px<0,称X与Y 负相关。 例2设(XY)的联合分布律为 92919 929 求p
例2 设(X,Y)的联合分布律为 定义4.6 若XY=0, 称X与Y不相关。否则,称为相 关,其中,若XY>0, 称X与Y正相关;若XY<0, 称X与Y 负相关。 2 0 0 1 0 2 0 0 1 Y X 9 1 9 1 9 1 9 2 9 2 9 2 求XY