53协方差与相关系数 、协方差的定义与性质 、随机变量的线性逼近与相关系数 欐率统计(ZYH) ▲区u
概率统计(ZYH) 5.3 协方差与相关系数 一、协方差的定义与性质 二、随机变量的线性逼近与相关系数
一、协方差的定义和性质 在52节方差性质4°的证明中 协方差 D(X±Y)=DX+DY±2E[(X-EXY-E)] D(X)+D()<x,独立口→冷0 即,如果随机变量X和Y是相互独立的,则必有 EI(-EXO-EDIO 这意味着当E(XEX(YEY均0时,X与Y不相互 独立或存在着一定的关系 为此,我们引入下面的定义 欐率统计(ZYH) ▲区u
概率统计(ZYH) 一、协方差的定义和性质 在5.2节方差性质4°的证明中 为此, 我们引入下面的定义. D X Y DX DY E ( ) 2 = + ( )( ) X EX Y EY − − 即,如果随机变量X和Y是相互独立的, 则必有 E[(X-EX)(Y-EY)]=0 这意味着当E[(X-EX)(Y-EY)]≠0时, X与Y 不相互 独立或存在着一定的关系. || 0 协方差 = D(X) + D(Y ) X,Y独立
定义1对二维(X,,若E[(X-EX)(Y-EY)]存在, 则称E[(X-E(Y-E)为随机变量X与Y的协方差记 为Cov(X,),即 CoV(X, Y)=EL(X-EX)(Y-EY)] 将上式展开,易得公式 CoV(X,Y=E(XY-(EX(Er 特别,当X与Y相互独立时,有 Cov(X,r=0 由协方差的定义亦容易推得协方差的如下性质 欐率统计(ZYH) ▲区u
概率统计(ZYH) 定义1 Cov( , ) ( ) ( )( ) X Y E XY EX EY = − ( , ), ( )( ) , ( )( ) , Cov( , ), X Y E X EX Y EY E X EX Y EY X Y X Y − − − − 协 对二维 若 存在 则称 为随机变量 与 的 记 为 方差 即 特别, 当X与Y 相互独立时,有 Cov( , ) ( )( ) X Y E X EX Y EY = − − 将上式展开, 易得公式 Cov( , ) 0 X Y = 由协方差的定义亦容易推得协方差的如下性质
协方差的性质CoVX,)=E(X-EX(Y-E 设a,b是常数,则当下所遇期望和协方差存在时,有 1°C0v(a,X)=0; 2 CoV (X, X)=DX 3 Cov(X, Y=Cov(Y, X) 4 Cov(ax, br=abCov(x, Y); 5 Cov(X+Y, Z=Cov(X, 2)+ Cov (r, 2) 例1设X为一随机变量,其方差为DX,Y=+bX, 其中a与b均为常数,求Cov(X,F A Cov(X, r)=Cov(a+bX, X) Cov(a, X)+bCov(X, X)=bDX 欐率统计(ZYH) ▲
概率统计(ZYH) 设a b, , , 是常数 则当下所遇期望和协方差存在时 有 协方差的性质 o 1 Cov( , ) 0; a X = o 2 Cov( , ) ; X X DX = o 3 Cov( , ) Cov( , ); X Y Y X = o 4 Cov( , ) Cov( , ); aX bY ab X Y = o 5 Cov( , ) Cov( , ) Cov( , ). X Y Z X Z Y Z + = + 例1 设X为一随机变量, 其方差为DX, Y=a+bX, 其中a与b均为常数, 求Cov( X ,Y ). 解 Cov( , ) Cov( , ) X Y a bX X = + = + Cov( , ) Cov( , ) a X b X X = bDX Cov( , ) ( )( ) X Y E X EX Y EY = − −
二、随机变量的线性逼近与相关系数 在解决实际问题时,常常需要用随机变量X的 线性函数a+bX逼近随机变量Y为了使这种逼近的 近似程度好,我们自然希望误差ya+b》)越小越 好或者更方便地用误差 r=ElY-(a+bX) 来衡量这种逼近的好坏程度显然,r的值越小,则表 示逼近程度越好故应取a,b使误差r的值最小 下面讨论a,b的取值 欐率统计(ZYH) ▲区u
概率统计(ZYH) 二、随机变量的线性逼近与相关系数 在解决实际问题时,常常需要用随机变量X的 线性函数a+bX逼近随机变量Y.为了使这种逼近的 近似程度好,我们自然希望误差|Y-(a+bX)|越小越 好.或者更方便地,用误差 来衡量这种逼近的好坏程度.显然,r的值越小,则表 示逼近程度越好.故应取a,b使误差r的值最小. 2 r = E[Y − (a + bX)] 下面讨论a,b的取值
参数a,b的确定(设DX>0,DY>0) r=Err-(a+bx) Er+a+b EX+2abEX-2aEy-2bE(Xn 00a rar 2a+2bEX-2EY 2bEX +2GEX-2E(XY ab 000 a=EY-bEX=EY CoV(X,Y) DYEX 得 b E(XY)-EXEY COV(X, Y) ab EX -(EX DX 欐率统计(ZYH) ▲
概率统计(ZYH) 参数a,b的确定 2 r = E[Y − (a + bX)] 2 2 2 ( ) 2 2 2 2 = EY + a + b EX + abEX − aEY − bE XY a bEX EY a r = 2 + 2 − 2 2 2 2 ( ) 2 bEX aEX E XY b r = + − a = EY −bEX 2 2 ( ) ( ) EX EX E XY EXEY b − − = DX Cov(X,Y ) = EX DX X Y EY Cov( , ) = − 得 0, 0, = = b r a r 令 (设DX DY 0, 0)
误差r的最小值:a=EY-Cm(x,PEX,b=CoX,n DX DX mIn elr-(a+bx) =ElY-EY CoV(X,Y EX+ CoV(X,Y DX DX E(Y-EY) Cov(x,Y (-EX) DX DY Cov(x,Y) =/、Cov(X,)2 DY DX DX√DY Cov(X,Y 记 XY (称其为X与Y的相关系数) DX√DY mIn =(1-p)DY 欐率统计(ZYH) ▲区u
概率统计(ZYH) 误差r的最小值: (称其为X Y 与 的相关系数) DX X Y b Cov( , ) = 2 min r = E[Y − (a + bX)] 2 Cov( , ) Cov( , ) = − − + X DX X Y EX DX X Y E Y EY ( ) 2 Cov( , ) ( ) = − − X − EX D X X Y E Y EY DX X Y DY 2 [Cov( , )] = − DY DX DY X Y = − 2 Cov( , ) 1 DX DY X Y XY Cov( , ) 记 = r (1 XY )DY 2 则 min = − , Cov( , ) EX DX X Y a = EY −
Cov(x,r 误差mn=(1-P3)DY,其中Px=√DX√DY 为相关系数 相关系数的性质相关系数满足|x1且 px=±1分→彐常数n,b,使P{Y=a+bX}=1 证由(-P3y)∥0知Ox11 mIn Pxy=土兮mn=0分3常数a,b,使EY-(a+bX)2=0 EXDIY-(a+bX)1+EY(a+bX)12=0 或Dy-(a+bX)=0且EY-(a+bX)=0 台→彐常数a,b,使P{Y=a+b}=1 欐率统计(ZYH) ▲
概率统计(ZYH) 相关系数的性质 其 中 为相关系数 DX DY X Y XY Cov( , ) (1 ) , = 2 误差r min = − XY DY XY = 1 常数a,b,使P{Y = a + bX} = 1 证 (1 ) 0 | | 1 2 min − XY = XY DY r 由 知 1 0 XY = r min = , , [ ( )] 0 2 常数a b 使E Y − a + bX = [ ( )] { [ ( )]} 0 2 或D Y − a + bX + E Y − a + bX = 或D[Y −(a + bX)] = 0且E[Y −(a + bX)] = 0 常数a,b,使P{Y = a + bX} = 1 相关系数满足|ρXY|≤1且
Cov(x,r 误差mm=(1-p)DY,其中px=√DX√DY 为相关系数 性质表明:当x较大时rm较小,此时X与Y (就线性关系来说)联系较紧密特别当xP=±1时, X与Y之间以概率1存在着线性关系 当x较小时rmm较大,此时X与Y(就线性关 系)联系不够紧密.特别当xy=0时rmim达到最大 X与Y之间无线性关系可言,这时称X与Y不相关 一般 地 相互独立→不相关 相关系数px刻画了随机变量X与Y的线性相关性 欐率统计(ZYH) ▲
概率统计(ZYH) 当|ρXY| 较大时rmin较小, 此时X与Y (就线性关系来说) 联系较紧密. 特别当ρXY=±1时, X与Y之间以概率1存在着线性关系. 当|ρXY| 较小时 rmin 较大, 此时X与Y (就线性关 系) 联系不够紧密. 特别当ρXY = 0 时 rmin 达到最大, X与Y 之间无线性关系可言, 这时称 X与Y 不相关. 性质表明: 其 中 为相关系数 DX DY X Y XY Cov( , ) (1 ) , = 2 误差r min = − XY DY 相关系数ρXY刻画了随机变量X与Y 的线性相关性 相互独立 不相关 一般 地
例2设随机变量X和Y的方差分别为4和16 相关系数为-0.5,求协方差Cov(X,Y 解Cov(X,Y)=px·√DX·√DY=-0.5×√4√l6=-4 例3设(X,Y) 相关东数p=-09 服从参数为A, 12 的 f(dy) 维正态分布, 求X与Y的相关 系数 欐率统计(ZYH) ▲
概率统计(ZYH) 设随机变量X和Y的方差分别为4和16, 相关系数为-0.5, 求协方差Cov( X ,Y ). 例2 解 Cov(X,Y ) = XY D X D Y = −0.5 4 16 = −4 1 2 2 2 1 2 ( , ) , ,,, , . X Y X Y 设 服从参数为 的 二维正态分布 求 与 的相关 系数 例3