§4.3协方差、相关系数和矩 他苏差构果素数的卷 >、他市差和相素数的质 >。的会
§43协方差、相关系数和矩 主则和每关买的禽 除了关心它的各个分 量的数学期望和方差外,还需要知道这两个分量之 平间的相互关系,这种关系无法从各个分量的期望和 方差来说明,这就需要引进描述这两个分量之间相 下互关系的数字特征协方差及相关系数,但如何 广来刻画这种关系呢? 上由(417知若x与y相互独立则Ax-EXy-E0; 若(X-EXY-Ey≠0,则表示X与Y不独立X与Y之间 存在着一定的关系据此我们引入下列定义 上页
§4.3 协方差、相关系数和矩 一、协方差和相关系数的概念 对于二维随机变量 ,除了关心它的各个分 量的数学期望和方差外,还需要知道这两个分量之 间的相互关系,这种关系无法从各个分量的期望和 方差来说明,这就需要引进描述这两个分量之间相 互关系的数字特征——协方差及相关系数,但如何 来刻画这种关系呢? 由(4-17)知,若 相互独立,则 ; 若 ,则表示X与Y不独立,X与Y之间 存在着一定的关系.据此,我们引入下列定义 (X , Y) X与Y E(X − EX)(Y − EY)= 0 E(X − EX)(Y − EY) 0
定义4.6设(X,Y)是二维随机变量,则称E(xEX)YEY r为X与Y的协方差( Covariance),记为o(X,或ax,即 王∞o(x.,y)==(x-EX=E (4-20) 若x=√DX≠0且a=Dy≠0,则称 coV(, Y XY DX.√DY (4-21) 上为X与的相关系数( Correlation Coefficient(x,)是 斗厂有量纲的量,而O则是无量纲的量 协方差常用下列公式计算 工工 ST cov(Y, Y)=E(XY)-EXEY 事实上, 上页
定义4.6 设 是二维随机变量, 则称 为X与Y的协方差(Covariance),记为 或 , 即 (4—20) 若 且 ,则称 (4—21) 为X与Y的相关系数(Correlation Coefficient). 是 有量纲的量,而 则是无量纲的量. 协方差常用下列公式计算 事实上, (X , Y) E(X − EX)(Y − EY) cov(X, Y) XY cov(X, Y) = XY = E(X − EX)(Y − EY) X = DX 0 Y = DY 0 XY X Y XY = DX DY X Y = cov( , ) cov(X, Y) XY cov(X, Y) = E(XY)− EX EY
cow(五,Y)=E[x-BxY-EF 互[xY-x.E-F.Ex+ExEy E(xY)-应x·应Y+EY应x+Ex·EY =E(Y)-Bx·EY 协方差和相关系数的性质 性质1.cov(H,Y)=cow(Y,H (4-23) H性质2.cov(x,x)=Dx (4—24) N性质3c0(ax,by)=abc0w(x,,a,b是常数 (4-25) 性质4.0x1+x2,Y)=0(x1,r)+0(x2,) (4-26) 性质5.D(x±Y)=Dx+DY±2co(x,Y (4-27) 上页
定理41(柯西许瓦兹( Cauchy- Schwarz)不等式) (X,Y)为二维随机变量,若(x)和E2)存在,则 (EXY)2≤E(X2),E(r2) (428) 证明因为Ws2(x2+y),所以E()存在另一方面对 任意λ∈R二次三项式 E(x+y)2=E(x2)+2E(xy)+B(y2)≥0,(429) 可见上述关于的二次三项式不可能有两个不同的实根, 上因而判别式 △=4(EX)2-4E(X2),E(Y2)≤0 即有EXY)≤E(X2)E(Y2) 定理42设(X,Y)是二维随机变量,若X与Y的相关系 牛数存在则 r(1)/|≤l (430) (2)p1=1的充要条件是存在常数(0b使P=ax+b}= 上页
定理4.1 (柯西—许瓦兹(Cauchy-Schwarz)不等式) (X,Y)为二维随机变量,若 和 存在,则 (4—28) 证明 因为 , 所以 存在. 另一方面,对 任意λ ,二次三项式 , (4—29) 可见上述关于λ的二次三项式不可能有两个不同的实根, 因而判别式 即有 □ 定理4.2 设(X,Y)是二维随机变量,若X与Y的相关系 数 存在,则 (1) (4—30) (2) 的充要条件是存在常数 使 . ( ) 2 E X ( ) 2 E Y ( ) ( ) ( ) 2 2 2 EXY E X E Y ( ) 2 2 2 1 XY X + Y E(XY) R ( ) ( ) 2 ( ) ( ) 0 2 2 2 2 E X + Y = E X + E XY + E Y 4( ) 4 ( ) ( ) 0 2 2 2 = EXY − E X E Y ( ) ( ) ( ) 2 2 2 EXY E X E Y XY XY 1 XY =1 a ( 0)、 b, PY = aX + b=1
证明(1)由定理41知 cov(X, Y2=ELY-EXY-EY<ELY-EXEY -EY=DXDy, 平图此cox,n)1,即,ys1,所以11 DX·√Dy (2)我们略去结论(2)的充分性证明,这里只给出必要 性的证明: 生则三次三式右4+23)中的和分别换为和 E((X-EX+(Y-ED)=22 DX+2/cov(X, Y)+DY 即 D(X+Y)=22+2A0Xa,+a2≥0 上特别地,当等于二次三项式的最小值点礼=Pm时,上 广式变为 X D(0X+Y)=(1-p2x)a2≥0 上页
证明 (1) 由定理4.1知 , 因此 , 即 ,所以 . (2)我们略去结论(2)的充分性证明,这里只给出必要 性的证明: 将二次三项式(4—29)中的X和Y分别换为 和 则对任意λ ,有 , 即 . 特别地,当 等于二次三项式的最小值点 时,上 式变为 (X Y ) = E(X − EX )(Y − EY) EX − EX EY − EY = DX DY 2 2 2 2 cov , 1 cov( ) 2 DX DY X,Y ( ) 1 2 XY XY 1 (X − EX ) (Y − EY) R ( ( ) ( )) 2 cov( , ) 2 2 E X − EX + Y − EY = DX + X Y + DY ( ) 2 0 2 2 2 D X +Y = X + XY X Y + Y X XY Y 0 − ( ) (1 ) 0 2 2 D 0 X + Y = − X Y Y
王 由于y|=1,故D(A0X+Y)=0.根据方差性质4有 P1X+y=E(1X+Y)}=1即P{=(-1)X+E(0X+1)=1 c于是存在常数a=-1和b=E(4nXx+1)使P{Y=ax+b}=1 显然,利用(431)亦可证(430)的结论成立不过, 给出(431)的主要目的还在于证明结论(2)的必要性 定理42表明:X与Y的相关系数是衡量X与Y之间线性相关 程度的量.当Pm=1时,X与Y依概率线性相关;特别当 滩Pxy=1时yY随X的增大而线性增大,此时称X与Y线性正相关 ( Positive correlation);当Px=-1时,Y随X的增大而线性地减 小,此时称X与Y线性负相关 Negative Correlation当变小 时,X与Y的线性相关程度就变弱如果P=0,X与Y之间就不存 在线性关系,此时称X与Y不相关( Uncorrelated) 需要指出的是:这里的不相关指的是从线性关系上看没有 关联并非X与Y之间没有任何关系也许此时还存在别的关系
由于 ,故 . 根据方差性质4,有 即 于是, 存在常数 和 使 □ 显然,利用(4—31)亦可证(4—30)的结论成立. 不过, 给出(4—31)的主要目的还在于证明结论(2)的必要性. 定理4.2表明:X与Y的相关系数是衡量X与Y之间线性相关 程度的量.当 时,X与Y依概率1线性相关;特别当 时,Y随X的增大而线性增大,此时称X与Y线性正相关 (Positive Correlation);当 时,Y随X的增大而线性地减 小,此时称X与Y线性负相关(Negative Correlation);当 变小 时,X与Y的线性相关程度就变弱;如果 =0,X与Y之间就不存 在线性关系,此时称X与Y不相关(Uncorrelated). 需要指出的是:这里的不相关,指的是从线性关系上看没有 关联,并非X与Y之间没有任何关系,也许此时还存在别的关系. XY =1 D(0 X +Y) = 0 P0 X +Y = E(0 X +Y) = 1 PY = (−0 )X + E(0 X +Y)=1 a = −0 ( ) b = E 0 X +Y PY = aX + b=1 XY =1 XY =1 XY = −1 XY XY
独立与不相关都是随机变量之间相互联系程度的一种反映, 独立指的是X与Y没有任何关系,不相关指的X与Y之间没有线 H性相关关系 事实上,若X与Y独立,则X与Y一定不相关(这可以利用 (4-10)和(4-19)进行证明);但反过来,着x与Y不相 中关,则X与Y却未必独立 然而,对于二维正态随机变量(X,)而言,X与Y的独立性 与不相关性却是等价的,我们有如下结果 定理43设X,Y)~M(A1H2,o2,a2,p)则 PXy =p (432) 证明显然,我们有E(X)=12DX=G2,EY=2,DY=a2 而 上页
独立与不相关都是随机变量之间相互联系程度的一种反映, 独立指的是X与Y没有任何关系,不相关指的X与Y之间没有线 性相关关系. 事实上,若X与Y独立,则X与Y一定不相关(这可以利用 (4-10)和(4-19)进行证明);但反过来,若X与Y不相 关,则X与Y却未必独立. 然而,对于二维正态随机变量 而言,X与Y的独立性 与不相关性却是等价的,我们有如下结果: 定理4.3 设 则 (4—32) 证明 显然,我们有 ,而 (X , Y) (X Y ) N( , ) 2 2 2 1 2 1 , ~ , , , XY = ( ) 2 2 2 2 1 1 E X = , DX = , EY = , DY =
cov(X, Y)=(x-H1)(y-u2)f(x, y)dxdy+ rC(-X-092 x-内、2(x-A) dyer 2 12 2x-1 则 x.)=1∫“(5h-+m0) dtds ds)c 1 se 2 ds te 2 dt CIo2 2丌 因此 (x,Y) Dx√DY 上页
推论设(X,1)~N(1,2a1,a2,D),则x与Y相互独立的 充要条件是X与Y不相关 证明由定理3知若(x,Y)N(4,p2,2,o2,p),则x 与Y相互独立的充要条件是=0,由定理4.3知,y=p,因 此,X与Y相互独立的充要条件是X与Y不相关 根据上面的讨论,二维正态随机变量(X,Y的概率密度中 的参数?就是X和Y的相关系数,因而二维正态随机变量(X,Y c的分布就完全可由X和Y的数学期望、方差以及它们的相关系 数所确定 随机变量除了前面介绍的数学期望、方差、协方差以及它 c们的相关系数等数字特征外,还存在许多其它的数字特征下 面介绍另外几种常见的数字特征 三、矩的概念 上页
推论 设 ,则X与Y相互独立的 充要条件是X与Y不相关. 证明 由定理3.3知, 若 ,则X 与Y相互独立的充要条件是 ,由定理4.3知, ,因 此,X与Y相互独立的充要条件是X与Y不相关. □ 根据上面的讨论,二维正态随机变量 的概率密度中 的参数 就是X和Y的相关系数,因而二维正态随机变量 的分布就完全可由X和Y的数学期望、方差以及它们的相关系 数所确定. 随机变量除了前面介绍的数学期望、方差、协方差以及它 们的相关系数等数字特征外,还存在许多其它的数字特征,下 面介绍另外几种常见的数字特征. 三、矩的概念 (X Y ) N( , ) 2 2 2 1 2 1 , ~ , , , (X Y ) N( , ) 2 2 2 1 2 1 , ~ , , , = 0 XY = (X , Y) (X , Y)