第三章随机变量的教特怔 【授课对象】理工类本科二年级 【授课时数】4学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解数学期望、方差的概念,并掌握它们的性质。 2、会计算随机变量函数的数学期望。 3、了解协方差、相关系数的概念 本章重点】对数学期望、方差、相关系数等数字特征概念的理解与计算。 【本章难点】对不相关与相互独立间关系的理解。 【授课内容及学时分配】 §3.0前言 从上一章我们可以看出,分布函数(或密度函数、分布列)给出了随机变量的一种最完 全的描述。因此,原则上讲,全面认识和分析随机现象就应当求出随机变量的分布,但是对 许多实际问题来讲,要想精确地求出其分布是很困难的。其实,通过对现实问题的分析,人 们发现对某些随机现象的认识并不要求了解它的确切分布,而只要求掌握他们的某些重要特 征,这些特征往往更能集中地反映随机现象的特点。例如要评价两个不同厂家生产的灯泡的 质量,人们最关心的是谁家的灯泡使用的平均寿命更长些,而不需要知道其寿命的完全分布, 同时还要考虑其寿命与平均寿命的偏离程度等,这些数据反映了它在某些方面的重要特征。 我们把刻划随机变量(或其分布某些特征的确定的数值称为随机变量的数字特征。 本章主要介绍反应随机变量取值的集中位置、分散程度以及随机变量之间的线性相依程 度的数字特征一一数学期望、方差与相关系数(矩)。 §3.1随机变量的数学期望 、离散型随机变量的数学期望 引例:甲、乙二人进行射击比赛,以5、n分别表示他们命中的环数,其分布列分别为 8910 0.30.10.6 0.20.50.3 试问谁的技术好些?
1 第三章 随机变量的数字特征 【授课对象】理工类本科二年级 【授课时数】4 学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解数学期望、方差的概念,并掌握它们的性质。 2、会计算随机变量函数的数学期望。 3、了解协方差、相关系数的概念。 【本章重点】对数学期望、方差、相关系数等数字特征概念的理解与计算。 【本章难点】对不相关与相互独立间关系的理解。 【授课内容及学时分配】 §3.0 前 言 从上一章我们可以看出,分布函数(或密度函数、分布列)给出了随机变量的一种最完 全的描述。因此,原则上讲,全面认识和分析随机现象就应当求出随机变量的分布,但是对 许多实际问题来讲,要想精确地求出其分布是很困难的。其实,通过对现实问题的分析,人 们发现对某些随机现象的认识并不要求了解它的确切分布,而只要求掌握他们的某些重要特 征,这些特征往往更能集中地反映随机现象的特点。例如要评价两个不同厂家生产的灯泡的 质量,人们最关心的是谁家的灯泡使用的平均寿命更长些,而不需要知道其寿命的完全分布, 同时还要考虑其寿命与平均寿命的偏离程度等,这些数据反映了它在某些方面的重要特征。 我们把刻划随机变量(或其分布)某些特征的确定的数值称为随机变量的数字特征。 本章主要介绍反应随机变量取值的集中位置、分散程度以及随机变量之间的线性相依程 度的数字特征——数学期望、方差与相关系数(矩)。 §3.1 随机变量的数学期望 一、离散型随机变量的数学期望 引例:甲、乙二人进行射击比赛,以 、 分别表示他们命中的环数,其分布列分别为 ~ 0.3 0.1 0.6 8 9 10 ~ 0.2 0.5 0.3 8 9 10 试问谁的技术好些?
解:这个问题的答案并不是一眼看得出的。这说明了分布列虽然完整地描述了离散型随 机变量的概率特征,但是却不够“集中”地反映出它的变化情况,因此我们有必要找出一些 量来更集中、更概括地描述随机变量,这些量多是某种平均值。 若在上述问题中,使两个射手各射N枪,则他们打中靶的总环数大约是 甲8×0.3N+9×0.1N+10×0.6N=93N 乙8×0.2N+9×0.5N+10×0.3N=9.1N 平均起来甲每枪射中9.3环,乙每枪射中9.1环,因此可以认为甲射手的本领要好些 受上面问题的启发,对一般离散型随机变量,我们引入如下定义: 定义设为离散型随机变量,其分布列为:xx 若∑|x0, 试求E 解:E ∑k(,),令 b则0<b<1 +a1+a 1+a 从而有∑1)=∑=bb-=(b)=△b” 所以E=( 1+a1+a 1+a
2 解:这个问题的答案并不是一眼看得出的。这说明了分布列虽然完整地描述了离散型随 机变量的概率特征,但是却不够“集中”地反映出它的变化情况,因此我们有必要找出一些 量来更集中、更概括地描述随机变量,这些量多是某种平均值。 若在上述问题中,使两个射手各射 N 枪,则他们打中靶的总环数大约是: 甲 8 0.3 N+9 0.1N+10 0.6N=9.3N 乙 8 0.2N+9 0.5N+10 0.3N=9.1N 平均起来甲每枪射中 9.3 环,乙每枪射中 9.1 环,因此可以认为甲射手的本领要好些。 受上面问题的启发,对一般离散型随机变量,我们引入如下定义: 定义 1:设 为离散型随机变量,其分布列为: 1 2 1 2 p p x x ,若 = i i xi p 1 + 则称:E = i i xi p =1 为 的数学期望或均值。 〖注〗:为使 E 与级数各项的次序无关,必须要求 i i xi p =1 收敛;否则, E 不存在。 例 1:设用一个匀称的骰子来玩游戏。在这样的游戏中,若骰子向上为 2,则玩游戏的人 赢 20 元,若向上为 4 则赢 40 元,若向上为 6 则输 30 元,若其它的面向上,则玩游戏的人既 不赢也不输,求玩游戏的人赢得钱数的期望和。 解:令 为任何一次抛掷中赢得钱数,则 − 1/ 2 1/ 6 1/ 6 1/ 6 0 20 40 30 ~ ,则由离散型随机变 量数学期望的定义可知: E = 01/ 2 + 201/ 6 + 401/ 6 − 301/ 6 = 5 从而玩游戏的人可期望赢 5 元,因此,在一个公正的游戏中,玩游戏的人为了参加游戏应当 付 5 元底金。 例 2:设随机变量 只取非负整数值,且其分布列为 0 (1 ) { } 1 + = = + a a a P k k k , 试求 E 。 解: 0 1 1 ) 1 ( 1 1 0 (1 ) 1 1 = + + + = + = = = + b b a a a a k a a a E k k k k k k ,令 则 从而有 2 ' ' 1 1 1 1 1 1 (1 ) ) 1 ) ( ) [ ] ( 1 ( b b b b k b b k b b b b b b a a k k k k k k k k k k k − = − = = = = = + = = = − = = 所以 a a a a a a E = + − + + = 2 ) 1 ) (1 1 1 1 (
二、连续型随机变量的数学期望 由离散型随机变量数学期望的定义,我们自然可以设想取很密的分点x0<x1<…<xn 将(-∞+∞)分割成n个小区间,则ξ落在(x,x]内的概率等于 P{x,<5x,}=「"(x)x=(x1-x)=f(x1x1-x)(积分中值定理),其中落在x 与x1之间,因此当n→∞时,与以概率f(x1Xxn1-x)取值x1的离散型随机变量相似, 而后者的数学期望为∑x/(x)xm-x),而这个和式的极限就是x(x 为此,对一般连续型随机变量,我们引入如下定义: 定义2:设ξ为连续型随机变量,其密度函数为f(x),若广义积分 (xk<+,则称E(5)=x(xk为的数学期望或均值。 我们知道,若f(x)在x点连续时,有f(x)=F(x),从而dF(x)=f(x)kx,所以上述定义 等价于 定义2:设-F(x),若xF(x)<+∞,则称E(=[(x)为5的数学期望或均 值。 顺便指出,该定义是数学期望的一般定义,它对于离散型和连续型随机变量都适用 0<X≤1 例3:设连续型随机变量5~f(x)={2-x1<x≤2,求E5。 其它 解:由连续型随机变量数学期望的定义可知 E x(x)=x女+x(2-x1 +(x2-1/3x3)=1 随机变量函数的数学期望 我们经常需要求随机变量函数的数学期望,这时可以通过下面的定理来求随机变量函数 的数学期望。 定理:设n是随机变量ξ的函数:n=g(5)(其中g是连续函数), (1)ξ是离散型随机变量,它的分布律为p1=P{=x,},=1,2,…,若 g(x)P<+,则有En=E()=∑8(x)P; (2)5是连续型随机变量,其密度函数为f(x),若[(x(x)x+,则有
3 二、连续型随机变量的数学期望 由离散型随机变量数学期望的定义,我们自然可以设想取很密的分点 n x x x 0 1 , 将 (−,+) 分割成 n 个小区间,则 落 在 , ] i i+1 (x x 内的概率等于 { } ( ) ( )( ) ( )( ) 1 1 1 1 1 i i i i i x x i i P x x f x dx f x x f x x x i i + = = + − + + − + (积分中值定理),其中 落在 i x 与 i+1 x 之间,因此当 n → 时, 与以概率 ( )( ) i 1 i 1 i f x x − x + + 取值 i+1 x 的离散型随机变量相似, 而后者的数学期望为 + + + − i i i i i x f (x )(x x ) 1 1 1 ,而这个和式的极限就是 + − xf(x)dx 。 为此,对一般连续型随机变量,我们引入如下定义: 定义 2:设 为连续型随机变量,其密度函数为 f (x) ,若广义积分 + + − x f (x)dx ,则称 E xf x dx + − () = ( ) 为 的数学期望或均值。 我们知道,若 f (x) 在 x 点连续时,有 f (x) = F(x) ,从而 dF(x) = f (x)dx ,所以上述定义 等价于: 定义 2’:设 ~ F(x) ,若 + + − xdF(x) ,则称 E( ) xdF(x) + − = 为 的数学期望或均 值。 顺便指出,该定义是数学期望的一般定义,它对于离散型和连续型随机变量都适用。 例 3:设连续型随机变量 − = 0 其它 2 1 2 0 1 ~ ( ) x x x x f x ,求 E 。 解:由连续型随机变量数学期望的定义可知: 1 1 2 ( 1 3 ) 0 1 3 1 ( ) (2 ) 3 2 3 2 1 1 0 2 = = + − = + − = + − E x f x dx x dx x x dx x x x 三、随机变量函数的数学期望 我们经常需要求随机变量函数的数学期望,这时可以通过下面的定理来求随机变量函数 的数学期望。 定理:设 是随机变量 的函数: = g( ) (其中 g 是连续函数), (1) 是 离 散 型 随 机 变 量 , 它 的 分 布 律 为 pi = P{ = xi },i =1,2, , 若 + i i pi g(x ) ,则有 = = i i Pi E E[g()] g(x ) ; (2) 是连续型随机变量,其密度函数为 f (x) ,若 + + − g(x) f (x)dx ,则有
E[g(s)]= g(x)f(xXx 定理的证明超出了本书的范围,故略。 定理的重要意义在于当我们求En时,不必算出n的分布律或密度函数,而只需利用的 分布律或密度函数就可以求出。 例4;设5~p(=k}=e=p1k=012…,求E 则E Pk 1+kk1+k)! k+1 (e2-1)=(1-e) 上述定理还可以推广到两个或两个以随机变量函数的情形: 假设y是随机变量(5,n)的函数:y=g(,n)(其中g是连续函数) (3)(5,n)为二维离散型随机变量,其联合分布列为P=P{=x,n=y},1,j=12,…, 若∑∑(x<+,则有Ey=E8(m=∑∑(x,y)P i=l ja (4)ξ,n)为二维连续型随机变量,其联合密度函数为p(x,y),若 g(x,y)(x,y)th<+,则有Ey=Eg(m=∫8(x,y)p(xy)b 例5:设(,n)的密度函数为p(x,y) ∫x+y0≤x10≤y≤1 其它 试求+n,5n的数学期望 解:由定义知:E(+m)=C[(x+mxy)bh=[(x+ybh=76 E(Sn)= xypx, y)dxdy=xy(x+y)dxdy=1/3 四、数学期望的性质 1若a≤5≤b,则a≤E≤b。特别地:ECc=c,这里a,b,c为常数 2线性性质:vc∈R,=1.2…,n及b∈R有E∑c2+b)=∑cE1+b 特别地:E(c2)=cE,E(2+n=E+En
4 E E g g x f x dx + − = [ ()] = ( ) ( ) 。 定理的证明超出了本书的范围,故略。 定理的重要意义在于当我们求 E 时,不必算出 的分布律或密度函数,而只需利用 的 分布律或密度函数就可以求出。 例 4:设 0,1,2, ! ~ { = } = = = − e p k k p k k k ,求 1+ 1 E 。 解:令 + = 1 1 ,则 − = = + = + = e k k p k E k k k k 1 ! 1 1 1 0 0 = = + 0 + 1 k 1 k ( k )! − e = + − e n k 1 =1 ! n n n = − e (e -1)= (1 )/ − − e = =0 ! n n x n x e 上述定理还可以推广到两个或两个以随机变量函数的情形: 假设 是随机变量 ( ,) 的函数: = g(,) (其中 g 是连续函数) (3) ( , )为二维离散型随机变量,其联合分布列为 { , } ij i j P = P = x = y ,i , j =1,2, , 若 + = = ij i j g xi y j P 1 1 ) ( ,则有 = = = = 1 1 [ ( , )] ( , ) i j i j Pij E E g g x y ; (4)( , )为二维连续型随机变量,其联合密度函数为 p(x, y) ,若 + + − + − g(x, y) p(x, y)dxdy ,则有 E E[g( , )] g(x, y)p(x, y)dxdy + − + − = = 。 例 5:设( , )的密度函数为 + = 0 其它 0 1,0 1 ( , ) x y x y p x y 试求 + , 的数学期望。 解:由定义知: + = + = + = + − + − 1 0 2 1 0 E( ) (x y)p(x, y)dxdy (x y) dxdy 7 6 E() = + − + − xyp(x, y)dxdy= + 1 0 1 0 xy(x y)dxdy =1/3 四、数学期望的性质 1.若 a b ,则 a E b 。特别地: Ec = c ,这里 a, b ,c 为常数。 2.线性性质: ci R , i =1,2, ,n 及 bR 有 = = + = + n i i i n i E ci i b c E b 1 1 ( ) 。 特别地: E(c) = cE , E( + ) = E + E
愿孝:若E存在,则E(E()=? 3若,相互独立,则En=EE 证明:仅对ξ,s为连续型随机变量时给予证明。 事实上,Es=「「xyP(xy)ddhy=「「xyP:(x)Pn()dxd ∫xP:x)a∫yPn)h=EE 我们注意到,只要将证明中的“积分”用“和式”代替,就能得到离散型随机变量情形 的证明 【注】:性质3的逆不成立。 反例:设(5,)的联合分布为: 01/O 01/401/4 显然:E=En=0,Em=0,故有EEn=E5n 又P{=0,5=0}=0,而P{5=0 ,P{=0)=, 故P{n=0,5=0}≠P{=0}P{n=0},从而,n不独立 例6:假定国际市场上每年对我国某种出口商品的需求量是随即变量(单位:千吨),其 密度函数为P(x={2000 2000≤x≤4000 0 其它 设每售出这种商品一千吨,可为国家挣得外汇3千万元;但假如销售不了而囤积于仓库,则 每吨须花保养费1千万元,问需要组织多少货源,才能使国家收益最大? 解:设y为一年预备出口的该种商品量,由于外国的需求量为5,则国家收入n(单位 万元)是ξ的函数,且n=g(5) 13-(y-)5<y 这η为随机变量。若收益达到最大,那么其平均值也达到最大。 而Em5=8(=1了 f(x) 2000
5 思考:若 E 存在,则 E(E()) = ? 3.若 , 相互独立,则 E =E E 证明:仅对 , 为连续型随机变量时给予证明。 事实上,E = + − + − xyP(x,y) dxdy = + − + − xyP (x)P (y) dxdy = + − xP (x) dx + − yP (y) dy =E E 。 我们注意到,只要将证明中的“积分”用“和式”代替,就能得到离散型随机变量情形 的证明。 【注】:性质 3 的逆不成立。 反例:设( , )的联合分布为: 显然:E = E =0,E =0,故有 E E =E 又 P{ = 0, = 0} = 0,而 P{ = 0) = 2 1 ,P{ = 0) = 2 1 , 故 P{ = 0, = 0} P{ = 0}P{ = 0} ,从而 , 不独立。 例 6:假定国际市场上每年对我国某种出口商品的需求量是随即变量 (单位:千吨),其 密度函数为 P(x)= 0 其它 2000 4000 2000 1 x 设每售出这种商品一千吨,可为国家挣得外汇 3 千万元;但假如销售不了而囤积于仓库,则 每吨须花保养费 1 千万元,问需要组织多少货源,才能使国家收益最大? 解:设 y 为一年预备出口的该种商品量,由于外国的需求量为 ,则国家收入 (单位: 万元)是 的函数,且 =g( )= − − y y y y 3 ( ) 3 这 为随机变量。若收益达到最大,那么其平均值也达到最大。 而 E =Eg( )= + − g(x)P(x)dx = 4000 2000 ( ) 2000 1 f x dx
2000 y=x 1[3ydx 100270021 解得:当y=3500时,Eη取得最大值。因此,须组织3500千吨该商品,平均说来能使国家 的收益最大,这最好的决策。 课后作业:1、仔细阅读P60-73 2、作业:P801,2,4,5 、预习P73-79
6 = − − y x y x 2000 3 ( ) 2000 1 d x + ydx y 4000 3 2000 1 = 2 6 7000 4 10 1000 1 − y y − 解得:当 y =3500 时, E 取得最大值。因此,须组织 3500 千吨该商品,平均说来能使国家 的收益最大,这最好的决策。 课后作业:1、仔细阅读 P60-73; 2、作业:P80 1, 2, 4, 5; 3、预习 P73-79
§3.2方差 上节课,我们研究了随即变量的重要数字特征一一数学期望。它描述了随机变量一切可 能取值的平均水平。但在一些实际问题中,仅知道平均值是不够的,因为它有很大的局限性 还不能够完全反映问题的实质。例如,某厂生产两类手表,甲类手表日走时误差均匀分布在 -10~-10秒之间;乙类手表日走时误差均匀分布在-20~20秒之间,易知其数学期望均为0,即 两类手表的日走时误差平均来说都是0。所以由此并不能比较出哪类手表走得好,但我们从 直觉上易得出甲类手表比乙类手表走得较准,这是由于甲的日走时误差与其平均值偏离度较 小,质量稳定。由此可见,我们有必要研究随机变量取值与其数学期望值的偏离程度一一即 方差 方差的定义与计算 设5是随机变量,E5是其数学期望,则-E引表示5与E5之间的偏差大小,但由于绝 对值对运算带来得不便,所以常用(E)2代替之。又因为(5)2仍是一随机变量,则用 E(2-E2)2来描述与其EE的偏离程度的大小,为此有 1定义:设是一随机变量,若E(E5)2<+∞,则称E(E)2为随机变量ξ的方差,记 为D(或Ⅶr),即D5=E(5E5)2,而称√D5为的标准差(或均方差),记为()。 由定义,显然Dξ≥0,当ξ的可能取值集中在ξξ附近时,Dξ较小,否则D5较大。可 见,其大小就反映了与E5的偏离程度或取值的分散程度 2.计算: 由定义及随机变量函数的数学期望,可以推出方差的计算公式 ①D=E52-(E5) 事实上:D5=E(E5)2=E52-25E+CE5)] =E2EE+(E)2=E(E5)2 ②当ξ是离散型随机变量时,则有: D=E(E5)2=∑(x-EB)P,其中P=P{5=x}1=123 ③若ξ是连续变量,则有:
7 §3.2 方 差 上节课,我们研究了随即变量的重要数字特征——数学期望。它描述了随机变量一切可 能取值的平均水平。但在一些实际问题中,仅知道平均值是不够的,因为它有很大的局限性, 还不能够完全反映问题的实质。例如,某厂生产两类手表,甲类手表日走时误差均匀分布在 -10~10 秒之间;乙类手表日走时误差均匀分布在-20~20 秒之间,易知其数学期望均为 0,即 两类手表的日走时误差平均来说都是 0。所以由此并不能比较出哪类手表走得好,但我们从 直觉上易得出甲类手表比乙类手表走得较准,这是由于甲的日走时误差与其平均值偏离度较 小,质量稳定。由此可见,我们有必要研究随机变量取值与其数学期望值的偏离程度——即 方差。 一、方差的定义与计算 设 是随机变量,E 是其数学期望,则 − E 表示 与 E 之间的偏差大小,但由于绝 对值对运算带来得不便,所以常用( -E ) 2 代替之。又因为( -E ) 2 仍是一随机变量,则用 E( -E ) 2 来描述 与其 E 的偏离程度的大小,为此有: 1.定义:设 是一随机变量,若 E( -E ) 2 <+ ,则称 E( -E ) 2 为随机变量 的方差,记 为 D (或 Var ),即 D =E( -E ) 2 ,而称 D 为 的标准差(或均方差),记为 ( ) 。 由定义,显然 D 0,当 的可能取值集中在 E 附近时,D 较小,否则 D 较大。可 见,其大小就反映了 与 E 的偏离程度或 取值的分散程度。 2.计算: 由定义及随机变量函数的数学期望,可以推出方差的计算公式: ① D =E 2 -(E ) 2 事实上:D =E( -E ) 2 =E[ 2 -2 E +(E ) 2 ] =E 2 -2E E +(E ) 2 =E 2 -(E ) 2 ②当 是离散型随机变量时,则有: D =E( -E ) 2 = 2 (x E) i i − P i ,其中 P i =P{ = x i } i =1,2,3… ③若 是连续变量,则有:
D=「(x-EB)P(x)d,其中P(x)是的密度函数 般地,若随机变量5的分布函数为Fx),则DE=(x-EB)dF(x) 例1:设随机变量的数学期望E=p,方差D=a2≠0,记=5 则有 E=-E(5-)=-[E5-=0 D2=E()-E2() )=-2E(5-) 5称为的标准化变量 例2:设51,2分别表示甲、乙手表的日走时误差,则其概率密度分别为: 10<x<10 20<x<20 P(x)=120 P2(x)=140 0 其它 0 其它 因此有:E5=「xR(x)=∫x=0=E52 5=E12E5)=E P(xAx=[x2c xid 10 D52=E2 400 因此D51<D52’即5的偏离程度小,甲手表走得较好。 、方差的性质 1若C为常数,则Dc=0 2对V常a,D(a5)=a2D5 由1,2得如下结论: D(a+c=a2D5,特别地D(+c=Dl 思考:若D存在,则D(D)=? 3.随机变量ξ与独立,则D(±n)=D+Dn ProD(±n)=E[±n-E(2±n)2=E(5-E)±(n-En)
8 D = 2 ( ) x E + − − P(x) dx ,其中 P(x)是 的密度函数。 一般地,若随机变量 的分布函数为 F(x),则 2 D x E dF x ( ) ( ) + − = − 。 例 1:设随机变量 的数学期望 E = ,方差 0 2 D = ,记 − = , 则有 [ ] 0 1 ( ) 1 = − = − = E E E , ( ) 1 1 ( ) ( ) ( ) 2 2 2 2 2 2 2 = − = = − = − = D E E E E 称为 的标准化变量。 例 2:设 1 2 , 分别表示甲、乙手表的日走时误差,则其概率密度分别为: p1 (x) = − 0 其它 10 10 20 1 x p2 (x) = − 0 其它 20 20 40 1 x 因此有:E 1 = xP (x)dx − 1 = − 10 10 20 1 xdx =0=E 2 D 1 =E 2 1 -(E ) 2 =E 2 1 = x P (x)dx − 1 2 = − 10 10 2 20 1 x dx = = 10 0 2 10 1 x dx 3 100 D 2 =E 2 2 = − 20 20 2 40 1 x dx = 20 0 2 20 1 x dx= 3 400 因此 D 1 <D 2 ,即 1 的偏离程度小,甲手表走得较好。 二、方差的性质 1.若 C 为常数,则 Dc=0 2.对 常 a,D(a )=a 2 D 由 1,2 得如下结论: D(a +c)=a 2 D ,特别地 D( +c)=D 思考:若 D 存在,则 D(D) = ? 3.随机变量 与 独立,则 D( )=D +D Proof:D( )=E[ -E( )] 2 =E[( -E ) ( -E )] 2
=E(S-E5)2+E(n- En)2+2E(S-E5(n-En) (由,n独立→5E与En独立→B(En-En)=B(5E5(7En)=0) 故D(2+n)=D5+Dn 推论;若51,52…5n相互独立则DC∑,)=∑D 4对v实数C,有E(c)2≥E(E5)2=D 即随机变量的取值与其平均值的偏离程度是最小的。 Proof: E(5-c)=ELS-ES+ES-C]=E(S-E5)+E(ES-C)+2E(S-ES)ES-C E(E5)2+EC)2≥E(E5)2=D5 5切比雪夫( Chebyshev)不等式 设随机变量具有数学期望E和方差D5,则vE>0,有 P5-E|2e;}≤ 【注】:该不等式一方面给出了期望与方差之间的某种关系,同时也给出了在随机变量分布未 知,只知期望和方差的情况下,对事件-E≤e}的概率的下限估计。 §3.3协方鑾与相关系数 对于二维随机变量(ξ,n),我们除了讨论5与n的数学期望与方差外,还需要讨论描述ξ与 门之间相互关系的数字特征一一协方差与相关系数 、协方差的定义及其性质 1定义1:称cov(5,n)=E(E)nEn)为随机变量与n的协方差。 由定义可知:cov(5,n)E(5 EsXn-En) 王列EnE5+EEn=E5n-EEn 即:cov(5,7)=E5EEn 2.性质: (1)cov(5, nFcov(n, 5) (2)co(a,bn)= Fabcov(5,n)ab为任意常数
9 =E( -E ) 2 +E( -E ) 2 2E( -E )( -E ) (由 , 独立 -E 与 -E 独立 E( -E )( -E )=E( -E )E( -E )=0) 故 D( + )=D +D 推论:若 1 2 n , 相互独立,则 = = = n i i n i D i D 1 1 ( ) 。 4.对 实数 C,有 E( -c) 2 E( -E ) 2 =D 即随机变量的取值与其平均值的偏离程度是最小的。 Proof:E( -c) 2 =E[ -E +E -C] 2 =E( -E ) 2 +E(E -C) 2 +2E( -E )(E -C) =E( -E ) 2 +(E -C) 2 E( -E ) 2 =D 5.切比雪夫(Chebyshev)不等式: 设随机变量 具有数学期望 E 和方差 D ,则 0 ,有 2 { } D P − E 【注】:该不等式一方面给出了期望与方差之间的某种关系,同时也给出了在随机变量分布未 知,只知期望和方差的情况下,对事件 { − E } 的概率的下限估计。 §3.3 协方差与相关系数 对于二维随机变量 ( ,) ,我们除了讨论 与 的数学期望与方差外,还需要讨论描述 与 之间相互关系的数字特征——协方差与相关系数。 一、协方差的定义及其性质 1.定义 1:称 cov( , )=E( -E )( -E )为随机变量 与 的协方差。 由定义可知:cov( , )=E( -E )( -E ) =E -E E -E E +E E =E -E E 即:cov( , )=E -E E 2.性质: ⑴cov( , )=cov( , ) ⑵cov(a ,b )=abcov( , ) a,b 为任意常数
) cov(5,+52, nov(5 (4D(5±n)D5+D±2cov(n) 若5,n独立,显然有cov(5,n)=0,反之不然。 引例:(5,n)的分布列为:(2,n)的分布列为 11/20 0m/20 0I2 计算可得E=En=E=E 而cov(,)E=1·1·+(-1)·(-1)=1 cov(5,n=E5n=10,10 (-10)·(-10)·=100 由此并不能说出(5,)比(,n)间的联系紧密。 事实上10ξ=ξ,η=10n,他们之间的联系是一样的。之所以出现这种情况,是因为协 方差的大小还受随机变量本身所取数值的影响。为了清除这种影响,我们引进一个无量纲的 量一相关系数的概念,来衡量随机变量间的联系的密切程度。 相关系数的定义及其性质 1定义2:若D5>0,Dn>0,则称p=eOs,m) DE√D 为随机变量5,n的相关系数(或标准协方差)。 显然:p就是标准化随机变量5,卫团的协方差 DE 性质: )s1(p>0称正相关,p<0称负相关。) 特别1分5n以概率1线形相关。即存在常数a与b使P{n=a5+b}=1 具体地 E PO n-En √DE√D 正线性相关 p=-1P(5B=B)=1—负线性相关 Dn 定义3:若,的相关系数p=0,则称与与n不相关
10 ⑶cov( , 1+ 2 )=cov( 1 , )+cov( 2 , ) ⑷D( )=D + D 2cov( ) 若 , 独立,显然有 cov( , )=0,反之不然。 引例:( , )的分布列为: ( ' , ' )的分布列为: 计算可得 E = E = E = E = 0 而 cov( , )=E =1 1 2 1 ( 1) ( 1) 2 1 1 + − − = cov( ' , ' )=E ' ' =10 100 2 1 ( 10) ( 10) 2 1 10 + − − = 由此并不能说出( ' , ' )比( , )间的联系紧密。 事实上 10 = ' , ' =10 ,他们之间的联系是一样的。之所以出现这种情况,是因为协 方差的大小还受随机变量本身所取数值的影响。为了清除这种影响,我们引进一个无量纲的 量—相关系数的概念,来衡量随机变量间的联系的密切程度。 二、相关系数的定义及其性质 1.定义 2:若 D >0,D >0,则称 D D cov( , ) = 为随机变量 , 的相关系数(或标准协方差)。 显然: 就是标准化随机变量 − D E , − D E 的协方差。 2.性质: ⑴ 1 ( 0 称正相关, 0 称负相关。) 特别 =1 与 以概率 1 线形相关。即存在常数 a 与 b 使 P{ = a + b} = 1。 具体地: = 1 P( − D E = ) D − E =1 ——正线性相关 = −1 P( D − E =- ) D − E =1 ——负线性相关 定义 3:若 , 的相关系数 =0,则称 与 不相关