§3.6条件分布函数与条件期望、回归与第二类回归 在前一章中,对离散型随机变量(,n),我们曾经研 究了在已知(=y,)发生的条件下的分布问题,并称 P(=x=y)为条件分布开,类似的问题对连续型随机变 量也存在。 因为连续型随机变量取单点值的概率为零,所以用分 布函数P(x)=P(<x)来代替离散型时的分布列 P(=a,),在这里也同样以P(x=y)来代替离散型时
的P(5=x7=y:),并且称(5=x;7y:)为已知(门) 发生的条件下的条件分布函数,并记作F渺x)。z© 现在的问题是,如果已知(飞,)的联合分布函数(x, )或它的密度函数3),如何来条件分布函数F助(x): 由条件慨率的定义读者会想到应该有 P(ξ<x,7=y) P助xF5<7)F P(n=y) 但是,因为对连续型随机变量来说,代5<x,”=y)0
氏刀y)0,上述等式中的右端是”,也就是数学分布中的 0 “不定式”,这并没有解决问题。 在数学分析中已知少也是· 的不定式,为解决这个 dx 0 矛盾,先考虑有限增量时的比值 y, 然后再令△x→0,并 △x 定义gzs y=li山m △y dx 点x→0△x 由此得到启发,我们采取同样的思想途径定义 P an (xl)=P($<xln=y)
=limP(5<x|y≤7<y+Ay) F(x,y+△y)-F(x,y) lim (3.8 4→0F(+0,y+△y)-F(+∞,y) 因为(5,)是连续型随机变量,若其密度函数为(x,), 上式可以写成 P助x)尸P5<x7=y)
y+A "p(u,)dudy lim 40 p(u,v)dud p(u,v)dudy lim- 4y0 , (3.87) 若太是连续函数,又,则有
p(u,y)du P渺(xy)= p:(y) - (3.88) 显然,这时P助x)关于x的导数存在,且有 gizsi Pn(x)尸F,cl) =p(x,y) (3.89) P,(y)
我们称P助x)为在已知发生的条件下二的条件概率密度。 完全类似地可以定义F州x及P州(yx,读者还可以 比较一下条件概率密度与离散型时的条件分布列: P(5=x17=,P(5=x,刀=y) p(7=y:) 它们之间是多么的相似! 例6.18(略)gz 条件分布函数F州(|x)或条件密度函做P州(y| x)描写了随机变量在已知(?=y)发生的条件下的统计规
律,同样离散型情形一样,还可以求在(”=y)发生的条件下 的数学期望,也就是条件数学期望,于是有下述定义。 定义5.1如果随机变量在已知(7=y)发生的条件 下的条件密度函做为P(yx,若 0xlp防x1y)k<n 则称E(传引刀=y)片xP((x|y)d<0|(3.0)
为在(”=y)发生的条件下的数学期望,或简称为条件期 望。 同离散型情形相同,连续型随机变量的条件期望也具有 下述性质:zs (1)若a≤5b,则a≤E(5引”=y)sb; (2)若是k1、,两个常数,又E(5F少(问1,2) 存在,则有 E(k15+52”=y))=kE(57=y)+k2E (52|7=y)
进一步还可以把E(引”=y)看成是门的函数,当时这 个函做取值为E(引”=y),记这个函数为E(5引”), 它是一个随机变量,可以对它求数学期望,仍与离散型 相同,有z (3)E(E(5引})=E5. 条件数学期望在近代概率论中有着基本重要的作用,在 实际问题中也有很大用处。在两个互有影响的随机变量 门中,如果已知其中一个随机变量的取值门y,要据此去估