第三章第五节 条件分布 条件分布的概念
第三章第五节 条 件 分 布 一、条件分布的概念
在第一章中,我们介绍了条件概率的概念 在事件B发生的条件下事件4发生的条件概率 P(A B)= P(AB) P(B) 推广到随机变量 设有两个X,Y,在给定Y取某个或 某些值的条件下,求X的概率分布 这个分布就是条件分布
在第一章中,我们介绍了条件概率的概念 . ( ) ( ) ( | ) P B P AB P A B = 在事件B发生的条件下事件A发生的条件概率 推广到随机变量 设有两个r.v. X, Y , 在给定Y取某个或 某些值的条件下,求X的概率分布. 这个分布就是条件分布
例如,考虑某大学的全体学生,从其中随 机抽取一个学生,分别以X和Y表示其体重和 身高.则X和Y都是随机变量,它们都有一定 的概率分布 f(x) 身高Ya 体重X 的分布 0 X 0.1 005 身高Y 的分布 0 170 体重X
例如,考虑某大学的全体学生,从其中随 机抽取一个学生,分别以X和Y 表示其体重和 身高 . 则X和Y都是随机变量,它们都有一定 的概率分布. 体重X 身高Y 体重X 的分布 身高Y 的分布
现在若限制1.7<K1.8(米在这个条件下 去求X的条件分布,这就意味着要从该校的学 生中把身高在17米和18米之间的那些人都挑 出来,然后在挑出的学生中求其体重的分布 容易想象,这个分布与不加这个条件 时的分布会很不一样 例如,在条件分布中体重取大值的概 率会显著增加
现在若限制1.7<Y<1.8(米), 在这个条件下 去求X的条件分布,这就意味着要从该校的学 生中把身高在1.7米和1.8米之间的那些人都挑 出来,然后在挑出的学生中求其体重的分布. 容易想象,这个分布与不加这个条件 时的分布会很不一样. 例如,在条件分布中体重取大值的概 率会显著增加
离散型r的条件分布 实际上是第一章讲过的条件概率概念在 另一种形式下的重复 定义1设(X,Y)是二维离散型随机变量, 对于固定的,若P(Fy)>0,则称 P(X=x P(=xilY=vi= Y=y P P(r=yi) A,,=1,2 为在条件下、态量X的条件概率分布 作为条件的那个:n,认为取值是 给定的,在此条件下求另一E的 概率分布
一、离散型r.v.的条件分布 实际上是第一章讲过的条件概率概念在 另一种形式下的重复. 定义1 设 (X,Y) 是二维离散型随机变量, 对于固定的 j,若P(Y=yj )>0,则称 为在Y=yj条件下随机变量X的条件概率分布. P(X=xi |Y=yj )= ( ) ( , ) j i j P Y y P X x Y y = = = j i j p p • = ,i=1,2, … 作为条件的那个r.v.,认为取值是 给定的,在此条件下求另一r.v.的 概率分布
若PX=x)>0,则称 P(r=Y;=xi P(X=X,Y=y) p ,=1,2 P(X=x) 为在X=x条件下随机变量X的条件概率分布 条件分布是一种概率分布,它具有概率 分布的一切性质.正如条件概率是一种概率, 具有概率的一切性质 例如:P(X=x1|Y=y1)≥0 1,2 P(X=x1Y=y1)=1
条件分布是一种概率分布,它具有概率 分布的一切性质. 正如条件概率是一种概率, 具有概率的一切性质. ( = | = ) 0, i j 例如: P X x Y y ( | ) 1 1 = = = i= i j P X x Y y i=1,2, … 若P(X=xi )>0,则称 P(Y=Yj |X=xi )= ( ) ( , ) i i j P X x P X x Y y = = = i。 i j p p = ,i=1,2, … 为在X= xi条件下随机变量X的条件概率分布
例1求书中例3.2.1中Y的条件分布 X0 p 7/15 7/30 7/10 7/30 3/10 7/10 3/10 解:书中3.4.1中已求出X的边缘分布(见上表) (1)在 X=0P{Y=0|X=0 P{Y=0,X=0} P{X=0} 的条 7/152 件下 7/103
解: 例 1 求书中例3.2.1中Y的条件分布. Y X 0 1 pi. 0 7/15 7/30 7/10 1 7/30 1/15 3/10 p.j 7/10 3/10 1 书中3.4.1中已求出X的边缘分布(见上表). 3 2 7 /10 7 /15 { 0} { 0, 0} { 0 | 0} = = = = = = = = P X P Y X P Y X (1)在 X=0 的条 件下
P{Y=1X=0={=1,X=0 P{X=0} 7/30 7/103 (2)X=1条件下 P{Y=0,X=1}7/307 P{Y=0X=1} P{X=1} 3/109 P{Y=1X=1}=P(Y=1,X=1}1/152 P{X=1} 3/109
{ 0} { 1, 0} { 1| 0} = = = = = = P X P Y X P Y X (2)X=1 条件下 9 7 3/10 7 / 30 { 1} { 0, 1} { 0 | 1} = = = = = = = = P X P Y X P Y X 9 2 3/10 1/15 { 1} { 1, 1} { 1| 1} = = = = = = = = P X P Y X P Y X 3 1 7 /10 7 / 30 = =
例2求例3.2.2中被调查者吸烟的条件下得肺癌的 概率和不吸烟的条件下得肺癌的概率 是否患肺癌Y患 未患X的边缘分布 是否吸烟X Y=0 Y=1 吸烟{X=0} 0.000130.19987 0.20000 不吸烟{X=1} 0.000040.79996 0.80000 Y的边缘分布0.000170.993 解 P{=01X=0=Y=0.,X=0 0.00013 0.00065 P{X=0 0.2 P{Y=0X=1} P{Y=0,X=1}0.00004 P{X=1} 0.8÷0.00005
解: 例 2求例3.2.2中被调查者吸烟的条件下得肺癌的 概率和不吸烟的条件下得肺癌的概率. 0.00065 0.2 0.00013 { 0} { 0, 0} { 0 | 0} = = = = = = = = P X P Y X P Y X 0.00005 0.8 0.00004 { 1} { 0, 1} { 0 | 1} = = = = = = = = P X P Y X P Y X 是否患肺癌 Y 是否吸烟 X 患 {Y=0} 未患 {Y=1} X 的边缘分布 吸 烟 {X=0} 0.00013 0.19987 0.20000 不吸烟{X=1} 0.00004 0.79996 0.80000 Y 的边缘分布 0.00017 0.99983 1
连续型r的条件分布 设(X,Y)是二维连续型rv,由于对任意 x,y,P(X=x)=0,P(Yy)=0,所以不能直接 用条件概率公式得到条件分布,下面我们 直接给出条件概率密度的定义
二、连续型r.v.的条件分布 设(X,Y)是二维连续型r.v,由于对任意 x, y, P(X=x)=0, P(Y=y)=0 ,所以不能直接 用条件概率公式得到条件分布,下面我们 直接给出条件概率密度的定义