第二章随机变量及其分布 在上一章中,我们用样本空间的子集,即基本事件的集合来表示随机试验的各种 结果。这种表示的方式对全面讨论随机试验的统计规律性及数学工具的运用都有较大 的局限。在本章中,我们将用实数来表示随机试验的各种结果,即引入随机变量的概 念。这样,不仅可更全面揭示随机试验的客观存在的统计规律性,而且可使我们用数 学分析的方法来讨论随机试验 第一节 随机变量与分布函数 一、随机变量的概念: 在随机试验中,若把试验中观察的对象与实数对应起来,即建立对应关系X,使其 对试验的每个结果o,都有一个实数(o)与之对应,则的取值随着试验的重复而不 同,厂是一个变量,且在每次试验中厂究竟取什么值事先无法预知,也就是说X是 一个随机取值的变量。因此,很自然地称X为随机变量 1定义设试验的样本空间为2,如果对于每一个o∈2,都有一个确定的 实数(o)与之对应,则称实值函数(o)为Ω上的随机变量 注:1.o)简记为X 2.X是由o唯一确定; 3.自变量0一 一试验结果,定义域一样本空间Ω 引入随机变量以后,就可以用随机变量X来描述随机事件。例如,在“掷硬币” 这个试验中,可定义 1,当正面出现时, Y= 0,当反面出现时, 则(X=)和(X=0)就分别表示了事件{出现正面}和{出现反面},且有 AX=)=P出现正面}=为,Ar=0)=出现反面}=乃 若试验的结果本身就是用数量描述的,则可定义X=(o)=1,0=t∈2。例如, 在“掷骰子”这个试验中,用(r=)表示{出现点},且 A=0=P础现点}=%1=1,2,…,6。 在“测试灯泡寿命”这个试验中,(X=)表示{灯泡的寿命为1(小时)},而r≤)就 是事件{灯泡寿命不超过1(小时)}的概率。 例1设9件产品中含有4件次品,从中任取3件,则被取3件中的次品数X是一个随 机变量,它的可能取值是0,1,2,3 例2检查一批织物的质量,从每平方米中观察到的疵点数Y是一个随机变量,它的可 能取值是0,1,2,3,.. 例3某公共汽车的行车间隔是a分钟,某乘客随机的到达车站,则其等车的事件Z是
1 第二章 随机变量及其分布 在上一章中,我们用样本空间的子集,即基本事件的集合来表示随机试验的各种 结果。这种表示的方式对全面讨论随机试验的统计规律性及数学工具的运用都有较大 的局限。在本章中,我们将用实数来表示随机试验的各种结果,即引入随机变量的概 念。这样,不仅可更全面揭示随机试验的客观存在的统计规律性,而且可使我们用数 学分析的方法来讨论随机试验. 第一节 随机变量与分布函数 一、 随机变量的概念: 在随机试验中,若把试验中观察的对象与实数对应起来,即建立对应关系 X,使其 对试验的每个结果 ,都有一个实数 X()与之对应,则 X 的取值随着试验的重复而不 同, X 是一个变量,且在每次试验中 X 究竟取什么值事先无法预知,也就是说 X 是 一个随机取值的变量。因此,很自然地称 X 为随机变量. 1. 1. 定义 设试验的样本空间为 ,如果对于每一个 ,都有一个确定的 实数 X()与之对应,则称实值函数 X()为 上的随机变量. 注: : 1. X() 简记为 X; 2. X 是由 唯一确定; 3.自变量 ———试验结果,定义域——样本空间 引入随机变量以后,就可以用随机变量 X 来描述随机事件。例如,在“掷硬币” 这个试验中,可定义 当反面出现时, 当正面出现时, 0 , 1, X 则(X 1) 和 (X 0) 就分 别 表 示 了 事 件 { 出现 正 面 } 和 { 出现 反 面 } ,且 有 出现正面 , 。 2 P(X 1) P{ } 1 2 P(X 0) P{出现反面} 1 若试验的结果本身就是用数量描述的,则可定义 X X() t, t 。例如, 在“掷骰子”这个试验中,用 (X i)表示{出现 i点},且 P(X i) P{出现i点} 1 6 ,i 1,2,,6。 在“测试灯泡寿命”这个试验中,(X t)表示{灯泡的寿命为t(小时)},而 P(X t)就 是事件{灯泡寿命不超过 t(小时)}的概率。 例 1 设 9 件产品中含有 4 件次品,从中任取 3 件,则被取 3 件中的次品数 X 是一个随 机变量 ,它的可能取值是 0,1,2,3. 例 2 检查一批织物的质量,从每平方米中观察到的疵点数 Y 是一个随机变量,它的可 能取值是 0,1,2,3,… 例 3 某公共汽车的行车间隔是 a 分钟,某乘客随机的到达车站,则其等车的事件 Z 是
个随机变量,它的一切可能取值充满区间[0,a. 2.分类 离散型随机变量 非离散型随机变量(连续型随机变量) 二、随机变量的分布函数 许多随机变量的取值是不能一个一个地列举出来的且它们取某个值的概率可能是 零。例如,在测试灯泡的寿命时,可认为寿命X的取值充满了区间[0,+o),事件 (X=x)表示灯泡的寿命正好是:,在实际中,测试数百万只灯泡的寿命,可能也不 会有一只的寿命正好是。也就是说,事件(X=x。)发生的频率在零附近波动,自然 可认为=x)=0。 由于有许多随机变量的概率分布情况不能以其取某个值的概率来表示,故我们转而 讨论随机变量X的取值落在某一个区间里的概率,即讨论x<r≤x,)。 因为 P:<X≤)=Pr≤x2)-Pr≤x), 所以对任何一个实数x,只需知道代r≤),就可知r的取值落在任一区间里的概率 了。为此,我们用八K≤)来讨论随机变量X的概率分布情况。 (1)定义 设为一随机变量,是任意实数,称函数凡)=PX≤片(-0,+∞) 为的分布函数 注:有了分布函数,对于任意的实数x,(:<:),随机变量X落在区间(:,x2]里的概 率可用分布函数来计算: x<r≤x)=Pr≤)-r≤x)=F(x2)-F(x) 在这个意义上可以说,分布函数完整地描述了随机变量的统计规律性,或者说,分布 函数完整地表示了随机变量的概率分布情况。 若把r看作是数轴上的随机点的坐标,则分布函数凡x)在x的函数值就表示X落 在区间(-∞,里的概率。 (2).分布函数FG具有以下基本性质: 1.F是一个单调不减的函数,即当x<x,时,凡x)≤F(x)。 事实上,凡x)-凡x)=八x<X≤x2)≥0,故凡x)≤F(x,) 2.0≤F()≤1,且凡+o)=limF凡)=l,F-oo)=limF)=0。 2
2 一个随机变量,它的一切可能取值充满区间[0,a]. 2. 2. 分类 非离散型随机变量(连续型随机变量) 离散型随机变量 二、随机变量的分布函数 许多随机变量的取值是不能一个一个地列举出来的且它们取某个值的概率可能是 零。例如,在测试灯泡的寿命时,可认为寿命 X 的取值充满了区间 [0,) ,事件 (X x 0 )表示灯泡的寿命正好是 x 0 ,在实际中,测试数百万只灯泡的寿命,可能也不 会有一只的寿命正好是 x0。也就是说,事件 (X x 0 )发生的频率在零附近波动,自然 可认为 P(X x 0 ) 0。 由于有许多随机变量的概率分布情况不能以其取某个值的概率来表示,故我们转而 讨论随机变量 X 的取值落在某一个区间里的概率,即讨论 P( x 1 X x 2 )。 因为 P( x1 X x 2 ) P(X x 2 ) P(X x1 ), 所以对任何一个实数 x,只需知道 P(X x),就可知 X 的取值落在任一区间里的概率 了。为此,我们用 P(X x)来讨论随机变量 X 的概率分布情况。 (1). (1). 定义 . ( ) { } ( , ) 为 的分布函数 设 为一随机变量, 是任意实数,称函数 X X x F x P X x 注: : 有了分布函数,对于任意的实数 x 1, x 2 (x1 x2 ) ,随机变量 X 落在区间( x1 , x 2 ]里的概 率可用分布函数来计算: ( ) ( ) ( ) ( ) ( ). 1 2 2 1 2 1 P x X x P X x P X x F x F x 在这个意义上可以说,分布函数完整地描述了随机变量的统计规律性,或者说,分布 函数完整地表示了随机变量的概率分布情况。 若把 X 看作是数轴上的随机点的坐标,则分布函数 F(x)在 x 的函数值就表示 X 落 在区间 (, x]里的概率。 (2).分布函数 F(x)具有以下基本性质: 1.F(x)是一个单调不减的函数,即当 x 1 x 2时, F( x 1 ) F(x 2 )。 事实上, ( ) ( ) ( ) 0,故 . F x 2 F x 1 P x 1 X x 2 ( ) ( ) 1 2 F x F x 2. 0 F(x) 1,且 () lim ( ) 1, () lim ( ) 0。 F F x F F x x x
因为F风x)=r≤x),即风)是r落在(-0,里的概率,所以0≤凡x)≤1。对其 余两式,我们只给出一个直观的解释,不作严格的证明。事实上,凡+∞)是事件 (X<+∞)的概率,而(X<+∞)是必然事件,故凡+∞)=1。类似地,(X<-∞)是不可 能事件,故F-∞)=0。 3.F凡x+O)=lim,凡)=凡),即凡)是右连续的函数。 第二节离散型随机变量及其分布 若某个随机变量的全部可能取值是有限多个或可列无限多个,则称这个随机变量是 离散型随机变量。 易知,要掌握一个离散型随机变量X的统计规律,必须且只需知道r的所有可能取值 以及取每一个可能值的概率。 一、分布列 1.定义 设离散型随机变量的所有可能取值为x,为,…,x,,陬各个可能值的概率为 r=x)=P,(1=1,2,),称此整标函数为的分布列(概率分布、分布律、 概率函数) 分布律也可以用表格的形式(分布律)来表示,即表示为 X Y, P 2.分布列的性质 (1)p,≥0(i=1,2,5 (2) B=1 =1 3.求概率和分布函数 Pa≤r≤}=∑PAr=x,Ar∈GO-∑Pr=x) d≤x≤b 设凡x)离散型随机变量厂的分布函数,则当X有分布律 Pr=x4)=Pk≥0,k=1,2,… 时,易得风)=Pr≤)=U(=x)=∑r=x)=∑P 而 Px=x)=Pg=Px-<X≤x)=F凡x)-Fx) 由此可知,离散型随机变量r的分布函数是阶梯函数,,,…是F的第一类间断 3
3 因为 F(x) P(X x),即 F(x)是 X 落在 (, x]里的概率,所以 0 F(x) 1。对其 余两式,我们只给出一个直观的解释,不作严格的证明。事实上, F() 是事件 (X )的概率,而 (X )是必然事件,故 F() 1。类似地, (X )是不可 能事件,故 F() 0。 3. F( x 0) lim F(t) F( x) ,即 是右连续的函数。 t x F(x) 第二节 离散型随机变量及其分布 若某个随机变量的全部可能取值是有限多个或可列无限多个,则称这个随机变量是 离散型随机变量。 易知,要掌握一个离散型随机变量 X 的统计规律,必须且只需知道 X 的所有可能取值 以及 X 取每一个可能值的概率。 一、 分布列 1. 1. 定义 概率函数) ,称此整标函数为 的分布列(概率分布、分布律、 设离散型随机变量 的所有可能取值为 取各个可能值的概率为 P X x p i X X x x x X i i i ( ) ( 1,2, ) , , , , , 1 2 分布律也可以用表格的形式(分布律)来表示,即表示为 2. 2. 分布列的性质 1 (2) 1 (1) 0 ( 1,2, ); i i i p p i 3. 3. 求概率和分布函数 , , a x b i i P{a X b} P{X x } x G i i P(X G) P(X x ) 设 F( x)离散型随机变量 X 的分布函数,则当 X 有分布律 P(X x k ) pk o, k 1,2, 时,易得 , x x x x k k x x k k k k F x P X x P X x P X x p ( ) ( ) (( ) ( ) 而 ( ) ( ) ( ) ( ) k k k 1 k k k 1 P x x p P x X x F x F x 由此可知,离散型随机变量 X 的分布函数是阶梯函数, x1 , x 2 ,是 F(X)的第一类间断 X x1 x2 ... xk ... .... P p1 p2 .... pk ...
点,而K在x(k=1,2,)处的概率就是Fc在这些间断点处的跃度。 例1设一汽车在开往目的地的道路上需经过四盏信号灯,每盏信号灯以概率12允许 汽车通过或禁止汽车通过以表示汽车首次停下时,它已通过的信号灯的盏数(设各 信号灯的工作是相互独立的)。求X的分布律,分布函数以及概率 r≤3/2),P3/2<r≤5/2),P2≤r≤3)。 解设p为每盏信号灯禁止汽车通过的概率,则 P'=)=1-),k=0,12 八r=3)=(1-p)3. 现p=乃,故知r的分布律为 r 0 3 P 1/2 1/4 1/8 1/8 由此得X的分布函数 0, x<0 2 0≤x<1 113 x)={ *4 1≤x<2 2 4 11 7 + 2 488 2≤x<3: 1 3≤x 题中要求计算的概率分别为 Ar≤为=为=4,A为<r≤为=风为-F为=7为-4=⅓ R2≤r≤3)=2<r≤3)+r=2)=F3)-2)+r=2)=1-7g+⅓=4以 上概率也可以用分布律来计算,如 Ar≤为)=X=0)+Ar=)=为+4=4 A为<r≤h)=r=2)=8, A2≤r≤3)=Ar=3)+Ar=2)=⅓+g=4 例2某人独立地射击,每次射击的命中率为0<八1)。以r表示首次击中目标时 己进行的射击次数,求X的分布律和分布函数。 解在本题中,K的取值为k=1,2,3,…。容易求得代r=)=Pg-(g=1-p),而
4 点,而 X 在 x k (k 1,2,)处的概率就是 F(x)在这些间断点处的跃度。 例 1 1 设一汽车在开往目的地的道路上需经过四盏信号灯,每盏信号灯以概率 1/2 允许 汽车通过或禁止汽车通过.以 X 表示汽车首次停下时,它已通过的信号灯的盏数(设各 信号灯的工作是相互独立的)。求 X 的分布律,分布函数以及概率 P(X 3 2), P(3 2 X 5 2),P(2 X 3) 。 解 设 p 为每盏信号灯禁止汽车通过的概率,则 P(X k) p(1 p) , k 0,1,2. k ( 3) (1 ) . 3 P X p 现 ,故知 X 的分布律为 2 p 1 由此得 X 的分布函数 1, 3 ; 8 1 8 1 4 1 2 1 , 2 3; 8 7 8 1 4 1 2 1 , 1 2; 4 3 4 1 2 1 , 0 1; 2 1 0, 0; ( ) x x x x x F x 题中要求计算的概率分别为 , 8 1 4 3 8 ) 7 2 ) (3 2 ) ( 5 2 5 2 , ( 3 4 ) 3 2 ) ( 3 2 P(X 3 F P X F F P(2 X 3) P(2 X 3) P(X 2) F(3) F(2) P(X 2) 1 7 8 1 8 1 4 . 以 上概率也可以用分布律来计算,如 , 4 3 4 1 2 ) ( 0) ( 1) 1 2 P(X 3 P X P X , 8 ) ( 2) 1 2 5 2 P( 3 X P X . 4 1 8 1 8 P(2 X 3) P(X 3) P(X 2) 1 例 2 2 某人独立地射击,每次射击的命中率为 p(0<p<1)。以 X 表示首次击中目标时 已进行的射击次数,求 X 的分布律和分布函数。 解 在本题中,X 的取值为 k 1,2,3,。容易求得 P(X k ) pq k1 (q 1 p) ,而 X 0 1 2 3 P 1/2 1/4 1/8 1/8
由 r=)=pg≥0: 2r=-24=2g 知X的分布律是 2 (此时又可称X服从以D为参数的几何分布) 因为 r≤=是r==是四, L 其中[d是不超过x的最大整数,由此可知的分布函数为 0 x<l F)= ∑pPg1,x≥1. 在这个例题中,随机变量X可看作是在独立随机试验中首次成功所需的试验次数。 若X为独立随机试验中,成功r次所需的试验次数,则当p为一次试验中成功的概率 时(0<p<),r的分布律为 r P+1 "-p 此时称r服从以rp为参数的巴斯卡(Pascal)分布。Cm时p 练习 1设9件产品中含有4件次品,从中任取三件,则被取三件中的次品数X是一个随机 变量,求随机变量X的分布列,并求P(X<2) 2.从一批次品率为p的产品中有放回的逐件抽取产品,直到抽到次品为止,以X表示 抽取次数,求X的分布列及P(1<X<4) 3.设随机变量的分布列为 -3025 1 求(1)的分布函数;(2)P(2≤r<7);P(X≥-1) 4.一袋中装有5只球,编号为1,2,3,4,5.在袋中同时只球,用表示取出的 3只球中的最大号码数,求的分布函数.(P57) 5
5 由 P(X k) pq k 1 0; 1 1 1 1 1 ( ) k k k k k P X k pq p q 知 X 的分布律是 (此时又可称 X 服从以 p 为参数的几何分布) 因为 , [ ] 1 [ ] 1 [ ] 1 ( ) ( ) x k x x k P X x P X k pq 其中[x]是不超过 x 的最大整数,由此可知 X 的分布函数为 , 1. 0, 1; ( ) [ ] 1 [ ] 1 pq x x F x x k x 在这个例题中,随机变量 X 可看作是在独立随机试验中首次成功所需的试验次数。 若 X 为独立随机试验中,成功 r 次所需的试验次数,则当 p 为一次试验中成功的概率 时 (0 p 1) ,X 的分布律为 此时称 X 服从以 r,p 为参数的巴斯卡(Pascal)分布。Cn-1 n-r qn-r pr 练习 1.设 9 件产品中含有 4 件次品,从中任取三件,则被取三件中的次品数 X 是一个随机 变量,求随机变量 X 的分布列,并求 P(X<2). 2.从一批次品率为 p 的产品中有放回的逐件抽取产品,直到抽到次品为止,以 X 表示 抽取次数,求 X 的分布列及 P(1<X<4). 3 0 2 5 1 1 1 1 ( ) 4 6 2 12 (1) (2) (2 7); ( 1) i X X P X x X P X P X 3.设随机变量 的分布列为 求 的分布函数; 4. 5 1, 2,3, 4,5. 3 3 .( 57) X X YP 一袋中装有 只球,编号为 在袋中同时 只球,用 表示取出的 只球中的最大号码数,求 的分布函数 X 1 2 3 ... n ... P p pq 2 pq ... n1 pq ... X r r 1 ... n ... ... P r p r r C qp 1 ... n r n r r n C q p 1 ...
二、几种重要的离散型分布 1.两点分布(0-1)分布 若随机变量X的分布律为 Pr=)=p(1-p),k=01,(0<p<1) 则称X服从以p为参数的(0-1)分布。 (0-1)分布的分布律也可写成 K p 1-p 若某个随机试验的结果只有两个,如产品是否合格,试验是否成功,掷硬币是否出现 正面等,它们的样本空间为2={@1,02},则总能定义一个服从(0-1)分布的随机变量 1当o,发生时: Y= 0,当o,发生时。 也就是说,它们都可以用(0-1)分布来描述,只不过对不同的问题参数P的值不同而 已.可见,(0-1)分布是经常遇到的一种分布。 2.二项分布 若随机变量r的取值为0,l,2,…n且 =)=Cp"-,k=0,1,2,,n 其中0<p<1,p+g=1,则称X服从以n,p为参数的二项分布,记为r~Bn,p)。 容易证明X=)=Cpg≥0,且 立Ar==2cpg=p+r=1 0 注意到Cp正好是二项式(p+)"的展开式的一般项,因此称该随机变量服从二项 分布。 特别,当n=1时二项分布为八r=)=广g-,k=0,1。这就是(0-1)分布,故当r 服从(0-1)分布时,常记为'~L,)。 在第一章中我们讨论了n重贝努力试验,易见在n重贝努力试验中事件A发生的 次数X是服从而二项分布的随机变量。又由 RX=B)Cipfd n(kpg" =(n-k+)卫-(n+1)p-迎 RY=k-1)C4-p-g-kk-D)I(n-k+1)p4-ig- kg kg =n+)p--2-9+(n+p-k=1+n+Dp-k kg p kg 6
6 二、 几种重要的离散型分布 1. 1. 两点分布(0 0 -1 -1 )分布 若随机变量 X 的分布律为 ( ) (1 ) , 0,1,(0 1), 1 P X k p p k p k k 则称 X 服从以 p 为参数的( ( 0-1 0-1 )分布 )分布 。 ( ( 0-1 0-1 )分布 )分布 的分布律也可写成 若某个随机试验的结果只有两个,如产品是否合格,试验是否成功,掷硬币是否出现 正面等,它们的样本空间为 {1 ,2 },则总能定义一个服从(0-1)分布的随机变量 当 发生时。 当 发生时; 2 1 0, 1, X 也就是说,它们都可以用(0-1)分布来描述,只不过对不同的问题参数 p 的值不同而 已.可见,(0-1)分布是经常遇到的一种分布。 2. 2. 二项分布 若随机变量 X 的取值为 0,1,2,n且 P X k C p q k n k k n k n ( ) , 0,1,2,, 其中 ,则称 X 服从以 为参数的二项分布 二项分布 0 p 1, p q 1 n, p ,记为 X ~ B(n, p)。 容易证明 P(X k) Cn k p k q nk 0,且 ( ) ( ) 1. 0 0 k n k n n k n k k P X k Cn p q p q 注意到 Cn k p k q nk 正好是二项式( p q) n 的展开式的一般项,因此称该随机变量服从二项 分布。 特别,当n 1时二项分布为 ( ) , 0,1。这就是(0-1)分布,故当X 1 P X k p q k k k 服从(0-1)分布时,常记为 X ~ B(1, p)。 在第一章中我们讨论了 n 重贝努力试验,易见在 n 重贝努力试验中事件 A 发生的 次数 X 是服从而二项分布的随机变量。又由 kq n p kp kq n k p n k n k P q n k n k p q C p q C p q P X k P X k k n k k n k k k n k n k k n k n ( 1) ( 1) !/( 1)1( 1)! !/ !( )! ( 1) ( ) 1 1 1 1 1 . kq n p k kp kq n p k kq n p k q ( 1) 1 ( 1) (1 ) ( 1) X 1 0 P p 1 p
知当k(n+1)p时'=)单调下降,因此可知当 k在(n+I)p附近时P氏X=)达最大值,也就是说,在n重贝努力试验中,事件A发生 [(什1)次的概率最大,通常称[(n+1)p)为n次独立重复试验中最可能成功的次数 例3已知某型号电子元件的一级品律为0.2,现从一大批元件中随机抽查20只,问最 可能的一级品数是多少? 解检查20只元件是否一级品可看20重的贝努力试验,即其中一级品数r服从二项 分布20,0.2),而(20+1)×0.2=4.2,所以其中有4只一级品的概率最大。 下面的数据也验证了这个结果。 0 2 4 5 6 0.012 0.058 0.137 0.2050.218 0.1750.109 7 8 9 10 >11 0.055 0.022 0.007 0.002 0.001 0是一常数,n是正整数。若pn=元,则对任一固 定的非负整数,有mCp-,)=e。 E由=u知Cp0-n-a--+-A” -对(--引--2-为 对任意图定的。当m→时-分1/=2-上
7 知当 k (n 1)p时 P(X k)单调增加,k (n 1)p时 P(X k)单调下降,因此可知当 k 在 (n 1) p附近时 P(X k ) 达最大值,也就是说,在 n 重贝努力试验中,事件 A 发生 [(n+1)p]次的概率最大,通常称[(n 1)p]为 n 次独立重复试验中最可能成功的次数. 例 3 3 已知某型号电子元件的一级品律为 0.2,现从一大批元件中随机抽查 20 只,问最 可能的一级品数是多少? 解 检查 20 只元件是否一级品可看 20 重的贝努力试验,即其中一级品数 X 服从二项 分布 B(20,0.2),而 (201) 0.2 4.2,所以其中有 4 只一级品的概率最大。 下面的数据也验证了这个结果。 其中 ( ) (0.2) (1 0.2) . 20 20 k k k P P X k C 例 4 4 某人独立地射击,设每次射击的命中率为 0.02,射击 400 次,求至少击中目标两 次的概率。 解 把每次射击看成一次试验,设击中的次数为 X,则 X ~ B(400,0.02), X 的分布律为 ( ) (0.02) (0.98) , 0,1, ,400, 400 P X k C400 k k k k 于是所求概率为 ( 2) 1 ( 0) ( 1) 1 (0.98) 400 (0.02) (0.98) . 400 399 P X P X P X 直接计算上式是很麻烦的.下面我们给出一个当 n 很大而 p 很小时的 近似计算公式. 泊松定理(Poisson Poisson Poisson Poisson ) 设 0 是一常数,n 是正整数。若 npn ,,则对任一固 定的非负整数 k,,有 。 e k C p p k n k n k n k n n ! lim (1 ) 证 由 pn / n,知 k n k n k n k n k n k n n n n n k C p p 1 ! ( 1) ( 1) (1 ) 1 1 . 1 1 2 1 1 1 1 ! k n k n n n k k n n 对任意固定的 k,当 n 时 1 1, 1,2, , 1; i k n i X 0 1 2 3 4 5 6 P 0.012 0.058 0.137 0.205 0.218 0.175 0.109 X 7 8 9 10 11 >11 P 0.055 0.022 0.007 0.002 0.001 <0.01
-→- 故有 mC防p-h,)t=e 定理的条件p。=入,意味着n很大时,Pn必定很小,由泊松定理知,当 r~2),且n很大而p很小时,有 r=月=Cp0-pr≈ e (2.1) 其中2=p。在实际计算中,当n≥20,p≤0.05时,(2.1)式的近似值效果颇佳,而 n≥100且p≤10时,效果更好。 2e的值有表可查(见书后附表) 在例4中,p=8,由(21)式知 Hr=0)≈e8,r=1)≈8e8 因此 Pr≥2)≈1-e8-8e8=0.997. 例4的结果告诉我们两个事实: 其一,虽然每次射击的命中率很小(为0.02),但射击次数足够大(为400次),则 击中目标两次几乎是肯定的(概率为0.997)。这个事实告诉我们,一个事件尽管在一 次实验中发生的概率很小,但在大量的独立重复试验中这事件的发生几乎是必然的。 也就是说,小概率事件在大量独立重复室验中是不可忽视的。 其二,若射手在400次独立射击中,击中目标的次数不到两次是一件概率很小的事 件,而这事件竟然在一次实验中发生了,则跟据实际推断,我们有理由怀疑“每次射 击的命中率为0.02”这一假设是否正确,即可认为射手射击的命中率达不到0.02。 例5现有同型设备300台,各台设备的工作是相互独立的,发生故障的概率都是0.01 设一台设备的故障可由一名维修工人处理,问至少需配备多少名维修工人,才能保证 设备发生故障但不能及时维修的概率小于0.01? 解设需配备N名工人,r为同一时刻发生故障的设备的台数,则K~B(300,0.01)。所 需解决的问题是确定N最小值,使 rr≤WM≥0.99 因p=入=3,由泊松定理 r≤M户3 3, 8
8 1 1; 1 1 , ( ) e n n n n k n 故有 . e k C p p k n k n k n k n n ! lim (1 ) 定理的条 件 npn ,意味着 n 很大时, pn 必定很小 ,由泊松定理知, 当 X ~ B(n, p),,且 n 很大而 p 很小时,有 , (2.1) ! ( ) (1 ) e k P X k C p p k k k n k n 其中 np 。在实际计算中,当 n 20, p 0.05时,(2.1)式的近似值效果颇佳,而 n 100 且 np 10时,效果更好。 的值有表可查(见书后附表) e k k ! 在例 4 中, np 8,由(2.1)式知 ( 0) , ( 1) 8 . 8 8 P X e P X e 因此 ( 2) 1 8 0.997. 8 8 P X e e 例 4 的结果告诉我们两个事实: 其一,虽然每次射击的命中率很小(为 0.02),但射击次数足够大(为 400 次 ),则 击中目标两次几乎是肯定的(概率为 0.997)。这个事实告诉我们,一个事件尽管在一 次实验中发生的概率很小,但在大量的独立重复试验中这事件的发生几乎是必然的。 也就是说,小概率事件在大量独立重复室验中是不可忽视的。 其二,若射手在 400 次独立射击中,击中目标的次数不到两次是一件概率很小的事 件,而这事件竟然在一次实验中发生了,则跟据实际推断,我们有理由怀疑“每次射 击的命中率为 0.02”这一假设是否正确,即可认为射手射击的命中率达不到 0.02。 例 5 5 现有同型设备 300 台,各台设备的工作是相互独立的,发生故障的概率都是 0.01. 设一台设备的故障可由一名维修工人处理,问至少需配备多少名维修工人,才能保证 设备发生故障但不能及时维修的概率小于 0.01? 解 设需配备 N 名工人,X 为同一时刻发生故障的设备的台数,则 X ~ B(300,0.01)。所 需解决的问题是确定 N 最小值,使 P(X N) 0.99. 因 np 3,,由泊松定理 N k k e k P X N 0 3 , ! 3 ( )
故问题转化为求N的最小值,使 2 -e3≥0.99 即1-3e=3 3≤0.01 科 查书后附表2可知,当N≥8时,上式成立。因此,为达到上述要求,至少需配备8名 维修工人。 类似的问题在其他领域也会遇到,如电话交换台接线员的配备,机场供飞机起降的 跑道数的确定等 例6现有90台同类型的设备,各台设备的工作是相互独立的,发生故障的概率都 是0.01,且一台设备的故障能由一个人处理。配备维修工人的方法有两种,一种是由 三人分开维护,每人负责30台;另一种是由3人共同维护90台.试比较两种方法在设 备发生故障不能及时维修的概率的大小。 解设A,(1=1,2,3)为第个人负责的30台设备发生故障而无人修理的事件。 X表示第1个人负责的30台设备中同时发生故障的设备台数,则 ,~B30,0.01),1=p=0.3。由(2.1)式 A4=AX,≥2)=203)e03=0.0369. 而90台设备发生故障无人修理的事件为AUA,UA,故采用第一种配备维修工人的 方法时,所求概率为 R4U4U4)=1-pA4A)=1-PA)PA2)PA)=1-(1-0.0369)3=0.1067. 在采用第二种配备维修工人的方法时,设厂为90台设备中同时发生故障的设备 台数,则X~B(90,0.01),2=p=0.9,而所求概率为 r≥4)≈> 09)e09=0.0135 科 由于0.01350是常数,则称X服从参数为入的泊松分布,记为X~P(2)。 9
9 故问题转化为求 N 的最小值,使 N k k e 0 k 3 0.99. ! 3 即 0.01 ! 3 ! 3 1 3 0 1 3 e k e k N k k N k k 查书后附表 2 可知,当 N 8 时,上式成立。因此,为达到上述要求,至少需配备 8 名 维修工人。 类似的问题在其他领域也会遇到,如电话交换台接线员的配备,机场供飞机起降的 跑道数的确定等. 例 6 6 现有 90 台同类型的设备,各台设备的工作是相互独立的,发生故障的概率都 是 0.01,且一台设备的故障能由一个人处理。配备维修工人的方法有两种,一种是由 三人分开维护,每人负责 30 台;另一种是由 3 人共同维护 90 台.试比较两种方法在设 备发生故障不能及时维修的概率的大小。 解 设 A i (i 1, 2 ,3 ) 为第 i 个人负责的 30 台设备发生故障而无人修理的事件。 X i表示第 i 个人负责的 30 台设备中同时发生故障的设备台数,则 X i ~ B(30 ,0.01), np 0.3。由(2.1)式 0 .3 2 (0.3) ( ) ( 2) 0.0369. ! k i i k P A P X e k 而 90 台设备发生故障无人修理的事件为 A1 A2 A3,故采用第一种配备维修工人的 方法时,所求概率为 ( ) 1 ( ) 1 ( ) ( ) ( ) 1 (1 0.0369) 0.1067. 3 P A1 A2 A3 p A1A2A3 P A1 P A2 P A3 在采用第二种配备维修工人的方法时,设 X 为 90 台设备中同时发生故障的设备 台数,则 X ~ B( 90,0.01), np 0.9 ,而所求概率为 0.0135 ! (0.9) ( 4) 4 0.9 k k e k P X 由于 0.0135 0.1067 ,显然共同负责比分块负责的维修效率提高了。 3. 3. 泊松分布 若随机变量 X 所有可能取值为 0,1,2,, 而 , 0,1,2, , ! ( ) e k k P X k k 其中 0是常数,则称 X 服从参数为 的泊松分布,记为 X ~ P()
泊松定理表明,若r~Bn,Pn)(pn=元),则当n→+∞时,X~P八2),这个事 实也说明了泊松分布在理论上的重要性。 具有泊松分布的随机变量在实际应用中是很多的。例如,在每个时段内电话交换 台收到的电话的呼唤次数、某商店在一天内的顾客数、在某时段内的某放射性物质发 出的经过计数器的粒子数等。泊松分布也是一种常见的重要分布。 注泊松分布是作为二项分布的极限分布提出来的 例7设某段时间内通过一路口的汽车流量服从泊松分布,己知该时段内没有 汽车通过的概率为0.05,则这段时间内至少有两辆汽车通过的概率是多少? 4.超几何分布 设随机变量的分布列为 )=CuC (i=01.2.=mint nM) CN 其中M,N,n都是自然数,且n0 △r △r-0 △x 它表示了随机变量X在区间:x+△x]上的平均概率,其与物理学中线密度的定义类 似,故称为密度函数。若不计高阶无穷小,则当△x很小时,由上式可得 10
10 泊松定理表明,若 X ~ B(n, p n )(np n ),则当 n 时, X ~ P(),这个事 实也说明了泊松分布在理论上的重要性。 具有泊松分布的随机变量在实际应用中是很多的。例如,在每个时段内电话交换 台收到的电话的呼唤次数、某商店在一天内的顾客数、在某时段内的某放射性物质发 出的经过计数器的粒子数等。泊松分布也是一种常见的重要分布。 注 泊松分布是作为二项分布的极限分布提出来的 7 0.05, 例 设某段时间内通过一路口的汽车流量服从泊松分布,已知该时段内没有 汽车通过的概率为 则这段时间内至少有两辆汽车通过的概率是多少? 4. 4. 超几何分布 ~ ( , , ). , , , , , , ( ) ( 0,1,2, , ; min{ , }) X H N M n M N n n N M N X N M n i l l n N C C C P X x X n N n i N M i M i 超几何分布,记作 其中 都是自然数,且 则称 服从参数为 的 设随机变量 的分布列为 例 设有一批产品 1000 件,其中有次品 10 件,今从中任取 2 件, 求所取 2 件中恰有一件次品的概率。 第三节 连续型随机变量的分布 连续型随机变量是一种重要的非离散型的随机变量。在这一节中我们要给出连续 型随机变量的定义、性质、概率计算,并介绍一些常用的连续型随机变量的分布。 一、连续型随机变量 1. 定义: : 设 F(x)是随机变量 X 的分布函数,若存在非负函数 f(X),对任意实数 x,有 (2.2) x F( x) f (t)dt 则称 X 为连续型随机变量 连续型随机变量 连续型随机变量 连续型随机变量 。称f(X)为 X 的概率密度函数 概率密度函数 或密度函数 密度函数 ,也称为概率密度 概率密度 。 2. 性质:由定义可知,密度函数 f(x)有以下性质: 1. f ( x) 0, f (t)dt F() 1. 2. 2 1 ( ) ( ) ( ) ( ) 1 2 2 1 x x P x X x F x F x f t dt ( ) 1 2 x x 3.若 f(x)在点 x 处连续,则 F(x)=f(x) 由性质 3 知在 f(x)的连续点 x 处有 , ( ) lim ( ) ( ) ( ) ( ) lim 0 0 ' x P x X x x x F x x F x f x F x x x 它表示了随机变量 X 在区间 (x,x+△x]上的平均概率,其与物理学中线密度的定义类 似,故称 f(x)为密度函数。若不计高阶无穷小,则当 △x 很小时,由上式可得