第二章随机变量及其分布 本章主要讲述随机变量与分布函数,一维离散型随机变量,连续型随机变量的概率 内容密度,二维随机变量及其分布,边缘分布与随机变量的独立性,随机变量函数的分布 等内容 提要 1、了解随机变量的概念、离散型随机变量及概率函数(分布列)的概念和性质、连续 型随机变量及概率密度的概念和性质。 2、了解分布函数的概念与性质,会利用概率分布计算有关事件的概率。 3、掌握二项分布、泊松分布、正态分布,了解均匀分布与指数分布 4、会求简单随机变量函数的概率分布。 重点|5、了解多维随机变量的概念,了解二维随机变量的联合分布函数、联合概率函数、联 合概率密度的概念和性质。 分析6、了解二维随机变量的边缘分布 7、了解随机变量的独立性 8、会求两个独立随机变量和的分布 1、随机变量与分布函数、分布律与密度函数的概念、性质的理解 难点2、二项分布、泊松分布、正态分布的掌握。 分析|3、求简单随机变量函数的概率分布 习题 布置习题2(2,4,6,8,0.1315,1720,22) 备注
第二章 随机变量及其分布 内容 提要 本章主要讲述随机变量与分布函数,一维离散型随机变量,连续型随机变量的概率 密度,二维随机变量及其分布,边缘分布与随机变量的独立性, 随机变量函数的分布 等内容。 重点 分析 1、了解随机变量的概念、离散型随机变量及概率函数(分布列)的概念和性质、连续 型随机变量及概率密度的概念和性质。 2、了解分布函数的概念与性质,会利用概率分布计算有关事件的概率。 3、掌握二项分布、泊松分布、正态分布,了解均匀分布与指数分布。 4、会求简单随机变量函数的概率分布。 5、了解多维随机变量的概念,了解二维随机变量的联合分布函数、联合概率函数、联 合概率密度的概念和性质。 6、了解二维随机变量的边缘分布。 7、了解随机变量的独立性。 8、会求两个独立随机变量和的分布。 难点 分析 1、 随机变量与分布函数、分布律与密度函数的概念、性质的理解。 2、 二项分布、泊松分布、正态分布的掌握。 3、 求简单随机变量函数的概率分布。 习题 布置 习题 2 (2,4,6,8,10,13,15,17,20 ,22) 备注
教学内容( Contents) Chapter Two随机变量及其分布( Random varia ble and Distribution) §2.1一维随机变量(One- dimension random variable) 随机变量与分布函数( Random variable and distribution function 我们讨论过不少随机试验,其中有些实验的结果就是数量,有些虽然本身不是数量,但 可以用数量来表示实验的结果 Example2.1从一批废品率为p的产品中有放回地抽取n次,每次取一件产品,及录取 到废品的次数,这一试验的样本空间为S={12,…n如果用X表示取到废品的次数,那末 Y的取值依赖于实验结果,当实验结果确定了,Ⅹ的取值也就随之确定了。比如,进行了 次这样的随机试验,实验结果ω=1,即在n次抽取中,只有一次取到了废品,那末X=1 Example2.2掷一枚匀称的硬币,观察正面、背面的出现情况。这一试验的样本空间 为S={H,T},其中H表示“正面朝上”,T表示“背面朝上”。如果引入变量X,对实 验的两个结果,将X的值分别规定为1和0,即:x=当出现时 1当出现时·一旦实验的 结果确定了,Ⅹ的取值也就随之确定了 从上述两个例子可以看出:无论随机试验的结果本身与数量有无联系,我们都能把实验 的结果与实数对应起来,即可把实验的结果数量化。由于这样的数量依赖实验的结果,而对 随机试验来说,在每次试验之前无法断言会出现何种结果,因而也就无法确定它会取什麽值 即它的取值具有随机性,我们称这样的变量为随机变量。事实上,随机变量就是随试验结果 的不同而变化的量。因此可以说,随机变量是随试验结果的函数。我们可以把例2.1中的X 写成X=X(o)=O,其中O∈{01,2,…,n,把例2.2中的X写成 X=X() 1,当O=H 般的,我们有以下定义 Definition2.1设E为一随机试验,S为他的样本空间,若X=X(o),O∈S为单值实 函数,且对于任意实数X,集合{oX(o)≤x都是随机事件,则称X为随机变量LetE a random experiment S is its sample space ifX=X(o, oES is a single value real fur and the set olr(o)sx are all random occurrence for arbitrary real value, then define random variable.) 随机变量与普通实函数这两个概念既有联系又有区别,他们都是从一个集合到另一个集 合的映射,它们的区别主要在于:普通实函数无需做试验便可依据自变量的值确定函数值, 而随机变量的取值在做实验之前是不确定的,只有在做了试验之后,依据所出现的结果才能 确定。定义中要求对任一实数x,{o(o)≤x都是事件,这说明并非任何定义在S上的 函数都是随机变量,而是对着函数有一定的要求。定义中的要求无非是说,当我们把随机试 验的结果数量化时,不可随心所欲,而是应该合乎概率公理体系的规范。今后,在不必强调O 时,常省去O,简记X()为X,而O的集合{o|X()≤x所表示的事件简记为X≤x 引入了随机变量之后,随机事件就可以用随机变量来描述,例如,在某城市中考察人口 的年龄结构,年龄在80岁以上的长寿者,年龄介于18岁至35岁之间的年轻人,以及不到12
14 教 学 内 容( Contents ) Chapter Two 随机变量及其分布(Random Variable and Distribution) §2.1 一维随机变量(One-dimension Random Variable) 一、 随机变量与分布函数(Random variable and distribution function) 我们讨论过不少随机试验,其中有些实验的结果就是数量,有些虽然本身不是数量,但 可以用数量来表示实验的结果。 Example 2.1 从一批废品率为 p 的产品中有放回地抽取 n 次,每次取一件产品,及录取 到废品的次数,这一试验的样本空间为 S n = 1,2, , .如果用 X 表示取到废品的次数,那末, X 的取值依赖于实验结果,当实验结果确定了, X 的取值也就随之确定了。比如,进行了一 次这样的随机试验,实验结果 =1 ,即在 n 次抽取中,只有一次取到了废品,那末 X =1. Example 2.2 掷一枚匀称的硬币,观察正面、背面的出现情况。这一试验的样本空间 为 S H T = { , } ,其中 H 表示“正面朝上” ,T 表示“背面朝上” 。如果引入变量 X ,对实 验的两个结果,将 X 的值分别规定为 1 和 0 ,即 : = 当出现 时 当出现 时 T H X 0, 1, 。一旦实验的 结果确定了, X 的取值也就随之确定了。 从上述两个例子可以看出:无论随机试验的结果本身与数量有无联系,我们都能把实验 的结果与实数对应起来,即可把实验的结果数量化。由于这样的数量依赖实验的结果,而对 随机试验来说,在每次试验之前无法断言会出现何种结果,因而也就无法确定它会取什麽值, 即它的取值具有随机性,我们称这样的变量为随机变量。事实上,随机变量就是随试验结果 的不同而变化的量。因此可以说,随机变量是随试验结果的函数。我们可以把例 2.1 中的 X 写成 X X = = ( ) ,其中 0,1,2, ,n .把例 2.2 中的 X 写成 = = = = T H X X 当 当 0, 1, ( ) .一般的,我们有以下定义: Definition 2.1 设 E 为一随机试验, S 为他的样本空间,若 X X = ( ) ,S 为单值实 函数,且对于任意实数 X ,集合 X x ( ) 都是随机事件,则称 X 为随机变量。(Let E a random experiment, S is its sample space, if X X = ( ) ,S is a single value real function and the set X x ( ) are all random occurrence for arbitrary real value, then define X is random variable.) 随机变量与普通实函数这两个概念既有联系又有区别,他们都是从一个集合到另一个集 合的映射,它们的区别主要在于:普通实函数无需做试验便可依据自变量的值确定函数值, 而随机变量的取值在做实验之前是不确定的,只有在做了试验之后,依据所出现的结果才能 确定。定义中要求对任一实数 x , X x ( ) 都是事件,这说明并非任何定义在 S 上的 函数都是随机变量,而是对着函数有一定的要求。定义中的要求无非是说,当我们把随机试 验的结果数量化时,不可随心所欲,而是应该合乎概率公理体系的规范。今后,在不必强调 时,常省去 ,简记 X ( ) 为 X ,而 的集合 X x ( ) 所表示的事件简记为 X x . 引入了随机变量之后,随机事件就可以用随机变量来描述,例如,在某城市中考察人口 的年龄结构,年龄在 80 岁以上的长寿者,年龄介于 18 岁至 35 岁之间的年轻人,以及不到 12
岁的儿童,它们各自的比率如何。从表面上看,这些是孤立事件,但若我们引进一个随机变 量X:X表示随机抽取一个人的年龄:那末,上述几个事件可以分别表示成{X>80}、 18≤X≤35}及x<12.由此可见,随机事件的概念是被包容在随机变量这个更广的概念 之内的 对于随机变量X,我们不只是看它取哪些值,更重要的是看它以多大的概率取那些值 由随机变量的定义可知,对于每一个实数x,{X≤x}都是一个事件,因此有一个确定的概 率P(X≤x)与x相对应,所以,概率P(X≤x)是x的函数。这个函数在理论和应用中都是 很重要的,为此,我们有以下定义: Definition22设X为一个随机变量,x为任意实数,称函数F(x)=P(X≤x)为X 的分布函数。( Let x is a random variable, x is arbitrary real value, then define F(x)=P(X x)is the distribution function of x 显然,在上述定义中,当x固定为x0时,F(x0)为事件{X≤x0}的概率,当x变化时 概率P(X≤x)便是x的函数。 分布函数的性质( The property of distribution function (1)F(-∞)=0,F(+∞) (2)F(x)是自变量x的非降函数,即当x1<x2时,必有F(x1)≤F(x2).因为当 1<x2时有F(x2)-F(x)=P(x1<X≤x2)≥0,从而有F(x1)≤F(x2) (3)F(x)对自变量x右连续,即对任意实数x,F(x+0)=F(x),事实上 lim[F(x+Ax)-F(x)=lmP(x<X≤x+△x)=P(x<X≤x)=P()=0 右连续性是随机变量的分布函数的普遍性质。对连续的随机变量,F(x)是连续函数。对 离散的随机变量,在可能值x1,(=1,2,)处,F(x)是右连续的 §2.2一维高散型随机变量 (One Dimension Discrete Random variable 离散型随机变量的概率分布( discrete random variable and probability distribution) 离散型随机变量X只可能取有限个或可列个值,设x可能取的值为x1,x2…,xn Definition2.3设离散型随机变量X可能取的值为x1,x2,,xn2…,且X取这些值的概 率为 P(X=xk)=P4(k=1,2,,n2) 则称上述一系列等式为随机变量X的概率分布。( Suppose the value for the discrete random ariable X in the following sequence: xu,x2,, xn and the probability of the value for X is P(X P (k=1 then define the set of equations is probability distribution of X.) 为了直观起见,有时将X的取值及其对应的概率列表如下: P 我们称这种表为离散型随机变量X的概率分布表 Table of probability distribution)。式子 P(X=x)=P4,(k=12…,n,…)和概率分布表都称为离散型随机变量X的分布律( Law of
15 岁的儿童,它们各自的比率如何。从表面上看,这些是孤立事件,但若我们引进一个随机变 量 X : X 表示随机抽取一个人的年龄 ; 那末,上述几个事件可以分别表示成 X 80 、 18 35 X 及 X 12 .由此可见,随机事件的概念是被包容在随机变量这个更广的概念 之内的。 对于随机变量 X ,我们不只是看它取哪些值,更重要的是看它以多大的概率取那些值。 由随机变量的定义可知,对于每一个实数 x , X x 都是一个事件,因此有一个确定的概 率 P(X x) 与 x 相对应,所以,概率 P(X x) 是 x 的函数。这个函数在理论和应用中都是 很重要的,为此,我们有以下定义: Definition 2.2 设 X 为一个随机变量, x 为任意实数,称函数 F(x) = P(X x) 为 X 的 分布函数。 (Let X is a random variable, x is arbitrary real value, then define F(x) = P(X x) is the distribution function of X .) 显然,在上述定义中,当 x 固定为 0 x 时, ( ) 0 F x 为事件 { }0 X x 的概率,当 x 变化时, 概率 P(X x) 便是 x 的函数。 分布函数的性质(The property of distribution function) (1) F(−) = 0,F(+) = 1 . (2) F(x) 是自变量 x 的非降函数,即当 1 2 x x 时,必有 ( ) ( ) 1 2 F x F x .因为当 1 2 x x 时有 F(x2 ) − F(x1 ) = P(x1 X x2 ) 0 ,从而有 ( ) ( ) 1 2 F x F x . (3) F(x) 对自变量 x 右连续,即对任意实数 x , F(x + 0) = F(x) ,事实上, 0 0 lim [ ( ) ( )] lim ( ) ( ) ( ) 0 x x F x x F x P x X x x P x X x P V + + → → + − = + = = = 右连续性是随机变量的分布函数的普遍性质。对连续的随机变量, F(x) 是连续函数。对 离散的随机变量,在可能值 x ,(i =1,2,...) i 处, F(x) 是右连续的。 §2.2 一维离散型随机变量 (One Dimension Discrete Random Variable) 一、离散型随机变量的概率分布(discrete random variable and probability distribution) 离散型随机变量 X 只可能取有限个或可列个值,设 x 可能取的值为 , ,..., ,.... 1 2 n x x x . Definition 2.3 设离散型随机变量 X 可能取的值为 , ,..., ,.... 1 2 n x x x ,且 X 取这些值的概 率为: k pk P(X = x ) = ( k = 1,2,..., n,...) 则称上述一系列等式为随机变量 X 的概率分布。(Suppose the value for the discrete random variable X in the following sequence: , ,..., ,.... 1 2 n x x x , and the probability of the value for X is k pk P(X = x ) = ( k = 1,2,..., n,...) then define the set of equations is probability distribution of X .) 为了直观起见,有时将 X 的取值及其对应的概率列表如下: X 1 x 2 x …… n x … P 1 p 2 p …… n p … 我们称这种表为离散型随机变量 X 的概率分布表(Table of probability distribution)。式子 k pk P(X = x ) = ,( k = 1,2,..., n,...) 和概率分布表都称为离散型随机变量 X 的分布律(Law of
distribution)。 由概率的定义知,离散型随机变量X的概率分布具有以下两个性质 (1)p4≥0,(k=1,2,)(非负性) (2)∑P=1(归一性) 这里当X取有限个值n时,记号为∑,当X取无限可列个值时,记号为∑ (3)分布函数F(x)=PX≤x)=∑PX=x)=∑P,这里和式是对所有满足 I,<r x,≤x的i求和 Example2.3设袋中装有6个球,编号为{-1,2,2,2,3,3},从袋中任取一球,求 取到的球的号X的分布律。 Solution因为X可取的值为-1,2,3,而且P{X=-1=1/6,P{X=3}=1/3 P{X=}=1/2,所以X的分布律为 Example2.4在贝努里概型中,n次独立试验,事件A发生的次数为随机变量X,它 的所有可能取值为0,1,2,…n,X的分布律为 P(X=k)=p4=Cbp2q”(k=01,2,…n) 、几种常用的离散型分布( Several special discrete models 下面介绍几种常用的离散型随机变量的概率分布(简称分布)。 1.两点分布 如果随机变量X只可能取0和1两个值,且它的分布列为 P(X=1)=p,P(X=0)=1-p,(0<p<1),则称X服从两点分布( Two-point distribution (或0-1分布)。两点分布的概率分布表为 2.二项分布 如果随机变量X只可能取的值为0,1,2,…,n,它的分布列为 P(X=k)=Cp‘q,(k=0,12,n)其中0<p<,q=1-p.则称X服从参数为n,p 的二项分布( the binomial distribution),记为X~B(n,p).当n=1时,二项分布就是两点分 例2.4本身就是二项分布 冬☆ Example2.5某车间有8台56千瓦的车床,每台车床由于工艺上的原因,常要停车。 各车床停车是相互独立的,每台车床平均每小时停车12分钟 (1)求在某一指定的时刻车间恰有两台车床停车的概率 (2)全部车床用电超过30千瓦的可能有多大? Solution由于每台车床使用是独立的,而且每台车床只有开车与停车两种情况,且开车 的概率为12/60=0.2,因此,这是一个8重贝努里试验。若用X表示任意时刻同时工作的车 床数,则X~B(8,0.2),其分布律为 P(X=k)=C(0.2)(08),(k=0,12,83)
16 distribution)。 由概率的定义知,离散型随机变量 X 的概率分布具有以下两个性质: (1) p 0,(k =1,2,......) k (非负性) (2) = 1 k pk (归一性) 这里当 X 取有限个值 n 时,记号为 = n k 1 ,当 X 取无限可列个值时,记号为 k =1 . (3) 分布函数 = = = = x x x x i i i i F(x) P(X x) P(X x ) p ,这里和式是对所有满足 x x i 的 i 求和。 Example 2.3 设袋中装有 6 个球,编号为{-1,2,2,2,3,3},从袋中任取一球,求 取到的球的号 X 的分布律。 Solution 因为 X 可取的值为-1,2,3,而且 P X{ 1} 1 6 = − = , P X{ 3} 1 3 = = , P X{ } 1 2 = = ,所以 X 的分布律为 X -1 2 3 k p 6 1 2 1 3 1 Example 2.4 在贝努里概型中, n 次独立试验,事件 A 发生的次数为随机变量 X ,它 的所有可能取值为 0,1,2, n, X 的分布律为 = = = = − P X k p C p q k k k n k k n ( ) ( 0,1,2, n ) 二、 几种常用的离散型分布(Several special discrete models) 下面介绍几种常用的离散型随机变量的概率分布(简称分布)。 1. 两点分布 如果随机变量 X 只可能取 0 和 1 两个值,且它的分布列为 P(X = 1) = p,P(X = 0) = 1− p,(0 p 1) ,则称 X 服从两点分布(Two-point distribution) (或 0—1 分布)。两点分布的概率分布表为: X 1 0 P p 1- p 2. 二项分布 如 果 随 机 变 量 X 只可能取的值为 0,1,2,…,n , 它 的 分 布 列 为 k k n k P X k Cn p q − ( = ) = ,( k = 0,1,2,...n) 其中 0 p 1,q = 1− p .则称 X 服从参数为 n, p 的二项分布(the Binomial Distribution),记为 X ~ B(n, p) .当 n =1 时,二项分布就是两点分 布。 例 2.4 本身就是二项分布。 Example 2.5 某车间有 8 台 5.6 千瓦的车床,每台车床由于工艺上的原因,常要停车。 设各车床停车是相互独立的,每台车床平均每小时停车 12 分钟。 (1)求在某一指定的时刻车间恰有两台车床停车的概率。 (2)全部车床用电超过 30 千瓦的可能有多大? Solution 由于每台车床使用是独立的,而且每台车床只有开车与停车两种情况,且开车 的概率为 12/60=0.2,因此,这是一个 8 重贝努里试验。若用 X 表示任意时刻同时工作的车 床数,则 X ~ B(8,0.2) ,其分布律为 k k n k Cn P X k − ( = ) = (0.2) (0.8) ,( k = 0,1,2,...8)
(1)所求概率为P(X=2)=C3(02)2(0.8)°=0.2936 (2)由于30千瓦的电量只能供5台车床同时工作,“用电超过30千瓦”意味着有6台 或6台以上的车床同时工作,这一事件的概率为 P(X≥6)=P(X=6)+P(X=7)+P(X=8) =C8(0.2)°(0.8)2+C3(0.2)7(0.8)+(02)3=000123 Theorem2.l( Poisson theoren)设随机变量X服从二项分布B(n,pn),且 limnp,=1>0, Bu lim C P(I-p.)k=e-i(=1, 2, . (Let X ha ave the binomial distribution with parameter n and P, and limp,=2>0,then Cka、mxg(k=12,…)) Pro0:令叩n=n,有 CRP(1-P)". n(n-1)…(n-k+1),A k (1--(1--)…(1 (1-)”(1-一) 对任意固定的k(0≤k≤m),当n→>∞时 k-1 及 =Im(-)x(-) 所以 lm Cn Pn(I-n 2 (k=1 2, . . k 在应用中,当n很大,且p很小,而n是一个大小适当的数(通常00是常数,则称X服从参数为λ的泊松分布( Poisson distribution),记为X~∏I() 泊松分布在各领域中有着广泛的应用。例如某段时间内电话机接到的呼唤次数,候车的 乘客数,放射性物质在某段时间内放射的粒子数,纺纱机的断头数,某页书上的印刷错误的 个数等等都可以用泊松分布来描述。前面已知当n较大、p很小,且m是一个大小适当的数 (通常0<叩p≤8),可以用泊松分布近似代替二项分布(取=np)。 Example2.6某商店出售某种商品。根据经验,此商品的月销售量X服从λ=3的泊松
17 (1)所求概率为 ( 2) (0.2) (0.8) 0.2936 2 2 6 P X = = C8 = . (2)由于 30 千瓦的电量只能供 5 台车床同时工作,“用电超过 30 千瓦”意味着有 6 台 或 6 台以上的车床同时工作,这一事件的概率为 P(X 6) = P(X = 6) + P(X = 7) + P(X = 8) = (0.2) (0.8) (0.2) (0.8) (0.2) 0.00123 7 7 8 8 6 6 2 C8 + C + = Theorem2.1(Poisson theorem) 设随机变量 X 服从二项分布 ( , ) B n pn , 且 lim 0 n n np → = ,则 ( 1,2, ) ! lim (1− ) − = − = → e k k C p p k n k n k n k n n 。(Let X have the Binomial distribution with parameter n and P n , and lim 0 n n np → = , then ( 1,2, ) ! lim (1− ) − = − = → e k k C p p k n k n k n k n n .) Proof: 令 n np = n ,有 n k n k n n n k n k n k n k n n n n n n k C p p − − − − − − + − = ( ) (1 ) (1 ) ! ( 1) ( 1) (1 ) = n n n k k n n k n n k n n − − − − − − − (1 ) (1 ) ! ) 1 ) (1 2 )(1 1 (1 对任意固定的 k (0 k n) ,当 n → 时 ) 1 1 ) (1 2 )(1 1 (1 → − − − − n k n n ,(1− ) →1 n −k n , k k n → 及 − − − → → − = − = e n n n n n n n n n n ( ) lim (1 ) lim (1 ) 所以 ( 1,2, ) ! lim (1− ) − = − = → e k k C p p k n k n k n k n n 在应用中,当 n 很大,且 p 很小,而 np 是一个大小适当的数(通常 0 8 np )时,有 以下的泊松分布近似公式 − − − e k C p p k k k n k n ! (1 ) 其中 = np .而关于 − e k k ! 的值,可以查表(见附表)。 3. 泊松分布 如果随机变量 X 所有可能取的值为 0,1,2,…,它取各个值的概率为 ,( 0,1,2,...) ! ( = ) = = − e k k P X k k , 其中 0 是常数,则称 X 服从参数为 的泊松分布(Poisson distribution),记为 X ~ ( ) . 泊松分布在各领域中有着广泛的应用。例如某段时间内电话机接到的呼唤次数,候车的 乘客数,放射性物质在某段时间内放射的粒子数,纺纱机的断头数,某页书上的印刷错误的 个数等等都可以用泊松分布来描述。前面已知当 n 较大、 p 很小,且 np 是一个大小适当的数 (通常 0 8 np ),可以用泊松分布近似代替二项分布(取 = np )。 Example 2.6 某商店出售某种商品。根据经验,此商品的月销售量 X 服从 = 3 的泊松
分布。问在月初进货时要库存多少件此种商品,才能以99%的概率满足顾客要求? Solution设月初库存M件,依题意 P(X=k ,(k=0,1,2 P(X≤ 0.99 即 3g3<001 k 査附表3,可知M最小应是8,即月初进货时要库存8件此种商品,才能以99%的概率满 足顾客要求。 底xme27一本500页的书,共500错字,每个字等可能的出现在每一页上,求在给 某一页上最多两个错字的概率 Solution设X表示在给定的某一页上出现的错字的个数,则X~B(500, 因为n 500 很大,n=1,所以可以用泊松分布近似计算,依题意 P(X≤2) 0.92 4.超几何分布 设一批产品共有N个,其中有M个次品,现从中任取n个(n≤N-M),则这n个产 品中所含的次品数X是一个离散型随机变量,X所有可能的取值为0,1,2,…,j,(其 中j=min{M,n}),其概率分布为: P(X=k)=CMC=M/CN(k=0,1,2,…,j),称之为超几何分布 Super geometry distribution) 5.几何分布 从一批次品率为p(0<p<1)的产品中逐个地随机抽取产品进行检验,验后放回再抽 取下一件,直到抽到次品为止。设检验的次数为Ⅹ,则X可能取的值为1,2,3,…,其概 率分布为 P(X=k)=(-p)p,(k=12…),称这种概率分布为几何分布( Geometry distribution) §2.3连续型随机变量的概率密度 (Probability Density of Continuous Random Variable) 除了离散型随机变量外,还有一类重要的随机变量——连续型随机变量,这种随机变量X 可以取某个区间[a,b]或(-∞,+∞)的一切值。由于这种随机变量的所有可能取值无法像离散型 随机变量那样一一排列,因而也就不能用离散型随机变量的分布律来描述它的概率分布,刻 画这种随机变量的概率分布可以用分布函数,但在理论上和实践中更常用的方法是用所谓的 概率密度 分布密度的概念( The concept of density distribution Definition2.4设随机变量X的的分布函数为F(x),如果存在一个非负可积函数
18 分布。问在月初进货时要库存多少件此种商品,才能以 99%的概率满足顾客要求? Solution 设月初库存 M 件,依题意 ,( 0,1,2,...) ! 3 ( ) 3 = = = − e k k P X k k 那么 0.99 ! 3 ( ) 0 3 = = − M k k e k P X M 即 0.01 ! 3 ! 3 = + − k M k e k 查附表 3,可知 M 最小应是 8,即月初进货时要库存 8 件此种商品,才能以 99%的概率满 足顾客要求。 Example 2.7 一本 500 页的书,共 500 错字,每个字等可能的出现在每一页上,求在给 定的某一页上最多两个错字的概率。 Solution 设 X 表示在给定的某一页上出现的错字的个数,则 ) 500 1 X ~ B(500, ,因为 n 很大, np = 1 ,所以可以用泊松分布近似计算,依题意 0.92 2 5 ! 2 1 ( 2) 1 1 1 1 1 2 0 = + + = − − − − − = e e e e e k P X k 4. 超几何分布 设一批产品共有 N 个,其中有 M 个次品,现从中任取 n 个( n N M − ),则这 n 个产 品中所含的次品数 X 是一个离散型随机变量, X 所有可能的取值为 0,1,2,…, j , ( 其 中 j M n = min , ),其概率分布为: n N n k N M k P(X k) CM C /C − = = − ( k =0,1,2,…, j ),称之为超几何分布(Super geometry distribution)。 5. 几何分布 从一批次品率为 p ( 0 1 p )的产品中逐个地随机抽取产品进行检验,验后放回再抽 取下一件,直到抽到次品为止。设检验的次数为 X ,则 X 可能取的值为 1,2,3,…, 其概 率分布为: ( ) (1 ) ,( 1,2,....) 1 = = − = − P X k p p k n , 称 这 种 概 率 分 布 为 几 何 分 布 (Geometry distribution)。 §2.3 连续型随机变量的概率密度 (Probability Density of Continuous Random Variable) 除了离散型随机变量外,还有一类重要的随机变量——连续型随机变量,这种随机变量 X 可以取某个区间 [a,b] 或 (−,+) 的一切值。由于这种随机变量的所有可能取值无法像离散型 随机变量那样一一排列,因而也就不能用离散型随机变量的分布律来描述它的概率分布,刻 画这种随机变量的概率分布可以用分布函数,但在理论上和实践中更常用的方法是用所谓的 概率密度。 一、 分布密度的概念(The concept of density distribution) Definition 2.4 设随机变量 X 的的分布函数为 F x( ) ,如果存在一个非负可积函数
f(x),使得对于任意实数x,有: F(x)=f(x)dx 则称X为连续型随机变量,而f(x)称为X的分布密度函数(或概率密度函数),简称分布密 度(或概率密度)。( Suppose distribution function F(x) for random variable X, if there exists a nonnegative integral function f(x), such that for arbitrary x, there is F(x)=「f(x) then define X is a continuous random variable and f(x) is density function distribution(or probability density function), for short distribution density or probability density).) 由分布密度的定义及概率的性质可知分布密度∫(x)必须满足 (1)f(x)≥0:从几何上看,分布密度函数的曲线在横轴的上方 (2)「f(x)hx=1;这是因为-0 0,x≤0 (1)试确定常数K;
19 f (x) ,使得对于任意实数 x ,有: − = x F(x) f (x)dx 则称 X 为连续型随机变量,而 f (x) 称为 X 的分布密度函数(或概率密度函数),简称分布密 度(或概率密度)。(Suppose distribution function F x( ) for random variable X , if there exists a nonnegative integral function f (x) , such that for arbitrary x , there is − = x F(x) f (x)dx then define X is a continuous random variable and f (x) is density function distribution(or probability density function), for short distribution density ( or probability density). ) 由分布密度的定义及概率的性质可知分布密度 f (x) 必须满足: (1) f (x) 0 ;从几何上看,分布密度函数的曲线在横轴的上方; (2) + − f (x)dx = 1 ;这是因为 − X + 是必然事件,所以 + − f (x)dx = P(− X +) = P(U) = 1 从几何上看,对于任一连续型随机变量,分布密度函数与数轴所围成的面积是 1; (3) 对于任意实数 a,b ,且 a b 有 = − = b a P{a X b} F(b) F(a) f (x)dx ; (4)若 f (x) 在点 x 处连续,则有 ( ) ( ) ' F x = f x . Note: ○1 对于任意实数 a 有 P(X = a) = 0 .即连续型随机变量取某一实数值的概率为零。从 而有: = = = = b a P(a X b) P(a X b) P(a X b) P(a X b) f (x)dx 该式说明,当计算连续型随机变量在某一区间上取值的概率时,区间端点对概率无影响。 ○2 P(a X b) = P(X b) − P(X a) 事实上,因为事件 {a X b} 与事件 {X a} 互不相容,且 {X b} = {a X b}{X a} 所以 P(X b) = P(a X b) + P(X a) 即 = − = − = − − b a b a P(a X b) P(X b) P(X a) f (x)dx f (x)dx f (x)dx ○3 由定义可知,连续型随机变量就是存在理论分布曲线的随机变量,这一理论分布曲 线对应着一个函数 f (x) ,称为连续型随机变量的分布密度函数。连续型随机变量 X 落入微小 区间 [x, x + dx] 的概率为 P(x X x + dx) f (x)dx ,称 f (x)dx 为连续型随机变量 X 的 概率元。它起着离散型随机变量分布列中 i p 类似的作用。 Example 2.8 设随机变量 X 具有概率密度 = − 0, 0 , 0 ( ) 3 x Ke x f x x (1)试确定常数 K ;
(2)求P(X>0.1) (3)求F(x) Solution(1)由于f(x)dtx=1,即 f(x)dx= Ke-3xdx 34ked(、 得K=3.于是X的概率密度 0 f(x) (2)P(X>0D=G1fx)kG13d=0708 (3)由定义F(x) f(t)dt。当x≤0时,F(x)=0;当x>0时, F(x)=⊥(h-[,3-k=1-e1 所以 10.x≤0 二、几个常用的连续型随机变量的分布( Several special continuous models) 1.均匀分布 如果随机变量X的概率密度为 f(x)=b-a a≤x≤b 其他 则称X服从[ab]上的均匀分布( Uniform distribution) 如果X服从[a,b]上的均匀分布,那末,对于任意满足a≤c≤d≤b的c,d,应有 PcsX≤d)=」(xhsd-c 该式说明X取值于[a,b中任意小区间的概率与该小区间的长度成正比,而与该小区间的 具体位置无关。这就是均匀分布的概率意义 2.指数分布 如果随机变量X的概率密度为 x≥0 f(x) 0x0,,H为常数,则称X服从参数为a,p的正态分布( Normal distribution),记为
20 (2)求 P X( 0.1) ; (3)求 F x( ) . Solution (1)由于 + − f (x)dx =1 ,即 + − f (x)dx= 1 3 3 ( 3 ) 3 1 0 3 3 0 3 0 = = − − = − = − − + + − + K e K Ke dx Ke d x x x x 得 K = 3.于是 X 的概率密度 = − 0, 0 3 , 0 ( ) 3 x e x f x x ; (2) P X( 0.1) = + 0.1 f (x)dx = 3 0.7408 3 0.1 = − + e dx x ; (3)由定义 F x( ) = − x f (t)dt 。当 x 0 时, F x( ) =0;当 x 0 时, F x( ) = − x f (t)dt = x x x e dx e 3 3 0 3 1 − − = − 所以 − = − 0, 0 1 , 0 ( ) 3 x e x F x x . 二、几个常用的连续型随机变量的分布(Several special continuous models) 1. 均匀分布 如果随机变量 X 的概率密度为 1 , ( ) 0, a x b f x b a = − 其他 则称 X 服从 [a,b] 上的均匀分布(Uniform distribution)。 如果 X 服从 [a,b] 上的均匀分布,那末,对于任意满足 a c d b 的 c, d ,应有 b a d c P c X d f x dx d c − − = = ( ) ( ) 该式说明 X 取值于 [a,b] 中任意小区间的概率与该小区间的长度成正比,而与该小区间的 具体位置无关。这就是均匀分布的概率意义。 2. 指数分布 如果随机变量 X 的概率密度为 = − 0 ( ) x e f x ;( 0) 0 0 x x 则称 X 服从指数分布(Index distribution)(参数为 )。 指数分布也被称为寿命分布,如电子元件的寿命,电话通话的时间,随机服务系统的服 务时间等都可近似看作是服从指数分布的。 3. 正态分布 如果随机变量 X 的概率密度为 ,( ) 2 1 ( ) 2 2 ( ) 2 1 = − + − − f x e x x ; 其中 0,, 为常数,则称 X 服从参数为 , 的正态分布(Normal distribution),记为
X~N(,a2) 由高等数学可知,①当x=时,f(x)达到最大值 在x=±σ处,曲线 y=f(x)有拐点;(如图2-1)②f(x)的图形对称于直线x=;③f(x)以x轴为渐近 线;Φ若固定σ,改变μ值,则曲线y=f(x)沿x轴平行移动,曲线的几何图形不变:(如 图2-2)⑤若固定μ,改变σ值,由f(x)的最大值可知,当σ越大,f(x)的图形越平坦 当σ越小,∫(x)的图形越陡峭。(如图2-3) ¢=05 0=2 图2-1 图2-2 图2-3 特别的,当y=0,02=1时,称X服从标准正态分布( Standard normal distribution), 即X~N(0,1),密度函数为 p(x) e2,(-∞1.5);(4)P(X≤-1.2) (5)P(Xk0.34) Solution查标准正态分布表
21 ~ ( , ) 2 X N . 由高等数学可知,○1 当 x = 时, f (x) 达到最大值 2 1 ;在 x = 处,曲线 y = f (x) 有拐点;(如图 2—1)○2 f (x) 的图形对称于直线 x = ;○3 f (x) 以 x 轴为渐近 线; ○4 若固定 ,改变值 ,则曲线 y = f (x) 沿 x 轴平行移动,曲线的几何图形不变;(如 图 2—2)⑤ 若固定 ,改变 值,由 f (x) 的最大值可知,当 越大, f (x) 的图形越平坦; 当 越小, f (x) 的图形越陡峭。(如图 2—3) 图 2-1 图 2-2 图 2-3 特别的,当 0, 1 2 = = 时,称 X 服从标准正态分布(Standard normal distribution), 即 X ~ N(0,1) ,密度函数为 ,( ) 2 1 ( ) 2 2 = − + − x e x x 标准正态分布的分布函数为 − − − = = x t x x x dx e dt 2 2 2 1 ( ) ( ) 对于标准正态分布的分布函数,有下列等式 (−x) = 1− (x) 对于 ~ ( , ) 2 X N ,只要设 t x = − ,就有 1 2 1 2 1 2 ( ) 2 2 2 = = − + − − − + − e dx e dt x t 所以,如果 ~ ( , ) 2 X N ,那么 { } ( ) ( ) ( ) ( ) − − − = − = b a P a X b F b F a 为了应用方便,编制了标准正态分布函数 (x) 的函数值表;对于一般的正态分布函数, 可以通过变量替换化为标准正态分布函数。 3 规则(3 law): 服从正态分布 ( , ) 2 N 的随机变量 X 落在区间 ( − 3, + 3 ) 内 的概率为 0.9973,落在该区间外的概率只有 0.0027.也就是说, X 几乎不可能在区间 ( − 3, + 3 ) 之外取值。 Example 2.9 设 X N~ (0,1) ,求 (1) P(X 0.3) ; (2) P(0.2 X 0.5) ; (3) P(X 1.5) ; (4) P(X −1.2) ; (5) P(| X | 0.34) . Solution 查标准正态分布表
(1)P(X≤0.3)=d(0.3)=0.6179 (2)P(0.21.5)=1-Φ(1.5)=1-0.9332=0.0668. (4)P(X≤-1.2)=d(-1.2)=1-d(1.2)=1-0.8849=0.1151 (5)P(XK0.34) P{-0.34≤X≤0.34} =d(0.34)-d(-0.34)=d(0.34)-[-d(0.34)] 2d(0.34)-1=2×06331-1=02662 Example2.10设X~N(1.5,4),求 (1)P(X≤3.5);(2)P(X≤-4):(3)P(Xk3) 3.5-1.5 Solution (1) P(X h}=1-P{X≤h}0.99 h-170 因为P{X≤h}=d ),查标准正态分布表得Φ(2.33)=0.9901>0.99,所以得 h-170 =2.33 6 即h=184(cm),故车门的设计高度至少应为184cm方可保证男子与车门碰头的概率在001以 下 §2二维随机变量及其分布 (Two-dimension Random Variable and Distribution) 、二维随机变量及分布函数( Two-dimension random variable and distribution function)
22 (1) P(X 0.3) = = (0.3) 0.6179 . (2) P(0.2 X 0.5) =(0.5) − (0.2) = 0.6915 − 0.5793 = 0.1122 . (3) P(X 1.5) =1− (1.5) = 1− 0.9332 = 0.0668 . (4) P(X −1.2) =(−1.2) = 1− (1.2) = 1− 0.8849 = 0.1151 . (5) P(| X | 0.34) 2 (0.34) 1 2 0.6331 1 0.2662 (0.34) ( 0.34) (0.34) [1 (0.34)] { 0.34 0.34} = − = − = = − − = − − = P − X Example 2.10 设 X ~ N(1.5,4) ,求 (1) P(X 3.5) ; (2) P(X −4) ;(3) P(| X | 3) . Solution(1) P(X 3.5) = ) (1) 0.8413 2 3.5 1.5 (3.5) ( = = − F = . (2) P(X −4) ) ( 2.75) 1 (2.75) 1 0.5987 0.4013 2 4 1.5 ( = − = − = − = − − = . (3) P(| X | 3) = P{−3 X 3} = F(3) − F(−3) = ) (0.75) ( 2.25) 2 3 1.5 ) ( 2 3 1.5 ( = − − − − − − =(0.75) −[1− (2.25)] = 0.7734 − (1− 0.9878) = 0.7612 . Example 2.11 设一批零件的长度 X 服从参数为 = 20, = 0.02 的正态分布,规定长 度 X 在 20 0.03 内为合格品,现任取 1 个零件,问它为合格品的概率? Solution 由题意,即求 ) (1.5) ( 1.5) 0.02 20 0.03 20 ) ( 0.02 20 0.03 20 {20 0.03 20 0.03} ( = − − + − − − − P − X + = = 2(1.5) −1 = 0.8664 Example 2.12 公共汽车的高度是按男子与车门定碰头的机会在 0.01 以下来设计的,设 男子身高 X (单位:cm)服从正态分布 (170,6 ) 2 N ,试确定车门的高度。 Solution 设车门的高度为 h (cm).依题意有 P{X h} = 1− P{X h} 0.01 即 P{X h} 0.99 因为 ) 6 1.70 { } ( − = h P X h ,查标准正态分布表得 (2.33) = 0.9901 0.99 ,所以得 2.33 6 1.70 = h − 即 h =184 (cm),故车门的设计高度至少应为 184cm 方可保证男子与车门碰头的概率在 0.01 以 下。 §2.4 二维随机变量及其分布 (Two-dimension Random Variable and Distribution) 一、 二维随机变量及分布函数( Two-dimension random variable and distribution function)