第二章离散型随机变量 二章齋常魔视变 §2.1一维随机变量及分布列 教学目的要求: 使学生掌握一维离散型随机变量的概念及其分布、掌握二项分布(二点分布)、普哇松 分布及它们之间的联系,会应用这些概念、分布求分布列 教材分析: l概括分析:概率论所要考察的是与各种随机现象有关的问题,并通过随机试验从数 量的侧面来研究随机现象的统规律性.为此,就有必要把随机试验的每一个可能的结果与 个实数联系起来随机变量正是为适应这种需要而引进的。随机变量实质上是定义在样 本空间Ω={e}上的一个实值单值函数X(e).从此,对随机事件的研究转变为对随机变量的 硏究,通过随机变量将各个事件联系起来,进而去研究随机试验的全部结果.而且,随机变 量的引入,使我们有可能借助于微积分等数学工具,把研究引向深入.一维离散型随机变量 是随机变量中最简单最基本的一种 2教学重点:一维离散型随机变量的概念及其分布列与分布函数 3教学难点:求一维离散型随机变量的分布列、分布函数 教学过程: 在第一章里,我们研究了随机事件及其概率,细心的读者可能会注意到,在某些例子 中,随机事件和实数之间存在着某种客观的联系.例如,在贝努里概型这一节中,曾经讨 论过“在n重贝努里试验中,事件A出现k次”这一事件的概率,如果令 2=n重贝努里试验中事件A出现的次数 则上述“n重贝努里试验中事件A出现k次”这个事件就可以简单地记作(5=k),从而有 P(5=k)=,p 并且ξ所有可能取到的数值也就是试验中事件A可能出现的次数:0,1,…,n.在另一些例 子中,随机事件与实数之间虽然没有上述那种“自然的”联系,但是我们常常可以人为地 给它们建立起一个对应关系.例如抛掷一枚均匀的硬币,可能出现正面,也可能出现反面, 现在约定 若试验结果出现正面,令η=1,若试验结果出现反面,令=0 这时就有
第二章 离散型随机变量 ·45· 第二章 离散型随机变量 §2.1 —维随机变量及分布列 教学目的要求: 使学生掌握一维离散型随机变量的概念及其分布、掌握二项分布(二点分布)、普哇松 分布及它们之间的联系,会应用这些概念、分布求分布列. 教 材 分 析 : 1.概括分析:概率论所要考察的是与各种随机现象有关的问题,并通过随机试验从数 量的侧面来研究随机现象的统规律性.为此,就有必要把随机试验的每一个可能的结果与 一个实数联系起来.随机变量正是为适应这种需要而引进的。随机变量实质上是定义在样 本空间 ={e}上的一个实值单值函数 X(e).从此,对随机事件的研究转变为对随机变量的 研究,通过随机变量将各个事件联系起来,进而去研究随机试验的全部结果.而且,随机变 量的引入,使我们有可能借助于微积分等数学工具,把研究引向深入.一维离散型随机变量 是随机变量中最简单最基本的一种. 2.教学重点:一维离散型随机变量的概念及其分布列与分布函数. 3.教学难点:求一维离散型随机变量的分布列、分布函数. 教 学 过 程 : 在第一章里,我们研究了随机事件及其概率,细心的读者可能会注意到,在某些例子 中,随机事件和实数之间存在着某种客观的联系.例如,在贝努里概型这一节中,曾经讨 论过“在 n 重贝努里试验中,事件 A 出现 k 次”这一事件的概率,如果令 =n 重贝努里试验中事件 A 出现的次数 则上述“n 重贝努里试验中事件 A 出现 k 次”这个事件就可以简单地记作( =k),从而有 P( =k)= k n p k q n-k . 并且 所有可能取到的数值也就是试验中事件A可能出现的次数:0,1,…,n.在另一些例 子中,随机事件与实数之间虽然没有上述那种“自然的”联系,但是我们常常可以人为地 给它们建立起一个对应关系.例如抛掷一枚均匀的硬币,可能出现正面,也可能出现反面, 现在约定 若试验结果出现正面,令 =1, 若试验结果出现反面,令 =0, 这时就有:
第二章离散型随机变量 试验结果出现正面}=(n=1),{试验结果出现反面}=(n=0) 在上面的讨论中,我们遇到了两个变量:5和n,这两个变量取什么值,在每次试验之 前是不能确定的,因为它们的取值依赖于试验的结果,也就是说它们的取值是随机的.人 们常常称这种变量为随机变量,由前面的两个例子可知,有了随机变量,至少使随机事件 的表达在形式上简洁得多了.但是这个好处毕竟只是形式上的,在以后的讨论中,大家会 看到引入“随机变量”这个概念还有更为深远的意义 在上述第一个例子中,对每一个试验结果,“自然地”对应着一个实数,而在第二个 例子中,这种对应的关系是人为地建立起来的.由此可见,无论是哪一种情形,所谓随机 变量,不过是试验结果(即样本点!)和实数之间的一个对应关系,这与数学分析中熟知的 函数”概念本质上是一回事.只不过在函数概念中,函数f(x)的自变量是实数x,而在 随机变量的概念中,随机变量ξ(O)的自变量是样本点O.因为对每一个试验结果O, 都有实数ξ(ω)与之对应,所以,ξ()的定义域是样本空间,显然值域是实数轴此外, 重要的一点是,虽然在试验之前不能肯定随机变量ξ(o)会取哪一个数值,但是对于任 实数a,我们可以研究{ξ(ω)=a}发生的概率,也就是ξ(O)取值的统计规律.在这 章里我们先研究一类比较特殊的随机变量 、离散型随机变量的概念 定义21定义在样本空间Ω上,取值于实数域R,且只取有限个或可列个(所谓“可 列个”值,是指这个变量所取的值可依某种次序一一列举,排成一列例如自然数全体就是 可列的)值的变量ξ=5(ω),称作是一维(实值)离散型随机变量简称为离散型随机变 [例1]设9={某无线电厂80年一季度出厂的12叶电视机},对O∈Ω,令 5(O)=在一年中出故障的次数 则ξ(ω)是上的一个一维离散型随机变量,ξ(ω)的可能取值范围为(0,1,2,…).在试 验(即取定某一台电视机)之前,并不能断定会取哪一个值,但是 我们可以知道(=0)、(5=1)、…这些事件发生的概率(也就 0次 l次 P(=0)P(5=1) 是在总体中所占的比例).事实上,可以把这些电视机一年中发 生故障次数的分布情况列成下表: Pi p2
第二章 离散型随机变量 ·46· {试验结果出现正面}=( =1), {试验结果出现反面}=( =0). 在上面的讨论中,我们遇到了两个变量: 和 ,这两个变量取什么值,在每次试验之 前是不能确定的,因为它们的取值依赖于试验的结果,也就是说它们的取值是随机的.人 们常常称这种变量为随机变量,由前面的两个例子可知,有了随机变量,至少使随机事件 的表达在形式上简洁得多了.但是这个好处毕竟只是形式上的,在以后的讨论中,大家会 看到引入“随机变量”这个概念还有更为深远的意义. 在上述第一个例子中,对每一个试验结果,“自然地”对应着一个实数,而在第二个 例子中,这种对应的关系是人为地建立起来的.由此可见,无论是哪一种情形,所谓随机 变量,不过是试验结果(即样本点!)和实数之间的一个对应关系,这与数学分析中熟知的 “函数”概念本质上是一回事.只不过在函数概念中,函数 f(x)的自变量是实数 x,而在 随机变量的概念中,随机变量 ( )的自变量是样本点 .因为对每一个试验结果 , 都有实数 ( )与之对应,所以, ( )的定义域是样本空间,显然值域是实数轴.此外, 重要的一点是,虽然在试验之前不能肯定随机变量 ( )会取哪—个数值,但是对于任 一实数 a,我们可以研究{ ( )=a}发生的概率,也就是 ( )取值的统计规律.在这一 章里我们先研究一类比较特殊的随机变量. 一、离散型随机变量的概念: 定义 2.1 定义在样本空间 上,取值于实数域 R,且只取有限个或可列个(所谓“可 列个”值,是指这个变量所取的值可依某种次序一一列举,排成一列例如自然数全体就是 可列的)值的变量 = ( ),称作是—维(实值)离散型随机变量,简称为离散型随机变 量. [例 1] 设 ={某无线电厂 80 年一季度出厂的 12 叶电视机},对 ∈ ,令 ( )=在一年中出故障的次数 则 ( )是上的一个一维离散型随机变量, ( )的可能取值范围为(0,1,2,…).在试 验(即取定某一台电视机)之前,并不能断定会取哪一个值,但是 我们可以知道( =0)、( =1)、…这些事件发生的概率(也就 是在总体中所占的比例).事实上,可以把这些电视机一年中发 生故障次数的分布情况列成下表: = = ( 0) ( 1) 0 1 P P 次 次 1 2 1 2 p p a a
第二章离散型随机变量 这对研究和改进电视机的质量当然是很有用的材料 随机变量的分布列 1.分布列的定义 般来说,如果离散型随机变量ξ的可能取值为a1(i=1,2,…), 也就有了相应的取值a的概率P(ξ=a;)=p,人们常常习惯地把它们写 成这种表格的形式 并且称(1)或(1)为随机变量(O)的分布列,也称为分布律,有时就 简称为分布 [例2]在n=5的贝努里试验中,设事件A在一次试验中出现的概率为P,令 5=5次试验中事件A出现的次数 5012 4 则由(1)知:P(5=)=,|pq I q 5pq' 10p'q 10p q 5p'q ≤k≤5 于是,5的分布列为 2.分布列的性质 由概率的性质可知,任一离散型随机变量的分布列{P}都有下述两个性质 (1)P≥0,i=1,2, (2)∑P2=1 反过来,任意一个具有以上两个性质的数列的{P},都有资格作为一个随机变量的分布列 分布列不仅明确地给出了(5=a)的概率,而且对于任意的实数a<b,事件(a≤5≤b)发生 的概率均可由分布列算出,因为 (a≤5≤b)=U(5=a) 于是由概率的可列可加性有: P(a≤5≤b)=∑P(5=a)=∑P 其中lab={i:a≤a;≤b},即使对R中更复杂的集合B,也有 P(∈B)=∑P5=a)=∑P i∈(B) 其中I(B)={i:a∈B}.由此可知,ξ()取各种值的概率都可由它的分布列通过计算而
第二章 离散型随机变量 ·47· 这对研究和改进电视机的质量当然是很有用的材料. 二、随机变量的分布列: 1.分布列的定义: 一般来说,如果离散型随机变量 的可能取值为 ai(i=1,2,…), 也就有了相应的取值 ai 的概率 P( =ai)=pi,人们常常习惯地把它们写 成这种表格的形式: 并且称(1)或(1’)为随机变量 ( )的分布列,也称为分布律,有时就 简称为分布. [例 2] 在 n=5 的贝努里试验中,设事件 A 在一次试验中出现的概率为 P,令 =5 次试验中事件 A 出现的次数 则由(1)知: P( =k)= k 5 p k q 5-k , 0≤k≤5 于是, 的分布列为: 2.分布列的性质: 由概率的性质可知,任一离散型随机变量的分布列{Pi}都有下述两个性质: (1)Pi≥0,i=1,2,…; (2) i=1 i p =1. 反过来,任意一个具有以上两个性质的数列的{Pi},都有资格作为一个随机变量的分布列. 分布列不仅明确地给出了( =ai)的概率,而且对于任意的实数 a<b,事件(a≤ ≤b)发生 的概率均可由分布列算出,因为 (a≤ ≤b)= a a b i i a ( = ) 于是由概率的可列可加性有: P(a≤ ≤b)= = a b i I P ai , ( ) = a b i I pi , 其中 a b I , ={i:a≤ai≤b},即使对 R 中更复杂的集合 B,也有 P( ∈B)= = ( ) ( ) i I B P ai = iI (B) pi 其中 I(B)={i:ai∈B}.由此可知, ( )取各种值的概率都可由它的分布列通过计算而 a 1 a 2 … p i p 1 p 2 … 0 1 2 3 4 5 pi q 5 5pq4 10p2 q 3 10p3 q 2 5p4 q p 5
第二章离散型随机变量 得到,这件事实常常说成是:分布列全面地描述了高散型随机变量的统计规律 三、几种特殊分布 项分布 到本节开始时的n重贝努里试验的例子,已知有 p=P(E=k 0≤k≤n 容易验证: 1)p>0,0≤k≤n; Pk k=0 k 在这个例子中,大家可以注意到 pq,0≤k≤n恰好是二项式(p+0)的展开式中的第k+1项,由此人们给 分布列P4=12q(0≤k≤n)起了一个名字称它为二项分布并且常常记 k pq=b(k; n,p) 一个随机变量的分布列如果是二项分布,也称该随机变量服从二项分布.所以上述 例子中的是服从二项分布b(k;n,p)的随机变量 在二项分布中,如果n=1,那么k只能取值0或1,这时显然有 也可以表示成右表 这个分布列称为0-1分布或二点分布,它是二项分布的特例,本节 开始时讨论过的抛掷均匀硬币的例子中,随机变量的n分布列为 它就是0-1分布当p=1/2时的特例 在第一章里曾经提到,必然事件Ω可以作为随机事件的极端情形来看待,相应地,在 2上有定义的恒等于常数a的变量ξ(虽然它的取值已经失去随机性),也可以看作为随 机变量的极端形这时,随机变量ξ的分布列为 P(2=a)=1 人们称这个分布为单点分布或退化分布
第二章 离散型随机变量 ·48· 得到,这件事实常常说成是:分布列全面地描述了离散型随机变量的统计规律. 三、几种特殊分布: 1.二项分布: 回到本节开始时的 n 重贝努里试验的例子,已知有 pk=P( =k)= k n p k q n-k , 0≤k≤n 容易验证: (1) pk>0, 0≤k≤n; (2) = n k pk 0 == − n k k n k p q k n 0 =(p+q)n =1. 在这个例子中,大家可以注意到 k n k k p q k n p − = , 0≤k≤n 恰好是二项式(p+q)n 的展开式中的第 k+1 项,由此人们给 分布列 k n k k p q k n p − = (0≤k≤n)起了一个名字,称它为二项分布,并且常常记 p q b(k;n, p) k n k n k = − 一个随机变量的分布列如果是二项分布,也称该随机变量服从二项分布.所以上述 例子中的 是服从二项分布 b(k;n,p)的随机变量. 在二项分布中,如果 n=1,那么 k 只能取值 0或 1,这时显然有 p0=q, p1=p 也可以表示成右表: 这个分布列称为 0—1 分布或二点分布,它是二项分布的特例,本节 开始时讨论过的抛掷均匀硬币的例子中,随机变量的 分布列为: 它就是 0—1 分布当 p=1/2 时的特例. 在第一章里曾经提到,必然事件 可以作为随机事件的极端情形来看待,相应地,在 上有定义的恒等于常数 a 的变量 (虽然它的取值已经失去随机性),也可以看作为随 机变量的极端形.这时,随机变量 的分布列为 P( =a)=1 人们称这个分布为单点分布或退化分布. 0 1 pi q p 0 1 pi 1/2 1/2
第二章离散型随机变量 2.几何分布 以上是一些只取有限个值的随机变量的例子,下面进一步讨论取可列个值的随机变 量的例子 [例3]在一个贝努里试验中,每次试验成功的概率为p,失败的概率为q 1-p(0p0是某个常数,易于验证有 (1)P(5+).k=0,1,2,…;(2)∑P5=k)=∑e= 这个分布称作是参数为λ的普哇松( Poisson)分布,并常常记作P(k;2) [例4]在一个放射性物质的试验中,共观察了N=2608次,每次观察的时间间隔为 7.5秒,并记录到达指定区域内的质点数,若观察到有k个质点的次数为N,则N/N表示 有k个质点的频率,而P(k;3.870)表示参数A=3.870,5=k的概率,下表给出了两者的 对照值
第二章 离散型随机变量 ·49· 2.几何分布: 以上是一些只取有限个值的随机变量的例子,下面进一步讨论取可列个值的随机变 量的例子. [例 3] 在一个贝努里试验中,每次试验成功的概率为 p,失败的概率为 q= 1-p(00 是某个常数,易于验证有 (1) P( =k)>0,k=0,1,2, …; (2) 1 ! ( ) 0 0 = = = = − = k k k e k P k . 这个分布称作是参数为 的普哇松(Poisson)分布,并常常记作 P(k; ). [例 4] 在一个放射性物质的试验中,共观察了 N=2608 次,每次观察的时间间隔为 7.5 秒,并记录到达指定区域内的质点数,若观察到有 k 个质点的次数为 Nk,则 Nk/N 表示 有 k 个质点的频率,而 P(k;3.870)表示参数 =3.870, =k 的概率,下表给出了两者的 对照值
第二章离散型随机变量 k|N/N|P(k;3.870) 从表中可以看到,理论值(概率)和观察值(频率)两 00.02190.0209者都符合得相当好的事实上,在一些相当直观和合乎 10.07760.0807实际情况的前提下,人们已经证明这个随机变量的分布 20.14690.1562列是一个普哇松分布,我们在稍后将给出一个比较直观 30.20130.2015 的论证.由于许多实际问题中的随机变量都可以用普哇 松分布来描述,从而使得普哇松分布对于概率论的应用 5|0.15640.1509 来说,有着很重要的作用;而概率论理论的研究又表明 60.10470.0973 普哇松分布在理论上也有其特殊重要的地位,这里我们 70.05330.0538 只就二项分布与普哇松分布之间的关,人们已经证明这 80.01720.0260 个随机变量的分布列呈一个普哇松分布,我们在稍后将 0.01040.0112 给出一个比较直的论证.由于许多实际问题中的随机变 K≥100.00610.0066 量都可以用普哇松分布描述,从而使得井哇松分布对子 概率论的应用来说,有着很重要作用;而概率论理论的 研究又表明井哇松分布在理论上也有其殊重要的地位,这里我们只就二项分布与普哇松 分布之间的关系证明下述定理 四、二项分布的普哇松逼近: 定理2.1(普哇松定理)在n重贝努里试验中,事件A在一次试验中出现的概率为 pa(与试验总数n有关),如果当n→∞时,npn→λ(λ>0为常数),则有 b(k, n, p 2-k=0,1, 证明记npn=n,则 b (k; n, pn) (1-p)=n(n-1)…(n-k+1)(n kI k!( n 对于任一固定的k,显然有 m2= k-1 还有 从而 1b(k;,n,p) k 对任意的k(k=0,1,2,…)成立,定理得证
第二章 离散型随机变量 ·50· 从表中可以看到,理论值(概率)和观察值(频率)两 者都符合得相当好的.事实上,在一些相当直观和合乎 实际情况的前提下,人们已经证明这个随机变量的分布 列是一个普哇松分布,我们在稍后将给出一个比较直观 的论证.由于许多实际问题中的随机变量都可以用普哇 松分布来描述,从而使得普哇松分布对于概率论的应用 来说,有着很重要的作用;而概率论理论的研究又表明 普哇松分布在理论上也有其特殊重要的地位,这里我们 只就二项分布与普哇松分布之间的关,人们已经证明这 个随机变量的分布列呈一个普哇松分布,我们在稍后将 给出一个比较直的论证.由于许多实际问题中的随机变 量都可以用普哇松分布描述,从而使得井哇松分布对子 概率论的应用来说,有着很重要作用;而概率论理论的 研究又表明井哇松分布在理论上也有其殊重要的地位,这里我们只就二项分布与普哇松 分布之间的关系证明下述定理. 四、二项分布的普哇松逼近: 定理 2.1(普哇松定理)在 n 重贝努里试验中,事件 A 在一次试验中出现的概率为 pn(与试验总数 n 有关),如果当 n→ 时,npn→ ( >0 为常数),则有 − → = e k b k n p k n ! lim ( ; , ) , k=0,1,2, … 证明 记 npn= n,则 b(k;n,pn)= k n p k n (1-pn) n-k = n k n k n k n n n n n k − − − − + 1 ! ( 1)( 1) = n k n k n n n k k n n − − − − − − 1 1 1 2 1 1 1 ! 对于任一固定的 k,显然有 k k n n = → lim , 1 lim 1 lim 1 − − → − → = = − − e n n n n n k n n n k n n n n 还有 1 1 1 1 lim 1 = − − − → n k n n 从而 − → = e k b k n p k n ! lim ( ; , ) 对任意的 k(k=0,1,2,…)成立,定理得证. k Nk/N P(k;3.870) 0 0.0219 0.0209 1 0.0778 0.0807 2 0.1469 0.1562 3 0.2013 0.2015 4 0.2040 0.1949 5 0.1564 0.1509 6 0.1047 0.0973 7 0.0533 0.0538 8 0.0172 0.0260 9 0.0104 0.0112 K≥10 0.0061 0.0066
第二章离散型随机变量 这个定理有什么用呢?首先,它可以用来作近似计算.在二项分布中,要计算 b(k;n,p)=|p(1-p)°,当和都比较大时,计算量是令人烦恼的,如果这时m不太大(即 p较小),那么由普哇松定理就有 b(k;n,p)≈e- 其中λ=np,而要计算 2 h,有专用的普哇松分布表可查(见本书附录),这就方便多了 对于np=-1(n=10,20,40,100)的四种情形,表给出了直接按二项分布计算以及按上式 利用普哇松分布计算所得 的值 按b(k;n,p)=,lp(1-p)计算按e-计算 由表2.2可以看到,两 k 者的结果是很接近的,而且/k 当n越大时,近似的程度越 n=10n=20n=40n=100 1=np=1 好.下面是利用式作近似计 p=0.10p=0.05p=0.025p=0.01 算的一个具体例子 00.3490.3580.3630.386 0.368 [例5]己知某种疾病 0.3850.3770.3720.370 的发病率为1/1000,某单 0.1940.1890.186|0.185 0.184 位共有500间该单位[30.057[00600:0600.061 0.061 患有这种疾病的人数超过 0.0110.0130.0140.015 0.015 的概率为多大? 0.0040.0030.0050.003 0.004 [解]设该单位患有这一种疾病的人数为ξ,则 P(5)5)=∑P(5=k)=∑b(k500 1000 其中5009这时如果直接计算P(5>,计算量很 大.由于n很大,p很小,这时np=5000×0.001=5不很大,可以利用上述普哇松定理.取 5k查普哇松分布表可得 A=np=5,由公式就有P(2>5)=1-P(5≤5)≈1 k 0.616 于是P(5>5)≈1-0.616=0.384 在上述例子中,由于np不太大(即p较小),我们利用了普哇松定理作近似计算,比较
第二章 离散型随机变量 ·51· 这个定理有什么用呢?首先,它可以用来作近似计算.在二项分布中,要计算 b(k;n,p)= k n p k (1-p)n-k ,当和都比较大时,计算量是令人烦恼的,如果这时np不太大(即 p 较小),那么由普哇松定理就有 b(k;n,p)≈ − e k k ! 其中 =np,而要计算 − e k k ! ,有专用的普哇松分布表可查(见本书附录),这就方便多了. 对于 np=1(n=10,20,40,100)的四种情形,表给出了直接按二项分布计算以及按上式 利用普哇松分布计算所得 的值. 由表 2.2 可以看到,两 者的结果是很接近的,而且 当 n 越大时,近似的程度越 好.下面是利用式作近似计 算的一个具体例子. [例 5] 己知某种疾病 的发病率为 1/1000,某单 位共有 5000 人,问该单位 患有这种疾病的人数超过 5 的概率为多大? [解] 设该单位患有这一种疾病的人数为 ,则 P( >5)= = = = = 5000 6 5000 6 ) 1000 1 ( ) ( ;5000, k k P k b k 其中 b(k;5000,0.001)= k 5000 0.001k 0.9995000-k ,这时如果直接计算 P( >5),计算量很 大.由于 n 很大,p 很小,这时 np=5000×0.001=5 不很大,可以利用上述普哇松定理.取 =np=5,由公式就有 P( >5)=1-P( ≤5)≈1- 查普哇松分布表可得 = − 5 0 5 ! 5 k k e k 0.616 于是 P( >5)≈1-0.616=0.384 在上述例子中,由于 np 不太大(即 p 较小),我们利用了普哇松定理作近似计算,比较 k 按 b(k;n,p)= k n p k (1-p)n-k 计算 按 − e k k ! 计算 n=10 p=0.10 n=20 p=0.05 n=40 p=0.025 n=100 p=0.01 =np=1 0 0.349 0.358 0.363 0.386 0.368 1 0.385 0.377 0.372 0.370 0.368 2 0.194 0.189 0.186 0.185 0.184 3 0.057 0.060 0.060 0.061 0.061 4 0.011 0.013 0.014 0.015 0.015 >4 0.004 0.003 0.005 0.003 0.004
第二章离散型随机变量 方便地解决了问题.细心的读者也许要问,如果np也很大时怎么办呢?我们将在第四章 中讨论这个问题.由普哇松定理,还可以说明前述的电话呼唤次数,来到公共汽车站的乘 客人数等变量为什么可以用普哇松分布来描述作为一个例子,我们现在来解释在 群母鸡中,每只母鸡的年产蛋量(是一个随机变量)可以用普哇松分布来描述.可以设想, 把一年时间分成n等分,取n充分大,每一个等分的间隔A1=1/n(年)就很小(比方说小于 天 1(年) 于是在时间间隔4t内,母鸡或者下一个蛋,或者一个也不下(因为时间间隔很小,不会下 两个或两个以上的蛋).如果在一个时间间隔内下一个蛋的概率是p,并且在各个时间间 隔内是否下蛋假定是相互独立的,这时就构成了一个贝努里概型,于是在一年内下k个蛋 的概率就是b(k;n,p),再利用上述的普哇松定理可得 P(2=k) 2,k=0,1,2, (其中λ=mp),由此可知,母鸡的年产蛋量ξ的确可以用普哇松分布来描述.类似的问题 在生物学中可以说是比比皆是,这充分说明了概率论与数理统计在生物学中是有广泛的 应用的如同“母鸡下蛋”的论证,可以说明一家商店(每月)出售某种(非紧张)商品的 件数也是可以用普哇松分布来描述的,知道了这一点又有什么用呢?不妨来研究一下下 面的问题 家商店采用科学管理.为此,在每一个月的月底要制订出下一个月的商品进货计 划.为了不使商店的流动资金积压,月底的进货不宜过多,但是为了保证人民的生活需要 和完成每月的营业额,进货又不应该太少!这样的矛盾怎样才能合理的解决呢?那就请 看下面的例子 [例6]由该商店过去的销售纪录知道,某种商品每月的销售数可以用参数A=10 的普哇松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种 商品多少件? [解]设该有店每月销售某种商品ξ件,月底的进货为a件,则当(ξ≤a)时就不会脱 销,因而按题意要求为 P(5≤a)≥0.95 因为已知ξ服从=10的普哇松分布,上式也就是 10 ≥0.95
第二章 离散型随机变量 ·52· 方便地解决了问题.细心的读者也许要问,如果 np 也很大时怎么办呢?我们将在第四章 中讨论这个问题.由普哇松定理,还可以说明前述的电话呼唤次数,来到公共汽车站的乘 客人数等变量 为什么可以用普哇松分布来描述.作为一个例子,我们现在来解释在一 群母鸡中,每只母鸡的年产蛋量(是一个随机变量)可以用普哇松分布来描述.可以设想, 把一年时间分成 n 等分,取 n 充分大,每一个等分的间隔⊿T=1/n(年)就很小(比方说小于 一天): 于是在时间间隔⊿t 内,母鸡或者下一个蛋,或者一个也不下(因为时间间隔很小,不会下 两个或两个以上的蛋).如果在一个时间间隔内下一个蛋的概率是 p,并且在各个时间间 隔内是否下蛋假定是相互独立的,这时就构成了一个贝努里概型,于是在一年内下k个蛋 的概率就是 b(k;n,p),再利用上述的普哇松定理可得 P( =k)≈ − e k k ! ,k=0,1,2, … (其中 =np),由此可知,母鸡的年产蛋量 的确可以用普哇松分布来描述.类似的问题 在生物学中可以说是比比皆是,这充分说明了概率论与数理统计在生物学中是有广泛的 应用的.如同“母鸡下蛋”的论证,可以说明一家商店(每月)出售某种(非紧张)商品的 件数也是可以用普哇松分布来描述的,知道了这一点又有什么用呢?不妨来研究一下下 面的问题. 一家商店采用科学管理.为此,在每一个月的月底要制订出下一个月的商品进货计 划.为了不使商店的流动资金积压,月底的进货不宜过多,但是为了保证人民的生活需要 和完成每月的营业额,进货又不应该太少!这样的矛盾怎样才能合理的解决呢?那就请 看下面的例子. [例 6] 由该商店过去的销售纪录知道,某种商品每月的销售数可以用参数 =10 的普哇松分布来描述,为了以 95%以上的把握保证不脱销,问商店在月底至少应进某种 商品多少件? [解] 设该有店每月销售某种商品 件,月底的进货为 a 件,则当( ≤a)时就不会脱 销,因而按题意要求为 P( ≤a)≥0.95 因为已知 服从 =10 的普哇松分布,上式也就是 = − a k k e 0 k 10 ! 10 ≥0.95
第二章离散型随机变量 由附录的普哇松分布表知 S10c-0≈0.91660.9 0.9513>0.95 于是,这家商店只要在月底进货某种商品15件(假定上个月没有存货),就可以95%以上 的把握保证这种商品在下个月内不会脱销. §22多维随机变量、联合分布列和边际分布列 教学目的要求 使学生在掌握一维离散型随机变量的基础上,通过学习掌握n维随机变量及其联合分 布与边际分布的求法 教材分析: l概括分析:本节是在一维随机变量基础上,进一步讨论多维随机变量,主要是以 二维随机变量的讨论为重点,讨论了基本概念性质,边际分布,联合分布等问题及应用 2教学重点:二维离散型随机变量的概念、性质、联合分布与边际分布 3教学难点:二维离散型随机变量的分布及其应用 教学过程: 在上一节中我们讨论了一维随机变量,已经知道所谓一维随机变量无非是随机试验 的结果和一维实数之间的某个对应关系.但在许多实际问题中,对于每一个试验结果,往 往同时对应有一个以上的实数值.如在例2.1中,对每一台出厂的电视机来说,除了“ 年中发生故障次数”以外,还可以考察“一年中实际工作的小时数”、“一年中损坏的 元件数”等数据.一般地说,每个试验结果可以有n个数值与之对应,这时就称这种对应 关系是一个n维随机变量,也称为n维随机向量.如同§2.1中所给出的一维离散型随机 变量的定义,现在给出n维离散型随机变量的定义 n维随机向量 定义22设51,52,…,5是样本空间Ω上的n个离散型随机变量,则称n维向量(5 52,…,5m,)是Ω上的一个n维离散型随机变量或n维随机向量 如同数学分析中大家所熟悉的那样,从一维到多维会增添许多新的问题,为了叙述 和学习的方便起见,下面着重讨论二维的离散型随机变量 联合分布列 定义 设(,m)是一个二维离散型随机变量,它们一切可能取的值为(a,b),i,j=1,2
第二章 离散型随机变量 ·53· 由附录的普哇松分布表知 = − 14 0 10 ! 10 k k e k ≈ 0.91660.95 于是,这家商店只要在月底进货某种商品 15 件(假定上个月没有存货),就可以 95%以上 的把握保证这种商品在下个月内不会脱销. §2.2 多维随机变量、联合分布列和边际分布列 教学目的要求: 使学生在掌握一维离散型随机变量的基础上,通过学习掌握 n 维随机变量及其联合分 布与边际分布的求法. 教 材 分 析 : 1.概括分析:本节是在一维随机变量基础上,进一步讨论多维随机变量,主要是以 二维随机变量的讨论为重点,讨论了基本概念性质,边际分布,联合分布等问题及应用. 2.教学重点:二维离散型随机变量的概念、性质、联合分布与边际分布. 3.教学难点:二维离散型随机变量的分布及其应用. 教 学 过 程 : 在上一节中我们讨论了一维随机变量,已经知道所谓一维随机变量无非是随机试验 的结果和一维实数之间的某个对应关系.但在许多实际问题中,对于每一个试验结果,往 往同时对应有一个以上的实数值.如在例 2.1 中,对每一台出厂的电视机来说,除了“一 年中发生故障次数”以外,还可以考察“一年中实际工作的小时数”、“一年中损坏的 元件数”等数据.一般地说,每个试验结果可以有 n 个数值与之对应,这时就称这种对应 关系是一个 n 维随机变量,也称为 n 维随机向量.如同§2.1 中所给出的一维离散型随机 变量的定义,现在给出 n 维离散型随机变量的定义. 一、n 维随机向量: 定义2.2设 1, 2,…, n是样本空间 上的n个离散型随机变量,则称n维向量( 1, 2,…, n,)是 上的一个 n 维离散型随机变量或 n 维随机向量. 如同数学分析中大家所熟悉的那样,从一维到多维会增添许多新的问题,为了叙述 和学习的方便起见,下面着重讨论二维的离散型随机变量. 二、联合分布列: 1.定义: 设( , )是一个二维离散型随机变量,它们一切可能取的值为(ai,bj),i,j=1,2,…
第二章离散型随机变量 pP(5=a,n=b),i,j=1,2, 称(p;i,j=1,2,…)是二维离散型随机变量(5,n)的联合分布列 性质 如同一维时的论述,容易证明二维联合分布列具有下面三个性质 (1)非负性:p;≥0,i,j=1,2 (2)规范性:∑∑P=1 (3)边际规范性:P(=a)=∑P=.且P(=b)=∑P 其中(1)、(2)是显然的,现在验证(3).由联合分布列的定义及全概率公式有 P(5=a )=P((5=a)n[Uo=b,)11=PUIs=a, )n(n=b, )] =∑P(5=a)(m=b)=∑P 同理可得 P(n+b)=∑P 如果记∑P=·,∑P=甲,即可得到() 边际分布列 与一维的情形相似,人们也常常习惯于把二维离散型随机变量的联合分布列写成下 表的形式 由右表可以看到在联合分布列(p1)的右方多了 7b1b2…|p 列,它是把每一行中的p对j相加而得到的p.,由(2.17) 知道,它就是的分布列;相应地在联合分布列(p1)的 p21D22 下面也增加了一行,它是把每一列中的p对i相加而p 得到的p.,恰好是n的分布列.在这样的表示方式中 5和n的分布列的位置就在(5,)的联合分布列的边上,因而人们常常形象地称和n 的分布列是(5,n)联合分布列的边际分布
第二章 离散型随机变量 ·54· 令 pij=P( =ai, =bj),i,j=1,2, … 称(pij;i,j=1,2,…)是二维离散型随机变量( , )的联合分布列. 2.性质: 如同一维时的论述,容易证明二维联合分布列具有下面三个性质: (1) 非负性:pij≥0,i,j=1,2,…; (2) 规范性: = i 1 j=1 pij =1; (3) 边际规范性:P( =ai)= j=1 pij =pi·且 P( =bj)= i=1 pij =p·j 其中(1)、(2)是显然的,现在验证(3).由联合分布列的定义及全概率公式有 P( =ai)=P{( =ai)∩[ = = 1 ( ) j bj ]}=P{ [( ) ( )] 1 = = = j ai bj } = = = = 1 {( ) ( )} j P ai bj = j=1 pij 同理可得: P( =bj)= i=1 pij 如果记 j=1 pij =pi· , j=1 pij =p·j,即可得到(3). 三、边际分布列: 与一维的情形相似,人们也常常习惯于把二维离散型随机变量的联合分布列写成下 表的形式. 由右表可以看到在联合分布列(pij)的右方多了一 列,它是把每一行中的pij对j相加而得到的pi.,由(2.17) 知道,它就是 的分布列;相应地在联合分布列(pij)的 下面,也增加了一行,它是把每一列中的 pij 对 i 相加而 得到的 p.j,恰好是 的分布列.在这样的表示方式中, 和 的分布列的位置就在( , )的联合分布列的边上,因而人们常常形象地称 和 的分布列是( , )联合分布列的边际分布. b1 b2 … pi· a1 a2 p11 p12 … p21 p22 … p1· p2· p·j p·1 p·2 …