译者序 概率论是研究自然界和人类社会中随机现象数量规律的数学分支.概率论的理 论和方法与数学的其他分支、自然科学、工程、人文及社会科学各领域相互交叉渗 透,已经成为这些学科中的基本方法.概率论(或概率统计)和高等数学一样已经成 为我国高等院校各专业普遍设立的一门基础课. 目前,这方面的教材已经很多,但这本由Sheldon M.Ross编写的《概率论基础 教程》确实是一本很有特点的好教材.如在介绍概率的概念时,作者还用流畅的笔 调介绍了这些概念的发展历史,从独立重复试验事件发生频率的极限到近代概率论 的公理,同时引用大量例子介绍如何利用概率的公理进行概率的计算.这种讲法,使 得即使是只具有初等微积分知识的读者,也会获益匪浅,对概率的概念有一个正确 的和深刻的认识.在介绍数学期望的概念时,作者用大量的例子,强调应用期望的 性质,特别是利用可加性进行期望计算,从而使读者加深了对期望的认识,也提高了 运算技巧.从本书第1章到第8章,讲授的主题着重于概率论最基本的概念,如概 率、条件概率、期望、大数定律和中心极限定理等.本书附有大量的有意义的练习, 分为习题、理论习题和自检习题三大类,其中自检习题部分还给出全部解答,以供 参考.从以上分析看出,本书完全实现了作者在他的前言中的目标——试图成为 概率论的入门书. 本书第1版出版于1976年,1981年在国内曾出过第1版的中文翻译版.此书经 过作者历次修改,内容大大扩充.这个翻译本是根据2006年原文第7版翻译.我们 认为这个版本是作者积累了几十年教学经验基础上的定型版,是一本优秀的教材. 此外作者的另一本著作《随机过程》已经成为国内概率统计界推崇的教材.我们相 信本教材也一定会受到国内各界的欢迎. 由于译者的学识和中英文水平有限,译文难免会有不妥之处,欢迎广大读者批 评指正. 译者谨识 2006年5月
前言 法国著名数学家和天文学家拉普拉斯侯爵(人称“法国的牛顿”)曾经说过:“我 们发现概率论其实就是将常识问题归结为计算.它使我们能够精确地评价凭某种 直观感受到的、往往又不能解释清楚的见解··值得注意的是,概率论这门起源于 机会游戏的科学,早就应该成为人类知识中最重要的组成部分···生活中那些最重 要的问题绝大部分恰恰是概率论问题.”尽管许多人认为,这位对概率论的发展作 出过重大贡献的著名侯爵说话有点过头,然而今日,概率论已经成为几乎所有的科 学工作者、工程师、医务人员、法律工作者以及企业家们手中的基本工具,这是一 个不争的事实.事实上,现代人们不再问“是这样么?”而是问“这件事发生的概率 有多大?” 本书试图成为概率论的入门书.读者对象是数学、统计、工程和其他专业(包 括计算机科学、生物学、社会科学和管理科学)的学生.他们的先修知识只是初等 微积分.本书试图介绍概率论的数学理论,同时通过大量例子说明这门学科的广泛 的应用. 第1章介绍了组合分析的基本原理,它是计算概率的最有效的工具. 第2章介绍了概率论的公理体系,并且指出如何应用这些公理进行概率计算. 第3章讨论概率论中极为重要的概念,即事件的条件概率和事件间的独立性. 通过一系列例子说明当部分信息可利用时,条件概率就会发挥它的作用;即使在没 有这部分信息时,条件概率也可以使概率的计算变得容易、可行.利用“条件”计算 概率这一极为重要的技巧还将出现在第7章,在那里我们用它来计算期望. 在第4、5、6章,我们引进随机变量的概念,第4章讨论离散随机变量,第5章 讨论连续随机变量,而将随机变量的联合分布放在第6章.在第4章和第5章中讨 论了随机变量的期望和方差,并且对许多常见的随机变量,求出了相应的期望和方 差. 第7章讨论了期望值和它的一些重要的性质.书中引入了许多例子,解释如何 利用随机变量和的期望等于随机变量期望的和这一重要规律来计算随机变量的期 望,本章中还有几节介绍条件期望(包括它在预测方面的应用)和矩母函数等.最后 一节介绍了多元正态分布,同时给出了来自正态总体的样本均值和样本方差的联合 分布的简单证明. 在第8章我们介绍了概率论的主要的理论结果.特别地,我们证明了强大数定 律和中心极限定理.关于强大数定律的证明,我们假定随机变量具有有限的四阶矩
2前言 在这种假定之下,证明十分简单.在中心极限定理的证明中,我们假定了莱维(Lévy) 的连续性定理成立.在本章中,我们还介绍了若干概率不等式,如马尔可夫不等式、 切比雪夫不等式和切尔诺夫界.在最后一节,我们给出用随机变量的相应概率去近 似独立伯努利随机变量和的相关概率的误差界. 第9章介绍了一些附加课题,如马尔可夫链、泊松过程以及信息编码理论初步. 第10章介绍了统计模拟. 第7版将教材内容进一步扩充与调整,加入了很多新的习题和例子.其中第3 章例3h进一步展示了e的无处不在;第3章例5f讨论了信息的序贯修正;第4章 例7d利用泊松近似的方法,证明了n次抛掷硬币试验中,正面朝上的最大游程的长 度以0.86的概率落入log2(n)±2的区域内.同时引入了关于优惠收集的若干 新的例子(第3章例4i,第7章例3d和例3f等)和多项分布的例子(第6章例4c). 本版还加入了许多新内容.例如增加了第2章命题4.4的附注.在关于事件和的概 率等式中,若取前面若干项可依次得到事件和的概率的上下界.7.3节是新编入的 一节,它讨论一串事件发生次数的矩的计算方法.作为例子,导出了二项、超几何、 配对问题以及负几何随机变量的矩的公式.关于二元正态分布,也加入了若干新材 料,在第6章例5c,导出了它的条件分布和边缘分布.第7章例5f中计算了两个变 量的相关系数,并利用相关系数分析了第7章例8b中的贝叶斯统计的例子. 与前几版一样,每章后面附了三组练习题,它们分别命名为习题、理论习题和 自检习题.在附录B中提供了自检习题的全部解答,以供学生检验他们的理解能力. 本书前几版曾带有磁盘,包含有概率模型部分的材料,现在这些内容可从本书 配套网站下载:http:/www.prenhall.com/Ross.1 学生利用网站可在以下6个方面快速计算和模拟: ·有3个模块可进行二项、泊松和正态随机变量的计算. ·另一个模块演示中心极限定理,考虑取0,1,2,3,4共5个值的随机变量,容许使 用者输入相应的分布和样本量n.模块将显示n个独立随机变量和的分布列, 当n增加时,能“看”到其分布列收敛到正态分布的密度函数的形状. ·其他2个模块演示强大数定律,使用者可以输入5个可能值的概率以及样本量 n.模块利用随机数模拟具有指定分布的一组样本.模块将各个结果出现的次 数用图形显示出来,同时给出样本均值.两个模块在显示试验结果上稍有差别. 我们感谢下列对本书各个版本给出十分有价值的意见的人们: Robert Bauer(伊利诺伊大学厄巴纳-尚佩恩分校),Arthur Benjamin(Harvey Mudd 学院),Geoffrey Berresford(长岛大学),Baidurya Bhattacharya(特拉华大学), Shahar Boneh(丹佛城市州立学院),Nicolas Christou(加州大学洛杉矶分校),Scott Emerson(华盛顿大学),Larry Harris(肯塔基大学),Julia L.Higle(亚利桑那大学),Mark 1.本书配套材料也可从图灵网站www.turingbook.com下载
前言3 Huber(杜克大学),Hamid Jafarkhani(加州大学厄文分校),Chuanshu Ji(北卡罗来纳 大学Chapel Hill分校),Joe Naus(罗格斯大学),Nhu Nguyen(新墨西哥州立大学), Ellen O'Brien(乔治·梅森大学),Jim Propp(威斯康星大学),Malcolm Sherman(纽约 州立大学奥尔巴尼分校),Murad Taqqu(波士顿大学),Eli Upfal(布朗大学). 我们同时感谢下列人员对于这一版的修改提出的有益的建议和意见: Anastasia Ivanova(北卡罗来纳大学),Richard Bass(康涅狄格大学),Ed Wheeler (田纳西大学),Jean Cadet((纽约州立大学石溪分校),Jim Propp(威斯康星大学),Mike Hardy(麻省理工学院),Anant Godbole(密歌根科技大学),Zakkhula Govindarajulu(肯 塔基大学),Richard Groeneveld(爱荷华州立大学),Bernard Harris(威斯康星大学), Stephen Herschkorn(罗格斯大学),Robert Keener(密歌根大学),Thomas Liggett(加 州大学洛杉矶分校),Bill MeCormick(佐治亚大学),Kathryn Prewitt(亚利桑那州立 大学) 特别要感谢Hossein Hamedani(Marquette大学)和Ben Perles对手稿的仔细 校社 我们也要感谢本书的早期版本的校阅者: Thomas R.Fischer(德州农机大学),Jay DeVore(圣路易斯-奥比斯波的加州技术 大学),Robb J.Muirhead(密歇根大学),David Heath(康奈尔大学),Myra Samuels(普 度大学),I.R Savage(耶鲁大学),R.Miler((斯坦福大学),K.B Athreya(爱荷华州立大 学),Phillip Beckwith(密歇根科技大学),Howard Bird(圣克劳德州立大学),Steven Chiappari(圣克拉拉大学),James Clay(亚利桑那大学图森分校),Francis Conlan(圣 克拉拉大学),Fred Leysieffer(佛罗里达州立大学),Ian McKeague(佛罗里达州立大 学),Helmut Mayer(佐治亚大学),N.U.Prabhu(康奈尔大学),Art Schwartz(密歌根大 学安阿伯分校),Therese Shelton(西南大学),Allen Webster(布拉德利大学) S.R. smross@usc.edu
目 录 第1章组合分析 .1 4.4随机变量函数的期望.10 1.1引言 45方差.4. .112 1.2 计数基本法则 .1 4.6伯努利随机变量和二项随机 13非列 443 变骨4++*44.114 1.4组合 .4 4.6.1二项随机变量的性质.117 15名项式系数· 4.6.2计算二项分布函数.119 *1.6方程的整数解个数 4.7泊松随机变量 121 小结. 4.11 4.8其他离散型分布.。 130 习题 12 4.8.1 几何随机变量 130 理论习题 14 4.8.2负二项分布 131 自检习题 17 4.8.3超儿何随机变量 134 第2章概率论公理化 10 4.8.4c(ZiDf)分布 136 2.1 简介 4.9 分布函数的性质 137 22样本序间和事件 19 小结 138 2.3概率论公理 22 习题 140 2.4几个简单命题 24 理论习题 149 2.5 等可能结果的样本空间 28 自检习题 153 *26概名:连娃生函数 37 第5章连续型随机变量.156 27概率:确信程度的度量 40 5.1 简介 156 小结. 41 5.2连续型随机变量的期望和方 习题 42 差 159 理论习题. 47 5.3均匀分布的随机变量 .162 自检习题 54 正态随机变量 165 第3章条件概率和独立性.51 5.5指数随机变量 174 3.1简介 .51 5.6其他连续型分布 .179 3.2条件概率. .51 5.6.1厂分布. .179 3.3贝叶斯公式 5.6.2 威布尔分布 .180 3.4独立事件. 5.6.3柯西分布. .181 3.5P氏·1F)为概率 76 5.6.43分布*+. .182 小结. .83 5.7随机变量函数的分布 .183 习题: *84 小结. 184 理论习题 94 习颗. 186 自检习题 理论习题 190 第4章随机变量 102 自拾习颗 1.94 4.1随机变量 102 第6章随机变量的联合分布. 197 4.2离散型随机变量. 106 6.1联合分布函数 197 4.3期望 108 6.2独立随机变量 203
2目录 6.3独立随机变量的和. 214 第8章 极限定理 4*.334 6.4离散情形下的条件分布· 219 8.1引言 .334 6.5连续情形下的条件分布. ·222 8.2切比雪夫不等式及弱大数律.334 *6.6次序统计量 ·225 8 中心极限定理. .337 6.7随机变量函数的联合分布· 229 8.4强大数律 .342 *6.8可交换随机变量 235 8.5其他不等式 345 小结 239 8.6 用泊松随机变量通近独立的伯努 习题. 240 利随机变量和的概率误差界.351 理论习题. 246 小结 352 自检习题. 24g 习题 353 第7章期望的性质 4.253 理论习题 71引言. ·253 自检习题. 356 72随机变量和的期塑 .253 第9章概率论的其他课题 .358 *7.2.1通过概率方法将期望值 9.】泊松衬程. +**.358 作为界. .26 9.2 马尔可夫链. .360 *7.2.2关于最大数与最小数的 9.3惊奇、不确定性及痛+.365 9.4编码定理及熵. .368 恒等式. 265 7.3试验序列中事件发生次数的 小结. “373 理论习题 .374 矩 26 74协方差、和的方差及相关系 自检习题 ·375 第10章模拟 377 数 274 7.5条件期望. 10.1引言 281 377 7.5.1定义 10.2具有连续分布函数的随机变 281 量的模拟技术, 379 7.5.2利用条件计算期望. 282 10.2.1反变换方法. ·379 7.5.3利用条件计算概率 289 10.2.2舍取法. 380 75.4条件方差 295 10.3模拟离散分布. ·385 7.6条件期望及预测 294 10.4方差缩减技术 386 7.7矩母函数. 298 10.4.1利用对偶变量.387 7.8正态随机变量进一步的性质.306 10.4.2利用“条件”缩减 7.8.1多元正态分布. 306 方差 ++388 7.8.2 样本均值与样本方差的 10.4.3控制变量 .389 联合分布 ·309 小结 389 7.9期望的一般定义 *310 习骏*· .300 小结. .311 自检习题 .392 习邀 .314 索引. ·393 理论习题 323 自检习题 4330
第1章组合分析 1.1引言 首先,我们提出一个与概率论有关的有趣的经典问题:一个通信系统含个天 线,顺序地排成一排,只要没有两个连续的天线都失效,那么这个系统就可以接收到 信号,此时称这个通信系统是有效的.已经探明这n个天线里,恰好有m个天线是 失效的,问此通信系统仍然有效的概率是多大?举例来说,设n=4,m=2,通信系 统是否有效取决于这n个天线的设置方式(它们的排列次序).这4个天线一共有 6种可能的设置方式 0110 1010 1001 010100111100 其中,1表示天线有效,0表示天线失效.可以看出前3种情况整个通信系统仍然有 效,而后3种情况系统将失效,因此,若天线的设置方式是随机排列的,所求的概率 应该是。=),对于一般的n和m来说,用类似上述方法可以计算出所求概率.也 即,先计算使得系统仍有效的设置方式有多少种,再计算总共有多少种设置方式,两 者相除即为所求概率 从上所述可看出,一个有效地计算事件发生结果数目的方法是非常有用的.事 实上,概率论里的很多问题只要通过计算一个事件发生结果的数目就能得以解决, 关于计数的数学理论通常称为组合分析(combinatorial analysis)). 1 1.2计数基本法则 对我们的整个讨论来说,以下关于计数的法则是基本的.粗浅地说,若一个试 验有m个可能结果,而另一个试验又有n个可能结果,则两个试验一共有mn个 结果 计数基本法则 有两个试验,其中试验1有m种可能发生的结果,对应于试验1的每一个 结果,试验2有n种可能发生的结果,则对这两个试验来说,一共有mm种 可能结果 基本法则的证明通过列举两个试验所有可能的结果来证明这个问题,结果
2第1章组合分析 如下: (1,1)(1,2).(1,n) (2,1)(2,2).(2,n) (m,1)(m,2).(m,n) 其中,(亿,)表示第一个试验结果是第i种、第二个试验结果是第j种因此,所有可 能结果组成一个矩阵,共有m行n列,结果的总数为m×n,这样就完成了证明. 例2a一个小团体由10位妇女组成,每位妇女又有3个孩子.现在要从其中 选取一位妇女和她的一个孩子评为“年度母亲和年度儿童”,问一共有多少种可能 的选取方式? 解:将选择妇女看成第一个试验,而接下来选择这位母亲的一个孩子看作第二 个试验,那么根据计数基本法则可知,一共有10×3=30种选择方式. 当有2个以上的试验时,基本法则可以推广如下: 推广计数法则 一共有”个试验.第一个试验有1种可能结果;对应于第一个试验的每 一种试验结果,第二个试验有2种可能结果;对应于头两个试验的每一种 2 试验结果,第三个试验有3种可能结果;等等.那么,这r个试验一共有 n1·2.nr种可能结果. 例2b一个大学计划委员会由3名新生、4名二年级学生、5名三年级学生、2 名毕业班学生组成,现在要从中选4个人组成一个分委员会,要求来自不同的年级, 一共有多少种选择方式? 解:可以把它理解为从每个年级选取一个代表,从而有4个试验,根据推广计 数法则,一共有3×4×5×2=120种可能的选择结果 例2车牌号是7位的,如果要求前3个位置必须是字母,后4个必须是数字, 一共有多少种编排车牌号的方式? 解:根据推广计数法则,可知道答案为:26×26×26×10×10×10×10= 175760000. 例2对于只定义在n个点上的函数,如果函数取值只能为0或1,这样的函 数有多少? 解:设这n个点为1,2,·,n,既然对每个点来说,∫()的取值只能为0或者1, 那么一共有2”个这样的函数. 例2在例2c中,如果不允许字母或数字重复,一共有多少种可能的车牌号? 解:这种情况下,一共有26×25×24×10×9×8×7=78624000种可能的车 牌号
1.3排列3 1.3排列 按随意顺序来排列字母a,b,c,一共有多少种排列方式?通过直接列举,可知 共有6种:abc,acb,bac,bca,cab以及cba.每一种都可以称为一个排列(permutation). 因此,3个元素一共有6种可能排列方式.这个结果能通过计数基本法则得到:在 排列中第一个位置可供选择的元素有3个,第二个位置可供选择的元素是剩下的两3 个之一,第三个位置只能选择剩下的1个元素,因此一共有3×2×1=6种可能的排列. 假设有n个元素,那么用上述类似的方法,可知一共有n(n-1)(n-2).321= n!种不同的排列方式。 例3一个垒球队一共有9名队员,问一共有多少种击球顺序? 解:一共有9!=362880种可能的击球顺序. 例3b某概率论班共有6名男生、4名女生,有次测验是根据他们的表现来排 名次,假设没有两个学生成绩一样. (a)一共有多少种排名次的方式? (b)如限定男生、女生分开排名次,一共有多少种排名次的方式? 解: (a)每种排名方法都对应着一个10人的排列方式,故答案是:10!=3628800 (b)男生一起排名次有6!种可能,女生一起排名次有4!种,根据计数基本法 则,一共有6!×4!=720×24=17280种可能结果. ■ 例3c把10本书放到书架上,其中有4本数学书、3本化学书、2本历史书和 1本语文书.现在要求相同类别的书必须紧挨着放,问一共有多少种放法? 解:如果数学书放在最前面,接下来放化学书,再下来放历史书,最后放语文 书,那么一共有4!3!2!1!种排列方式.而这4种书的顺序一共又是4!种,因此, 求答案是4!413!211!=6912. ◆ 接下来讨论如果有n个元茶,其中有些是不可区分的,这种排列数如何计算? 看下面的例子 4口 例3d用PEPPER的6个字母进行排列,一共有几种不同的排列方式? 解:如果3个字母P和2个字母E都是可以区分的(标上号),也即P1EP2P3E2R 一共有6!种排列方式.然而,考察其中任一个排列,比如P1P2E1P3E2R,如果分别将 3个字母P和2个字母E重排,那么得到的结果仍然是PPEPER,也就是说,总共有 3!2!种排列 P1P2E1P3E2R PiP2E2P3EiR PiP3E:P2E2R P1P3E2P2ER P2P1EP3E2R P2P1E2P3ER P2P3EPiE2R P2P3E2P1ER P3P1E1P2E2R P3P1E2P2E1R P3P2EP1E2R P3P2E2PER 这些排列都是同一种形式:PPEPER.因此一共有6!/(3!2!)=60种不同的排列方
4第1章组合分析 式 一般来说,利用上述同样的方法可知:n个元素,如果其中1个元素彼此相同, 另个彼此相同,个也彼此相同,那么一共有n1n2,种排列方式 例3一个棋类比赛一共有10个选手,其中4个来自俄罗斯,3个来自美国 2个来自英国,另1个来自巴西.如果比赛结果只记录选手的国籍,那么一共有多少 种可能结果? 101 解:一共有。 =12600种可能结果 ■ 312 例3f有9面小旗排列在一条直线上,其中4面白色、3面红色和2面蓝色, 颜色相同的旗是一样的.如果不同的排列方式代表不同的信号,那么一共有多少种 可能的信号? 5 9! 解:一共有4312=1260种不同的信号 ■ 1.4组合 从个元素当中取r个,一共有多少种取法?这也是一个有趣的问题.比如,从 A,B,C,D和E这5个元素中选取3个组成一组,一共有多少种取法?解答如下:取 第一个有5种取法,取第2个有4种取法,取第三个有3种取法,所以,如果考虑选 择顺序的话,那么一共有5×4×3种取法.但是,每一个包含3个元素的组(比如包 含A,B,C的组)都被计算了6次,(也即,如果考虑顺序的话,所有的排列ABC,ACB, BAC,BCA,CAB,CBA都被算了一次)所以,组成方法数为: 5×4×3 3x2xi=10 一般来说,如果考虑顺序的话,从n个元素中选择r个组成一组一共有n(n- 1).(n-r+1)种方式,而每个含r个元素的小组都被重复计算了共r!次.所以, 能组成不同的组的数目为: 2(-1)D r! 记号与术语 对r≤n我们定义()如下: n! 并且说(C)表示了从n个元素中一次取r个的可能组合数.1 1.为了方便,0!被定义为1,因此(0)=(=1.当in时,有时也认为(等于0