应用研究 关于平均数和数学期望的应用 苏均和 在统计学中常用平均数来表述数据(或数列)集 定现象.如抛掷一枚硬币,出现正面还是反面,在地 中趋势的测度。平均数有:算术平均数、调和平均 掷以前是无法知道的这类现象称为随机现象。在 数、几何平均数、中位数及众数。各种平均数有各自 客观世界六随机现象是普遍存在的。 的定义和它们应用的范围。 随机现象和随机试验是密不可分的,所谓随机 算术平约数是爱常历的一种它有简单算术平 试验就是一个试验满足下述条件: 均数与加权算术平均数之分。简单算术平均数是将 (1)试验可以在相同的情形下重复进行: 总体的各个单位标志值简单相加,然后除以单位个 (2)试验的所有可能结果是明确可知的,并且不 数,求出平均标志值;加权算术平均数是用各组标志 止一个; 值乘以相应的总体单位数来计算的,由此,它的大小 (3)每次试验恰好出现这些可能结果的一个,但 不仅取决于总体各单位的变量值,而且受单位变量 试验前不能肯定会出现那一个结果。 重复出现的次数影响,各组出现的次数在这里面起 随机试验每一个可能结果,称为基本事件。由 了权衡轻重的作用。 多个基本事件所组成的事件称为随机事件。比如一 调和平均数是各个变量值倒数的算术平均数, 个盒子中有十个完全相同的球,分别标以号码1,2, 又称倒数平均数。在统计工作中应用机会很少,往 …,10,令i={取得球的标号为i,则从盒子中任取 往是作为算术平均数的变形来使用的。 一球标号为i为一基本事件,而从盒中任取一球标 几何平均数是计算平均比率和平均速度时适用 号为偶数为一随机事件。 的一种方法。几何平均数也有简单几何平均数和加 度量一个随机事件出现可能性大小的量常用概 权几何平均数之分。只有当变量值总量表现为各变 率来刻画,而一个随机事件总是和它的概率紧密相 量值的连乘积时,才适用几何平均数方法来计算平 联的。 均值。一般说来,计算社会经济现象在各个时期的 随机事件虽然与实数之间没有直接自然关系, 平均发展速度时,则采用几何平均数。 但我们常可以人为地给它们建立起一个对应关系, 中位数是一种按其在数据中的特殊位置而决定 比如抛掷一枚硬币,约定0 1 出现正面 的平均数。它将总体中某数量标志的各个数值按大 出现反面 小顺序排列,形成一个数列,处在数列中点位次的数 是一个变量,它取什么值在每次试验以前是不能确 值即为中位数。中位数的最大特点是:它是数据序 定的,也就是说,它的取值是随机的,我们一般把这 列中间一项或两项的平均数,不受极端值影响,所以 种变量称为随机变量。随机变量就它们的取值可分 当一个数据序列中含有特大值或特小值的情况下, 为离散型和连续型。我们把下表称为是离散型随机 采用中位数较为适宜。 变量的分布列。 众数也是一种位置平均数,是指在总体中出现 表4 次数最多的那个变量值。众数的计算只适用于单位 卡a1,a2,, 其中P=P(E=a) 数较多,且有明显的集中趋势。否则计算众数是没 PP1,P2,P3,…P。… 有意义的。 而把随机变量:的数学期望定义为: 为了使得平均值更精确、更科学化,还可以用 E=三aP,从它的定义我们可以看出,它是以 另一种语言来进行描述,即数学期望。 概率为权数的平均数,因此它较前面的平均数而言 在自然界和社会生活中,一般有两种现象:一种 就更为精确而科学。设:和刀为两个随机变量,则 是确定性的,如太阳从东方升起等等;另一种是不确 有(:、)的联合分布列及条件期望等等一些问题。 95·5上海统计 17 1994-2007 China Academic Journal Electronic Publishing House.All rights reserved.http://ww.cnki.net
© 1994-2007 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
应用研究 现在我们已经知道数学期望的含义,但对于它 (E(R:I C=2) 18 的作用,尤其是关于它在各方面的应用,迄今未能引 E(R21C=2) 起人们重视。当前,在社会主义市场经济条件下,如 E(R3 I C=2) 10 -1 何利用数学期望来解决一些经济问题是很有必要 -0.81 的。由于篇幅关系下面仅举一例,说明数学期望的 =2.29 应用。 3.71 例,(抽样信息的价值)某公司拟扩展其生产线, maxE(RIIC=1),E(R2!C=1).(R2IC=1) 有三项备选方案。方案I,建造大型厂房;方案Ⅱ,建 -E(R1|C=1)=8.9 造中型厂房;方案Ⅲ,租赁合适的设备。产品的需求 mxR:IC=2),E(R,:C=2),E(R2|C=2) 情况分为高、低两档,以S=1表示需求悬高,$=2 =上(R3|C=2)=3.71 表示需求量低。以R、R:,R分别表示方案I、K、四 于是按后验期望收益最大原则的决策规则为: 的收益,它依龄干箭求情况S其在各情识下的收益 当预测需求量C=1时,执行方案1,当预测需求量C 值如表所示: =2时,执行方案Ⅲ,不论C值如何均不执行方案Ⅱ 单位:万元 此时决策的收益是S和C的函数,记为R·(S,C), 方案 收 I 0 即 益 蓝求 R R2 R3 18, 当C=1,S=1 S=1 18 12 10 -15, 、当C=1,S=2 S=2 -15 -5 -1 R'(S,C)= 10, 当C=2,S=1 今考虑聘请市场顾问对市场需求情况进行预 -1. 当C=2,S=2 测。在此之前我们已知需求随机变量S的概率分布 由(S,C)的联合分布,可得 为 E[R'(S,C)]=18×0.42+(-15)×0.16+10 P(S=1)=0.6,P(S=2)=0.4 ×0.18+(-1)×0.24=6.72 这一概率分布常称为事前分布(或先验分布)。以C 聘请顾问得到的预测信息是不完全信息或称抽 =1和C=2 样信息,它的价值为 PS=21C=1)=8 E[R(S,C)]-E(R3)=6.72-5.6=1.12 即聘请顾问比不聘请顾问平均说来可净增收益 P(s=11C=2)=PS=1.C=2 P(C.=2) 1.12万元,而聘请费用仅需5000元,因而聘请该顺 问是值得的。 0.18 3 =0.18+0.14= 在信息市场中信息是有售价的,仅当该抽样倍 4 息的价值大于其售价时,该信息才值得购买。一般 P(S=21C=2)=7 说来计算抽样信息的价值,其步骤如下: 这两个条件分布是在已知预测信息后得到 (1)利用市场需求随机变量S的先验分布求出 的称为事后分布(或后验分布),关于该后验分布求 各个方案的期望收益,期望收益最大的方案即为在 条件期望称为后验期望。分别求出三个方案在C= 没有咨询信息情况下的决策方案,该方案的期望收 1和C=2下的后验期望为 益记为E(R)。 E(R IC=1) 18 -15 1 (2)由咨询信息C计算S的后验分布,它依赖于 29 C。 E(R21C=1) = -5 o (3)由后验分布计算各方案的后验期望收益,它 E(RIC=1) -1 是C的函数。 8.9 (4)对于C的每一个值,选出后验期望收益最 7.3 大的方案,这就是利用咨询信息C的情况下的决策 {7.0 规则,此时收益是S和C的函数,记为R·(S,C)。 (5)计算信息的价值:E[R·(S,C)]-E(R) (作者单位:上海财经大学统计亲) 18 95·5上海统计 1994-2007 China Academic Journal Electronic Publishing House.All righis reserved.http://www.cnki.net
© 1994-2007 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net