经济数学基础 第8章数据处理 第8章数据处理典型例题与综合练习 一、典型例题 1.重要特征数 例1设一组数据为78.2:88.2;79.3:80.5:83.4:81.2;76.3;86.5 求这组数据的(1)均值;(2)中位数:(3)极差;(4)方差及标准差;(5)变异系 数 解:将数据由小到大顺序排列为 76.3;782;79.3;80.5;81.2;83.4;86.5;88.2 (1)均值x=8(763+782+793+805+812+834+865+882) 1 8×653.6=81.7 (2)中位数 共有8个数据,中间两个数是80.5和81.2,故 中位数xM=2(80.5+81.2)=80.85 (3)极差 最大数是882,最小数是76.3,故 极差R82-763119 (4)方差S=8[763-81.7)2+(782-81.7++(882-81.7)]=8×1104=1463 236
经济数学基础 第 8 章 数据处理 ——236—— 第 8 章数据处理典型例题与综合练习 一、典型例题 1.重要特征数 例 1 设一组数据为 78.2;88.2;79.3;80.5;83.4;81.2;76.3;86.5 求这组数据的(1)均值;(2)中位数;(3) 极差;(4) 方差及标准差;(5)变异系 数. 解:将数据由小到大顺序排列为 76.3;78.2;79.3;80.5;81.2;83.4;86.5;88.2 (1)均值 x = 1 8 (76.3+78.2+79.3+80.5+81.2+83.4+86.5+88.2) = 1 8 ×653.6=81.7 (2)中位数 共有 8 个数据,中间两个数是 80.5 和 81.2,故 中位数 * M x = 1 2 (80.5+81.2) =80.85 (3)极差 最大数是 88.2,最小数是 76.3,故 极差 R 88.2-76.3 11.9 (4)方差 2 s = 1 8 [(76.3-81.7)2+(78.2-81.7)2+┅+(88.2-81.7)2 ] = 1 8 ×117.04=14.63
经济数学基础 第8章数据处理 标准差S=√163=382 =4.68% (5)变异系数817 例2某公司制定下一年度计划时,由A,B,CD,E五人预测下年度的销售量(单 位:吨,分别为1300:1250;1200:1230;1280 如果考虑到每人在公司的地位和作用,以及不同的业务水平,分别给予不同 的权重,若A,B的权各为30%,C,D的权各为10%,E的权为20%,求下年度销 售量的预测值及其方差 解:根据加权平均数的计算公式有 x=1300×30%+1250×30%+1200×10%+1230×10%+1280×20%=1264 即下年度销售量的预测值是1264吨 方差=(1300-12642×30%+(1250-1264)2×30%+…+(1280-1264)×20% 标准差s =√1024=32 直方图 例1某项试验测得100个数据如下 0.2530.2220.267 0.2690.3150.2350.2950.2380275 0.2890.2650.248 02950.2590.2720.2810.2610.305 0.2510.2390.2780.25 2800.2630.2570.2780.2460.285 0.2540.2490.3020.25002710.26002580.27202530.284 02550.2900.2710.25902570.2730.24602330.2490.270 027902420220025802702570.273027402 02880.2590.2700.2410.2730.2960.2480.2440.3000.254 0.2770.2440.2680.26102530.28202820.25602830.263 02520281|02360230025802550286026002780272 237—
经济数学基础 第 8 章 数据处理 ——237—— 标准差 s = 14.63=3.82 (5)变异系数 4.68% 81.7 3.82 cv = = 例 2 某公司制定下一年度计划时,由 A,B,C,D,E 五人预测下年度的销售量(单 位:吨),分别为 1300;1250;1 200;1230;1280 如果考虑到每人在公司的地位和作用,以及不同的业务水平,分别给予不同 的权重,若 A,B 的权各为 30%,C,D 的权各为 10%,E 的权为 20%,求下年度销 售量的预测值及其方差. 解:根据加权平均数的计算公式有 x =1300×30%+1250×30%+1200×10%+1230×10%+1280×20%=1264 即下年度销售量的预测值是 1264 吨. 方差 = 2 s (1300-1264)2×30%+(1250-1264)2×30%+┅+(1280-1264)2×20% =1024 标准差 1024 32 2 s = s = = 二、直方图 例 1 某项试验测得 100 个数据如下 0.253 0.222 0.267 0.278 0.269 0.315 0.235 0.295 0.238 0.275 0.289 0.265 0.248 0.256 0.295 0.259 0.272 0.281 0.261 0.305 0.251 0.239 0.278 0.251 0.280 0.263 0.257 0.278 0.246 0.285 0.254 0.249 0.302 0.250 0.271 0.260 0.258 0.272 0.253 0.284 0.255 0.290 0.271 0.259 0.257 0.273 0.246 0.233 0.249 0.270 0.266 0.279 0.242 0.220 0.258 0.271 0.257 0.273 0.274 0.244 0.288 0.259 0.270 0.241 0.273 0.296 0.248 0.244 0.300 0.254 0.277 0.244 0.268 0.261 0.253 0.282 0.282 0.256 0.283 0.263 0.252 0.281 0.236 0.230 0.258 0.255 0.286 0.260 0.278 0.272
经济数学基础 第8章数据处理 0248027029702700213026102310264027310296 (1)试列出这100个数据的频数分布表 (2)作出频数直方图 (3)作出频率直方图,并描绘出它的频率密度曲线 (4)根据频数表,求出这100个数据的均值、方差、标准差 解:(1)作频数分布表 ①确定范围 找出100个数据中的最大值和最小值,分别是0315和0213,取 a=0210(<0213),b=0.320∞0315),于是数据都落在(0210,0.320内 ②分组,确定组距和组限 0.320-0.210 d 将数据等分成10组,组距 10=0.011 确定每组的组下限和组上限,组下限和组上限分别为0210和0221,0.221和 0.232,…,0.309和0.320,填入表中的第1列 ③数出组频数 在表中的第3列用唱票法(画正字)数出每组的组频数,将结果填入表中的第4 ④计算组中值和组频率,分别填入表中的第2列和第5列.于是得到频数分布 表 频数分布表 组限组中值x唱票数频数组频数"组频率f/d 0.210~0.22 0.221~0.232 0.2265 0.03 2.73 0.232~0.243 0.2375 正T 7 0.07 6.36 238
经济数学基础 第 8 章 数据处理 ——238—— 0.248 0.279 0.297 0.270 0.213 0.261 0.231 0.264 0.273 0.296 (1)试列出这 100 个数据的频数分布表; (2)作出频数直方图; (3)作出频率直方图,并描绘出它的频率密度曲线; (4)根据频数表,求出这 100 个数据的均值、方差、标准差. 解:(1)作频数分布表 ①确定范围 找出 100 个数据中的最大值和最小值,分别是 0.315 和 0.213.取 a =0.210(0.315),于是数据都落在(0.210,0.320)内. ②分组,确定组距和组限 将数据等分成 10 组,组距 10 0.320 − 0.210 d = =0.011 确定每组的组下限和组上限,组下限和组上限分别为 0.210 和 0.221,0.221 和 0.232,…,0.309 和 0.320,填入表中的第 1 列. ③数出组频数 在表中的第 3 列用唱票法(画正字)数出每组的组频数,将结果填入表中的第 4 列. ④计算组中值和组频率,分别填入表中的第 2 列和第 5 列.于是得到频数分布 表. 频数分布表 组 限 组中值 i x 唱票数频数 组频数 i v 组频率 i f f i / d 0.210~0.221 0.2155 T 2 0.02 1.82 0.221~0.232 0.2265 F 3 0.03 2.73 0.232~0.243 0.2375 正 T 7 0.07 6.36
经济数学基础 第8章数据处理 0.243~0.254 0.2485 正正正 14.55 0.254~0.265 0.2595 正正正正T 0.265~0.276 0.2705 正正正正 0.21 19.09 0.276~0.287 0.281 正正正T 0.17 1545 0.287~0.298 0.2925 正F 7.27 0298~030903035 F 0.03 2.73 0.309~0.320 0.3145 0.01 0.91 (2)作频数直方图 直角坐标系中,用横轴表示数据用纵轴表示频数,在横轴上以组距为底边,以 每组的组频数为高作矩形得到频数直方图,如图 10 频数直方图 (3)频率直方图 在频数分布表中计算频率阻组距,即d,见频数分布表的最后一列,在横 轴上以组距为底,依次以a为高(=1,2…10)作矩形,得到频率直方图,如图 239
经济数学基础 第 8 章 数据处理 ——239—— 0.243~0.254 0.2485 正正正一 16 0.16 14.55 0.254~0.265 0.2595 正正正正 T 22 0.22 20 0.265~0.276 0.2705 正正正正一 21 0.21 19.09 0.276~0.287 0.2815 正正正 T 17 0.17 15.45 0.287~0.298 0.2925 正 F 8 0.08 7.27 0.298~0.309 0.3035 F 3 0.03 2.73 0.309~0.320 0.3145 一 1 0.01 0.91 合 计 100 1 (2)作频数直方图 直角坐标系中,用横轴表示数据,用纵轴表示频数,在横轴上以组距为底边,以 每组的组频数为高作矩形,得到频数直方图,如图. 0 5 10 15 20 25 频数直方图 (3)频率直方图 在频数分布表中计算频率/组距,即 f i / d ,见频数分布表的最后一列,在横 轴上以组距为底,依次以 f i / d 为高( i =1,2,…10)作矩形,得到频率直方图,如图
经济数学基础 第8章数据处理 频率直方图 (4)根据频数分布表及均值和方差的近似计算公式,得 均x≈∑∫x=0.215×002+0.265008+…+0.3145×001≈0.2619 方差: 0.02(0.2155-0.2649)2+0.03(0.2265-0.26492+ +001(0.3145-0.2649严2 ≈3.787×10 标准差:S=√s2≈√3787×10+x0019 二、综合练习 1.填空题 1.设一组试验数据为7.3,7.8,8.0,7.6,7.5,则它们的均值 ,中位数是 极差 是 方差是 标准差 变异系数是 240—
经济数学基础 第 8 章 数据处理 ——240—— 0 5 10 15 20 25 频率直方图 (4)根据频数分布表及均值和方差的近似计算公式,得 均值: i i i x f x = 10 1 = 0.21550.02+0.22650.03+ +0.31450.010.2649 方差: = − 10 1 2 2 ( ) i i i s f x x = − + − + + − 0 02 0 2155 0 2649 0 03 0 2265 0 2649 0 01 0 3145 0 2649 2 2 2 . ( . . ) . ( . . ) . ( . . ) 4 3.787 10− 标准差: 3.787 10 0.019 2 4 = − s s 二、综合练习 1.填空题 1.设一组试验数据为 7.3, 7.8, 8.0, 7.6, 7.5, 则它们的均值 是 ,中位数是 , 极差 是 , 方差是 ,标准差 是 ,变异系数是
经济数学基础 第8章数据处理 ⊙.设x,x2…x是一组数据,Pn,P2,P是它们的权,则P,PP满足 3.统计中将所要研究的对象的全体称 为 中的基本单位称为个体, 从 中抽出的一个个体称为 样品组成 称为样本 称为样本容量 1.7.64:7.6;0.7;0.0584:0.2417:3.16% p,=1 (1) 0(=1,2…,n) 3.总体:总体;总体;样品;样本:样本的取值;样本中所含样品的个数 2单选题 设x,x2,,x是一组数据,则这组数据的标准差的计算公式是( (x2 2设x,x2,x是一组数据,P1P2Pn是它们的权,则这组数据的加权平均数 和方差分别是( x=1∑nxs2=∑n1(x-x)x=∑ pixi,s= x=∑Px2=∑ x=∑Px52=∑(Px 3.下列各组数中, )能作为一组数据1x2,xx进行加权平均数的 -24
经济数学基础 第 8 章 数据处理 ——241—— 2.设 n x , x , , x 1 2 是一组数据, p p pn , , , 1 2 是它们的权,则 p p pn , , , 1 2 满足 (1) ,(2) . 3.统计中将所要研究的对象的全体称 为 , 中的基本单位称为个体, 从 中抽出的一个个体称为 ,一组 样品组成 , 称为样本 值, 称为样本容量. 1. 7.64;7.6;0.7;0.0584;0.2417;3.16%. 2. (1) p 0(i 1,2, ,n) i = ;(2) = = n i pi 1 1 . 3. 总体;总体;总体;样品;样本;样本的取值;样本中所含样品的个数. 2.单选题 1.设 n x , x , , x 1 2 是一组数据,则这组数据的标准差的计算公式是( ). (A) = − n i i x x n 1 2 ( ) 1 ;(B) = − n i i x x n 1 2 ( ) 1 ;(C) = − n i i x x n 1 2 ( ) 1 ;(D) = − n i i x x n 1 ( ) 1 . 2.设 n x , x , , x 1 2 是一组数据, p p pn , , , 1 2 是它们的权,则这组数据的加权平均数 和方差分别是( ). (A) = = = = − n i i i n i i i p x x n p x s n x 1 2 2 1 ( ) 1 , 1 ;(B) = = = = − n i i i n i i i p x x n p x s n x 1 2 2 1 ( ) 1 , 1 (C) = = = = − n i i i n i i i x p x s p x x 1 2 2 1 , ( ) ;(D) = = = = − n i i i n i i i x p x s p x x 1 2 2 1 , ( ) 3.下列各组数中,( )能作为一组数据 1 2 3 4 x , x , x , x 进行加权平均数的
经济数学基础 第8章数据处理 权 111 l111 (A)42126;(B)3326;(C)332126;(D)2346 B 2.C A 3计算题 1.全国电视歌曲大奖赛中,由10位评委为歌手打分,打分的办法是:去掉一个最 髙分,去掉一个最低分,其余得分求均值,就是该歌手的得分.下面是10位评委给 两名歌手的打分,先用这种方法算一算两位歌手的得分,再计算每组数据的均值.想 想,这种打分方法有什么优点? 甲10|9.59.49.39.49.29.39.29.59.2 乙[9.793929.3949696194|92|90 2.有两种股票,它们在5天内的收盘价如下: A7.8元,7.9元,7.8元,7.7元,7.8元 B7.8元,6.6元,7.4元,8.2元,9.0元 分别计算这两种股票的(1)5天内的平均价格和标准差,从中会得出什么结论 呢?(2)极差和变异系数 3.调查A单位职工某月收入情况,如下表: 「资档次(元)人 数工资档次(元)人 300-500 800-900 84 500-600 900-1000 600-700 1000130015 700-800 128 合计 试计算该单位职工的平均月工资 242
经济数学基础 第 8 章 数据处理 ——242—— “权”. (A) 6 1 , 12 1 , 2 1 , 4 1 ;(B) 6 1 ,0, 2 1 , 3 1 ;(C) 6 1 , 12 1 , 2 1 , 3 1 − ;(D) 6 1 , 4 1 , 3 1 , 2 1 . 1.B 2.C 3.A 3.计算题 1.全国电视歌曲大奖赛中,由 10 位评委为歌手打分,打分的办法是:去掉一个最 高分,去掉一个最低分,其余得分求均值,就是该歌手的得分. 下面是 10 位评委给 两名歌手的打分,先用这种方法算一算两位歌手的得分,再计算每组数据的均值. 想 一想,这种打分方法有什么优点? 甲 10 9.5 9.4 9.3 9.4 9.2 9.3 9.2 9.5 9.2 乙 9.7 9.3 9.2 9.3 9.4 9.6 9.6 9.4 9.2 9.0 2.有两种股票,它们在 5 天内的收盘价如下: A 7.8 元,7.9 元,7.8 元,7.7 元,7.8 元 B 7.8 元,6.6 元,7.4 元,8.2 元,9.0 元 分别计算这两种股票的(1)5 天内的平均价格和标准差,从中会得出什么结论 呢?(2)极差和变异系数. 3.调查 A 单位职工某月收入情况,如下表: 工资档次(元) 人 数 工资档次(元) 人 数 300-500 12 800-900 84 500-600 25 900-1000 45 600-700 66 1000-1300 15 700-800 128 合计 试计算该单位职工的平均月工资
经济数学基础 第8章数据处理 4有甲、乙两个不同品种的农作物种子分别播种在五块试验田上,生产条件 相同,得到各试验田上的产量分别如下表: 试验田面积(hm)产量(kg) 乙 2.0 7800 10700 8640 8400 1.7 6360 8840 4 7210 5000 7860 为研究两个品种的收获率,确定两个品种收获量的稳定性,试计算甲、乙两个品种 的(1)平均亩产量:(2)产量的标准差;(③3)各自的变异系数.(4)哪个品种较好? 5.某品牌的电话机确定用4个指标评价它的好坏,并依消费者的意见给4个 指标赋予不同的权重,如果每个指标的满分是10分,那么如下这个消费者给该 品牌电话机的打分是多少? 指标|[质量外观|价格|音质 权 50% 20 20% 10 10 6.现有50个数据 l68162|162163146150155148155158 158160157154155176163156153|159 159160152159165175160148161162 160154160150178165166157162162 170166|162167152149164168170149 (1)试列出这50个数据的频数分布表 (2)作出频数直方图 (3)作出频率直方图,并描绘出它的频率曲线 (4)根据频数表,求出这50个数据的均值、方差、标准差 243
经济数学基础 第 8 章 数据处理 ——243—— 4.有甲、乙两个不同品种的农作物种子分别播种在五块试验田上,生产条件 相同,得到各试验田上的产量分别如下表: 试验田 试验田面积(hm2 ) 产量(kg) 编号 甲 乙 甲 乙 1 1.5 2.0 7 800 10 700 2 1.6 1.6 8 640 8 400 3 1.2 1.7 6 360 8 840 4 1.3 1.4 6 630 7 210 5 1.0 1.5 5 000 7 860 为研究两个品种的收获率,确定两个品种收获量的稳定性,试计算甲、乙两个品种 的(1)平均亩产量;(2)产量的标准差;(3)各自的变异系数. (4)哪个品种较好? 5.某品牌的电话机确定用 4 个指标评价它的好坏,并依消费者的意见给 4 个 指标赋予不同的权重, 如果每个指标的满分是 10 分,那么如下这个消费者给该 品牌电话机的打分是多少? 指 标 质 量 外 观 价 格 音 质 权 50% 20% 20% 10% 打 分 10 7 8 10 6.现有 50 个数据 168 162 162 163 146 150 155 148 155 158 158 160 157 154 155 176 163 156 153 159 159 160 152 159 165 175 160 148 161 162 160 154 160 150 178 165 166 157 162 162 170 166 162 167 152 149 164 168 170 149 (1)试列出这 50 个数据的频数分布表; (2)作出频数直方图; (3)作出频率直方图,并描绘出它的频率曲线; (4)根据频数表,求出这 50 个数据的均值、方差、标准差
经济数学基础 第8章数据处理 1.①甲得分9.35:乙得分9.375 ②甲的均值=-(10+9.5+9.4+9.3+9.4+9.2+9.3+9.5+9.2+9.2)=9.4 乙的均值=10 (9.7+9.3+9.2+9.3+9.4+9.6+9.6+9.4+9.2+9.0)=9.37 ③这种打分方法的优点是:用这种方法打分,甲比乙的得分低,而用均值的方法打分, 甲比乙的得分却高,这是因为甲的大部分得分比较低,但有一个极端值10分,使得它的 均值就比较高:而乙的大部分得分比较高,但有一个极端值9.0分,使得它的均值就比 较低:这种极端值有可能是人为造成的为了公正,采用去掉一个最高分和一个最低分, 其余得分求均值的方法,可以剔除极端值对整体水平的影响. 2.(1)①A的平均价格是(7.8+7.9+7.8+7.7+7.8)=7.8 B的平均价格是(7.8+6.6+7.4+8.2+9.0)=7.8 ②A的标准差=√0004=0.063,B的标准差=√064=0.8 ③从中得到结论:B股票的股价波动大,从股票的操作上讲,股价波动大,风险大,但 获利的机会也比较大.这是因为A股票股价的标准差是0.063,B股票股价的标准差是 0.8,B股票股价的标准差大,说明股价波动大 (2)①A,B两种股票股价的极差分别是0.2和2.4.这是因为A股票的最高价和最低价 分别是7.9元和7.7元,故极差是7.9-7.7=0.2元;B股票的最高价和最低价分别是9.0 元和6.6元,故极差是9.0-6.6=2.4元 ②A,B两种股票股价的变异系数分别是0.81%,10.26%.这是因为A股票的均值78元 0.063 标准差为0.063元,故变异系数是 81% 7.8 B股票的均值为7.8元,标准差为0.8元,变异系数是 08=10.26% 4.①每块田的单位产量为 244
经济数学基础 第 8 章 数据处理 ——244—— 1.①甲得分 9.35;乙得分 9.375. ②甲的均值= 10 1 (10+9.5+9.4+9.3+9.4+9.2+9.3+9.5+9.2+9.2)=9.4 乙的均值= 10 1 (9.7+9.3+9.2+9.3+9.4+9.6+9.6+9.4+9.2+9.0)=9.37 ③这种打分方法的优点是:用这种方法打分,甲比乙的得分低,而用均值的方法打分, 甲比乙的得分却高,这是因为甲的大部分得分比较低,但有一个极端值 10 分,使得它的 均值就比较高;而乙的大部分得分比较高,但有一个极端值 9.0 分,使得它的均值就比 较低; 这种极端值有可能是人为造成的.为了公正,采用去掉一个最高分和一个最低分, 其余得分求均值的方法,可以剔除极端值对整体水平的影响. 2.(1)①A 的平均价格是 5 1 (7.8+7.9+7.8+7.7+7.8)=7.8 B 的平均价格是 5 1 (7.8+ 6.6+7.4+8.2+9.0)=7.8 ②A 的标准差= 0.004 =0.063, B 的标准差= 0.64 =0.8. ③从中得到结论: B 股票的股价波动大,从股票的操作上讲,股价波动大,风险大,但 获利的机会也比较大. 这是因为 A 股票股价的标准差是 0.063,B 股票股价的标准差是 0.8,B 股票股价的标准差大,说明股价波动大. (2)①A,B 两种股票股价的极差分别是 0.2 和 2.4. 这是因为 A 股票的最高价和最低价 分别是 7.9 元和 7.7 元,故极差是 7.9-7.7=0.2 元;B 股票的最高价和最低价分别是 9.0 元和 6.6 元,故极差是 9.0-6.6=2.4 元. ②A,B 两种股票股价的变异系数分别是 0.81%,10.26%. 这是因为 A 股票的均值 7.8 元, 标准差为 0.063 元,故变异系数是 7.8 0.063 =0.81%; B 股票的均值为 7.8 元,标准差为 0.8 元,变异系数是 7.8 0.8 =10.26%. 3.770.27 4.①每块田的单位产量为
经济数学基础 第8章数据处理 试验田试验田面积hm2/km2)单位产量(kg/km2) 编号 甲 甲 2.0 16 16 5400 5250 1.3 14 5100 5150 1.0 ②两个品种的单位平均产量分别为x甲=5216.67,x=5245.12 ③两个品种的产量的标准差分别为5甲=138.81,5=68.26 ④各自的变异系数分别为甲品种C=266%,乙品种Cv=1309 ⑤结论为:从上面计算看出,乙品种的单位面积平均产量略高于甲品种,变异系数也比甲 品种小,说明乙品种收获率具有较大的稳定性,即乙品种比甲品种的收获率具有较大的 稳定性 5.9分 (1) 频数分布表 组限组中值x组频数v组频率ffa 145-152148.5 0.14 0.02 152-1591555 11 0.22 0.031 0.44 166-173 169.5 7 0.14 0.02 173-180176.5 50 (2)作出频数直方图 245
经济数学基础 第 8 章 数据处理 ——245—— 试验田 试验田面积(hm2 /km2 ) 单位产量(kg/km2 ) 编号 甲 乙 甲 乙 1 1.5 2.0 5 200 5 350 2 1.6 1.6 5 400 5 250 3 1.2 1.7 5 300 5 200 4 1.3 1.4 5 100 5 150 5 1.0 1.5 5 000 5 240 ②两个品种的单位平均产量分别为 x甲 = 5 216.67, x乙 = 5 245.12 ③两个品种的产量的标准差分别为 s甲 = 138.81, s乙 = 68.26. ④各自的变异系数分别为甲品种 cv = 2.66%,乙品种 cv =1.30% ⑤结论为:从上面计算看出,乙品种的单位面积平均产量略高于甲品种,变异系数也比甲 品种小,说明乙品种收获率具有较大的稳定性,即乙品种比甲品种的收获率具有较大的 稳定性. 5.9 分 6.(1) 频数分布表 组 限 组中值 xi 组频数 vi 组频率 fi fi /d 145--152 148.5 7 0.14 0.02 152--159 155.5 11 0.22 0.031 159--166 162.5 22 0.44 0.063 166--173 169.5 7 0.14 0.02 173--180 176.5 3 0.06 0.009 合 计 50 1 (2)作出频数直方图