2,2用样本估计总体 调查时: 通过抽样来收集数据 2、数据被收集后,必须分析数据,找出数据规律 从中寻找所包含的信息,对总体作出相应的估计 估计一般分成两种: 用样本的频率分布估计总体的分布 2、用样本的数据特征(如平均数,标准差等)估计总 体的数字特征
调查时: 1、通过抽样来收集数据 2、数据被收集后,必须分析数据,找出数据规律, 从中寻找所包含的信息,对总体作出相应的估计。 估计一般分成两种: 1、用样本的频率分布估计总体的分布 2、用样本的数据特征(如平均数,标准差等)估计总 体的数字特征
二、基本概念 1、频率分布 样本中所有数据(或数据组)的频数和样本容量 的比,叫做该数据的频率 所有数据(或数据组)的频数的分布变化规律叫 做样本的频率分布 频率分布的表示形式有 ①样本频率分布表(初中) ②样本频率分布条形图(初中) ③样本频率分布直方图
1、频率分布 样本中所有数据(或数据组)的频数和样本容量 的比,叫做该数据的频率. 频率分布的表示形式有: ①样本频率分布表(初中) ②样本频率分布条形图(初中) ③样本频率分布直方图 所有数据(或数据组)的频数的分布变化规律叫 做样本的频率分布. 二、基本概念
2.2.1用样本的频率分 布估计总体分布
探究:我国是世界上严重缺水的国家之一,城市缺水问题较为 突出。某市政府为了节约生活用水,计划在本市试行居民生活用 水定额管理,即确定一个居民月用水量标准a,用水量不超过的 部分按平价收费,超出a的部分按议价收费。如果希望大部分居 民的日常生活不受影响,那么标准定为多少比较合理呢? 你认为,为了较为合理的确定出这个标准,需要做那些 工作? 缺水量/105m3 2000年全国主要城 30 25 市中缺水情况排在20 前10位的城市 15 10 5 1且■夏 O上广南北武天成沈重哈城市 海州京京汉津都阳庆尔 滨
探究:我国是世界上严重缺水的国家之一,城市缺水问题较为 突出。某市政府为了节约生活用水,计划在本市试行居民生活用 水定额管理,即确定一个居民月用水量标准a,用水量不超过a的 部分按平价收费,超出a的部分按议价收费。如果希望大部分居 民的日常生活不受影响,那么标准a定为多少比较合理呢? 你认为,为了较为合理的确定出这个标准,需要做那些 工作? 2000年全国主要城 市中缺水情况排在 前10位的城市
市100居民的月均用水量单佞: 3125202.01.51.016.81916 342.62.22.21.51.20.20.40.30.4 322.723211.612371.50.538 332823221.71.336.70.64.1 322924231.81.4351.90.84.3 302924241.9131.41.80.72.0 2.52823231.81.31.31.60.923 262.7242.11.71412150.524 2.52.623 211.61.01.01.70.824 282.52.22.01.51.0 2180.622
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 某市100名居民的月均用水量(单位:t)
将一批数据按要求分为若干组,各组内的数据的个数,叫做 该组数据的频数,各个小组数据在样本容量中所占的比例的大 小,叫做该组数据的频率 为了解数据分布的规律,可利用频率分布表和频率分布图 来分析,具体做法如下: l、求极差(即一组数据中最大值和最小值的差) 例如,4.3-0.2=4.1, 这说明这些数据的变化范围大小是4lt 2、决定组距和组数 例如,若取组距为05,则组数=极差=41=82 组距0.5 故可将数据分成9组。 注:一般样本容量越大,所分组数就越多,当样本容 量不超过100时,按照数据的多少,常分成5~12组
将一批数据按要求分为若干组,各组内的数据的个数,叫做 该组数据的频数,各个小组数据在样本容量中所占的比例的大 小,叫做该组数据的频率。 为了解数据分布的规律,可利用频率分布表和频率分布图 来分析,具体做法如下: 1、求极差(即一组数据中最大值和最小值的差) 例如, 4.3-0.2=4.1, 这说明这些数据的变化范围大小是4.1t。 2、决定组距和组数 例如,若取组距为0.5,则 4.1 8.2 0.5 组数 = = = 组 极差 距 故可将数据分成9组。 注:一般样本容量越大,所分组数就越多,当样本容 量不超过100时,按照数据的多少,常分成5~12组
3、将数据分组:以组距05将数据分组如下: 0,0.5),[0.5,1),……,[4,4.51 4、列频率分布表: 分组 频数 频率 [0,0.5) [0.5,1 48 0.04 0.08 11.5,第几组频率。第几组频数15 样本容量22 [2,25) 25 0.25 [25,3) 14 0.14 [3,3.5) 0.06 3.5,4 642 0.04 [4,4.5] 0.02 计 100 100
分组 频数 频率 [0,0.5) 4 0.04 [0.5,1) 8 0.08 [1,1.5) 15 0.15 [1.5,2) 22 0.22 [2,2.5) 25 0.25 [2.5,3) 14 0.14 [3,3.5) 6 0.06 [3.5,4) 4 0.04 [4,4.5] 2 0.02 合计 100 1.00 4、列频率分布表: 3、将数据分组:以组距0.5将数据分组如下: [0,0.5), [0.5,1),……,[4,4.5 ] = 第几组频数 第几组频率 样本容量
5、画频率分布直方图 用横轴表示月均用水量,纵轴表示频率与组距的比值,以每 个组距为底,以频率除以组距的商为高,分别画出矩形,这 样得到的直方图就是频率分布直方图。 频率分布直方图 思考:小矩形的面积与哪些量有关?如何表示? 5 怒0.4 0.3 0.2 0-0.50.5-11-1.51.5-22-2.52.5-33-3.53.5-44-4.5 用水量范围
5、画频率分布直方图 用横轴表示月均用水量,纵轴表示频率与组距的比值,以每 个组距为底,以频率除以组距的商为高,分别画出矩形,这 样得到的直方图就是频率分布直方图。 频率分布直方图 0 0.1 0.2 0.3 0.4 0.5 0.6 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5 用水量范围 频率/组距 思考:小矩形的面积与哪些量有关?如何表示?
横轴表示:月均用水量,纵轴表示:频率/组距 小长方形的面积组距*频率组距=频率 各小长方形的面积总和等于1 频率分布直方图 0.6 0.5 0.4 0.3 0.2 0-0.50.5-11-1.51.5-22-2.52.5-33-3.53.5-44-4.5 用水量范围 频率分布直方图的特征 (1)从频率分布直方图可以清楚的看出数据分布的总体趋势 (2)从频率分布直方图得不出原始的数据内容,把数据表示成 直方图后,原有的具体数据信息就被抹掉了
频率分布直方图 0 0.1 0.2 0.3 0.4 0.5 0.6 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5 用水量范围 频率/组距 横轴表示:月均用水量,纵轴表示:频率/组距 小长方形的面积=组距*(频率/组距)=频率 各小长方形的面积总和等于1 频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布的总体趋势. (2)从频率分布直方图得不出原始的数据内容,把数据表示成 直方图后,原有的具体数据信息就被抹掉了.
频率分布折樂图 怒0.4 0-0.50.5-11-1.51.5-22-2.52.5-33-3.53.5-44-4.5 连接频率分布直方图中各个小长方形上端的中点 思考:什么情况下频率折线图才会接近于一条光滑的曲线? 随着样本容量的增加,作图时所分的组数也会增加, 相应的频率折线图会越来越接近于一条光滑的曲线,统计 学中称这条光滑的曲线为总体密度曲线
频率分布直方图 0 0.1 0.2 0.3 0.4 0.5 0.6 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5 用水量范围 频率/组距 频率分布折线图 连接频率分布直方图中各个小长方形上端的中点 随着样本容量的增加,作图时所分的组数也会增加, 相应的频率折线图会越来越接近于一条光滑的曲线,统计 学中称这条光滑的曲线为总体密度曲线 思考:什么情况下频率折线图才会接近于一条光滑的曲线?