口上次课复习: 1.狭义统计指数?它的主要作用是什么?具有哪些性质? 2.什么叫综合指数?什么叫平均指数? 3.什么是指数化指标?什么是同度量因素? 4.确定经济指数同度量因素的一般原则是什么?为什么? 5.何为可变构成指数、结构影响指数、固定构成指数? 口本次课题:第七章抽样调查(8课时) 教学过程: 1.导入新课 2.讲授新课 3.总结及布置练习 ☐讲授内容: 引言:通过展示一份网络调查问卷引入新课。 导入新课: 在第四章中,我们学习了四大类型的指标。我们知道指标是用 来说明总体数量特征的数据,但是,在现实生活中,总体的大量 性特征(单位数量多)为各行各业的工作量提供了复杂性,在人 力,物力,财力,时间等方面的限制下,有时获得全面资料非常 困难,甚至不可能。这就客观需要我们建立一种这样的统计方法:
1 上次课复习: 1. 狭义统计指数?它的主要作用是什么? 具有哪些性质? 2. 什么叫综合指数?什么叫平均指数? 3. 什么是指数化指标?什么是同度量因素? 4.确定经济指数同度量因素的一般原则是什么? 为什么? 5.何为可变构成指数、结构影响指数、固定构成指数? 本次课题: 第七章 抽样调查(8 课时) 教学过程: 1.导入新课 2.讲授新课 3.总结及布置练习 讲授内容: 引言:通过展示一份网络调查问卷引入新课。 导入新课: 在第四章中,我们学习了四大类型的指标。我们知道指标是用 来说明总体数量特征的数据,但是,在现实生活中,总体的大量 性特征(单位数量多)为各行各业的工作量提供了复杂性,在人 力,物力,财力,时间等方面的限制下,有时获得全面资料 非常 困难,甚至不可能。这就客观需要我们建立一种这样的统计方法:
即用部分的资料来了解总体的数量特征,这就是我们的新课内容 一一抽样估计。 关于抽样估计,我们掌握这些方面的内容:抽样估计的概念, 误差的产生及其计算,误差的类型及其区别,抽样的区间估计。 讲授新课: 抽样推断的相关概念(1课时) (一)抽样推断的涵义及特点 1、涵义:在抽样调查的基础上,利用样本的实际资料计算样本指 标并据以推算总体相应数量特征的一种统计方法。 2、特点:是由部分推算总体的一种认识方法:是一种建立在随 机抽样基础上的统计方法:运用了概率估计的方法:抽 样估计误差可以事先计算并加以控制。 举例:要了解某班学生的数学平均成绩,在很紧张的时间限制下, 无法得知全班100名同学的成绩,这样,老师决定在100名当中 取出20名同学的分数来计算平均数,作为全班分数的平均数,来 概括全班考试情况。这就是抽样推断。 (二)抽样推断的内容 1.参数估计:依据所获得的样本资料观察对所研究现象总体的水 平,结构规模等数量特征进行估计。 参数估计包括许多内容:确定估计值和确定估计的优良标准加以 判别,求估计值和被估计值参数之间的误差范围,计算在一 定误差范围内所作推断的可靠程度
2 即用部分的资料来了解总体的数量特征 ,这就是我们的新课内容 ——抽样估计。 关于抽样估计,我们掌握这些方面的内容:抽样估计的概念, 误差的产生及其计算,误差的类型及其区别,抽样的区间估计。 讲授新课: 一、 抽样推断的相关概念(1 课时) (一)抽样推断的涵义及特点 1、涵义:在抽样调查的基础上,利用样本的实际资料计算样本指 标并据以推算总体相应数量特征的一种统计方法。 2、 特点:是由部分推算总体的一种认识方法;是一种建立在随 机抽样基础上的统计方法;运用了概率估计的方法;抽 样估计误差可以事先计算并加以控制。 举例:要了解某班学生的数学平均成绩,在很紧张的时间限制下, 无法得知全班 100 名同学的成绩,这样,老师决定在 100 名当中 取出 20 名同学的分数来计算平均数,作为全班分数的平均数,来 概括全班考试情况。这就是抽样推断。 (二)抽样推断的内容 1.参数估计:依据所获得的样本资料观察对所研究现象总体的水 平,结构规模等数量特征进行估计。 参数估计包括许多内容:确定估计值和确定估计的优良标准加以 判别,求估计值和被估计值参数之间的误差范围,计算在一 定误差范围内所作推断的可靠程度
2.假设检验:先对总体的状况作某种假设,然后再根据抽样推断 的原理,根据样本资料对所作假设进行检验,来判断这种假 设的真伪,以决定我们行动的取舍。 (三)相关概念 1、总体和样本 总体一一亦称全及总体,指所要认识的研究对象全体,它是由所 研究范围内具有某种共同属性的全体单位所组成的集合体。 样本一一又称子样,它是全及总体中随机抽取出来的,作为代表 这一总体的那部分单位组成的集合体。 由此可知,总体和样本,一个是整体,一个是部分,全及总 体是我们的研究内容的对象,因此它是唯一的,确定的:而样本 则是建立在随机基础上抽取出来的,所以每一次选样,都会选出 不同的结果,所以它是变动的,不确定的。 2、样本容量和样本个数 样本容量一一指一个样本所包含的单位数(样本容量小于30的称 为小样本,反之,则称为大样本) 样本个数一一指从一个总体中可能抽取的样本个数(重复抽样的 样本个数为乘方数,不重复抽样的样本个数为排列数) 3、抽样调查方法 重复抽样一一抽出一个单位,登记结果,又重新放回,参加下一 次抽选,抽取的样本可能值为N 不重复抽样一一每次抽取一个单位就不再放回参加下一次抽选, 其抽取的全部可能的样本个数为p ·4、抽样的组织形式:简单随机抽样,类型抽样,等距抽样, 整群抽样
3 2.假设检验:先对总体的状况作某种假设,然后再根据抽样推断 的原理,根据样本资料对所作假设进行检验,来判断这种假 设的真伪,以决定我们行动的取舍。 (三) 相关概念 1、 总体和样本 总体——亦称全及总体,指所要认识的研究对象全体,它是由所 研究范围内具有某种共同属性的全体单位所组成的集合体。 样本——又称子样,它是全及总体中随机抽取出来的,作为代表 这一总体的那部分单位组成的集合体。 由此可知,总体和样本,一个是整体,一个是部分,全及总 体是我们的研究内容的对象,因此它是唯一的,确定的;而样本 则是建立在随机基础上抽取出来的,所以每一次选样,都会选出 不同的结果,所以它是变动的,不确定的。 2、 样本容量和样本个数 样本容量——指一个样本所包含的单位数(样本容量小于 30 的称 为小样本,反之,则称为大样本) 样本个数——指从一个总体中可能抽取的样本个数(重复抽样的 样本个数为乘方数,不重复抽样的样本个数为排列数) 3、 抽样调查方法 重复抽样——抽出一个单位,登记结果,又重新放回,参加下一 次抽选,抽取的样本可能值为 N n 不重复抽样——每次抽取一个单位就不再放回参加下一次抽选, 其抽取的全部可能的样本个数为 pN n 、 4、抽样的组织形式:简单随机抽样,类型抽样,等距抽样, 整群抽样
5、参数和统计量 1)概念:参数一一根据总体各单位的标志值或标志属性计算 出来的(总体指标) 统计量一一根据样本各单位标志值或标志属性计算出来 的(样本指标) 参数和统计量的内容和计算方式一致的,但本质不同,一个 是直接总体的实际数据是唯一的,确定的,固定的。而统计量则 是随着抽样的变化,样本的变化,其指标值也是处于不断的变化 之中的。 2)常用的参数和统计量(指标:平均指标和变异指标) 对于数量标志,计算平均指标和变异指标(6,X) 对于品质标志,计算成数指标(结构相对指标)来表示某 种性质的单位数在总体全部单位数中所占的比重。 即p=(nl/n),则总体中不具有某种性质的单位数 在总体中所占的比重为:q=1-p 如果进行对品质标志是非标志进行赋值,即:定义为“1” 和“0”,则有: 6∑X-F_1-PyxN+0-PxN ∑F =P×(1-p) 6=P(1-P) 举例:某小组有10名学员,其成绩如下:现因时间紧迫,任课老 师要从10名学生中任取4人来了解本组中的性别构成,平均成绩 的基本情况,设抽选的资料为1一一4号学员: 4
4 5、参数和统计量 1)概念:参数——根据总体各单位的标志值或标志属性计算 出来的(总体指标) 统计量——根据样本各单位标志值或标志属性计算出来 的(样本指标) 参数和统计量的内容和计算方式一致的,但本质不同,一个 是直接总体的实际数据是唯一的,确定的,固定的。而统计量则 是随着抽样的变化,样本的变化,其指标值也是处于不断的变化 之中的。 2)常用的参数和统计量(指标:平均指标和变异指标) 对于数量标志,计算平均指标和变异指标( , X ) 对于品质标志,计算成数指标(结构相对指标)来表示某 种性质的单位数在总体全部单位数中所占的比重。 即 p=(n1/n),则总体中不具有某种性质的 单位数 在总体中所占的比重为:q=1-p 如果进行对品质标志是非标志进行赋值,即:定义为“1” 和“0”,则有: 2 = − F X X F 2 ( ) = N P N P N2 2 1 2 (1− ) + (0 − ) =P (1-p) = P(1− P) 举例:某小组有 10 名学员,其成绩如下:现因时间紧迫,任课老 师要从 10 名学生中任取 4 人来了解本组中的性别构成,平均成绩 的基本情况,设抽选的资料为 1——4 号学员:
学生代姓名 成绩 1 男 60 2 女 0 3 男 80 4 男 90 10 女 80 通过本题,我们基本上可以将上述几种有关抽样的基本概念 分析清楚:样本与总体,样本容量与样本个数,抽样方法,参数 和统计量等等(直接结合例题和同学们一起分析) 解:男生在样本中的比重为:p=n,/n=3/4=75% 6=VP1-P)=V3/4*1/4=√5/4 x∑X=7561.2 N 二、抽样误差(5课时) (一)抽样误差的基本涵义等 1、涵义:由于随机抽样的偶然因素使样本各单位的结构 不足以代表总体各单位的结构,而引起抽样指标和全 及指标之间的绝对离差
5 学生代 号 姓名 成绩 1 2 3 4 . 10 男 女 男 男 . 女 60 70 80 90 . 80 通过本题,我们基本上可以将上述几种有关抽样的基本概念 分析清楚:样本与总体,样本容量与样本个数,抽样方法,参数 和统计量等等(直接结合例题和同学们一起分析) 解:男生在样本中的比重为:p= n1 n =3/4=75% = P(1− P) = 3/ 4*1/ 4 = 3 /4 X = N X =75 X==11.2 二、 抽样误差(5 课时) (一)抽样误差的基本涵义等 1、涵义:由于随机抽样的偶然因素使样本各单位的结构 不足以代表总体各单位的结构,而引起抽样指标和全 及指标之间的绝对离差
2、性质:(简单复习误差的知识,见第二章,类型) 3、影响因素一一简答题型:总体各单位标志值的差异 程度,样本的单位数,抽样方法,抽样调查组织形式。 (二)抽样平均误差:反映抽样误差的一般水平。 1、抽样平均数的平均误差 (1)在重复抽样条件下,抽样平均数的平均误差和 总体的变异程度以及样本容量大小两个因素,即: (2)在不重复条件下,平均误差为: 云隔 2、抽样成数的平均误差 (1)重复抽样条件下u,=。,20-回 n V n 回不重复样条件下一号肉二6p》 (三)抽样极限误差:可允许的误差范围称为极限误差, 或者说,是统计量与参数离差的最大范围,即: F-X|≤△x=x-r≤X≤x+△x p-P|≤p→p-p≤P≤p+p (四)抽样误差的概率度:1=△ 1=4 u, u
6 2、性质:(简单复习误差的知识,见第二章,类型) 3、影响因素——简答题型: 总体各单位标志值的差异 程度,样本的单位数,抽样方法,抽样调查组织形式。 (二)抽样平均误差:反映抽样误差的一般水平。 1、抽样平均数的平均误差 (1)在重复抽样条件下,抽样平均数的平均误差和 总体的变异程度以及样本容量大小两个因素,即: ux= n (2) 在不重复条件下,平均误差为: ux= n −1 − N N n 2、抽样成数的平均误差 (1)重复抽样条件下 up= n = n p(1− p) (2)不重复抽样条件下 p u = n −1 − N N n ( =p(1-p)) (三)抽样极限误差: 可允许的误差范围称为极限误差, 或者说,是统计量与参数离差的最大范围,即: x - X x x -x X x + x p − P p p − p P p + p (四)抽样误差的概率度: ux x t = up p t =
△x=1×u Ap=txup t的含义(概率度):表示误差范围为抽样平均误差的t 倍,t是测量估计可靠程度的一个参数。 (五)抽样估计的置信度 前面我们学习了两种误差,即平均误差和极限误 差,这两种误差有着不同的含义。(简要复习) 抽样平均误差反映抽样误差一般水平,是样本资 料和总体之间所有离差值的一个平均数。 极限误差指进行抽样在统计工作前设立的一个误 差最大值。二者的关系是1=△ (△=t×u)用抽 样误差概率度来表示的。 我们客观地承认,只要进行抽样调查,必然存在 误差,并且根据经验或工作要求,我们可以设置一个 误差最大值,但要使抽样调查结果一定符合误差在极 限误差范围内,却并非能够实现。所以要保证误差不 超过一定范围的,只能给一定程度的概率保证程度。 抽样估计置信度就是表明抽样指标和总体指标的误差 不超过一定范围的概率保证程度。 举例说明这一概念:现在设我们在很短的时间内 要了解某个企业的职工工资水平,由于时间局限,只 能在300名职工中选出10名,来通过10名职工的平 均工资水平估计全厂职工水平。假设抽样误差不超过 20元,如果这10名职工平均工资为680元,则全厂 7
7 x = t x u u p p = t t 的含义(概率度):表示误差范围为抽样平均误差的 t 倍,t 是测量估计可靠程度的一个参数。 (五)抽样估计的置信度 前面我们学习了两种误差,即平均误差和极限误 差,这两种误差有着不同的含义。(简要复习) 抽样平均误差反映抽样误差一般水平,是样本资 料和总体之间所有离差值的一个平均数。 极限误差指进行抽样在统计工作前设立的一个误 差最大值。二者的关系是 u t = ( = t u ) 用抽 样误差概率度来表示的。 我们客观地承认,只要进行抽样调查,必然存在 误差,并且根据经验或工作要求,我们可以设置一个 误差最大值,但要使抽样调查结果一定符合误差在极 限误差范围内,却并非能够实现。所以要保证误差不 超过一定范围的,只能给一定程度的概率保证程度。 抽样估计置信度就是表明抽样指标和总体指标的误差 不超过一定范围的概率保证程度。 举例说明这一概念:现在设我们在很短的时间内 要了解某个企业的职工工资水平,由于时间局限,只 能在 300 名职工中选出 10 名,来通过 10 名职工的平 均工资水平估计全厂职工水平。假设抽样误差不超过 20 元,如果这 10 名职工平均工资为 680 元,则全厂
职工的平均工资水平应为(660,700)。 但是问题在于,如果我们在选样时被选单位工资 分布较均匀,那么这种代表性当然很强,出现误差数 肯定在20元以内,如果在选样时,被选单位工资过高 (或过低),那么算出来的工资与实际水平的误差就可 能不止20元了,说明因为随机选样,误差水平均不同, 所以无法使得误差水平一定在设定的范围内,而只能 说在这个范围内的一种可能程度、概率,比如说有百 分之九十的可能会使误差在设定范围内。 由此也可见,抽样估计置信度应是一个以百分比 表示的概率数,记作P(概率学中表示概率的符号)。 那么,我们现在来讨论一下P的确定。当误差变 化时,概率怎么变化。 1.首先我们看一下P与△的关系。在其它条件不变的情况下: 我们规定的△(极限误差)越大,抽样的把握程度越大: 反之,我们规定的△(极限误差)越小,抽样的把握程度越小。 即P与△之间是正方向变化。 (P与△之间存在一种函数关系) 举例说明:我们以上堂课中举的例子来看,以密云县太师屯、十 里堡等几个地(随机抽样的结果)的小麦产量来估计全县的 小麦产量,如果设误差最大值△,=100斤,△2=50斤,得(400, 600)、(450,550)两个区间。第一个区间的可能程度应大 于第二区间的可能程度,因为它实际上包括了第二个区间的 可能性。 8
8 职工的平均工资水平应为(660,700)。 但是问题在于,如果我们在选样时被选单位工资 分布较均匀,那么这种代表性当然很强,出现误差数 肯定在 20 元以内,如果在选样时,被选单位工资过高 (或过低),那么算出来的工资与实际水平的误差就可 能不止 20 元了,说明因为随机选样,误差水平均不同, 所以无法使得误差水平一定在设定的范围内,而只能 说在这个范围内的一种可能程度、概率,比如说有百 分之九十的可能会使误差在设定范围内。 由此也可见,抽样估计置信度应是一个以百分比 表示的概率数,记作 P(概率学中表示概率的符号)。 那么,我们现在来讨论一下 P 的确定。当误差变 化时,概率怎么变化。 1.首先我们看一下 P 与 的关系。在其它条件不变的情况下: 我们规定的 (极限误差)越大,抽样的把握程度越大; 反之,我们规定的 (极限误差)越小,抽样的把握程度越小。 即 P 与 之间是正方向变化。 (P 与 之间存在一种函数关系) 举例说明:我们以上堂课中举的例子来看,以密云县太师屯、十 里堡等几个地(随机抽样的结果)的小麦产量来估计全县的 小麦产量,如果设误差最大值 1 =100 斤, 2 =50 斤,得(400, 600)、(450,550)两个区间。第一个区间的可能程度应大 于第二区间的可能程度,因为它实际上包括了第二个区间的 可能性
2.因为前面我们已经学习到△=t×u,所以P与A之间的函数 关系也就是P与t、u之间的函数关系,根据样本资料,u 作为平均误差,可以计算出来,是一个常数,这样,P的值 就依赖于t数值的确定了,由此可以得到P=F(t)即抽样 的置信度可以表示成抽样误差概率度的一个函数,也就是 说,P与t值可以互相确定,知道t值就可以求出P值,反 之亦然。 如:t=1F(t)=P=68.27% 查《正态分布概率分布表》 t=2 F(t)=F(2)=P=95.45% t=3 F(t)=f(3)=P=99.73% t=1.64F(t)=90% t=1.96F(t)=95% 三.抽样估计方法(2课时) (一)参数估计的方法 1点估计:统计量作为参数 基本表现形式:x=Xp=P 2.区间估计:(x-△,x+△)(P-A,P+△) (二)估计的优良标准(填空题、多选题) 1,无偏性:E(x)=XE(p)=P 2.一致性:样本容易→Nx→万 3.有效性:u最小
9 2.因为前面我们已经学习到 = t u ,所以 P 与 之间的函数 关系也就是 P 与 t、u 之间的函数关系,根据样本资料,u 作为平均误差,可以计算出来,是一个常数,这样,P 的值 就依赖于 t 数值的确定了,由此可以得到 P=F(t)即抽样 的置信度可以表示成抽样误差概率度的一个函数,也就是 说,P 与 t 值可以互相确定,知道 t 值就可以求出 P 值,反 之亦然。 如:t=1 F(t)=P=68.27% 查《正态分布概率分布表》 t=2 F(t)=F(2)=P=95.45% t=3 F(t)=F(3)=P=99.73% t=1.64 F(t)=90% t=1.96 F(t)=95% 三.抽样估计方法(2 课时) (一)参数估计的方法 1.点估计:统计量作为参数 基本表现形式: x = X p = P 2.区间估计:( x – , x + ) (P- ,P+ ) (二)估计的优良标准(填空题、多选题) 1.无偏性:E( x )= X E( p )=P 2.一致性:样本容易 → N x → X 3.有效性: u 最小
●抽样估计精度:(计算) 误差率=4 精度=1一误差率=1一4 (三)总体参数的区间估计 1.在给定的概率保证程度的要求下,指出总体参数可能存在 的范围。 2.包括的三个基本要素:x(估计值)、△(误差范围)、 概率保证程度F(t) 3.题型: (1)已知△,求F(t) (2)已知F(t),求区间(实值求A) 「根据样本资料,求、p 求4p 步骤: 据1=△,求出,求出F() 并求出参数的区间范围 根据样本资料,求x、p 求, 步骤:F()已知,则可知t值 利用△=1×4,求出△ 作区间估计 例题1.(题型一)某乡水道总面积2000亩,从中随机抽取 40亩(重复抽样),每亩产量资料如下:
10 ⚫ 抽样估计精度:(计算) 误差率= x x 精度=1—误差率=1— x x (三)总体参数的区间估计 1.在给定的概率保证程度的要求下,指出总体参数可能存在 的范围。 2.包括的三个基本要素: x (估计值)、 (误差范围)、 概率保证程度 F(t) 3.题型: (1)已知 ,求 F(t) (2)已知 F(t),求区间(实值求 ) 步骤: = 并求出参数的区间范围 据 求出 ,求出 ( ) 求 、 根据样本资料,求 、 t F t u t u u x p x p , 步骤: = 作区间估计 利用 求出 已知,则可知 值 求 根据样本资料,求 、 、 , ( ) t u F t t u x p u p x 例题 1.(题型一)某乡水道总面积 2000 亩,从中随机抽取 40 亩(重复抽样),每亩产量资料如下: