第九章参数估计 (Parameters estimation) 参数估计,通俗地说,就是根据抽样结果 来合理地、科学地估计总体的参数很可能是什 么?或者在什么范围。 点估计:根据样本数据算出一个单一的估 计值,用来估计总体的参数值。 区间估计:计算抽样平均误差,指出估计 的可信程度,进而在点估计的基础上,确定总 体参数的所在范围或区间
第九章 参数估计 (Parameter’s estimation) 参数估计,通俗地说,就是根据抽样结果 来合理地、科学地估计总体的参数很可能是什 么?或者在什么范围。 点估计:根据样本数据算出一个单一的估 计值,用来估计总体的参数值。 区间估计:计算抽样平均误差,指出估计 的可信程度,进而在点估计的基础上,确定总 体参数的所在范围或区间
第一节点估计( Point estimation) 点估计:点值估计,是以一个最适当的 样本统计值来代表总体参数值 估计量如果具有无偏性、一致性和有效 性,就可以认为这种统计量是总体参数的合理 估计或最佳估计
第一节 点估计(Point estimation) 点估计:点值估计,是以一个最适当的 样本统计值来代表总体参数值。 估计量如果具有无偏性、一致性和有效 性,就可以认为这种统计量是总体参数的合理 估计或最佳估计
求点估计值的标准 无偏性:要求统计量抽样分布的均值恰好等 于被估计的参数之值。比如,中心极限定理告诉 我们,样本均值抽样分布的均值恰好等于总体均 值,因此用样本均值估计总体均值就满足这个标 准。 有效性:要求估计值的抽样分布有较小的分 散性,即选择抽样分布的标准差较小的统计量作 为估计量。 致性:要求统计量随着样本容量n的增大 以更大的概率接近被估计参数
一、求点估计值的标准 无偏性:要求统计量抽样分布的均值恰好等 于被估计的参数之值。比如,中心极限定理告诉 我们,样本均值抽样分布的均值恰好等于总体均 值,因此用样本均值估计总体均值就满足这个标 准。 有效性:要求估计值的抽样分布有较小的分 散性,即选择抽样分布的标准差较小的统计量作 为估计量。 一致性:要求统计量随着样本容量n的增大 以更大的概率接近被估计参数
二、点估计值的计算 1.总体均值的点估计 2.总体方差的点估计值 ∑(X1-x)2 在统计学中,常常用符号“S”来表示无偏估 计量。数学上可以证明,对于随机样本而高2才是 总体方差的无偏估计量,它称为修正样本方差
在统计学中,常常用符号“ ” 来表示无偏估 计量。数学上可以证明,对于随机样本而言, 才是 总体方差 的无偏估计量,它称为修正样本方差 。 二、点估计值的计算 1. 总体均值的点估计 2. 总体方差的点估计值
例]研究者要调查某社区居民家庭收入分 布的差异情况,现随机抽査了10户,得到样本 方差为=200元)。试以此资料估计总体家庭 收入分布的差异情况。 「解]因为样本容量较小,宜用修正样本 方差作为总体方差点估计量。即 10 ×200=2222 10-1
[例]研究者要调查某社区居民家庭收入分 布的差异情况,现随机抽查了10户,得到样本 方差为=200(元2 )。试以此资料估计总体家庭 收入分布的差异情况。 [解] 因为样本容量较小,宜用修正样本 方差作为总体方差点估计量。即 = = =222.2
第二节区间估计( Interval estimation) 区间估计的任务是,在点估计值的两侧设置 个区间,使得总体参数被估计到的概率大大增 加。可靠性和精确性(即信度和效度)在区间估计中 是相互矛盾的两个方面 有关区间估计的几个概念 1.置信区间:区间估计是求所谓置信区间的方法。置 信区间就是我们为了增加参数被估计到的信心而在 点估计两边设置的估计区间 2.显著性水平:用置信区间来估计的不可靠程度
第二节 区间估计(Interval estimation) 一、有关区间估计的几个概念 1. 置信区间:区间估计是求所谓置信区间的方法。置 信区间就是我们为了增加参数被估计到的信心而在 点估计两边设置的估计区间。 2. 显著性水平 :用置信区间来估计的不可靠程度。 区间估计的任务是,在点估计值的两侧设置 一个区间,使得总体参数被估计到的概率大大增 加。可靠性和精确性(即信度和效度)在区间估计中 是相互矛盾的两个方面
3.置信度(水平)1-a:用置信区间估计的可靠性 (把握度) 4.抽样平均误差σx与概率度Z 抽样平均误差σx:样本均值抽样分布的标准差。 反映在参数周围抽样平均值的平均变异程度。 σx越大,样本均值越分散 概率度:Z在参数估计中被称为概率度,其大 小座决定
3. 置信度(水平) :用置信区间估计的可靠性 (把握度) 4. 抽样平均误差 与概率度 Z 抽样平均误差 :样本均值抽样分布的标准差。 反映在参数周围抽样平均值的平均变异程度。 越大,样本均值越分散。 概率度:Z在参数估计中被称为概率度,其大 小由 决定
显著性水平、置信水平、概率度 之间的关系: =010时,1-a=0.90,Z2=165 a=005时,1-=0.95,Zm2=1.96 a=0.01时,1-a=0.9,Za2=258 a/2
显著性水平、置信水平、概率度 之间的关系: =0.10时, =0.90,Z α/2=1.65 =0.05时, =0.95,Z α/2=1.96 =0.01时, =0.99,Z α/2=2.58
区间估计的做法 从点估计值开始,向两侧展开一定倍数的抽样平 均误差,并估计总体参数很可能就包含在这个区间之 内 X-20x≤HsX+20x 对 1.96021.60 3.X 1960-196011960411.960
二、区间估计的做法 从点估计值开始,向两侧展开一定倍数的抽样平 均误差,并估计总体参数很可能就包含在这个区间之 内
对参数的区间估计的步骤: 1.首先从总体抽取一个样本,根据收集的样本资 料求出它的均值。 2.根据合乎实际的置信水平查表求得概率度 3.根据总体标准差和样本容量求出抽样平均误差 4.以均值为基准,向两侧展开Z倍抽样平均误差 的区间。 抽样极限误差(更普遍地可以写成抽样估计的允许误差e △=Z0 抽样估计的精度 △ A=1
对参数 的区间估计的步骤: 1. 首先从总体抽取一个样本,根据收集的样本资 料求出它 的均值。 2. 根据合乎实际的置信水平查表求得概率度 3. 根据总体标准差和样本容量求出抽样平均误差 4. 以均值为基准,向两侧展开 倍抽样平均误差 的区间。 抽样极限误差(更普遍地可以写成抽样估计的允许误差 ) 抽样估计的精度