推断的基本概念 对应于 Tamhane和 Dunlop所著讲义 的第六章 幻灯片由 Elizabeth newton(麻省理工学院制 作,其中一部分由 Jacqueline telford(约翰斯霍 普金斯大学)和 Roy Welsche(麻省理工学院制 作
1 推断的基本概念 • 对应于Tamhane 和 Dunlop所著讲义 的第六章 幻灯片由Elizabeth Newton(麻省理工学院 ) 制 作,其中一部分由Jacqueline Telford(约翰斯霍 普金斯大学 ) 和Roy Welsch(麻省理工学院 ) 制 作
“就像读写能力一样,统计能力有一天会成为 每一个公民必备的能力,。” HG Wells 统计推断: 根据从总体中抽取的样本信息来得出总体情况 的方法 点估计:估计一个未知总体的参数。 置信区间估计:找到以预先指定概率包含参数 的区间。 假设检验:对一个未知的总体参数的假设的检
2 “就像读写能力一样,统计能力有一天会成为 每一个公民必备的能力,。” H.G.Wells 统计推断: 根据从总体中抽取的样本信息来得出总体情况 的方法。 点估计:估计一个未知总体的参数。 置信区间估计:找到以预先指定概率包含参数 的区间。 假设检验:对一个未知的总体参数的假设的检 验
举例 点估计:估计在一条生产线上,平均每 个谷物箱的毛重。 置信区间估计:基于数据找到一个区间 L,U],使之按给定概率包含谷物箱的毛 重均值。 假设检验:谷物箱的最小毛重均值是16 盎司吗?
3 举例 点估计:估计在一条生产线上,平均每 个谷物箱的毛重。 置信区间估计:基于数据找到一个区间 [L,U],使之按给定概率包含谷物箱的毛 重均值。 假设检验:谷物箱的最小毛重均值是16 盎司吗?
统计推断的两个层次 非正式的,用概要统计(也许只是描述 性统计)。 正式的,用概率的方法和样本分布来提 高统计精确度
4 统计推断的两个层次 • 非正式的,用概要统计(也许只是描述 性统计)。 • 正式的,用概率的方法和样本分布来提 高统计精确度
估计问题 点估计:通过一个从样本数据中计算出 来的单个统计量来估计未知总体的参 数。 置信区间估计:从样本数据中计算一个 按照预先给定概率来包含未知总体参数 的区间
5 估计问题 • 点估计:通过一个从样本数据中计算出 来的单个统计量来估计未知总体的参 数。 • 置信区间估计:从样本数据中计算一个 按照预先给定概率来包含未知总体参数 的区间
点估计的术语 估计量=随机变量(「.)θ,X的函数。(从数据 中计算出规则的一般公式) 估计值=从已观测样本数据X1=X1…Xn=Xn计 算出的θ的数值。(从数据中计算出的特定 值) 例如:X~N2 估计量=∑x,,是以=的估计量, X 估计值=∑x(=102),是μ的估计值 x==1 u的其它估计量呢?
6 点估计的术语 估计量 =随机变量 , 的函数。(从数据 中计算出规则的一般公式) 估计值 =从已观测样本数据 中计 算出的 的数值。(从数据中计算出的特定 值) 例如: 估计量= ,是 的估计量, 估计值= (=10.2),是 的估计值。 的其它估计量呢?
估计偏差和方差的计算方法 Bas(6)=E()-6 偏差测量估计量的准确性。 偏差为零的估计量称为无偏的。 但是,样本和样本之间的无偏估计量仍然变 动很大。 ar)=E10-E() 方差越小,估计量越精确。 个低方差的估计量可能是有偏的。 在无偏统计量中,选择方差最小的一个。 “最佳的”=最小方差
7 估计偏差和方差的计算方法 -偏差测量估计量的准确性 。 -偏差为零的估计量称为无偏的 。 -但是,样本和样本之间的无偏估计量仍然变 动很大。 -方差越小,估计量越精确 。 -一个低方差的估计量可能是有偏的。 -在无偏统计量中,选择方差最小的一个。 “最佳的 ”=最小方差
准确性和精确性 既准确准确但精确但既不准确 又精确不精确不准确也不精确
8 准确性和精确性 既准确 准确但 精确但 既不准确 又精确 不精确 不准确 也不精确
均方差 从所有估计量(有偏的和无偏的)中 选出使偏差和方差同时最小的估计量。 个“好的”估计量应该有低偏差(准 确性)和低方差(精确性)。 MSE(0)=Ere-Au2\var(0)+[Bias(0)) MSE=平方误差损失的期望。 Bas()=E(⊙)- Var(6)=E[6-E()
9 均方差 -从所有估计量(有偏的和无偏的)中 选出使偏差和方差同时最小的估计量。 -一个“好的”估计量应该有低偏差(准 确性)和低方差(精确性)。 MSE=平方误差损失的期望
方差估计量 方差的两个估计量: ∑(+是无偏的(例63) S2=∑"(x-)}m是有偏的但有更小的 MSE(例64 尽管出现了较大的MSE,我们通常采用
10 方差估计量 方差的两个估计量: 是无偏的(例6.3) 是有偏的但有更小的 MSE(例6.4) 尽管出现了较大的MSE,我们通常采用 S12