结论的过程 从数据得到对现实世界的 统计推断
统计推断 从数据得到对现实世界的 结论的过程
佔计 ·总体它代表我们所关心的那部分现实世界。 而在利用样本中的傖鳥來对总体进行推断 之前人们一敷对代表总体的变量假定了分 布族。比如假定人们的身高属于正分布 族:对抽样调查假定了二项分布族等等 这些模型基本上是視据经验来假定的。所 以仅仅是对现实世界的一个近似。在假定 了总体分布族之后,进一步对总体的认识 就是要在这个分布族中选择一个适合于我 价问题的分布。由于分布族成员是由参数 确定的,如果参数能够佑计,对总体的具 体分布就知道得差不多了
估计 • 总体它代表我们所关心的那部分现实世界。 而在利用样本中的信息来对总体进行推断 之前人们一般对代表总体的变量假定了分 布族。比如假定人们的身高属于正态分布 族;对抽样调查假定了二项分布族等等。 这些模型基本上是根据经验来假定的,所 以仅仅是对现实世界的一个近似。在假定 了总体分布族之后,进一步对总体的认识 就是要在这个分布族中选择一个适合于我 们问题的分布;由于分布族成员是由参数 确定的,如果参数能够估计,对总体的具 体分布就知道得差不多了
估计 种是点估讣( point estimation),也就是用 佑计量的奥现值來近似相疝的总体参数。 另一种是区间估讣( Interval estimation);它 是包括估计量在内(有时是以估计量为中 心)的一个区间;该区间被认为很可能包 含总体参数。 点估计给出一个数字。用起来很方便:而 区间估计给出一个区间,说起来留有余地; 不象点佑计那么绝对 元偏估计(大样本性质) 区间估计的置信度(大样本性质)
估计 • 一种是点估计(point estimation),也就是用 估计量的实现值来近似相应的总体参数。 • 另一种是区间估计(interval estimation);它 是包括估计量在内(有时是以估计量为中 心)的一个区间;该区间被认为很可能包 含总体参数。 • 点估计给出一个数字,用起来很方便;而 区间估计给出一个区间,说起来留有余地; 不象点估计那么绝对。 • 无偏估计(大样本性质) • 区间估计的置信度(大样本性质)
估计 ·注意置信区间的论迷是由区间和置信 度两部分组成。有些新闻媒体报熴 些调查结果只给出百分比和误差(即 量信区间),并不说明量信度,也不 给出被调查的人数。这是不负货的表 现。因为降低置信度可以使量信区间 变窄(显得“犄确”),有误导读者 之嫌。如果给出被调查的人数,则内 行可以由推算出量信度(由后面给出 的公式),反之亦然
估计 • 注意置信区间的论述是由区间和置信 度两部分组成。有些新闻媒体报道一 些调查结果只给出百分比和误差(即 置信区间),并不说明置信度,也不 给出被调查的人数,这是不负责的表 现。因为降低置信度可以使置信区间 变窄(显得“精确”),有误导读者 之嫌。如果给出被调查的人数,则内 行可以由推算出置信度(由后面给出 的公式),反之亦然
个描迷性例子 个有10000个人回答的调查显示,同意某 种观点的人的比例为70%(有7000人同 意),可以算出总体中同意该观点的比例 的95%量信区间为(0.691,0.709);另 个调查声称有70%的比例反对该种观点, 还说总体中反对该观点的置傖区间也是 (0.691,0.709)。到底相信谁呢?实际上, 第二个调査隐瞒了置信度(等价于隐瞒了 样本量)。如果第二个调查仅仅调查了50 个人,有35个人反对该观点。根据后面的 公式可以犷出。第二个调查的置信区间的 置信度仅有11%
一个描述性例子 • 一个有10000个人回答的调查显示,同意某 种观点的人的比例为70%(有7000人同 意),可以算出总体中同意该观点的比例 的95%置信区间为(0.691,0.709);另一 个调查声称有70%的比例反对该种观点, 还说总体中反对该观点的置信区间也是 (0.691,0.709)。到底相信谁呢?实际上, 第二个调查隐瞒了置信度(等价于隐瞒了 样本量)。如果第二个调查仅仅调查了50 个人,有35个人反对该观点。根据后面的 公式可以算出,第二个调查的置信区间的 置信度仅有11%
假设检验 在假设检验中,一般要设立一个原假设; 而设立该假设的动机主要是企图利用人们 握的反映现实世界的教据來找出假设和 现实的矛盾,从而否定这个假设。在多数 统计教科书中(除了理论探讨之外)的假 设检验都是以否定原假设为目标。 如果否定不了。那就说明证据不足。元法 否定原假设。但这不能说明原假设正确 很多教科节在这个问题上不适当地用“接 受原假设”的说法。犯了明显的低级逻辑
假设检验 • 在假设检验中,一般要设立一个原假设; 而设立该假设的动机主要是企图利用人们 掌握的反映现实世界的数据来找出假设和 现实的矛盾,从而否定这个假设。在多数 统计教科书中(除了理论探讨之外)的假 设检验都是以否定原假设为目标。 • 如果否定不了,那就说明证据不足,无法 否定原假设。但这不能说明原假设正确。 很多教科书在这个问题上不适当地用“接 受原假设”的说法,犯了明显的低级逻辑 错误
假设检验的过程和逻辑 首先要提出一个原假设。比如某正恋 总体的均值等于5(m=5)。这种原假 设也称为零假设( null hypothesis), 记为H 0 ·与此同时必须提出对立假设。比如总 体均值大于5(m>5)。对立假设又称 为备选假设或备择假设( alternative hypothesis)记为记为H1或H2o
假设检验的过程和逻辑 • 首先要提出一个原假设,比如某正态 总体的均值等于5(m=5)。这种原假 设也称为零假设(null hypothesis), 记为H0。 • 与此同时必须提出对立假设,比如总 体均值大于5(m>5)。对立假设又称 为备选假设或备择假设(alternative hypothesis)记为记为H1或Ha
假设检验的过程和逻 据零设(不是备选假设!),我 们可以得到该裣验统计量的分布; ·然后再看这个统计量的教据实现值 ( realization)属不属于小概率事件。 也就是说把数据代入检验统计量,看 其值是否落入零假设下的小概率驼喷; 如果的确是小概率事件,那么我们就 有可能拒绝粵假设。否则我们说没有 足郇证据拒绝粵假设
假设检验的过程和逻辑 • 根据零假设(不是备选假设!),我 们可以得到该检验统计量的分布; • 然后再看这个统计量的数据实现值 (realization)属不属于小概率事件。 也就是说把数据代入检验统计量,看 其值是否落入零假设下的小概率范畴; • 如果的确是小概率事件,那么我们就 有可能拒绝零假设,否则我们说没有 足够证据拒绝零假设
假设检验的过程和逻髯 注危:零假设和鲁选假设在假桠验 中并不划称。因检验统计量的分布是 从零假设导出的。因此。如果发生 盾,当然就对零假设不利了。 不发生子盾也不说明音选假设有问题 (因为和备选假设无关)
假设检验的过程和逻辑 • 注意:零假设和备选假设在假设检验 中并不对称。因检验统计量的分布是 从零假设导出的,因此,如果发生矛 盾,当然就对零假设不利了。 • 不发生矛盾也不说明备选假设有问题 (因为和备选假设无关)
假设检验的过程和逻髯 ·检验统计量在粵假设下等于这个样本的数 据奥现值或更加极端值的概率称为p-值(p value)o 显然得到很小P值意味着小概率事件发生 了。如果小概率事件发生,是相信粵假设 还是相信数据呢? 当然是相信数据。于是就拒绝零假设。但 小概率并不能说明不会发生。仅仅发生的 概率很小了。 拒绝正确粵假谀的错误常被称为第一类错 误( type I error)
假设检验的过程和逻辑 • 检验统计量在零假设下等于这个样本的数 据实现值或更加极端值的概率称为p-值(pvalue)。 • 显然得到很小p-值意味着小概率事件发生 了。如果小概率事件发生,是相信零假设, 还是相信数据呢? • 当然是相信数据。于是就拒绝零假设。但 小概率并不能说明不会发生,仅仅发生的 概率很小罢了。 • 拒绝正确零假设的错误常被称为第一类错 误(type I error)