第七章 假设检验 *统计推断的另一个主要方面是统计假设检验 在这一章里我们将讲座统计假设的检验问题, 顺便也介绍一些区间估计的内容 *§7.1假设检验的基本思想和概念 *前一章中我们讲座了如何根据子样去得到母 体分布所含参数的优良估计.以如此得到的估 计值作为参数的已知值的一个母体必须与真 的母体作比较,考察它们之间是否在统计意义 上相似合.显然,这种比较也只能在子样的基础 上进行.怎样在子样基础上作出一个有较大把 握的结论就是统计假设检验问题.实际上很多 问题都可以作为统计假设检验问题予以解决. 我们用一个例子来说明:
第七章 假设检验 统计推断的另一个主要方面是统计假设检验. 在这一章里我们将讲座统计假设的检验问题, 顺便也介绍一些区间估计的内容. § 7.1 假设检验的基本思想和概念 前一章中我们讲座了如何根据子样去得到母 体分布所含参数的优良估计.以如此得到的估 计值作为参数的已知值的一个母体必须与真 的母体作比较,考察它们之间是否在统计意义 上相似合.显然,这种比较也只能在子样的基础 上进行.怎样在子样基础上作出一个有较大把 握的结论就是统计假设检验问题.实际上很多 问题都可以作为统计假设检验问题予以解决. 我们用一个例子来说明
例7.1 设某厂生产一种灯管,其寿命服从正态分 布.N(μ;40000),从过去较长一段时间的生产情祝来看,灯管的 平均寿命为μ=1500小时现在采用新工艺后,在所生产的灯 管中抽取25只,测得平均寿命为1675小时.问采用新工艺后, 灯管寿命是否是显著提高?我们的问题就是要判别新产品的 寿命是服从μ>1500的正态分布呢?还是与老产品一样仍然 服从μ=1500的正态分布呢?若是前者,我们说新产品的寿命 有显著提高,若是后者,就说没有显著提高。 今后我们把任意一个有关未知分布的假设称为统计假设 或简称假设.在上面的例子中,我们可以把所有涉及到的两种
情况用统计假设的形式表示出来.第一个统计假设μ=1500表 示彩新工艺后产品平均寿命没有显著增加第二个统计假设 μ>1500表示采用新工艺后产品平均寿命有显著增加.这第 个假设我们称为原假设,用符号H。:μ=1500表示,第二个假 设μ>1500表示称为备择假设,用符号H1:μ>1500表示至于 在两个假设中用哪一个作为原假设,哪一个作为备择假设,要 看具体的目的和要求而定假如我们的目的是希望从子样观 察值对某一陈述取得强有力的支持,我们把这一陈述的否定 作为原假设,而陈述本身作为备择假设.很多实际例子都是这 样的譬如例7.1中所提出的新工艺对产品寿命确有提高,但它 又不可能象老产品那样有较多的数据.为此,我们取“寿命没有
提高(μ=1500”作原假设,并以“提高寿命(μ>1500)”作 备择假设.有时,原假设的选定还要考虑到数学上的处理方便 在许多问题中,母体分布的类型为已知,仅是一个或几个 参数为未知,只要对这一个或几个未知参数的值作出假设,就 可完全确定母体的分布这种仅涉及到母体分布的未知参数 的统计假设称为参数假设.如上例中就是只对参数μ作出假 设在有些实际问题中,我们不知道母体分布的具体类型譬如 某种家作物的家药残留量,它可能服从对数正态分布,也可能 服从其它的分布因此,统计假设只能对未知分布函数的类型 或者它的某些特征提出某种假设.这种不同于参数假设的统 计假设称作非参数假设.例如
H,F(8)∈对数正态分布族) H,F()∈正态分布族) 上面看到,一个统计假设是关于母体分布状态的一种陈述 如果一个统计假设完全确定母体的分布,则称这假设为简单 统计假设或简单假设,否则就称为复合统计假设或复合假设 如例7.1中H0:μ=1500,完全确定母体分布N(1500,40000),所 以H,为简单假设.H1:μ>1500就是一个复合假设在非参 数假设情形,若原假设H,F(x=F,(,F。(8为具有参数山
=2, ∂2=10的对数正态分布,这就是一个简单假设;若 原假设HnF8∈对数正态分布族),它没有指定F(x是对 数分布族中哪一个分布,这就是一个复合假设,又如,我们要检 验两个子样是否来自同一母体,我们作假设H,F(8=G(8),这 里F(8和G(8分别表示这两个子样的分布函,但不指定这两 个分布的具体形式这也是一个复合假设. 统计假设检验问题的一般提法是:在给定备择假设H,下
对原假设H作出判断,若拒绝原假设H。,那就意味着接受备 择假设H,否则就接受假设H,简单的说,假设检验问题就是 要在原假设H和备择假设H,中作出拒绝哪一个接受娜一 个的判断这类假设检验问题常常简称为H对H,的检验问 题 在H,对H的检验问题中作出某种判断,必须要从子样
(51,…,5m出发,制定一个法则,一旦子样的观察值(x1…,x) 确定后,利用我们所构造的法则作出判断;拒绝H,还是拒绝 H1这种法则就称为H。对H,的一个检验法则,有时就简称为 一个检验法则,或一个检验 我们的检验法则是什么呢?显然,它应该是以定义在子样 空间上的一个函数为依据所构成的一个准则一旦子样观察 什(x1…,x)确定后,我们就可根据这一准则作出判断;拒绝 H。还是接受H。所以我们的检验法则本质上就是把子样空
间x划分成两个互不相交的子集C和C,使得当子样 (51,…,)的观察值点(石1…,x)EC,我们将拒绝原假设 H(即接受备择假设H)若(x1…,x)EC”,我们将接受原 假设H(也即拒绝备择假设H)这样的划分构成一个准则, 我们称这个子样空间的子集C为检验的临域(或拒绝域) 假如我们给出了H对H,的某个检验法则,亦即给出了X 的一个划分C与C'.由于子样的随机性,在进行判断时,我们
还是有可能犯两类错误一类错误是,当H。为真时,而子样的 观察值落入C,按给定的检验法则,我们应当拒绝H。,这种错 误称为第一类错误其发生的概率称为犯第一类错误的概率 或称拒真概率.通常记为a即 gizs P拒绝H。|H。为真)=a 在上面的例子中就是 P(x1…,xw)∈Cμ=0)=a 另一种错误是,当H,为真时,而子样的观察落入C∵,按给定的