第七章假设检验 教学要求 1.理解显著性检验的基本思想,了解假设检验可能产生的两类错误。知道两类错误概率, 并在较简单的情况能计算两类错误概率,掌握假设检验的基本步骤 2.了解单个及两个正态总体的均值和方差的假设检验。 3.了解总体分布假设的拟合优度检验法 本章重点:正态总体的参数的假设检验 教学内容 §71假设检验的基本概念 假设检验是统计推断的另一类重要问题。对总体的分布函数的某些参数或分布函数的形 式作某种假设,然后利用样本的有关信息对所作的假设的正确性进行推断,这类统计问题称 为假设检验,所作的假设称为原假设(或统计假设,用Ho表示。 例71某厂有一批产品,共有200件,需检验合格才能出厂。按国家标准,次品率不 得超过3%。今在其中随机地抽取10件,发现其中有2件次品,问这批产品能否出厂? 分析:如果用点估计方法作为检验方法,显然二>3%,这批货物是要被拒出厂的。但是厂 家有理由反对用这种检验方法。他们认为,由于抽样是随机的,在这次抽样中,次品的频率 超过3%,不等于说这批产品的次品率P(概率)超过了3%。就如同说掷一枚钱币,正反 两面出现的概率各为1/2,但若掷两次钱币,不见得正、反面正好各出现一次一样。就是说, 即使该批货的次品率为3%,仍有很大的概率使得在抽检10件产品时出现2个以上的次品, 因此需要用别的方法 事实上,对于这类问题,通常就是采用假设检验的方法。具体来说就是先假设次品率 p≤3%,然后从抽样的结果来说明p≤3%这一假设是否合理。注意,这里用的是“合理” 一词,而不是“正确”,粗略地说就是“认为P≤3%”能否说得过去。 例7.2某研究所推出一种感冒特效新药,为证明其疗效,选择200名患者为志愿者。 将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据。 表7.1 是否痊愈 痊愈者未痊愈者合计 服何种药 未服药者 服药者 44 100 合计 104
第七章 假设检验 一. 教学要求 1.理解显著性检验的基本思想,了解假设检验可能产生的两类错误。知道两类错误概率, 并在较简单的情况能计算两类错误概率,掌握假设检验的基本步骤。 2.了解单个及两个正态总体的均值和方差的假设检验。 3.了解总体分布假设的 拟合优度检验法。 本章重点:正态总体的参数的假设检验。 二. 教学内容 §7.1 假设检验的基本概念 假设检验是统计推断的另一类重要问题。对总体的分布函数的某些参数或分布函数的形 式作某种假设,然后利用样本的有关信息对所作的假设的正确性进行推断,这类统计问题称 为假设检验,所作的假设称为原假设(或统计假设),用H0 表示。 例 7.1 某厂有一批产品,共有 200 件,需检验合格才能出厂。 按国家标准,次品率不 得超过 3%。今在其中随机地抽取 10 件,发现其中有 2 件次品,问这批产品能否出厂? 分析:如果用点估计方法作为检验方法,显然10 2 >3%,这批货物是要被拒出厂的。但是厂 家有理由反对用这种检验方法。他们认为,由于抽样是随机的,在这次抽样中,次品的频率 超过 3%,不等于说这批产品的次品率 (概率)超过了 3%。就如同说掷一枚钱币,正反 两面出现的概率各为 1/2,但若掷两次钱币,不见得正、反面正好各出现一次一样。就是说, 即使该批货的次品率为 3%,仍有很大的概率使得在抽检 10 件产品时出现 2 个以上的次品, 因此需要用别的方法。 p 事实上,对于这类问题,通常就是采用假设检验的方法。具体来说就是先假设次品率 p ≤ 3% ,然后从抽样的结果来说明 p ≤ 3% 这一假设是否合理。注意,这里用的是“合理” 一词,而不是“正确”,粗略地说就是“认为 p ≤ 3% ”能否说得过去。 例 7.2 某研究所推出一种感冒特效新药,为证明其疗效,选择 200 名患者为志愿者。 将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据。 表 7.1 是否痊愈 服何种药 痊愈者 未痊愈者 合计 未服药者 48 52 100 服药者 56 44 100 合 计 104 96 200
问新药是否确有明显疗效? 分析:这个问题就不存在估计什么的问题。从数据来看,新药似乎有一定疗效,但效果不明 显,服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。对于新药上市 这样关系到千万人健康的事,一定要采取慎重的态度。这就需要用一种统计方法来检验药 效,假设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用 因此可以提出假设“新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不能认 为新药有明显的疗效。这种提出假设,然后做出否定或不否定的判断通常称为显著性检验 假设检验可分为参数检验( Parametric test)和非参数检验( Nonparametric test)。当总体 分布形式已知,只对某些参数做出假设,进而做出的检验称为参数检验:对其它假设做出的 检验为非参数检验。 如例7.1中,总体是两点分布,只需对参数p做出假设检验,这是参数检验问题,而例 72则是非参数检验的问题。 1.假设检验的基本原理 (1)基本原理:小概率原理(或实际推断原理),即“概率很小的事件在一次试验中,实 际上可认为几乎不会发生 2)基本思想:采用概率性质的反证法,即先提出假设H,然后根据一次抽样所得的样 本值进行计算,若导致小概率事件发生,则否定假设H:;否则,接受假设H 注:所谓“小概率事件”。究竟多大概率为小概率事件?在一个问题中,通常是指定 个正数a,0<a<1,认为概率不超过O的事件是在一次试验中不会发生的事件,这个a称 为显著性水平。对于实际问题应根据不同的需要和侧重,指定不同的显著性水平。但为了制 表方便,通常可选取a=0.01,0.05,0.10等 我们将通过下面的例子来阐述假设检验的一般原理和步骤。 例7.3某超市为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定 从装有红、白两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得白球, 则中大奖。某人按此规则去摸10次,皆为白球,商店认定此人作弊,拒付大奖,此人不服 最后引出官司 分析:从统计的观点看,商店的怀疑是有道理的。因为,如果此人摸球完全是随机的,则要 正好在10次摸球中均摸到白球的概率为()= 这是一个很小的数。由统计的基本 1024 原理知道:在一次试验中所发生的事件不应该是小概率事件。现在既然这样小概率的事件发 生了,就应当推测出此人摸球不是随机的,换句话说有作弊之嫌。上述的这一推断,实际上
问新药是否确有明显疗效? 分析:这个问题就不存在估计什么的问题。从数据来看,新药似乎有一定疗效,但效果不明 显,服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。对于新药上市 这样关系到千万人健康的事,一定要采取慎重的态度。 这就需要用一种统计方法来检验药 效,假设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用, 因此可以提出假设“新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不能认 为新药有明显的疗效。这种提出假设,然后做出否定或不否定的判断通常称为显著性检验。 假设检验可分为参数检验(Parametric test)和非参数检验(Nonparametric test)。当总体 分布形式已知,只对某些参数做出假设,进而做出的检验称为参数检验;对其它假设做出的 检验为非参数检验。 如例 7.1 中,总体是两点分布,只需对参数 做出假设检验,这是参数检验问题,而例 7.2 则是非参数检验的问题。 p 1. 假设检验的基本原理 (1) 基本原理:小概率原理(或实际推断原理),即“概率很小的事件在一次试验中,实 际上可认为几乎不会发生”; (2) 基本思想:采用概率性质的反证法,即先提出假设H0,然后根据一次抽样所得的样 本值进行计算,若导致小概率事件发生,则否定假设H0;否则,接受假设H0。 注:所谓“小概率事件”。究竟多大概率为小概率事件?在一个问题中,通常是指定一 个正数α, 0 <α <1,认为概率不超过α的事件是在一次试验中不会发生的事件,这个α 称 为显著性水平。对于实际问题应根据不同的需要和侧重,指定不同的显著性水平。但为了制 表方便,通常可选取α =0.01,0.05,0.10 等。 我们将通过下面的例子来阐述假设检验的一般原理和步骤。 例 7.3 某超市为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定 从装有红、白两色球各 10 个的暗箱中连续摸 10 次(摸后放回),若 10 次都是摸得白球, 则中大奖。某人按此规则去摸 10 次,皆为白球,商店认定此人作弊,拒付大奖,此人不服, 最后引出官司。 分析:从统计的观点看,商店的怀疑是有道理的。因为,如果此人摸球完全是随机的,则要 正好在 10 次摸球中均摸到白球的概率为 1024 1 ) 2 1 ( 10 = ,这是一个很小的数。由统计的基本 原理知道:在一次试验中所发生的事件不应该是小概率事件。现在既然这样小概率的事件发 生了,就应当推测出此人摸球不是随机的,换句话说有作弊之嫌。上述的这一推断,实际上
就是假设检验的全部过程 下面,我们用假设检验的语言来模拟商店的推断 °提出假设 此人未作弊;H1:此人作弊 其中H称为原假设,H称为备选假设或对立假设,备选假设也可以不写。 2°构造统计量,并由样本算出其观察值 取统计量为:N={在10次模球中,摸中白球的个数}.由样本得N的观察值为N=10 求出在H下,统计量N的分布 在H下,即如果此人是完全随机地摸球的话,则N~B(10,-),其分布律为 P4=Ch6()°,k=0,2…10 4°给定显著性水平a,构造对H不利的小概率事件 在H下,此人摸到的白球数应该在平均数5个附近,所以对H不利的小概率事件是:“白 球数N大于某个较大的数,或小于某个较小的数”。在此问题中,若H不成立,即此人作 弊的话,不可能故意少摸白球,因此只需考虑事件“N大于某个较大的数”,这个数常称 为临界值,即某个分位数。即取一数n(a),使得 PIN>n(a=a 如取a=0.01,由分布律算出 Po=1/1024≈0.001,pg=10/1024≈0.01 对于这种离散型概率分布,不一定能取到n(a).取最接近的n,使当Ho成立时, P{N>n}≤α,因此n=9。即该小概率事件是{N>9}。 5°作判断: 已算得N=10,即{N>9}发生了,而{N>9}被视为对H不利的小概率事件,它在一次 试验中是不应该发生的,现在{N>9}居然发生了,只能认为H是不成立的,即H1:“此人 作弊”成立。 这一推断过程,也是假设检验的一般步骤,在这些步骤中,关键的技术问题是确定一个 适当的用以检验假设的统计量,这个统计量至少应该满足在H成立的情况下,其抽样分布 易于计算(查到) 2.拒绝域与临界值 设Ω是所有样本观察值x=(x1,x2,…,xn)的集合,令 W={xx∈g,x使Ho否定}
就是假设检验的全部过程。 下面,我们用假设检验的语言来模拟商店的推断: 1° 提出假设: H0 :此人未作弊;H1 :此人作弊 其中H0称为原假设,H1称为备选假设或对立假设,备选假设也可以不写。 2° 构造统计量,并由样本算出其观察值 取统计量为:N ={在 10 次模球中,摸中白球的个数}.由样本得 N 的观察值为 N =10 . 3° 求出在H0下,统计量 N 的分布 在H0下,即如果此人是完全随机地摸球的话,则 ), 2 1 N ~ B(10, 其分布律为 10 10 ) 2 1 ( k pk = C , k = 0,1,2,",10 4° 给定显著性水平α ,构造对H0不利的小概率事件 在H0下,此人摸到的白球数应该在平均数 5 个附近,所以对H0不利的小概率事件是:“白 球数 N 大于某个较大的数,或小于某个较小的数”。 在此问题中,若H0不成立,即此人作 弊的话,不可能故意少摸白球,因此只需考虑事件“ 大于某个较大的数”,这个数常称 为临界值,即某个分位数。即取一数 N n(α) ,使得 P{ N > n(α) }=α 如取α =0.01,由分布律算出: 1/1024 0.001, p10 = ≈ 10 /1024 0.01, p9 = ≈ 对于这种离 散型概率分 布,不一定 能取到 n(α) .取最接近的 n ,使当H0 成立时, P{N > n} ≤ α ,因此 n = 9 。即该小概率事件是{N > 9}。 5° 作判断: 已算得 N =10,即{N > 9}发生了,而{N > 9}被视为对H0不利的小概率事件,它在一次 试验中是不应该发生的,现在{N > 9}居然发生了,只能认为H0是不成立的,即H1:“此人 作弊”成立。 这一推断过程,也是假设检验的一般步骤,在这些步骤中,关键的技术问题是确定一个 适当的用以检验假设的统计量,这个统计量至少应该满足在H0成立的情况下,其抽样分布 易于计算(查到)。 2. 拒绝域与临界值 设Ω是所有样本观察值 ( , , , ) 的集合,令 1 2 n x = x x " x { , H } W = x x∈Ω x使 0 否定
则称此集合为H的拒绝域,其余集W称为H的接受域 对应于拒绝域W边界点处的检验统计量的值称为检验H的临界值 注.在检验统计量选定以后,便可构造出由该统计量T描述某个显著性水平α下的一 小概率事件{T∈B},这一小概率事件发生的样本空间的点的全体 W={xx∈9,(x,0)∈Ba} 即为H的拒绝域,通常也简记为W={T∈Ba}最后的检验即是判断所给的样本是否落在W 内,或者是T∈Ba是否成立。因此,从这个意义上可以说,设计一个检验,本质上就是找 到一个恰当的拒绝域W,使得在H下,它的概率 P(x∈WHo成立)=(或≤)a 今后我们总是把统计检验中提到的“小概率事件”视为与拒绝域W是等价的概念。 3.假设检验的基本步骤 (1)根据实际问题的要求,提出原假设H及备选假设H1 (2)构造适当的检验统计量T 要求在H成立的条件下,统计量T的分布是确定和已知的。 (3)给定显著性水平a,确定临界值和拒绝域W (4)由样本观察值计算统计量7的值t (5)作出判断:若t0∈W,则拒绝Ho;否则,接受H 4.两类错误 假设检验的依据是:小概率事件在一次试验中很难发生。但很难发生不等于不发生,因 而假设检验所作的结论也可能是错误的。这种错误有两类: (1)第一类错误:当原假设H为真时,因观察值落在拒绝域W中,而错误地作出拒绝 H的判断。犯第一类错误的概率恰好是显著性水平: a=P{拒绝Ho|Ho为真 (2)第二类错误:当原假设H不真时,因观察值未落在拒绝域W中,而错误地作出接受 的判断。犯第二类错误的概率记为 B=P(接受H0|H0不真 5.单侧检验与双侧检验 双侧检验:备选假设H1的参数区域在原假设H的参数的两侧 如,H H1:H≠0
则称此集合为H0的拒绝域,其余集W 称为H0的接受域。 对应于拒绝域W 边界点处的检验统计量的值称为检验H0的临界值。 注. 在检验统计量选定以后,便可构造出由该统计量T 描述某个显著性水平α 下的一 小概率事件{ },这一小概率事件发生的样本空间的点的全体 T ∈ Bα W ={x x∈Ω, T (x;θ )∈ Bα} 即为H0的拒绝域,通常也简记为W ={T ∈ Bα }.最后的检验即是判断所给的样本是否落在W 内,或者是 是否成立。因此,从这个意义上可以说,设计一个检验,本质上就是找 到一个恰当的拒绝域W ,使得在H T ∈ Bα 0下,它的概率 P(x∈W | H0成立) = (或 ≤)a 今后我们总是把统计检验中提到的“小概率事件”视为与拒绝域W 是等价的概念。 3. 假设检验的基本步骤 (1) 根据实际问题的要求,提出原假设H0及备选假设H1. (2) 构造适当的检验统计量 T; 要求在H0成立的条件下,统计量T的分布是确定和已知的。 (3) 给定显著性水平α ,确定临界值和拒绝域W ; (4) 由样本观察值计算统计量T的值t0; (5) 作出判断:若 t0 ∈W,则拒绝 H0;否则,接受H0。 4. 两类错误 假设检验的依据是:小概率事件在一次试验中很难发生。但很难发生不等于不发生,因 而假设检验所作的结论也可能是错误的。这种错误有两类: (1) 第一类错误:当原假设H0为真时, 因观察值落在拒绝域W 中,而错误地作出拒绝 H0的判断。犯第一类错误的概率恰好是显著性水平: P{ }. α = 拒绝H0 H0为真 (2) 第二类错误:当原假设H0不真时,因观察值未落在拒绝域W 中,而错误地作出接受 H0的判断。犯第二类错误的概率记为 P{ }. β = 接受H0 H0不真 5. 单侧检验与双侧检验 双侧检验:备选假设H1的参数区域在原假设H0的参数的两侧 如,H0: µ = µ 0 H1: µ ≠ µ 0
单侧检验:备选假设H1的参数区域在原假设H的参数的一侧 如,H;4=10 H1:>0
单侧检验:备选假设H1的参数区域在原假设H0的参数的一侧 如,H0: µ = µ 0 H1: µ > µ 0