西北工业大学：《概率论与数理统计》课程教学资源（讲义）第七章假设检验（7.1）假设检验的基本概念

假设检验是统计推断的另一类重要问题。对总体的分布函数的某些参数或分布函数的形式作某种假设，然后利用样本的有关信息对所作的假设的正确性进行推断，这类统计问题称为假设检验，所作的假设称为原假设(或统计假设)，用H0 表示。

团购合买资源类别：文库，文档格式：PDF，文档页数：5，文件大小：156.81KB

第七章假设检验教学要求 1.理解显著性检验的基本思想,了解假设检验可能产生的两类错误。知道两类错误概率, 并在较简单的情况能计算两类错误概率,掌握假设检验的基本步骤 2.了解单个及两个正态总体的均值和方差的假设检验。 3.了解总体分布假设的拟合优度检验法本章重点:正态总体的参数的假设检验教学内容 §71假设检验的基本概念假设检验是统计推断的另一类重要问题。对总体的分布函数的某些参数或分布函数的形式作某种假设,然后利用样本的有关信息对所作的假设的正确性进行推断,这类统计问题称为假设检验,所作的假设称为原假设(或统计假设,用Ho表示。例71某厂有一批产品,共有200件,需检验合格才能出厂。按国家标准,次品率不得超过3%。今在其中随机地抽取10件,发现其中有2件次品,问这批产品能否出厂? 分析:如果用点估计方法作为检验方法,显然二>3%,这批货物是要被拒出厂的。但是厂家有理由反对用这种检验方法。他们认为,由于抽样是随机的,在这次抽样中,次品的频率超过3%,不等于说这批产品的次品率P(概率)超过了3%。就如同说掷一枚钱币,正反两面出现的概率各为1/2,但若掷两次钱币,不见得正、反面正好各出现一次一样。就是说, 即使该批货的次品率为3%,仍有很大的概率使得在抽检10件产品时出现2个以上的次品, 因此需要用别的方法事实上,对于这类问题,通常就是采用假设检验的方法。具体来说就是先假设次品率 p≤3%,然后从抽样的结果来说明p≤3%这一假设是否合理。注意,这里用的是“合理” 一词,而不是“正确”,粗略地说就是“认为P≤3%”能否说得过去。例7.2某研究所推出一种感冒特效新药,为证明其疗效,选择200名患者为志愿者。将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据。表7.1 是否痊愈痊愈者未痊愈者合计服何种药未服药者服药者 44 100 合计 104

第七章假设检验一. 教学要求 1．理解显著性检验的基本思想，了解假设检验可能产生的两类错误。知道两类错误概率，并在较简单的情况能计算两类错误概率，掌握假设检验的基本步骤。 2．了解单个及两个正态总体的均值和方差的假设检验。 3．了解总体分布假设的拟合优度检验法。本章重点：正态总体的参数的假设检验。二. 教学内容 §7.1 假设检验的基本概念假设检验是统计推断的另一类重要问题。对总体的分布函数的某些参数或分布函数的形式作某种假设，然后利用样本的有关信息对所作的假设的正确性进行推断，这类统计问题称为假设检验，所作的假设称为原假设(或统计假设)，用H0 表示。例 7.1 某厂有一批产品，共有 200 件，需检验合格才能出厂。按国家标准，次品率不得超过 3%。今在其中随机地抽取 10 件，发现其中有 2 件次品，问这批产品能否出厂？分析：如果用点估计方法作为检验方法，显然10 2 ＞3％，这批货物是要被拒出厂的。但是厂家有理由反对用这种检验方法。他们认为，由于抽样是随机的，在这次抽样中，次品的频率超过 3%，不等于说这批产品的次品率（概率）超过了 3%。就如同说掷一枚钱币，正反两面出现的概率各为 1/2，但若掷两次钱币，不见得正、反面正好各出现一次一样。就是说，即使该批货的次品率为 3％，仍有很大的概率使得在抽检 10 件产品时出现 2 个以上的次品，因此需要用别的方法。 p 事实上，对于这类问题，通常就是采用假设检验的方法。具体来说就是先假设次品率 p ≤ 3% ，然后从抽样的结果来说明 p ≤ 3% 这一假设是否合理。注意，这里用的是“合理” 一词，而不是“正确”，粗略地说就是“认为 p ≤ 3% ”能否说得过去。例 7.2 某研究所推出一种感冒特效新药，为证明其疗效，选择 200 名患者为志愿者。将他们均分为两组，分别不服药或服药，观察三日后痊愈的情况，得出下列数据。表 7.1 是否痊愈服何种药痊愈者未痊愈者合计未服药者 48 52 100 服药者 56 44 100 合计 104 96 200

问新药是否确有明显疗效? 分析:这个问题就不存在估计什么的问题。从数据来看,新药似乎有一定疗效,但效果不明显,服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。对于新药上市这样关系到千万人健康的事,一定要采取慎重的态度。这就需要用一种统计方法来检验药效,假设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用因此可以提出假设“新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不能认为新药有明显的疗效。这种提出假设,然后做出否定或不否定的判断通常称为显著性检验假设检验可分为参数检验( Parametric test)和非参数检验( Nonparametric test)。当总体分布形式已知,只对某些参数做出假设,进而做出的检验称为参数检验:对其它假设做出的检验为非参数检验。如例7.1中,总体是两点分布,只需对参数p做出假设检验,这是参数检验问题,而例 72则是非参数检验的问题。 1.假设检验的基本原理 (1)基本原理:小概率原理(或实际推断原理),即“概率很小的事件在一次试验中,实际上可认为几乎不会发生 2)基本思想:采用概率性质的反证法,即先提出假设H,然后根据一次抽样所得的样本值进行计算,若导致小概率事件发生,则否定假设H:;否则,接受假设H 注:所谓“小概率事件”。究竟多大概率为小概率事件?在一个问题中,通常是指定个正数a,0<a<1,认为概率不超过O的事件是在一次试验中不会发生的事件,这个a称为显著性水平。对于实际问题应根据不同的需要和侧重,指定不同的显著性水平。但为了制表方便,通常可选取a=0.01,0.05,0.10等我们将通过下面的例子来阐述假设检验的一般原理和步骤。例7.3某超市为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、白两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得白球, 则中大奖。某人按此规则去摸10次,皆为白球,商店认定此人作弊,拒付大奖,此人不服最后引出官司分析:从统计的观点看,商店的怀疑是有道理的。因为,如果此人摸球完全是随机的,则要正好在10次摸球中均摸到白球的概率为()= 这是一个很小的数。由统计的基本 1024 原理知道:在一次试验中所发生的事件不应该是小概率事件。现在既然这样小概率的事件发生了,就应当推测出此人摸球不是随机的,换句话说有作弊之嫌。上述的这一推断,实际上

问新药是否确有明显疗效？分析：这个问题就不存在估计什么的问题。从数据来看，新药似乎有一定疗效，但效果不明显，服药者在这次试验中的情况比未服药者好，完全可能是随机因素造成的。对于新药上市这样关系到千万人健康的事，一定要采取慎重的态度。这就需要用一种统计方法来检验药效，假设检验就是在这种场合下的常用手段。具体来说，我们先不轻易地相信新药的作用，因此可以提出假设“新药无效”，除非抽样结果显著地说明这假设不合理，否则，将不能认为新药有明显的疗效。这种提出假设，然后做出否定或不否定的判断通常称为显著性检验。假设检验可分为参数检验(Parametric test)和非参数检验(Nonparametric test)。当总体分布形式已知，只对某些参数做出假设，进而做出的检验称为参数检验；对其它假设做出的检验为非参数检验。如例 7.1 中，总体是两点分布，只需对参数做出假设检验，这是参数检验问题，而例 7.2 则是非参数检验的问题。 p 1. 假设检验的基本原理 (1) 基本原理：小概率原理(或实际推断原理)，即“概率很小的事件在一次试验中，实际上可认为几乎不会发生”； (2) 基本思想：采用概率性质的反证法，即先提出假设H0，然后根据一次抽样所得的样本值进行计算，若导致小概率事件发生，则否定假设H0；否则，接受假设H0。注：所谓“小概率事件”。究竟多大概率为小概率事件？在一个问题中，通常是指定一个正数α, 0 <α <1，认为概率不超过α的事件是在一次试验中不会发生的事件，这个α 称为显著性水平。对于实际问题应根据不同的需要和侧重，指定不同的显著性水平。但为了制表方便，通常可选取α =0.01，0.05，0.10 等。我们将通过下面的例子来阐述假设检验的一般原理和步骤。例 7.3 某超市为搞促销，对购买一定数额商品的顾客给予一次摸球中奖的机会，规定从装有红、白两色球各 10 个的暗箱中连续摸 10 次（摸后放回），若 10 次都是摸得白球，则中大奖。某人按此规则去摸 10 次，皆为白球，商店认定此人作弊，拒付大奖，此人不服，最后引出官司。分析：从统计的观点看，商店的怀疑是有道理的。因为，如果此人摸球完全是随机的，则要正好在 10 次摸球中均摸到白球的概率为 1024 1 ) 2 1 ( 10 = ，这是一个很小的数。由统计的基本原理知道：在一次试验中所发生的事件不应该是小概率事件。现在既然这样小概率的事件发生了，就应当推测出此人摸球不是随机的，换句话说有作弊之嫌。上述的这一推断，实际上

就是假设检验的全部过程。下面，我们用假设检验的语言来模拟商店的推断： 1° 提出假设： H0 ：此人未作弊；H1 ：此人作弊其中H0称为原假设，H1称为备选假设或对立假设，备选假设也可以不写。 2° 构造统计量，并由样本算出其观察值取统计量为：N ={在 10 次模球中，摸中白球的个数}．由样本得 N 的观察值为 N =10 . 3° 求出在H0下，统计量 N 的分布在H0下，即如果此人是完全随机地摸球的话，则 ), 2 1 N ~ B(10, 其分布律为 10 10 ) 2 1 ( k pk = C ， k = 0,1,2,",10 4° 给定显著性水平α ，构造对H0不利的小概率事件在H0下，此人摸到的白球数应该在平均数 5 个附近,所以对H0不利的小概率事件是：“白球数 N 大于某个较大的数，或小于某个较小的数”。在此问题中，若H0不成立，即此人作弊的话，不可能故意少摸白球，因此只需考虑事件“ 大于某个较大的数”，这个数常称为临界值，即某个分位数。即取一数 N n(α) ，使得 P{ N ＞ n(α) }=α 如取α =0.01,由分布律算出： 1/1024 0.001, p10 = ≈ 10 /1024 0.01, p9 = ≈ 对于这种离散型概率分布,不一定能取到 n(α) .取最接近的 n ,使当H0 成立时， P{N > n} ≤ α ，因此 n = 9 。即该小概率事件是{N > 9}。 5° 作判断：已算得 N =10，即{N > 9}发生了，而{N > 9}被视为对H0不利的小概率事件,它在一次试验中是不应该发生的，现在{N > 9}居然发生了，只能认为H0是不成立的，即H1：“此人作弊”成立。这一推断过程,也是假设检验的一般步骤，在这些步骤中，关键的技术问题是确定一个适当的用以检验假设的统计量，这个统计量至少应该满足在H0成立的情况下，其抽样分布易于计算（查到）。 2. 拒绝域与临界值设Ω是所有样本观察值 ( , , , ) 的集合，令 1 2 n x = x x " x { , H } W = x x∈Ω x使 0 否定

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录