中国科学技术大学：《概率论与数理统计》课程教学资源（课件讲义）第七章假设检验 7.1 基本概念与重要参数的检验

团购合买资源类别：文库，文档格式：PDF，文档页数：15，文件大小：246.95KB

第七讲：假设检验 7.1基本概念和问题的提法 1 7.1.1基本概念 7.1. 2原假设的提法.·· 9 7.1.3检验统计量的选取及假设检验的步骤.11 Previous Next First Last Back Forward 1

第七讲: 假设检验 7.1 基本概念和问题的提法 . . . . . . . . . . . . . 1 7.1.1 基本概念 . . . . . . . . . . . . . . . . 1 7.1.2 原假设的提法 . . . . . . . . . . . . . . 9 7.1.3 检验统计量的选取及假设检验的步骤 . 11 Previous Next First Last Back Forward 1

7.1基本概念和问题的提法 ·(统计)假设：在数理统计中，关于总体分布的概率性质的假定.例如假设正态总体，二项总体等，或者二项总体中成功概率 p≤0.5等等. 。(统计)检验：使用样本对所作出的假设进行检查的方法和过程。 7.1.1基本概念假设检验问题就是研究如何根据抽样后获得的样本来检查抽样前所作假设是否合理，首先，由一个例子引出一些基本概念。某厂产品出厂检验规定：每批产品次品率p不超过4%才能出下Example 厂。现从某批产品10000件中任意抽查12件发现4件次品，问该批产品能否出厂？若抽得结果是1件次品呢？ ⊥Example Previous Next First Last Back Forward

7.1 基本概念和问题的提法 • (统计) 假设: 在数理统计中, 关于总体分布的概率性质的假定. 例如假设正态总体, 二项总体等, 或者二项总体中成功概率 p ≤ 0.5 等等. • (统计) 检验: 使用样本对所作出的假设进行检查的方法和过程. 7.1.1 基本概念假设检验问题就是研究如何根据抽样后获得的样本来检查抽样前所作假设是否合理. 首先, 由一个例子引出一些基本概念. ↑Example 某厂产品出厂检验规定：每批产品次品率 p 不超过 4% 才能出厂。现从某批产品 10000 件中任意抽查 12 件发现 4 件次品，问该批产品能否出厂？若抽得结果是 1 件次品呢？ ↓Example Previous Next First Last Back Forward 1

解：若以p表示此批产品的次品率，则问该批产品能否出厂等价于即要检验次品率p是否不超过4%。我们假设“p≤4%”，并记Y为 12件中的次品数，由于总产品数很大，故可以认为Y~B(12,p), 此时当p≤0.04时， P(Y=4) 19 0.0440.96=0.000914 这是一个小概率事件，即当p≤0.04时，12件产品中有4件是次品的概率不到1/1000，这样的事件在一次试验中几乎是不可能发生的，但确实发生了（我们观察到了4件次品），因此更倾向于怀疑假设 “p≤0.04”的正确性，即认为它不成立。而由于 P(Y=1) 0.040.9612=0.306 即此时当假设“p≤0.04”成立时，“12个产品中有一个次品”这一事件的概率最大为0.306，这个事件不是小概率事件。因此我们没有足够的证据支持原假设不成立这一说法。 Previous Next First Last Back Forward

解: 若以 p 表示此批产品的次品率，则问该批产品能否出厂等价于即要检验次品率 p 是否不超过 4%。我们假设“p ≤ 4%”，并记 Y 为 12 件中的次品数，由于总产品数很大，故可以认为 Y ∼ B(12, p)，此时当 p ≤ 0.04 时， P(Y = 4) = ( 12 4 ) p 4 q 8 < ( 12 4 ) 0.044 0.968 = 0.000914 这是一个小概率事件，即当 p ≤ 0.04 时，12 件产品中有 4 件是次品的概率不到 1/1000，这样的事件在一次试验中几乎是不可能发生的，但确实发生了 (我们观察到了 4 件次品), 因此更倾向于怀疑假设 “p ≤ 0.04”的正确性，即认为它不成立。而由于 P(Y = 1) ≤ ( 12 1 ) 0.041 0.9612 = 0.306 即此时当假设“p ≤ 0.04”成立时，“12 个产品中有一个次品”这一事件的概率最大为 0.306，这个事件不是小概率事件。因此我们没有足够的证据支持原假设不成立这一说法。 Previous Next First Last Back Forward 2

某饮料厂在自动流水线上罐装饮料.在正常生产情况下，每瓶饮下Example 料的容量（单位：毫升）X服从正态分布N(500,10)(由以往的经验得知).经过一段时间之后，有人觉得每瓶饮料的平均容量减小到490，于是抽取了9瓶样品，称得它们的平均值为元=492毫升.试问此断言是否正确？即问平均每瓶饮料的容量仍是500毫升还是变成490 毫升？假定标准差10毫升不变 ⊥Example 在这个问题中，统计假设：罐装饮料容量X~N(4,10) 问题：根据样本来在“μ=500”和“μ=490”之间作判断. 数理统计中，把它们看成两个假设.习惯上，称前者为原假设或零假设，记作Ho:后者称为备择假设或对立假设，记作H1或H。·所谓检验 H0:μ=500←+H1:4=490. Previous Next First Last Back Forward 3

↑Example 某饮料厂在自动流水线上罐装饮料. 在正常生产情况下, 每瓶饮料的容量 (单位: 毫升) X 服从正态分布 N(500, 102 ) (由以往的经验得知). 经过一段时间之后, 有人觉得每瓶饮料的平均容量减小到 490, 于是抽取了 9 瓶样品, 称得它们的平均值为 x¯ = 492 毫升. 试问此断言是否正确? 即问平均每瓶饮料的容量仍是 500 毫升还是变成 490 毫升? 假定标准差 10 毫升不变. ↓Example 在这个问题中, 统计假设: 罐装饮料容量 X ∼ N(µ, 102 ). 问题: 根据样本来在 “µ = 500” 和 “µ = 490” 之间作判断. 数理统计中, 把它们看成两个假设. 习惯上, 称前者为原假设或零假设, 记作 H0; 后者称为备择假设或对立假设, 记作 H1 或 Ha. 所谓检验 H0 : µ = 500 ↔ H1 : µ = 490. Previous Next First Last Back Forward 3

就是要根据样本判断究竟是“Ho成立”还是“H1成立”.断言“Ho 成立”称为不能拒绝Ho;断言“H1成立”称为拒绝Ho. 下面讨论如何检验上述假设，即给定一个接受或者拒绝零假设的准则.设从总体中抽取一个样本X1,·,X,我们可以用极大似然估计T=(称之为检验统计量)来估计4.由于该估计值接近μ（尤其是当样本量较大时)，故当T的绝对值小的时候有利于H1而不利于Ho,此时应该拒绝Ho.我们可以事先取定一个常数T,称之为临界值，当T的取值小于该临界值时拒绝Ho,即样本满足 W={区<} 中时拒绝Ho,称W为拒绝域.即样本的取值落在拒绝域中，就拒绝 Ho,否则不能拒绝之.一个拒绝域就对应于一个检验方法.现在的问题是T应该取多大？这涉及到两类错误 Previous Next First Last Back Forward 4

就是要根据样本判断究竟是 “H0 成立” 还是 “H1 成立”. 断言 “H0 成立” 称为不能拒绝 H0; 断言 “H1 成立” 称为拒绝 H0. 下面讨论如何检验上述假设, 即给定一个接受或者拒绝零假设的准则. 设从总体中抽取一个样本 X1, · · · , Xn, 我们可以用极大似然估计 T = X¯ (称之为检验统计量) 来估计 µ. 由于该估计值接近 µ (尤其是当样本量较大时), 故当 T 的绝对值小的时候有利于 H1 而不利于 H0, 此时应该拒绝 H0. 我们可以事先取定一个常数 τ , 称之为临界值, 当 T 的取值小于该临界值时拒绝 H0, 即样本满足 W = {X < τ ¯ } 中时拒绝 H0, 称 W 为拒绝域. 即样本的取值落在拒绝域中, 就拒绝 H0, 否则不能拒绝之. 一个拒绝域就对应于一个检验方法. 现在的问题是 τ 应该取多大? 这涉及到两类错误. Previous Next First Last Back Forward 4

事实 Ho成立 H1成立决策不拒绝Ho 不犯错第Ⅱ类错误拒绝Ho 第I类错误不犯错 ·称“实际上Ho成立但是它被拒绝”这个错误为第I类错误 (弃真) ·“实际上Ho不成立但是它没有被拒绝”这样一类错误为第IⅡ 类错误（存伪）而由于我们的方法是基于观测数据，而观测数据是带有随机误差的，故难免在做出决策的时候犯错，我们能做的是控制犯错的概率，一个理想的检验应该使这两类错误的概率都小，但是在实际问题中不可能使这两类错误一致地小：要让犯第I类错误的概率小，应该让T小，而要让犯第Ⅱ类错误的概率小，则T不能太小.解决这个矛盾的一个方法是在控制I类错误的基础上，尽量少犯第II类错误 Previous Next First Last Back Forward

P 决策 PPPPPPPP 事实 H0 成立 H1 成立不拒绝 H0 不犯错第 II 类错误拒绝 H0 第 I 类错误不犯错 • 称 “实际上 H0 成立但是它被拒绝” 这个错误为第 I 类错误 (弃真) • “实际上 H0 不成立但是它没有被拒绝” 这样一类错误为第 II 类错误 (存伪). 而由于我们的方法是基于观测数据, 而观测数据是带有随机误差的, 故难免在做出决策的时候犯错, 我们能做的是控制犯错的概率. 一个理想的检验应该使这两类错误的概率都小, 但是在实际问题中不可能使这两类错误一致地小: 要让犯第 I 类错误的概率小, 应该让 τ 小, 而要让犯第 II 类错误的概率小, 则 τ 不能太小. 解决这个矛盾的一个方法是在控制 I 类错误的基础上, 尽量少犯第 II 类错误 Previous Next First Last Back Forward 5

(在下一小节中我们讨论如何设定假设时会提到，应该将受保护对象设为零假设，故犯第I类错误的严重性更大，因此必须尽量避免犯第1 类错误).因此，这种在只限制第一类错误的原则下的检验方法，就称为“显著性检验”(Significance Test)。具体地，给定一个允许的犯第一类错误概率的最大值α，选取T 使得 PH(T<T)≤a 连续场合下，等号可以达到.这样的x可以通过T在H。下的分布及上式条件下求得称a为显著性水平.通常将a取为0.1,0.05,0.01等较小的数具体取值视实际需要而定，有时候要求α很小，比如在涉及到数十万个基因标记的基因关联分析中，单个位点检验的α一般是10~7这样的量级 Previous Next First Last Back Forward 6

(在下一小节中我们讨论如何设定假设时会提到, 应该将受保护对象设为零假设, 故犯第 I 类错误的严重性更大, 因此必须尽量避免犯第 I 类错误). 因此，这种在只限制第一类错误的原则下的检验方法，就称为“显著性检验”(Significance Test)。具体地, 给定一个允许的犯第一类错误概率的最大值 α, 选取 τ 使得 PH0 (T < τ ) ≤ α 连续场合下, 等号可以达到. 这样的 τ 可以通过 T 在 H0 下的分布及上式条件下求得. 称 α 为显著性水平. 通常将 α 取为 0.1, 0.05, 0.01 等较小的数, 具体取值视实际需要而定, 有时候要求 α 很小, 比如在涉及到数十万个基因标记的基因关联分析中, 单个位点检验的 α 一般是 10−7 这样的量级. Previous Next First Last Back Forward 6

现在将问题一般化 1.根据问题，提出假设检验问题 Ho:0∈⊙0←+H1:0∈Θ1. 其中Ho为零假设或原假设，而H1为对立假设或备择假设， 2.根据参数的估计方法构造一个适当的检验统计量T=T(X1,·,X), 其中X1,·,Xn为从总体中抽得的一个样本 3.根据对立假设的形状构造一个检验的拒绝域W={T(X1,·,X)∈ A},其中A为一个集合，通常是一个区间.比如拒绝域可取为 {T(X1,·,Xn)>r},则称r为临界值 4.对任意的0∈Oo,犯第I类错误的概率Pa(T(X1,·,Xn)∈ A)小于或等于某个指定正的常数a),则称a为显著性水平. 5.结合T在Ho下的分布，定出A. Previous Next First Last Back Forward

现在将问题一般化: 1. 根据问题, 提出假设检验问题 H0 : θ ∈ Θ0 ↔ H1 : θ ∈ Θ1. 其中 H0 为零假设或原假设, 而 H1 为对立假设或备择假设. 2. 根据参数的估计方法构造一个适当的检验统计量 T = T(X1, · · · , Xn), 其中 X1, · · · , Xn 为从总体中抽得的一个样本. 3. 根据对立假设的形状构造一个检验的拒绝域 W = {T(X1, · · · , Xn) ∈ A}, 其中 A 为一个集合, 通常是一个区间. 比如拒绝域可取为 {T(X1, · · · , Xn) > τ}, 则称 τ 为临界值. 4. 对任意的 θ ∈ Θ0, 犯第 I 类错误的概率 Pθ(T(X1, · · · , Xn) ∈ A) 小于或等于某个指定正的常数 α), 则称 α 为显著性水平. 5. 结合 T 在 H0 下的分布, 定出 A. Previous Next First Last Back Forward 7

显然显著性水平不是唯一的，事实上，如果α是一个显著性水平，则任意大于α的数都是显著性水平.实际中通常采用显著性水平最小的那一个称B()=P6(Ho被拒绝)为检验的功效函数。 Definition 如果检验的显著性水平为a,则当0∈90时，B(0)≤a.而当 0∈日1时，我们希望功效值越大越好（这样犯第Ⅱ类错误的概率 1一()就越小)，所以功效可以作为评价一个检验优劣的准则，显著性检验方法由于只控制第一类错误，因此保护了原假设不被轻易拒绝，从而原假设和对立假设地位不相同！ Previous Next First Last Back Forward 8

显然显著性水平不是唯一的, 事实上, 如果 α 是一个显著性水平, 则任意大于 α 的数都是显著性水平. 实际中通常采用显著性水平最小的那一个. 称 β(θ) = Pθ (H0 被拒绝) 为检验的功效函数. Definition 如果检验的显著性水平为 α, 则当 θ ∈ Θ0 时, β(θ) ≤ α. 而当 θ ∈ Θ1 时, 我们希望功效值越大越好 (这样犯第 II 类错误的概率 1 − β(θ) 就越小), 所以功效可以作为评价一个检验优劣的准则. 显著性检验方法由于只控制第一类错误, 因此保护了原假设不被轻易拒绝, 从而原假设和对立假设地位不相同! Previous Next First Last Back Forward 8

7.1.2 原假设的提法在有时候需要自己判断如何提假设检验问题.在建立原假设时有两个原则。原则一：将受保护的对象置为零假设.将已经存在的事实，或者错误拒绝会带来很大后果的事情作为原假设.例如，司法上的无罪推断.这样做大大地有利于保护公民的利益.又若对新药的批准，显然使用药品的病人是应该受保护的对象，这时应该设定一个有利于病人的命题作为零假设，这个命题就是“新药不比安慰剂效果好”，以尽量避免病人用无效甚至有副作用的新药.将检验的显著性水平α设定得较小，以保证零假设不被轻易推翻. 在实际问题中，如果根据某个合理的检验方法发现零假设被推翻，则有充分的理由认为零假设不成立而对立假设成立，这是因为万一零假设成立而被误据的概率不会超过α：另一方面，如果发现零假设未被拒绝，并不表明有充分理由接受零假设，而是因为零假设被保护得较严密以至于未被拒绝. Previous Next First Last Back Forward 9

7.1.2 原假设的提法在有时候需要自己判断如何提假设检验问题. 在建立原假设时有两个原则。原则一: 将受保护的对象置为零假设. 将已经存在的事实, 或者错误拒绝会带来很大后果的事情作为原假设. 例如, 司法上的无罪推断. 这样做大大地有利于保护公民的利益. 又若对新药的批准, 显然使用药品的病人是应该受保护的对象, 这时应该设定一个有利于病人的命题作为零假设, 这个命题就是 “新药不比安慰剂效果好”, 以尽量避免病人用无效甚至有副作用的新药. 将检验的显著性水平 α 设定得较小, 以保证零假设不被轻易推翻. 在实际问题中, 如果根据某个合理的检验方法发现零假设被推翻, 则有充分的理由认为零假设不成立而对立假设成立, 这是因为万一零假设成立而被误据的概率不会超过 α; 另一方面, 如果发现零假设未被拒绝, 并不表明有充分理由接受零假设, 而是因为零假设被保护得较严密以至于未被拒绝. Previous Next First Last Back Forward 9

点击下载完整版文档（PDF格式）

共15页，试读已结束，阅读完整版请下载

点击下载（PDF格式）

浏览记录