中国科学技术大学：《概率论与数理统计》课程教学资源（课件讲义）第七章假设检验.pdf_大学文库

这是一个小概率事件，即当p≤0.04时，12件产品中有4件是次品的概率不到1/1000，这样的事件在一次试验中几乎是不可能发生的，但确实发生了（我们观察到了4件次品），因此更倾向于怀疑假设“p≤0.04”的正确性，即认为它不成立。而由于 PY=≤(）p4os6P=03 即此时当假设“p≤0.04”成立时，“12个产品中有一个次品”这一事件的概率最大为0.306，这个事件不是小概率事件。因此我们没有足够的证据支持原假设不成立这一说法。例71.2.某饮料厂在自动流水线上罐装饮料.在正常生产情况下，每瓶饮料的容量（单位：毫升） X服从正态分布N(⑤00,10)（由以往的经验得知）.经过一段时间之后，有人觉得每瓶饮料的平均容量减小到490，于是抽取了9瓶样品，称得它们的平均值为元=492毫升.试问此断言是否正确？即问平均每瓶饮料的容量仍是500毫升还是变成490毫升？假定标准差10毫升不变在这个问题中，设经过一段时间后罐装饮料容量X的平均值为4，则由题意可设X~N(μ，102)，记x1,·,xg为取自这个正态总体X的一组样本观测值，则元=∑9=1：=492.我们需要在“饮料平均容量为500毫升”与“饮料平均容量为490毫升”之间作判断，即在“μ=500”和“μ=490”之间作判断.数理统计中，把它们看成两个假设.习惯上，称前者为原假设或零假设，记作Ho；后者称为备择假设或对立假设，记作H1或Ha.所谓检验 H0:4=500←分H1:4=490. 就是要根据样本判断究竞是“Ho成立”还是“H1成立”.断言“Ho成立”称为接受Ho；断言“H1成立”称为拒绝Ho 下面讨论如何检验上述假设，即给定一个接受或者拒绝零假设的准则.设从总体中抽取一个样本X1,··,X,我们可以用极大似然估计T=了（称之为检验统计量）来估计山.由于该估计值接近μ（尤其是当样本量较大时），故当T的绝对值小的时候有利于H1而不利于Ho,此时应该拒绝 Ho.我们可以事先取定一个常数T,称之为临界值，当T的取值小于该临界值时拒绝H,即样本满足 W={及<T} 中时拒绝Ho,称W为拒绝域.即样本的取值落在拒绝域中，就拒绝Ho,否则不能拒绝之.一个拒绝域就对应于一个检验方法.现在的问题是T应该取多大？这涉及到两类错误. 2

这是一个小概率事件，即当p ≤ 0.04时，12件产品中有4件是次品的概率不到1/1000，这样的事件在一次试验中几乎是不可能发生的，但确实发生了(我们观察到了4件次品), 因此更倾向于怀疑假设“p ≤ 0.04”的正确性，即认为它不成立。而由于 P(Y = 1) ≤ 12 1 0.041 0.9612 = 0.306 即此时当假设“p ≤ 0.04”成立时，“12个产品中有一个次品”这一事件的概率最大为0.306，这个事件不是小概率事件。因此我们没有足够的证据支持原假设不成立这一说法。例 7.1.2. 某饮料厂在自动流水线上罐装饮料. 在正常生产情况下, 每瓶饮料的容量 (单位: 毫升) X 服从正态分布 N(500, 102 ) (由以往的经验得知). 经过一段时间之后, 有人觉得每瓶饮料的平均容量减小到 490, 于是抽取了 9 瓶样品, 称得它们的平均值为 x¯ = 492 毫升. 试问此断言是否正确? 即问平均每瓶饮料的容量仍是 500 毫升还是变成 490 毫升? 假定标准差 10 毫升不变. 在这个问题中, 设经过一段时间后罐装饮料容量 X 的平均值为 µ, 则由题意可设 X ∼ N(µ, 102 ). 记 x1, · · · , x9 为取自这个正态总体 X 的一组样本观测值, 则 x¯ = 1 9 P9 i=1 xi = 492. 我们需要在“饮料平均容量为 500 毫升”与“饮料平均容量为 490 毫升”之间作判断, 即在“µ = 500”和“µ = 490”之间作判断. 数理统计中, 把它们看成两个假设. 习惯上, 称前者为原假设或零假设, 记作 H0; 后者称为备择假设或对立假设, 记作 H1 或 Ha. 所谓检验 H0 : µ = 500 ↔ H1 : µ = 490. 就是要根据样本判断究竟是“H0成立”还是“H1成立”. 断言“H0成立”称为接受 H0; 断言“H1成立”称为拒绝 H0. 下面讨论如何检验上述假设, 即给定一个接受或者拒绝零假设的准则. 设从总体中抽取一个样本 X1, · · · , Xn, 我们可以用极大似然估计 T = X¯ (称之为检验统计量) 来估计 µ. 由于该估计值接近 µ (尤其是当样本量较大时), 故当 T 的绝对值小的时候有利于 H1 而不利于 H0, 此时应该拒绝 H0. 我们可以事先取定一个常数 τ , 称之为临界值, 当 T 的取值小于该临界值时拒绝 H0, 即样本满足 W = {X < τ ¯ } 中时拒绝 H0, 称 W 为拒绝域. 即样本的取值落在拒绝域中, 就拒绝 H0, 否则不能拒绝之. 一个拒绝域就对应于一个检验方法. 现在的问题是 τ 应该取多大? 这涉及到两类错误. 2

事实 Ho成立 H1成立决策接受Ho 不犯错第Ⅱ类错误拒绝H0 第I类错误不犯错称“实际上Ho成立但是它被拒绝”这个错误为第I类错误（弃真），而“实际上H0不成立但是它被接受”这样一类错误为第Ⅱ类错误（存伪）.由于我们的方法是基于观测数据，而观测数据是带有随机误差的，故难免在做出决策的时候犯错，我们能做的是控制犯错的概率.一个理想的检验应该使这两类错误的概率都小，但是在实际问题中不可能使这两类错误一致地小：要让犯第I类错误的概率小，应该让T小，而要让犯第Ⅱ类错误的概率小，则T不能太小.解决这个矛盾的一个方法是在控制虹类错误的基础上，尽量少犯第Ⅱ类错误（在下一小节中我们讨论如何设定假设时会提到，应该将受保护对象设为零假设，故犯第I类错误的严重性更大，因此必须尽量避免犯第I类错误).因此，这种在只限制第一类错误的原则下的检验方法，就称为“显著性检验”(Significance Tst)。具体地，选定一个小的常数α，取T使得犯第I类错误的概率，即T小于T的概率小于a. 称α为显著性水平.理想情况下，T取得恰好满足PHo(TT},则称T为临界值.如果零假设成立但拒绝了零假设，则称犯了第I类错误，如果对立假设成立但接受零假设，则称犯了第IⅡ类错误.如对任意的0∈日o,犯第I类错误的概率P(T(X1,·,X)∈A)小于或等于某个正的常数a),则称a为显著性水平.显然显著性水平不是唯一的，事实上，如果α是一个显著性水平，则任意大于α的数都是显著性水平.实际中通常采用显著性水平最小的那一个.一个检验对应于一个拒绝域，称()=P(Ho被拒绝)为检验的功效函数.如果检验的显著性水平为a,则当0∈O0时，B(0)≤a.而当0∈⊙1时，我们希望功效值越大越好（这样犯第Ⅱ类错误的概率1一(）就越小)，所以功效可以作为评价一个检验优劣的准则。 3

❍❍❍❍❍❍ 决策 ❍ 事实 H0 成立 H1 成立接受 H0 不犯错第 II 类错误拒绝 H0 第 I 类错误不犯错称“实际上 H0 成立但是它被拒绝”这个错误为第 I 类错误 (弃真) , 而“实际上 H0 不成立但是它被接受”这样一类错误为第 II 类错误 (存伪). 由于我们的方法是基于观测数据, 而观测数据是带有随机误差的, 故难免在做出决策的时候犯错, 我们能做的是控制犯错的概率. 一个理想的检验应该使这两类错误的概率都小, 但是在实际问题中不可能使这两类错误一致地小: 要让犯第 I 类错误的概率小, 应该让 τ 小, 而要让犯第 II 类错误的概率小, 则 τ 不能太小. 解决这个矛盾的一个方法是在控制I类错误的基础上, 尽量少犯第 II 类错误 (在下一小节中我们讨论如何设定假设时会提到, 应该将受保护对象设为零假设, 故犯第 I 类错误的严重性更大, 因此必须尽量避免犯第 I 类错误).因此，这种在只限制第一类错误的原则下的检验方法，就称为“显著性检验”(Significance Test)。具体地, 选定一个小的常数 α, 取 τ 使得犯第 I 类错误的概率, 即 T 小于 τ 的概率小于 α. 称 α 为显著性水平. 理想情况下, τ 取得恰好满足 PH0 (T τ}, 则称 τ 为临界值. 如果零假设成立但拒绝了零假设, 则称犯了第 I 类错误, 如果对立假设成立但接受零假设, 则称犯了第 II 类错误. 如对任意的 θ ∈ Θ0, 犯第 I 类错误的概率 Pθ(T(X1, · · · , Xn) ∈ A) 小于或等于某个正的常数 α), 则称 α 为显著性水平. 显然显著性水平不是唯一的, 事实上, 如果 α 是一个显著性水平, 则任意大于 α 的数都是显著性水平. 实际中通常采用显著性水平最小的那一个. 一个检验对应于一个拒绝域, 称 β(θ) = Pθ (H0 被拒绝) 为检验的功效函数. 如果检验的显著性水平为 α, 则当 θ ∈ Θ0 时, β(θ) ≤ α. 而当 θ ∈ Θ1 时, 我们希望功效值越大越好 (这样犯第 II 类错误的概率 1 − β(θ) 就越小), 所以功效可以作为评价一个检验优劣的准则. 3

7.1.2原假设的提法在有时候需要自己判断如何提假设检验问题.在建立原假设时有两个原则。原则一：将受保护的对象置为零假设.如我国按照以前的司法制度，公安机关抓到嫌疑犯后，很多情况下要犯人自己证明无罪（有罪推断），这对嫌疑犯很不利，从而容易导致冤案.现在的司法制度则总假定嫌疑犯是无罪的，要司法部门证明其有罪（无罪推断），这样做大大地有利于保护公民的利益，如果要将真正的嫌疑犯绳之以法，则司法部门必须有充分的证据，这样做可以有效保护公民的权益，对司法部门要求也变高了.又比如药厂生产出一种新药，在上市前要通过食品与药品监管局的检验.显然使用药品的病人是应该受保护的对象，这时应该设定一个有利于病人的命题作为零假设，这个命题就是“新药不比安慰剂效果好”，以尽量避免病人用无效甚至有副作用的新药.当然，对立假设就是“新药比安慰剂效果好'.将检验的显著性水平α设定得较小，以保证零假设不被轻易推翻.在实际问题中，如果根据某个合理的检验方法发现零假设被推翻，则有充分的理由认为零假设不成立而对立假设成立，这是因为万一零假设成立而被误据的概率不会超过α；另一方面，如果发现零假设未被拒绝，并不表明有充分理由接受零假设，而是因为零假设被保护得较严密以至于未被拒绝原则二：如果你希望“证明”某个命题，就取相反结论或者其中一部分作为零假设（类似于反证法).这种提法往往是在两个假设命题中不太清楚哪个应受保护，此时可以借用司法制度里的“谁主张，谁举证”，即若想用统计方法向人“证明”一个命题，则将那个命题置为对立假设.注意这里的证明不是数学上的严格证明，而是允许犯错的一种统计推断方法.用统计方法证明一个命题不是一件容易的事情，所以如果没有足够把握，人们应该避免用统计方法去证明一个命题上述两原则是统一的：一般不应该让受保护对象去证明一个命题. 7.1.3检验统计量的选取及假设检验的步骤通过解答例7.1.1来说明假设检验的步骤，例7.1.3.例7.1.1续)能否在显著性水平0.05下认为饮料的平均容量确实减少到490毫升？解：基于统计量京，我们采用“标准化”过的检验统计量（减均值再除以标准差） 1=V(-500) 10 以使该统计量服从标准正态分布，检验的拒绝域仍取形如{T<},我们控制犯第I类错误的概率等于a即 P(T1<Tl0=500)=a. 4

7.1.2 原假设的提法在有时候需要自己判断如何提假设检验问题. 在建立原假设时有两个原则。原则一: 将受保护的对象置为零假设. 如我国按照以前的司法制度, 公安机关抓到嫌疑犯后, 很多情况下要犯人自己证明无罪 (有罪推断) , 这对嫌疑犯很不利, 从而容易导致冤案. 现在的司法制度则总假定嫌疑犯是无罪的, 要司法部门证明其有罪 (无罪推断), 这样做大大地有利于保护公民的利益, 如果要将真正的嫌疑犯绳之以法, 则司法部门必须有充分的证据, 这样做可以有效保护公民的权益, 对司法部门要求也变高了. 又比如药厂生产出一种新药, 在上市前要通过食品与药品监管局的检验. 显然使用药品的病人是应该受保护的对象, 这时应该设定一个有利于病人的命题作为零假设, 这个命题就是“新药不比安慰剂效果好”, 以尽量避免病人用无效甚至有副作用的新药. 当然, 对立假设就是“新药比安慰剂效果好’. 将检验的显著性水平 α 设定得较小, 以保证零假设不被轻易推翻. 在实际问题中, 如果根据某个合理的检验方法发现零假设被推翻, 则有充分的理由认为零假设不成立而对立假设成立, 这是因为万一零假设成立而被误据的概率不会超过 α; 另一方面, 如果发现零假设未被拒绝, 并不表明有充分理由接受零假设, 而是因为零假设被保护得较严密以至于未被拒绝. 原则二: 如果你希望“证明”某个命题, 就取相反结论或者其中一部分作为零假设 (类似于反证法). 这种提法往往是在两个假设命题中不太清楚哪个应受保护, 此时可以借用司法制度里的“谁主张, 谁举证”, 即若想用统计方法向人“证明” 一个命题, 则将那个命题置为对立假设. 注意这里的证明不是数学上的严格证明, 而是允许犯错的一种统计推断方法. 用统计方法证明一个命题不是一件容易的事情, 所以如果没有足够把握, 人们应该避免用统计方法去证明一个命题. 上述两原则是统一的: 一般不应该让受保护对象去证明一个命题. 7.1.3 检验统计量的选取及假设检验的步骤通过解答例7.1.1来说明假设检验的步骤. 例 7.1.3. (例7.1.1续) 能否在显著性水平 0.05 下认为饮料的平均容量确实减少到 490 毫升? 解: 基于统计量 X¯, 我们采用“标准化”过的检验统计量 (减均值再除以标准差) T1 = √ n(X¯ − 500) 10 以使该统计量服从标准正态分布, 检验的拒绝域仍取形如 {T1 < τ1}, 我们控制犯第 I 类错误的概率等于 α, 即 P(T1 < τ1|θ = 500) = α. 4

中国科学技术大学：《概率论与数理统计》课程教学资源（课件讲义）第七章 假设检验

中国科学技术大学：《概率论与数理统计》课程教学资源（课件讲义）第七章假设检验