正在加载图片...
事实 Ho成立 H1成立 决策 接受Ho 不犯错 第Ⅱ类错误 拒绝H0 第I类错误 不犯错 称“实际上Ho成立但是它被拒绝”这个错误为第I类错误(弃真),而“实际上H0不成立但是它 被接受”这样一类错误为第Ⅱ类错误(存伪).由于我们的方法是基于观测数据,而观测数据是带 有随机误差的,故难免在做出决策的时候犯错,我们能做的是控制犯错的概率.一个理想的检验应 该使这两类错误的概率都小,但是在实际问题中不可能使这两类错误一致地小:要让犯第I类错误 的概率小,应该让T小,而要让犯第Ⅱ类错误的概率小,则T不能太小.解决这个矛盾的一个方 法是在控制虹类错误的基础上,尽量少犯第Ⅱ类错误(在下一小节中我们讨论如何设定假设时会 提到,应该将受保护对象设为零假设,故犯第I类错误的严重性更大,因此必须尽量避免犯第I类 错误).因此,这种在只限制第一类错误的原则下的检验方法,就称为“显著性检验”(Significance Tst)。具体地,选定一个小的常数α,取T使得犯第I类错误的概率,即T小于T的概率小于a. 称α为显著性水平.理想情况下,T取得恰好满足PHo(T<T)=a.为控制犯第I类错误的发生, 通常将α取为0.1,0.05,0.01等较小的数,具体取值视实际需要而定,有时候要求a很小,比如在 涉及到数十万个基因标记的基因关联分析中,单个位点检验的α一般是10一7这样的量级, 现在将问题一般化.设有假设检验问题 H0:0∈Θ0→H1:0∈Θ1 (7.1.1) 其中Ho为零假设或原假设而H1为对立假设或备择假设.构造一个适当的检验统计量T= T(X1,·,X),其中X1,·,Xn为从总体中抽得的一个样本.根据对立假设的形状构造一个检 验的拒绝域W={T(X1,·,X)∈A},其中A为一个集合,通常是一个区间.比如拒绝域可取 为{T(X1,·,X)>T},则称T为临界值.如果零假设成立但拒绝了零假设,则称犯了第I类错 误,如果对立假设成立但接受零假设,则称犯了第IⅡ类错误.如对任意的0∈日o,犯第I类错误的 概率P(T(X1,·,X)∈A)小于或等于某个正的常数a),则称a为显著性水平.显然显著性水 平不是唯一的,事实上,如果α是一个显著性水平,则任意大于α的数都是显著性水平.实际中通 常采用显著性水平最小的那一个.一个检验对应于一个拒绝域,称()=P(Ho被拒绝)为检验 的功效函数.如果检验的显著性水平为a,则当0∈O0时,B(0)≤a.而当0∈⊙1时,我们希望功 效值越大越好(这样犯第Ⅱ类错误的概率1一()就越小),所以功效可以作为评价一个检验优劣 的准则。 3❍❍❍❍❍❍ 决策 ❍ 事实 H0 成立 H1 成立 接受 H0 不犯错 第 II 类错误 拒绝 H0 第 I 类错误 不犯错 称“实际上 H0 成立但是它被拒绝”这个错误为第 I 类错误 (弃真) , 而“实际上 H0 不成立但是它 被接受”这样一类错误为 第 II 类错误 (存伪). 由于我们的方法是基于观测数据, 而观测数据是带 有随机误差的, 故难免在做出决策的时候犯错, 我们能做的是控制犯错的概率. 一个理想的检验应 该使这两类错误的概率都小, 但是在实际问题中不可能使这两类错误一致地小: 要让犯第 I 类错误 的概率小, 应该让 τ 小, 而要让犯第 II 类错误的概率小, 则 τ 不能太小. 解决这个矛盾的一个方 法是在控制I类错误的基础上, 尽量少犯第 II 类错误 (在下一小节中我们讨论如何设定假设时会 提到, 应该将受保护对象设为零假设, 故犯第 I 类错误的严重性更大, 因此必须尽量避免犯第 I 类 错误).因此,这种在只限制第一类错误的原则下的检验方法,就称为“显著性检验”(Significance Test)。具体地, 选定一个小的常数 α, 取 τ 使得犯第 I 类错误的概率, 即 T 小于 τ 的概率小于 α. 称 α 为显著性水平. 理想情况下, τ 取得恰好满足 PH0 (T < τ ) = α. 为控制犯第 I 类错误的发生, 通常将 α 取为 0.1, 0.05, 0.01 等较小的数, 具体取值视实际需要而定, 有时候要求 α 很小, 比如在 涉及到数十万个基因标记的基因关联分析中, 单个位点检验的 α 一般是 10−7 这样的量级. 现在将问题一般化. 设有假设检验问题 H0 : θ ∈ Θ0 ↔ H1 : θ ∈ Θ1. (7.1.1) 其中 H0 为零假设或原假设 而 H1 为对立假设或备择假设. 构造一个适当的检验统计量 T = T(X1, · · · , Xn), 其中 X1, · · · , Xn 为从总体中抽得的一个样本. 根据对立假设的形状构造一个检 验的拒绝域 W = {T(X1, · · · , Xn) ∈ A}, 其中 A 为一个集合, 通常是一个区间. 比如拒绝域可取 为 {T(X1, · · · , Xn) > τ}, 则称 τ 为 临界值. 如果零假设成立但拒绝了零假设, 则称犯了第 I 类错 误, 如果对立假设成立但接受零假设, 则称犯了第 II 类错误. 如对任意的 θ ∈ Θ0, 犯第 I 类错误的 概率 Pθ(T(X1, · · · , Xn) ∈ A) 小于或等于某个正的常数 α), 则称 α 为显著性水平. 显然显著性水 平不是唯一的, 事实上, 如果 α 是一个显著性水平, 则任意大于 α 的数都是显著性水平. 实际中通 常采用显著性水平最小的那一个. 一个检验 对应于一个拒绝域, 称 β(θ) = Pθ (H0 被拒绝) 为检验 的功效函数. 如果检验的显著性水平为 α, 则当 θ ∈ Θ0 时, β(θ) ≤ α. 而当 θ ∈ Θ1 时, 我们希望功 效值越大越好 (这样犯第 II 类错误的概率 1 − β(θ) 就越小), 所以功效可以作为评价一个检验优劣 的准则. 3
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有