第8.1节假设检验的基本概念 1.问题的提法 众所周知,总体X的全部信息可以通过其分布 函数F(X,反映出来但实际上,参数日往往未知有时 甚至F(X,0)的表达式也未知因此需要根据实际问题 的需要对总体参数或分布函数的表达式做出某种 假设(称为统计假设,再利用从总体中获得的样本信 息来对所作假设的真伪做出判断或进行检验 这种利用样本检验统计假设真伪的过程叫做 统计检验(假设检验)
第8.1节 假设检验的基本概念 众所周知,总体 X 的全部信息可以通过其分布 函数 反映出来,但实际上,参数 往往未知,有时 甚至 的表达式也未知.因此需要根据实际问题 的需要,对总体参数或分布函数的表达式做出某种 假设(称为统计假设),再利用从总体中获得的样本信 息来对所作假设的真伪做出判断或进行检验. F(X,) F(X,) 1. 问题的提法 统计检验(假设检验) 这种利用样本检验统计假设真伪的过程叫做
在许多实际研究中,都有需要做出检 验的问题如:某批产品能否出厂?某生产 线工作是否正常?某人是否患有某种疾病? 某种新药的治疗效果是否提高了?发生事 故是否与星期几有关?某次水平考试是否 正常?等等,都需要做出检验. 假(参数假设检验 X-F(x,0),0为参数 假设(=0 设 检 例X-F(x),F(x)未知 验非黍数假设检验:1假设F)F
在许多实际研究中,都有需要做出检 验的问题.如:某批产品能否出厂?某生产 线工作是否正常?某人是否患有某种疾病? 某种新药的治疗效果是否提高了?发生事 故是否与星期几有关?某次水平考试是否 正常?等等,都需要做出检验. 假 设 检 验 参数假设检验 非参数假设检验: X~F(x,θ),θ为参数 假设 θ=θ0 例X~F(x),F(x)未知 假设 F(x)=F0 (x)
例811某地旅游者的消费额服从正态分布X~N(,G2),调查 25个旅游者得出一组样本观测值x1,x2,,x25,若有专家认为 消费额的期望值为μ,如何由这组观测值验证这个说法? 假设检验为μ= 例8.1.2用精确方法测量某化工厂排放的气体中有害气体 的含量服从正态分布XN(23,22,-现用一简便方法测量6次 得一组数据23,21,19,24,18,18(单位:十万分之一问用简便 方法测的有害气体含量是否有系统偏差? 假设检验μ=23,02=22
例8.1.1.某地旅游者的消费额服从正态分布X~N(μ,σ2 ), 调查 25个旅游者,得出一组样本观测值x1 ,x2 ,…,x25,若有专家认为 消费额的期望值为μ0 ,如何由这组观测值验证这个说法? 假设检验为 μ=μ0 例8.1.2.用精确方法测量某化工厂排放的气体中有害气体 的含量服从正态分布X~N(23,22 ),现用一简便方法测量6次 得一组数据23,21,19,24,18,18(单位:十万分之一),问用简便 方法测的有害气体含量是否有系统偏差? 假设检验 μ=23,σ2=22
例8.1.3用精确方法测量某化工厂排放的气体中有害气体的 含量服从正态分布N(23,2),现用一简便方法测量6次得一组数据 23,21,1924,18,18(单位:十万分之一),若用简便方法测得有害气体含量 的方差不变问用该方法测得有害气体含量的均值是否有系统偏差? 解:由题意得:用简便方法测得有害气体含量X~N(μ,2), 假设H:μ=23,若H成立则U=X-H~N0,) G/√n 若取a=0.05,则P{U|z1m2}=,即:P{U>1.96}=0.05, 在假设成立的条件下,U>196为概率很小事件,般认为: 小概率事件在一次实验中是不会发生的, X-23 将样本观测值代入U得u =3.06 2/√n u>1.96, 小概率事件在一次实验中发生了,故假设不合情理,即: 否定原假设简便方法测得均值有系统偏差
例8.1.3.用精确方法测量某化工厂排放的气体中有害气体的 含量服从正态分布N(23,22 ),现用一简便方法测量6次得一组数据 23,21,19,24,18,18(单位:十万分之一),若用简便方法测得有害气体含量 的方差不变,问用该方法测得有害气体含量的均值是否有系统偏差? 假设 H0 : μ=23, 解:由题意得:用简便方法测得有害气体含量X~N(μ,22 ), 若H0成立,则 ~ N(0,1) / n X U − = 若取α=0.05,则 P{|U|>z1-α/2}=α, 即: P{|U|>1.96}=0.05, 在假设成立的条件下,|U|>1.96为概率很小事件,一般认为: 小概率事件在一次实验中是不会发生的, 将样本观测值代入U得 3.06, 2 / n X 23 u = − = |u|>1.96, 小概率事件在一次实验中发生了, 否定原假设,简便方法测得均值有系统偏差. 故假设不合情理,即:
2.假设检验的基本思想 (1)小概率原理(实际推断原理)认为概率很小的事件在 次试验中实际上不会出现,并且小概率事件在一次试验中 出现了,就被认为是不合理的 (2)基本思想:先对总体的参数或分布函数的表达式做出某 种假设,然后找出一个在假设成立条件下出现可能性甚小 的(条件)小概率事件.如果试验或抽样的结果使该小概率 事件出现了,这与小概率原理相违背,表明原来的假设有问 题,应予以否定,即拒绝这个假设若该小概率事件在一次 试验或抽样中并未出现,就没有理由否定这个假设,表明试 验或抽样结果支持这个假设,这时称假设与实验结果是相 容的,或者说可以接受原来的假设
2. 假设检验的基本思想 (1)小概率原理(实际推断原理)认为概率很小的事件在一 次试验中实际上不会出现,并且小概率事件在一次试验中 出现了,就被认为是不合理的. (2)基本思想:先对总体的参数或分布函数的表达式做出某 种假设,然后找出一个在假设成立条件下出现可能性甚小 的(条件)小概率事件.如果试验或抽样的结果使该小概率 事件出现了,这与小概率原理相违背,表明原来的假设有问 题,应予以否定,即拒绝这个假设.若该小概率事件在一次 试验或抽样中并未出现,就没有理由否定这个假设,表明试 验或抽样结果支持这个假设,这时称假设与实验结果是相 容的,或者说可以接受原来的假设
3假设检验的两类错误 在假设检验中,否定原假设的理由是小概率事件在一次试 验中出现了,但小概率事件并不是不会出现,只是出现的可 能性较小,即出现的概率不超过很小的正数C, 因此,根据小概率原理否定原假设,有可能把本来客观上正 确的假设否定了,造成犯“弃真”的错误,称为第一类错误, C就是犯第一类错误的概率的最大允许值 另一方面,当原假设不成立时,却作出接受原假设的结论, 造成犯“取伪”的错误,称为第二类错误, 一般用/表示犯第二类错误的概率
另一方面,当原假设不成立时,却作出接受原假设的结论, 造成犯“取伪”的错误,称为第二类错误, 3. 假设检验的两类错误 在假设检验中,否定原假设的理由是小概率事件在一次试 验中出现了,但小概率事件并不是不会出现,只是出现的可 能性较小,即出现的概率不超过很小的正数 , 就是犯第一类错误的概率的最大允许值. 一般用 表示犯第二类错误的概率. 因此,根据小概率原理否定原假设,有可能把本来客观上正 确的假设否定了,造成犯“弃真”的错误,称为第一类错误
弃真<a 3假设检验的两类错误1充伪尸 当样本容量n定时,小,就大,反之,B小,O就大 在进行假设检验时,我们采取的原则是 控制犯第一类错误(即O事先给定且很小)的同时使犯 第二类错误的概率达到最小 另外,一般a+β≠1, 即使+B=1碰巧出现,也决不能把“犯第一类错误” 和 “犯第二类错误”理解为相互对立的事件
在进行假设检验时,我们采取的原则是: 控制犯第一类错误(即 事先给定且很小)的同时使犯 第二类错误的概率达到最小. 当样本容量 n 一定时, 小, 就大,反之, 小, 就大. 另外,一般 + 1 , 即使 碰巧出现,也决不能把“犯第一类错误” 和 “犯第二类错误”理解为相互对立的事件. + =1 3. 假设检验的两类错误 弃真 充伪
之、-p~N(0,1) o/√n (p(X) 卩≠|0(p>0) 02/ 2 才2 L一U 1-/2: Z N -μ 1) /√n G/√n G/√n 注意:增大样本容量n时,可以使a和同时减小
α/2 α/2 X φ(x) 注意: 增大样本容量n时,可以使α和β同时减小. z1-α/2 - z1-α/2 β / n 0 − μ=μ0 ~ N(0,1) / n X Z 0 − = μ≠μ0 (μ>μ0 ) ,1) / n ~ N( / n X Z 0 0 − − =
显著性水平与否定域 小概率原理中,关于“小概率”的值通常根据实 际问题的要求而定,如取=0.1,0.05,0.01等, a为检验的显著性水平(检验水平 在假设检验过程中,使得小概率事件出现的统计 量的取值范围称为该假设检验的否定域(拒绝域) 否定域的边界称为该假设检验的临界值
小概率原理中,关于“小概率”的值通常根据实 际问题的要求而定,如取α=0.1,0.05,0.01等, α为检验的显著性水平(检验水平). 4. 显著性水平与否定域 在假设检验过程中,使得小概率事件出现的统计 量的取值范围称为该假设检验的否定域(拒绝域), 否定域的边界称为该假设检验的临界值
pp(x) P{|U|<u1a23=1-0 2 ■■■■■■ 否定域」接受域否定域」 宝意:否定域的大小依赖于显著性水平的取值, 般说来,显著性水平越高,即α越小,否定域也越 小,这时原假设就越难否定
α/2 α/2 X φ(x) 接受域 P{|U|<u1-α/2}=1-α 否定域的大小,依赖于显著性水平的取值, 一般说来,显著性水平越高,即α越小,否定域也越 小,这时原假设就越难否定. 注意: 否定域 否定域 z1-α/2 - z1-α/2