第七章统计假设 教学目的 1检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两种错误。 2了解单个与两个正态总体的均值与方差的假设检验 3了解总体分布假设的Ⅺ2检验法,F-检验法,-检验法 二、教学重点 1假设检验的基本步骤,x2检验法 2单个正态总体的均值与方法的假设检验 三、教学难点 1非参数的假设检验 2正态母体总数的置信区间 3柯尔莫歌洛夫拟合检验一D,检验 §7.1假设检验的基本思想和概念 1.统计假设:有关未知分布的假设N14000 ①原假设:第一个假设(陈述的否定)Ho:=1500 ②备择假设:第二个假设(陈述本身)H1:)1500 (1)参数假设:及到未知参数本身的统计假设 (2)非参数假设:未知分布函数的类型或者它的某些特征提出假设 如H0:F(x)∈{对数正态分布簇 H:F(x)∈征态分布簇} 「简单统计假设:一个统计假设完全确定母体的分布 复合统计假设:不指定母体具体形式 3.计假设问题:在给定备择假设H1的前提下,对原假设H0作出判断 (1)拒绝H,则接受H1 (2)接受H0,则拒绝H1 该法则称为H0对H1的一个检验法则,有时简称检验 4.拒绝域(临界域):将子样空间划分为两个互不相交的子集c1和c
第七章 统计假设 一、教学目的 1 检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两种错误。 2 了解单个与两个正态总体的均值与方差的假设检验。 3 了解总体分布假设的 2 X 检验法, F − 检验法, t −检验法 二、教学重点 1 假设检验的基本步骤, 2 x 检验法 2 单个正态总体的均值与方法的假设检验 三、教学难点 1 非参数的假设检验 2 正态母体总数的置信区间。 3 柯尔莫歌洛夫拟合检验 − Dn 检验 §7.1 假设检验的基本思想和概念 1. 统计假设:有关未知分布的假设 N(,40000) ①原假设:第一个假设(陈述的否定) H0 : = 1500 ②备择假设:第二个假设(陈述本身) H1 : ›1500 (1) 参数假设 :及到未知参数本身的统计假设 (2) 非参数假设:未知分布函数的类型或者它的某些特征提出假设 如 H0 : F(x)对数正态分布簇 H1:F(x)正态分布簇 复合统计假设:不指定母体具体形式 简单统计假设:一个统计假设完全确定母体的分布 3. 计假设问题:在给定备择假设 HL 的前提下,对原假设 H0 作出判断 。 (1)拒绝 H0 ,则接受 H1 。 (2)接受 H0 ,则拒绝 H1 该法则称为 H0 对 H1 的一个检验法则,有时简称检验。 4. 拒绝域(临界域):将子样空间划分为两个互不相交的子集 1 2 c 和c
当子样观测值点(x,x2…xn)∈C1则拒绝H0 当子样观测值点(x1,x2…xn)∈C2则拒绝H1 5.假设检验可能发生的两类错误。 1第一类错误(α风险)“弃真”:原假设H。正确,却错误的拒绝H。 P(拒绝H0|H为真)=a即P(x1…xn)∈C1|u=)=a 2第二类错误(β风险)“收伪”原假设H不正确,却错误的接受H。 P(接受H0H0为假)=B即P(x1….x,)∈C2≠山)=B 6.显著性检验问题。 对犯第一类错误α加以控制,而不考虑第二类错误。在这一原则下,寻找临界域C 只涉及到原假设H0,不涉及备择假设H1 7显著性水平 在进行显著性检验时,给定的犯第一类错误概率α 、小概率原理(实用统计原理) 小概率事件在一次实际实验中是不可能发生的。如果在一次实验中,居然发生了,人们 宁愿认为该事件的前提条件起了变化(或发生了错误,或人为安排,或属于一种反常现象)。 三、假设检验的一般步骤: 1.根据问题提出原假设H和备择假设H,要明白根据样本值 去检验 什么样的问题。 2.寻找检验H0的合适统计量。 3.由给定的显著水平α,根据统计量的分布,查表定出相应的分位数的值,即临界值。 (确定拒绝域) 4.根据实测的样本值,具体计算岀所统计量的值。视此值是否落入拒绝域。做出Ha是 否成立的判断。 作业P361.2.3 §7.2参数假设检验 、U-检验 1、双边检验:设5,52,…,5n取自正态母体N(,σ)的一个样本 为已知常数 (1)检验假设H0:H=0H1:H≠o
当子样观测值点 1 2 1 (x ,x ........xn)C 则拒绝 H0 当子样观测值点 1 2 2 (x ,x ........xn)C 则拒绝 H1 5.假设检验可能发生的两类错误。 1 第一类错误( 风险)“弃真”:原假设 H0 正确,却错误的拒绝 H0 P(拒绝H0 | H0为真) = 即 P((x1 ....xn )C1 | = 0 ) = 2 第二类错误( 风险)“收伪”:原假设 H0 不正确,却错误的接受 H0 P(接受H0 | H0为假) = 即 P((x1 ......xn )C2 | 0 ) = 6.显著性检验问题。 对犯第一类错误 加以控制,而不考虑第二类错误。在这一原则下,寻找临界域 C 只涉及到原假设 H0 ,不涉及备择假设 H1 7 显著性水平 在进行显著性检验时,给定的犯第一类错误概率 二、小概率原理(实用统计原理) 小概率事件在一次实际实验中是不可能发生的。如果在一次实验中,居然发生了,人们 宁愿认为该事件的前提条件起了变化(或发生了错误,或人为安排,或属于一种反常现象)。 三、假设检验的一般步骤: 1. 根据问题提出原假设 H 0 和备择假设 H 1 ,要明白根据样本值 x 1,x 2 ,…,x n 去检验 什么样的问题。 2. 寻找检验 H 0 的合适统计量。 3. 由给定的显著水平 ,根据统计量的分布,查表定出相应的分位数的值,即临界值。 (确定拒绝域) 4. 根据实测的样本值,具体计算出所统计量的值。视此值是否落入拒绝域。做出 H 0 是 否成立的判断。 作业 P 366 1.2.3 §7.2 参数假设检验 一、U-检验: 1、 双边检验:设 1, 2 ,…, n 取自正态母体 N( , 2 )的一个样本, 0 2 = 2 为已知常数。 (1)检验假设 H 0: = 0 H 1: 0
(2)构造U统计量 ~N(0,1) /√ (3)给定显著性水平a,查正态分布表,使P日571≥k=a ≤k)=1-a go/n 2(k)-1=1-ad(k)=1-a 上侧分位点n。=k使P(aa)=1-a 确定拒绝域D:{μ∈(-∞, )U( +∞)} (4)计算子样的μ值,判断其是否落入拒绝域 Egl。P3157 2.单边检验 (1)检验假设H0:H=0,H1:μ(4o 此时拒绝域确定方法有差别 /V(-k}=a为小概率事件 即P{Ha(-k}=aΦ(-k)=ad(k)=1-a 查正态分布表,k=4-拒绝域D△(-∞,A1-a) (2)检验Ho:H≥,H1:(4 (3)确定拒绝域,分两种情况 (I)=拒绝域D△(-∞,H1-a) (ii)p)0,对于任何样本观测有 a/√n'a/√n 在给定a条件下,使P(5))=a
(2)构造 U 统计量 / n 0 − = ~N(0,1) (3)给定显著性水平 ,查正态分布表,使 P { 0 / n 0 − k }= 即 P{ 0 / n 0 − k =1- P( u k )=1- 2 (k) −1 = 1− 2 ( ) 1 k = − 上侧分位点 = k − 2 1 使 P( 2 1 − ) =1- 确定拒绝域 D:{ (- ,- 2 1 − ) ( 2 1 − ,+ )} (4)计算子样的 值,判断其是否落入拒绝域。 Eg1。P 315 7.2 2.单边检验 (1) 检验假设 H 0: = 0 ,H 1: 0 此时拒绝域确定方法有差别 P{ 0 / n 0 − −k }= 为小概率事件 即 P{ −k }= (−k) = (k) = 1− 查正态分布表,k= 1− 拒绝域 D (- , 1− ) (2) 检验 H 0: 0 ,H 1: 0 (3) 确定拒绝域,分两种情况: (I) = 0 拒绝域 D (- , 1− ) (ii) 0 ,对于任何样本观测有: / n 0 − / n − / n − ~N(0,1) 在给定 条件下,使 P( 0 / n 0 − k )=
即db(1-)=1-a 由于事件(54p(-k)(5--k) G。/√n -k)≤P( F/vn 对假设H0而言,拒绝域仍为D (3)验H0:H={0,H1:A) 此时拒绝域为D=(1-a,+∞) (4)检验H0:H≤Ho,H1:A)0 拒绝域为D=(H-a,+∞) 二、t-检验 1.方差未知,对正态总体N(H,2)中参数进行检验 1.1双边检验 ①H0:H=A H1:H≠o ②构造t统计量 σ0/Vn 其中 ,即用子样方差s,替代原来的总体方差σ n-1 ③给定显著性水平a,确定拒绝域 P(》k)=a,P(≤k)=1-a 查t分布表,自由度取n-1,确定分位点t。(n-1) 确定拒绝域D(-∞,-t,a(n-1)U(g’+a) 1.2单边检验 (1)Ho:H=0,H1:H(4o 拒绝域D=(-∞,-t1a(n-1)) (2) H20,H1:(0
即 (1− ) =1− 由于事件{ 0 / n 0 − −k } { / n − −k } 所以 P( 0 / n 0 − −k ) P( / n − −k ) 对假设 H 0 而言,拒绝域仍为 D (3) 验 H 0: = 0,H 1: 0 此时拒绝域为 D=( 1−,+ ) (4) 检验 H 0: 0 ,H 1: 0 拒绝域为 D=( 1−,+ ) 二、t-检验 1. 方差未知,对正态总体 N( 2 , )中参数 进行检验 1. 1 双边检验 ①H 0: = 0 H 1: 0 ②构造 t 统计量 。t= 0 / n 0 − ~t(n-1) 其中 s= 1 ( ) 2 1 − − = n n i i ,即用子样方差 s,替代原来的总体方差 ③给定显著性水平 ,确定拒绝域 P( t k )= ,P( t k )=1- 查 t-分布表,自由度取 n-1,确定分位点 2 1 − t (n-1) 确定拒绝域 D=(- ,-t 2 1 − (n-1)) (t 2 1 − ,+ ) 1.2 单边检验 (1) H 0: = 0,H 1: 0 拒绝域 D=(- , -t 1− (n-1)) (2) H 0: 0 ,H 1: 0
拒绝域D=(-∞,-t1a(n-1) (3)Ho:H={0,H1:A)o 拒绝域D=(t (4)Ho:4≤,H1:p)p 拒绝域D=(t 2.双正态总体N(p,a2)N(42a2)在假使方差G2=a2条件下 (1)检验H:H1=H2,H1:1≠2 (2)构造t统计量t= ct(n-n nI (n1-1)Sn+(n2-1)S 其中S 特别n=n2时S S, n,+S,n, H1+n2 可以推广至检验A1-2=C此时将t统计量分子换成5-n (3)给定显著性水平a确定拒绝域 Pn(H≥t-(1+n2-2)=a 查t分布表拒绝域D=(-∞-12)∪(41+∞) (3)求子样观测值的t-值,判断t∈D与否 P31g例7.4(略) (-检验 单个正态总N(a2)有关方差假使检验 3.1均值=40已知 1.双边检验 Ho: 0=O H1=-≠O 5-{0)2 构造x2统计量x x2(n) ③给定a,确定拒绝域c使P(k≤x2≤k2)=1-a
拒绝域 D=(- , -t 1− (n-1)) (3) H 0: = 0,H 1: 0 拒绝域 D=(t 2 1 − ,+ ) (4)H 0: 0 ,H 1: 0 拒绝域 D=(t 2 1 − ,+ ) 2.双正态总体 N( 1, 2 1 ) N( , ) 2 2 2 在假使方差 = 2 1 2 2 条件下 (1) 检验 H0: 1 = 2, H1: 1 2 (2) 构造 t 统计量 t= 1 2 1 1 n n Sw + − ~t(n1-n2) 其中 2 ( 1) ( 1) 1 2 1 1 1 2 2 2 + − − + − = n n n S n S S n n W 特别 n1=n2 时 2 S1n1 S2n2 Sw + = 可以推广至检验 − = c 1 2 此时将 t 统计量分子换成 − − c (3) 给定显著性水平 确定拒绝域 ( ( 2)) 1 1 2 2 0 + − − PH t t n n = 查 t-分布表 拒绝域 D= ( , ) ( , ) 2 2 1 1 − − + − − t t (3) 求子样观测值的 t-值,判断 t D 与否 P319 例 7.4(略) 三.X 2 -检验 单个正态总 ( , ) 2 N 有关方差假使检验 3.1 均值 = 0 已知 1. 双边检验 H0: 2 0 2 = H1= 2 0 2 构造 x 2 统计量 2 0 1 2 0 2 ( ) = − = n i i x ~x 2(n) ③给定 ,确定拒绝域 c 使 ( 2 ) =1− 2 0 1 P k x k H
由于c的结构形式为{x2(k1}U{x2)k2} 即P(x2()=a1P(x2)=a2且a1+a2=a 为了计算方便,取a1=a2=2 查x2-分布表知,上侧分位点x22(m)使P(x2)x,(n) x2(n)使P(x2(x、(n) 拒绝域cA(O.,x2(m)U(x14(m)+∞) 类似地,可给出单边检验的拒绝域 (1):a2≤abH:a2) 欲拒绝H,即接受H,S2/σ2必过分地大 x2=nS2/σ2必过分地大,又由于Ex2=n x2远离n的可能性较小 即P(xk)=a 确立临界值k=x2-(n) 拒绝域C=(x-a(m)+∞) (2)H:a2≥a,H:a2(a2 查x2-分布表:临界值k=x2(n) 拒绝域c=(0,x2(m) 3.2均值未知 (n-12(-5 此时构造x2统计量x2= 类似地确定双边检验:临界值x2(m-1),x2(n-1) 临界域c△(O,x2(n-1)∪(x22(n-1)+∞) 单边检验:临界值x2(n-1)或x2(n-1)
由于 c 的结构形式为 { } { }2 2 1 2 x k x k 即 1 1 2 ( ) 0 PH x k = 2 2 2 ( ) 0 PH x k = 且 1 +2 = 为了计算方便,取 2 1 2 = = 查 x 2 -分布表知,上侧分位点 ( ) 2 1 2 x n − 使 2 ( ( )) 2 1 2 = − P x x n ( ) 2 2 x n 使 2 ( ( )) 2 2 P x x n = 拒绝域 c (0, ( )) ( ( ), ) 2 2 1 + − x n x n 类似地,可给出单边检验的拒绝域 (1)H0: 2 0 2 H1: 2 0 2 欲拒绝 H0,即接受 H1, Sn 2 / 2 0 必过分地大 x 2 =nSn 2 / 2 0 必过分地大,又由于 E x2 =n x 2 远离 n 的可能性较小 即 ( ) = 2 P x k 确立临界值 ( ) 2 k = x1− n 拒绝域 ( ( ), ) c = x1− n + (2)H0: 2 0 2 , H1: 2 0 2 查 x 2 -分布表:临界值 ( ) 2 k = x n 拒绝域 (0, ( )) 2 c = x n 3.2 均值未知 此时构造 x 2 统计量 0 1 2 2 0 2 2 ( ) ( 1) = − = − = n i i n s x ~x 2(1-n) 类似地确定双边检验:临界值 ( 1) 2 1 2 − − x n , ( 1) 2 2 x n − 临界域 (0, ( 1)) ( ( 1), ) 2 1 2 2 2 − − + − c x n x n 单边检验:临界值 ( 1) 2 x1− n − 或 ( 1) 2 x n −
例7.5.P32 四.F-检验 双正态总体N(41,2)N(2G2) 41均值1,2已知,①H0:a2=a2。H1:σ2≠σ2 (5-1) ②F F(n1,n2) ∑(n-42) ③给定α确定临界域 双边检验:F2(n1,n2) 至于F(n1,n2)也可利用F分布的性质 F2(n1,m2)=1/F2(n1,n2)特别地n=n2时两者互为倒数 4.2均值未知 双边检验:①H0:a1=02。H1:a2≠a2 构造F F(n1-1,n2-1) 其中S2=,SnS2 n, h2-12 给定显著性水平,类似地运用F-分布表确定临界点 §7.3正态总体参数的置信区间 置信区间 设总体具有概率函数f(x,),为未知参数,51n为取定这个总体的字样, 若对于0a(1,两个统计量O1(51 02(51…5n)使P{6(0(O2}=1-a 则称区间(O1,O2)为参数O的置信度为1-a的置信区间,O1称为置信下限,O2称 为置信上限 注:①置信区间(1,2)是一个随机区间,它的两端点是不依赖为的统计量 ②其意义指在重复抽样下,许多不同的置信区间中大约100(1-a)%的区间包含 未知参数
例 7.5.P322 四.F-检验 双正态总体 ( , ) 2 N 1 1 ( , ) 2 N 2 2 4.1 均值 1 2 , 已知, ① 2 2 2 0 1 H : = 。 2 2 2 1 1 H : ② = = − − = = 2 1 2 1 1 2 2 1 2 1 2 2 2 1 ( ) ( ) n i i n i i n n S S F ~ F(n1,n2) ③给定 确定临界域 双边检验: ( , ) 1 1 2 2 F n n − 至于 ( , ) 1 2 2 F n n 也可利用 F-分布的性质 ( , ) 1 2 2 F n n =1/ ( , ) 1 1 2 2 F n n − 特别地 n1=n2 时 两者互为倒数 4.2 均值未知 双边检验:① 2 2 2 0 1 H : = 。 2 2 2 1 1 H : 构造 F= *2 2 *2 1 2 1 n n S S ~ F(n1-1,n2-1) 其中 2 1 1 *2 1 1 1 1 1 n S n n n S − = 2 2 2 *2 2 2 2 2 1 n S n n n S − = 给定显著性水平,类似地运用 F-分布表确定临界点 §7.3 正态总体参数的置信区间 一.置信区间. 设总体具有概率函数 f(x, ), 为未知参数, n ...... 1 为取定这个总体的字样, 若对于 01, 两个统计量 ( ....... ) 1 ^ 1 n ( ....... ) 1 ^ 2 n 使 { } = 1− ^ 2 ^ p 1 则称区间 ( , ) ^ 2 ^ 1 为参数 的置信度为 1- 的置信区间 , ^ 1 称为置信下限, ^ 2 称 为置信上限 注:①置信区间 ( , ) ^ 2 ^ 1 是一个随机区间,它的两端点是不依赖为 的统计量 ②其意义指在重复抽样下,许多不同的置信区间中大约 100(1-) %的区间包含 未知参数
即包含θ的区间类的置信度,不能认为不等式1(0(O2成立的概率为1-a 正态总体值的区间估计 (1)已知0=00,则u的置信水平1-a的置信区间是 ua,+u。)其分位点 即P(-4a〈4(H ( )/(an/√n)〈 (2)未知0=00,则μ的置信水平1-a的置信区间是 vn 由于P(-ta(n-1)((5-4)/(a0/Vn)(ta(n-1)=1 二正态总体方差a2的区间估计 (1)已知=0,则a2的置信水平为1a的置信区间为 ∑(- )2∑(5-0)2 x2(n) zig(n) 由P(xa(n)(x2=-2(x,a(m)可得 (2)4未知,置信水平1-a的置信区间
即包含 的区间类的置信度,不能认为不等式 ^ 2 ^ 1 成立的概率为 1- 一 正态总体值的区间估计 (1)已知σ=σ 0 ,则μ的置信水平 1- 的置信区间是 ( - n 0 2 , + n 0 2 ) 其 2 分位点 P( 〈 2 〉=1- 即 P(- 2 1 − 〈 〈 2 1 − 〉=1- P(- 2 1 − 〈( - )/( 0 / n )〈 2 1 − 〉=1- P( - n 0 2 1 − 〈 0 〈 + n 0 2 1 − 〉=1- (2) 未知σ=σ 0 ,则μ的置信水平 1- 的置信区间是 ( - n sn * t 2 1 − (n-1), + n sn * t 2 1 − (n-1)) 由于 P(- t 2 1 − (n-1) 〈 ( - )/( 0 / n )〈 t 2 1 − (n-1)〉=1- 二 正态总体方差 2 的区间估计 (1)已知 = 0 ,则 2 的置信水平为 1- 的置信区间为 ( ( ) ( ) 2 2 1 2 0 n n i i = − , ( ) ( ) 2 2 1 1 2 0 n n i i − = − ) 由 P( ( ) 2 2 n 〈 2 = 2 2 n nS 〈 ( ) 2 2 1 n − 〉可得 (2) 未知 ,置信水平 1- 的置信区间 [ ( 1) ( 1) 2 1 2* 1 − − − n n Sn , ( 1) ( 1) 2 2* 1 − − − n n Sn ] 由 P( ( 1) 2 1 1 − n − 〈 = 2 2 2* ( 1) n − Sn 〈 ( 1) 2 1 − n − 〉
三双正态总体的区间估计 均值差1-12的区间估计 (1)已知G1及2,则山112的置信水平为1-a的置信区间是 由P( 7-1=2 n, n2 知G1及2,但假定a1=02,则1P2的置信水平为1-a的 置信区间是 t(n,+n,-2),2-n-S Vn, n2 由于P(ta((5-n +—)〈t,)=1-a nI 2方差比,的区间估计 (1)41,p2已知,一2的置信区间为 (51-1)2/ ∑(-H1)2/n F(n,n2)∑(7-2)2/n2F=(m1,n2)∑(n-2)2/m2 由P(F〈F F)=1-a (2)H1,H2未知
=1- 三 双正态总体的区间估计 1 均值差 1 - 2 的区间估计 (1)已知 1 及 2 ,则 1 - 2 的置信水平为 1- 的置信区间是 ( - - 2 2 2 1 1 2 n n + 2 , - + 2 2 2 1 1 2 n n + 2 ) 由 P( 2 − 〈 = 2 2 1 2 1 1 2 2 n n + − − − 〈 2 〉 =1- (2)未知 1 及 2 ,但假定 1 = 2 ,则 1 -2 的置信水平为 1- 的 置信区间是 ( - -S w 1 2 1 1 n n + t 2 (n 1 +n 2 -2), - -S w 1 2 1 1 n n + t 2 1 − (n 1 +n 2 -2)) 由于 P(t 2 〈 ( - )/(S w 1 2 1 1 n n + )〈 t 2 1 − 〉=1- 2 方差比 2 2 2 1 的区间估计 (1) 1, 2 已知, 2 2 2 1 的置信区间为 [ 2 1 2 1 2 2 2 1 1 2 1 ( , ) ( ) / ( ) / F n n n n n i i n i i = = − − , 2 1 2 1 2 2 1 1 2 1 ( , ) ( ) / ( ) / 1 F n n n n n i i n i i = − = − − ] 由 P(F 2 〈F= 2 2 2 2 2 1 2 1 / / 2 1 n n S S 〈F 2 1 − 〉=1- (2) 1, 2 未知