§72参数假设检验 我们这里仅介绍母体5的分布为正态时的几种显著性检验的方法正态分布(:,σ)含 有两个参数μ和。2,因此这里的假设都是对这两个参数的假设 一U-检验 设5…5n是取自正态母体N(μ,σ2)的一个子样,G2=σ子为已知常数要检验假设H μ=40- 如果原假设H。:μ=。为真,那么子样的平均值E应在4,周围随机地摆动,而不会偏听偏 离4。太大所以临界域的结构应有形状 (I-ok) 为了便于查表,我们把统计量-4,改成 0--丛 (7.2) n 它服从正态分布NO,1). 给出显若性水平a,在,为真下 PmQURA 例7.2设某厂一车床生产的钮扣,其直径据经验服从正态八N(4,。2),0=5.2为了检验 这一车床生产是否正常,现抽取容量=100的子样,其子样均值r=26.56.要求在显著性水平a =0.05下检验H。:4=26. 由正态N0,表查得1一号0975分位点n%根据子样现察值得 1-4上26.5626-108<1.96 5.2 10 不能拒绝原假设H。,因而认为生产是正常的 二t检验 设5…5n是取自正态终体N(4,02)的一个子样,02为未知常数。要检验的假设
§ 7.2 参数假设检验 我们这里仅介绍母体ξ的分布为正态时的几种显著性检验的方法.正态分布 N(μ, 2 )含 有两个参数μ和 2 ,因此这里的假设都是对这两个参数的假设. 一 U-检验 设 1 n 是取自正态母体 N(μ, 2 )的一个子样, 2 = 2 0 为已知常数.要检验假设 H0 : μ= 0 . 如果原假设 H0 :μ= 0 .为真,那么子样的平均值 应在 0 周围随机地摆动,而不会偏听偏 离 0 太大.所以临界域的结构应有形状 (| - 0 |>k) 为了便于查表,我们把统计量 - 0 改成 U= n 0 0 − (7.2) 它服从正态分布 N(0,1). 给出显著性水平α,在 H0 为真下 P 2 1 (| | 0 − H U )=α 例 7.2 设某厂一车床生产的钮扣,其直径据经验服从正态 N(μ, 2 ),σ=5.2.为了检验 这一车床生产是否正常,现抽取容量 n=100 的子样,其子样均值 x =26.56.要求在显著性水平α =0.05 下检验 H0 : 0 =26. 由正态 N(0,1)表查得 2 1 − =0.975 分位点 0.975=1.96 根据子样观察值得 |u|= 10 5.2 26.56 26 | | 0 0 − = − n x =1.08<1.96 不能拒绝原假设 H0 ,因而认为生产是正常的. 二 t-检验 设 1 n 是取自正态终体 N(μ, 2 )的一个子样, 2 为未知常数。要检验的假设
仍是H。:u=o 现在母体方差σ2未知,(7.2)中的统计量U己不能用,因为在这里U含未知参数σ2,它已 不是一个统计量所以要选取一个不含未知参。的统计量我们自然想到用方并的无偏估计 “,之G-了去取代写体方发。这样额得到统计量 S2=1 1=地n (7.3) 在H。为真时,§52中定理5.4的系1指出,这个统计量服从自由度为n-1的分布 给出显著性水平a,在H。为真时 Pi.(2(n-1))=a 这里1ga-)由查自由度为1)的分布表得到分布的密度函数 例7.3(略)见P317 检验还可用于检验两个正态母体的均值是否相等的问题不过这里应当指出,它们的方 差虽然未知,但是必须假定是相等的,否则下面的方法也不适用. 设5…5n是取自正态母体N(4,σ2)的子样n…n是取自母体N(42,G2)的子样并 且这两个子样相互独立.。之是未知常数现在要检验原假设H。:4,=42这个假设也可以写 成H。H凸=0 令这两个子样的均值与方差的无偏估计分别为 -2.2n 产6-研 82m-n 如果原假设H。:4~凸,0.为真,那-71应该在0的周期随机地摆动根据定理5.4的 系3可以选取这样的统计量
仍是 H0 :μ= 0 . 现在母体方差 2 未知,(7.2)中的统计量 U 已不能用,因为在这里 U 含未知参数 2 ,它已 不是一个统计量.所以要选取一个不含未知参 2 的统计量.我们自然想到用方并的无偏估计 2 1 *2 ( ) 1 1 = − + = n i n n S 去取代母体方差 2 .这样就得到 t-统计量 n S t n * − 0 = (7.3) 在 H0 为真时, §5.2 中定理 5.4 的系 1 指出,这个统计量服从自由度为 n-1 的 t-分布. 给出显著性水平α,在 H0 为真时 − = − (| | ( 1)) 2 1 0 PH t t n 这里 ( 1) 2 1 − − t n 由查自由度为(n-1)的 t-分布表得到 t-分布的密度函数. 例 7.3 (略)见 P317 t-检验还可用于检验两个正态母体的均值是否相等的问题.不过这里应当指出,它们的方 差虽然未知,但是必须假定是相等的,否则下面的方法也不适用. 设 1 n 是取自正态母体 N( , 1 2 )的子样. 1 n2 是取自母体 N( 2 2 , )的子样.并 且这两个子样相互独立. 2 是未知常数.现在要检验原假设 H0 : 1 = 2 .这个假设也可以写 成 H0 : 1 - 2 =0. 令这两个子样的均值与方差的无偏估计分别为 = = 1 1 1 n i i n , = = 2 2 1 1 n i i n 2 1 1 *2 1 ( ) 1 1 1 1 = − − = n i n i n S 2 2 1 *2 2 ( ) 1 1 2 2 = − − = n i n i n S 如果原假设 H0 : 1 - 2 =0.为真,那么| − |应该在 0 的周期随机地摆动根据定理 5.4 的 系 3 可以选取这样的统计量
1= ξ-n (7.4) 其中 S=a-1S+0,-1s空 月+n2-2 这些统计量他服从自由度为n,n2-2的他他t分布 给出显著性水平a在H。为真下 Pm01e1gm+n3-2》=a 这里1,m+%-2)由查自由度为%+%-2的他k分布表得到若由子样观察值 (,x,按74式算出州≥1e(+-2)则拒绝原假设H4=,即认为两个母体 的均值有显著的差别否则,没有显著差别,也即可以认为这两个子样来自同一母体 例7.4(略)见P319 三x2检验 上面介绍的U-检验与t检验都是有关均值假设的显著性检验问题 设5n取自正态母体N(4,σ2)的子样要求检验假设H。σ2=σ子现在分别对μ未 知两种情形进行讨论 一么为已如密数因为于样方整艺一从广是每体方差口的无计事么线封 量 之G-4 在H。为真时应该在1的周围随机的摆动我们知道在假设H。成立下,统计量 (5-4)月 2- (7.5) 服从自由度为n的x2.分布这时对于给定的显著性水平α,如何来确定临界域C呢?由于这 个统计量x2的值应在的周围随机摆,所以x己的值应界于某两个数,譬如k与k2,之间使得
1 2 1 1 n n S t W + − = (7.4) 其中 2 ( 1) ( 1) 1 2 *2 2 2 *2 2 1 1 1 2 + − − + − = n n n S n S S n n W 这些统计量他服从自由度为 n1+n2 − 2 的他他 t-分布. 给出显著性水平 a,在 H0 为真下 + − = − (| | ( 2)) 1 2 2 1 0 PH t t n n 这里 ( 2) 1 2 2 1 + − − t n n 由查自由度为 n1 + n2 − 2 的他 t- 分布表得到. 若由子样观察值 ( n x , , x 1 )按(7.4)式算出|t|≥ ( 2) 1 2 2 1 + − − t n n ,则拒绝原假设 H0 : 1 = 2 ,即认为两个母体 的均值有显著的差别.否则,没有显著差别,也即可以认为这两个子样来自同一母体. 例 7.4(略) 见 P319 三 2 -检验 上面介绍的 U-检验与 t-检验都是有关均值假设的显著性检验问题. 设 1 n 取自正态母体 N( 2 , )的子样.要求检验假设 H0 : 2 = 2 0 .现在分别对μ未 知两种情形进行讨论. μ= 0 为已知常数.因为子样方差 = − n i i n 1 2 0 ) 1 是母体方差 2 的无偏估计,那么统计 量 2 0 1 2 0 ( ) 1 = − n i i n 在 H0 为真时应该在 1 的周围随机的摆动.我们知道在假设 H0 成立下,统计量 2 0 1 2 0 2 ( ) = − = n i i (7.5) 服从自由度为 n 的 2 -分布.这时对于给定的显著性水平 ,如何来确定临界域 C 呢?由于这 个统计量 2 的值应在 n 的周围随机摆,所以 2 的值应界于某两个数,譬如 1 k 与 2 k ,之间使得
Pa,(ksx2≤k)=1-a 这就表明,临界域C的结构形式为{x2k2}.定出这种k和k,的方式很多,这 是由于我们可以把a分成任意两个%1,a2>0,a+a%2=a:分别由 P,(x2(m) 当子样观测值(x,…,,)∈C时就拒绝假设H,否则就接受原假设H。或者由子样观测值 (,,x,)算出统计量X己的值,若它Xe()就拒绝假设H。,否则就接受原 假设H。 2.μ为未知常数的情形.上面(们.5)式所表示的已经不是一个统计量因为它含有未知参数 μ,如前一们,我们用子样均值去代替未知母体均值μ。 在原假设H。成立下,根据定理5.4知道统计量 25.-0 Go (7.6 服从自由度为n-1)的X2-分布给定显著性水平α后,我们如在1中一样由 Px>xgm-》=号
( 2 ) =1− 2 1 P k k Hn 这就表明,临界域 C 的结构形式为 { } { }2 2 1 2 k k .定出这种 1 k 和 2 k 的方式很多,这 是由于我们可以把 分成任意两个 1 ,2 0,1 +2 = ;分别由 1 1 2 ( ) 0 PH k = 2 2 2 ( ) 0 PH K = 定出 1 k 和 2 k .一般地说, 1 和 2 的选取,应该由犯第二类错误的概率来决定.就是如此选取 1 和 2 使得犯第二类错误的概率尽可能的小.但在实际上由于计算最优的 1 和 2 很复杂. 往往就取 2 1 2 = = 显然对这时定出的 1 k 和 2 k 分别是自由度为 n 的 2 分布的 2 和 2 1 − 分位点.(图 7.4,P321)即 ( ), 2 2 k1 = n ( ) 2 2 1 k2 n − = 这样我们得到临界域 C= { ( )} { ( )} 2 2 1 2 2 2 2 n n − 当子样观测值( n x , , x 1 )∈C 时就拒绝假设 H0 否则就接受原假设 H0 .或者由子样观测值 ( n x , , x 1 )算出统计量 2 的值,若它 ( ) 2 2 n 或 ( ) 2 2 1 n − 就拒绝假设 H0 ,否则就接受原 假设 H0 . 2. μ为未知常数的情形.上面(7.5)式所表示的已经不是一个统计量.因为它含有未知参数 μ.如前一们,我们用子样均值 去代替未知母体均值μ. 在原假设 H0 成立下,根据定理 5.4 知道统计量 2 0 1 2 0 *2 2 ( ) ( 1) − = − = = n i i n Sn (7.6) 服从自由度为(n-1)的 2 -分布.给定显著性水平 后,我们如在 1 中一样由 2 ( ( 1)) 2 2 1 2 − = − P n
r<xm-W=号 定出两个临界值不过这时X2.(n-1)和x2(n-1)都是查自由度为n-1)的x2-检验 例7.5(略)见P322 四F检验 如果要比较两个正态母体的方差是否相等,我们藏要用到下面的一检验我们在用,检验 去检验两个母体的均值是否相等时,作了一个重要的假定就是这两个母体方差是相等的,即 σ=σ=σ2.否则我们就不能用t~检验如果我们事先不知道方差是否相等就不须先进行 方差是否相等的检验 高,…,5n是取自正态母体N4,G2)的子样,,…,是取自正态母体NM(4,。2) 的子样并且5,…,5和71,…,1n相互独立现在要检验假设H。:o=O 我们只讨论山与山都未知的情形.关于4与山,已知的情形,我们在x2-检验的讨论中 己经看到与4,山,未知情形完全类似的,差异仅在于每一个X2变量自由度各增加1就行了 在原假设H。成立下,两个子样方差的比应该在1周围随机地摆动所以这个比也是既不 能太大又不能太小.因此它的临界域也应由两个集合构成 在原假设H。:2=o为真时,由S5.2中定理5.4的系2知道统计量 (7.7 服从自由度为(m-1,n2-1)的F-分布在给定显著性水平α下,如X2检验那样,可由 PF≥a-%--号 PF≤Fm-l%-l》=号 定出两个临界值,这里Fg-n-)和F--)可由自度为-%-)的 下分布表查得,若由子样观察值算出的F满足F≥Fm-Lm,-)或 F≤F2m-1,n-)则拒绝H。:o=oi,否则接受H
2 ( ( 1)) 2 2 2 P n − = 定出两个临界值.不过这时 ( 1) 2 2 1 − − n 和 ( 1) 2 2 n − 都是查自由度为(n-1)的 2 -检验. 例 7.5 (略) 见 P322 四 F-检验 如果要比较两个正态母体的方差是否相等,我们就要用到下面的 F-检验.我们在用 t-检验 去检验两个母体的均值是否相等时,作了一个重要的假定就是这两个母体方差是相等的,即 2 2 2 2 1 = = .否则我们就不能用 t-检验.如果我们事先不知道方差是否相等,就不须先进行 方差是否相等的检验. 高 1 , , 1 n 是取自正态母体 N( , 1 2 )的子样, 2 , , 1 n 是取自正态母体 N( , 1 2 ) 的子样.并且 1 , , 1 n 和 2 , , 1 n 相互独立.现在要检验假设 H0 : 2 2 2 1 = . 我们只讨论 1 与 2 都未知的情形.关于 1 与 2 已知的情形,我们在 2 -检验的讨论中 已经看到与 1 , 2 未知情形完全类似的,差异仅在于每一个 2 变量自由度各增加 1 就行了. 在原假设 H0 成立下,两个子样方差的比应该在 1 周围随机地摆动.所以这个比也是既不 能太大又不能太小.因此它的临界域也应由两个集合构成. 在原假设 H0 : 2 2 2 1 = 为真时,由§5.2 中定理 5.4 的系 2 知道统计量 *2 2 *2 1 2 1 n n S S F = (7.7) 服从自由度为 ( 1, 1) n1 − n2 − 的 F-分布.在给定显著性水平 下,如 2 检验那样,可由 2 ( ( 1, 1)) 1 2 2 1 − − = − P F F n n 和 2 ( ( 1, 1)) 1 2 2 P F F n − n − = 定出两个临界值,这里 ( 1, 1) 1 2 2 1 − − − F n n 和 ( 1, 1) 1 2 2 F n − n − 可由自度为 ( 1, 1) n1 − n2 − 的 F- 分 布 表 查 得 , 若 由 子 样 观 察 值 算 出 的 F 满 足 ( 1, 1) 1 2 2 1 − − − F F n n 或 ( 1, 1) 1 2 2 F F n − n − 则拒绝 H0 : 2 2 2 1 = ,否则接受 H0
般的一分布只给出Fg~而不给出F三0的值,由关系式 Fgm-lm-)=F2m,-1m-可 可以从分位点F三一山%一)求出F三以-山山-)注意这两个自由度的前后换位 例7.6(略)见P325
一般的 F-分布只给出 ( ) 2 1 • − F 而不给出 ( ) 2 • F 的值,由关系式 ( 1, 1) 1 ( 1, 1) 2 1 2 1 2 2 1 − − − − = − F n n F n n 可以从分位点 ( 1, 1) 1 2 2 1 − − − F n n 求出 ( 1, 1) 1 2 2 F n − n − 注意这两个自由度的前后换位. 例 7.6 (略)见 P325