第四节关于一般总体数学期望的假设检验 在前两节中,我们讨论了正态总体的假设检验问题.本节我们讨论一般总体的假设检验 问题,此类问题可借助一些统计量的极限分布近似地进行假设检验,属于大样本统计范畴. 其理论依据是中心极限定理 分布图示 ★一个一般总体均值的大样本假设检验 ★例1 ★例2 ★两个一般总体均值的大样本假设检验 ★*一个0-1分布总体参数的大样本假设检验 ★*例5 ★*两个0-1分布总体参数的大样本假设检验 ★内容小结 ★课堂练习 ★习题7-4 ★返回 内容要点 一个总体均值的大样本假设检验 设非正态总体X的均值为,方差为a2,x1,X2,…,Xn为总体X的一个样本,样本 均值为x,样本的方差为S2,则当n充分大时,由中心极限定理知,U=近似地服 从N(O1).所以对μ的假设检验可以用前面讲过的u检验法这时所不同的是拒绝域是近似 的,这是关于一般总体数学期望的假设检验的简单有效的方法 对于双侧检验:H0:=10H1:μ≠山,可得近似的拒绝域为 对于右侧检验:H0:4≤A.H1:H>4,可得近似的拒绝域为 对于左侧假检验:H0:H20H1:4<灿,可得近似的拒绝域为 W=-∞,x-na 注若标准差σ未知,可以用样本标准差S来代替.即当n充分大时,由中心极限定理 知 7-近似地服从N(0,1) S/ 只需将上述的a用S代替,U用T代替,可得到类似的结论 二、两个总体均值的大样本假设检验 设有两个独立的总体X,F,其均值分别为山1,2,方差分别为G2,a2均值与方差均未知, 现从两个总体中分别抽取样本容量n,n2(n2n2均大于10)的大样本X1,X2,…An与 H1,H2…yn,F与F及S2与S2分别为这两个样本的样本均值及样本方差记Sn2是S2与S 的加权平均 2
第四节 关于一般总体数学期望的假设检验 在前两节中,我们讨论了正态总体的假设检验问题. 本节我们讨论一般总体的假设检验 问题,此类问题可借助一些统计量的极限分布近似地进行假设检验,属于大样本统计范畴. 其理论依据是中心极限定理. 分布图示 ★ 一个一般总体均值的大样本假设检验 ★ 例1 ★ 例2 ★ 两个一般总体均值的大样本假设检验 ★ 例3 ★ *一个 0 − 1 分布总体参数的大样本假设检验 ★ *例4 ★ *例5 ★ *两个 0 − 1 分布总体参数的大样本假设检验 ★ *例6 ★ 内容小结 ★ 课堂练习 ★ 习题 7-4 ★ 返回 内容要点 一、一个总体均值的大样本假设检验 设非正态总体 X 的均值为 ,方差为 2 ,X X Xn , , , 1 2 为总体 X 的一个样本,样本的 均值为 X ,样本的方差为 2 S ,则当 n 充分大时,由中心极限定理知, n X U − = 近似地服 从 N(0,1). 所以对 的假设检验可以用前面讲过的 u 检验法. 这时所不同的是拒绝域是近似 的,这是关于一般总体数学期望的假设检验的简单有效的方法。 对于双侧检验: 0 0, H : = : , H1 0 可得近似的拒绝域为 W = , , / 2 / 2 − + n X u n X u 对于右侧检验: 0 0, H : : , H1 0 可得近似的拒绝域为 W = , , + + n X u 对于左侧假检验: 0 0, H : : , H1 0 可得近似的拒绝域为 W = , , − − n X u 注 若标准差 未知,可以用样本标准差 S 来代替. 即当 n 充分大时,由中心极限定理 知, (0,1). / 0 N S n X Tn 近似地服从 − = 只需将上述的 用 S 代替, U 用 Tn 代替,可得到类似的结论. 二、两个总体均值的大样本假设检验 设有两个独立的总体 X,Y , 其均值分别为 , , 1 2 方差分别为 2 2 2 1 , ,均值与方差均未知, 现从两个总体中分别抽取样本容量 1 2 n , n ( 1 2 n , n 均大于 100)的大样本 1 , , , X1 X2 Xn 与 2 , , , Y1 Y2 Yn , X 与 Y 及 2 1 S 与 2 2 S 分别为这两个样本的样本均值及样本方差,记 2 Sw 是 2 1 S 与 2 2 S 的加权平均 . 2 ( 1) ( 1) 1 2 2 2 2 2 2 1 1 + − − + − = n n n S n S Sw
检验假设(1)H0:A1=2,H1:A≠山 (2)H0:1≤2,H1:>2 (3)H0:H1≥42,H1:pln}≈a,此时拒绝域为U>un; 3)对假设(3)P{U90 由于n=100为大样本,故用u检验法.总体标准差σ未知,用样本标准差s代替 当B成立时,有G==90x-近似 S/100S/100 N(0, 对于a=0.05,查表得la=l005=1645,近似拒绝域为W={>1.645}.已知x=96,s=30 于是统计量T的观察值t =2>1.645,落在了拒绝域中,故拒绝H0,即支持该 30/√100 管理员的看法 ( Weibu)分布,伽马分布,对数正态分布等多种寿命分布类来描述设备或部件的使用寿命 某厂新研究并开发了某类设备所需的关键部件,由于尚缺乏足够的经验数据,还无法判定此 部件的使用寿命所服从的分布类型.现通过加速失效试验法测得了100个新生产部件的使 用寿命,并算出了它们样本均值的观测值为x=17.84(kh,样本标准差的观测值为 s=1.25(kh),试问:由这些数据能否判定此部件的连续使用寿命至少为2年?(给定显著性水 平a=0.01) 解以每年365天计算,一部件若可连续使用二年,则使用的小时数至少应为 2×365×24=17520,折合为17.52kh 为此可考虑下述假设检验问题:Ho:≤17.52,H1:4>17.52,这可利用近似a检验法的 单侧检验来解.本例中灿0=17.52,n=100
检验假设 (1) : , : . H0 1 = 2 H1 1 2 (3) : , : . (2) : , : , 0 1 2 1 1 2 0 1 2 1 1 2 H H H H 若 2 2 2 1 ,可采用以下检验统计量及其近似分布 ( ) 1 = 2 (0,1), / / 2 2 1 2 2 1 N S n S n X Y U 近似地服从 + − = 若 2 2 2 1 = ,可采用以下检验统计量及其近似分布 ( ) 1 = 2 (0,1), 1/ 1/ ( ) 1 2 N S n n X Y U w 近似地服从 + − = 对于给定的显著性水平 ,有 1) 对假设(1) P{|U | u / 2 } ,此时拒绝域为 / 2 | | U u ; 2) 对假设(2) P{U u} ,此时拒绝域为 U u ; 3) 对假设(3) P{U −u} ,此时拒绝域为 U −u . 例题选讲 一个总体均值的大样本假设检验 例 1(E01) 某厂的生产管理员认为该厂第一道工序加工完的产品送到第二道工序进行加 工之前的平均等待时间超过 90min. 现对 100 件产品的随机抽样结果是平均等待时间为 96min, 样本标准差为 30min. 问抽样的结果是否支持该管理员的看法( = 0.05 )? 解 用 X 表示第一道工序加工完的产品送到第二道工序进行加工之前的等待时间, 总 体均值为 . 依题意, 检验假设为 : 90, H0 : 90. H1 由于 n =100 为大样本, 故用 u 检验法. 总体标准差 未知, 用样本标准差 s 代替. 当 H0 成立时, 有 ~ (0,1). / 100 / 100 90 N S X S X Tn − 近似 = − = 对于 = 0.05, 查表得 1.645, u = u0.05 = 近似拒绝域为 W ={t 1.645}. 已知 x = 96, s = 30, 于是统计量 Tn 的观察值 2 1.645, 30/ 100 96 90 = − t = 落在了拒绝域中, 故拒绝 , H0 即支持该 管理员的看法. 例 2 在可靠性理论与应用中, 常根据设备或部件不同的失效性质, 以指数分布,韦布尔 (Weibull)分布, 伽马分布, 对数正态分布等多种寿命分布类来描述设备或部件的使用寿命. 某厂新研究并开发了某类设备所需的关键部件,由于尚缺乏足够的经验数据, 还无法判定此 部件的使用寿命所服从的分布类型. 现通过加速失效试验法, 测得了 100 个新生产部件的使 用寿命, 并算出了它们样本均值的观测值为 x =17.84 (kh), 样本标准差的观测值为 s = 1.25 (kh), 试问: 由这些数据能否判定此部件的连续使用寿命至少为 2 年?(给定显著性水 平 = 0.01 ). 解 以每年 365 天计算, 一部件若可连续使用二年, 则使用的小时数至少应为 236524 =17520, 折合为 17.52 kh. 为此可考虑下述假设检验问题: : 17.52, H0 : 17.52, H1 这可利用近似 u 检验法的 单侧检验来解. 本例中 17.52, 0 = n =100
由测出的数据可计算Tn的观察值t=x地=1784-1752x10=2.56 对于给定的a=001,查附表,得ua=l01=233 由t=2.56>lo1=233故否定原假设H,即认为部件至少可以连续使用两年 两个总体均值的大样本假设检验 例3(E02)为比较两种小麦植株的高度(单位cm),在相同条件下进行高度测定,算得样 本均值与样本方差分别如下 甲小麦:n1=100x=28,s1=358 乙小麦:n2=100=26.2=32.3 在显著性水平a=005下,这两种小麦株高之间有无显著差异(假设两个总体方差相等)? 解这是属于大样本情形下两个总体分布未知、两个总体方差未知且相等的均值的差异 性检验,提出假设:H0:A1=H2,H1:1≠2 由于a=0.05,an2=196,又n1=n2=100,x=28,y=26,s2=358,s2=323,计算统计 量U的值u= =24.2 -+(2-+工 nI nI 由于|196,故否定H0,在显著性水平a=005下可认为两种小麦株高之间有显著差 异 一个0-1分布总体参数的检验 *例4一项调查结果声称,某市老年人口的比重为152%.该市老年人口研究会为了检验 该项调査结果是否可靠,随机抽选了400名居民,发现其中有6位老年人.问调査结果是否 支持该市老年人口比重为152%的看法(a=0.01)? 解设该市老年人口的比重为p,则需检验假设H0:p=0.152,H1P≠0.152 1,抽得的居民是老年人 引入随机就量X=10抽得的居民不是老年、则x服从0-1分布,其概率分布为 P{X=x}=p2(1-p) X-0.152 当H成立时,统计量U= N(0,1) 152×(1-0.152)/400 对于a=001,查表得ua2=l00=2.58,使得P{U卜2.58}≈0.01,故近似拒绝域为 由题设,x=62/400=0.155,代入求得U的值μ=0167,因|auk2.58,故接受原假设H0
由测出的数据可计算 Tn 的观察值 10 2.56. 1.25 17.84 17.52 / 0 = − = − = s n x t 对于给定的 = 0.01, 查附表, 得 2.33. u = u0.01 = 由 2.56 2.33, t = u0.01 = 故否定原假设 , H0 即认为部件至少可以连续使用两年. 两个总体均值的大样本假设检验 例 3 (E02) 为比较两种小麦植株的高度(单位:cm), 在相同条件下进行高度测定, 算得样 本均值与样本方差分别如下: 甲小麦: 100, 28, 35.8 2 n1 = x = s1 = 乙小麦: 100, 26, 32.3. 2 n2 = y = s2 = 在显著性水平 = 0.05 下,这两种小麦株高之间有无显著差异(假设两个总体方差相等)? 解 这是属于大样本情形下两个总体分布未知、两个总体方差未知且相等的均值的差异 性检验, 提出假设: : , H0 1 = 2 : . H1 1 2 由于 = 0.05, 1.96, u / 2 = 又 100, n1 = n2 = x = 28, y = 26, 35.8, 2 s1 = 32.3, 2 s2 = 计算统计 量 U 的值 24.2. 1 1 2 ( 1) ( 1) 1 2 1 2 2 2 2 2 1 2 = + + − − + − − = n n n n n s n s x y u 由于 | u |1.96, 故否定 , H0 在显著性水平 = 0.05 下可认为两种小麦株高之间有显著差 异. 一个 0-1 分布总体参数的检验 *例 4 一项调查结果声称, 某市老年人口的比重为 15.2%. 该市老年人口研究会为了检验 该项调查结果是否可靠, 随机抽选了 400 名居民, 发现其中有 62 位老年人. 问调查结果是否 支持该市老年人口比重为 15.2%的看法( = 0.01 )? 解 设该市老年人口的比重为 p, 则需检验假设 : 0.152, H0 p = 0.152. H1 p 引入随机就量 = , 0, 1, 抽得的居民不是老年人 抽得的居民是老年人 X 则 X 服从 0 −1 分布, 其概率分布为 { } (1 ) , x 1 x P X x p p − = = − x = 0,1. 当 H0 成立时, 统计量 ~ (0,1). 0.152 (1 0.152)/ 400 0.152 N X U 近似 − − = 对于 = 0.01, 查表得 2.58, u / 2 = u0.005 = 使得 P{|U | 2.58} 0.01, 故近似拒绝域为 W ={| u | 2.58}. 由题设, x=62/400=0.155, 代入求得 U 的值 |u|=0.167, 因 | u | 2.58, 故接受原假设 . H0
*例5某地区主管工业的负责人收到一份报告,该报告中说他主管的工厂中执行环境保 护条例的厂家不足60%,这位负责人认为应不低于60%,于是他在该地区众多的工厂中随机 抽査了60个厂家,结果发现有33家执行了环境条例,那么由他本人的调查结果能否证明那 份报告中的说法有问题(a=005)? 解(1)建立检验假设H0:p≥06,H1:p-1645 p0(1-p0)/n 故接受H0,即认为执行环保条例的厂家不低于60% 两个0-1分布总体参数的检验 例6在A县调查n=1500个农户,其中有中小型农业机械的农户m=300户;在B县 调查n2=1800户,其中有中小型农业机械的农户n=320户.试在显著性水平a=0.05下 检验两个县有中小型农户的比率有无差异? 解由于n1=1500,m2=1800,这是大样本情下两个0-1总体的概率检验问题 假设H0:P1=P2,H1:P1≠P2,由于n1=1500n2=1800,n=3004m2=320,经计算得 Pl 0.200p2 =0.178, =“+/=0188 n=B-2 0.161 p(1-p(/n+1/mn2) 由a=005,可知uan2=1.96,由于|k<uan2,故在显著性水平a=0.05下接受H0 课堂练习 丽华厂有批产品10000件,按规定的标准,出厂时的次品率不得超过3%,质量检验 员从中任意抽取100件,发现其中有5件次品,问这批产品能否出厂(a=005)?
*例 5 某地区主管工业的负责人收到一份报告, 该报告中说他主管的工厂中执行环境保 护条例的厂家不足 60%, 这位负责人认为应不低于 60%, 于是他在该地区众多的工厂中随机 抽查了 60 个厂家, 结果发现有 33 家执行了环境条例, 那么由他本人的调查结果能否证明那 份报告中的说法有问题( = 0.05 )? 解 (1) 建立检验假设 : 0.6, H0 p : 0.6. H1 p (2) 选择统计量 ~ (0,1). (1 )/ 0 0 0 N p p n X p U 近似 − − = (3) 给定显著性水平 , 确定 k, 使 − − k p p n X p P (1 )/ 0 0 0 查标准正态分布表得 1.645, k = −u = u0.05 = − 所以拒绝域为 u −1.645. (4) 由于 x = 33/60 = 0.55, 0.6, p0 = 所以 0.79 1.645, (1 )/ 0 0 0 = − − − − = p p n x p u 故接受 , H0 即认为执行环保条例的厂家不低于 60%. 两个 0-1 分布总体参数的检验 *例 6 在 A 县调查 n1 =1500 个农户, 其中有中小型农业机械的农户 300 1 n = 户; 在 B 县 调查 n2 =1800 户, 其中有中小型农业机械的农户 320 2 n = 户. 试在显著性水平 = 0.05 下 检验两个县有中小型农户的比率有无差异? 解 由于 1500, n1 = 1800, n2 = 这是大样本情下两个 0 −1 总体的概率检验问题. 假设 : , H0 p1 = p2 : . H1 p1 p2 由于 1500, n1 = 1800, n2 = 300, 1 n = 320, 2 n = 经计算得 0.200, 1 1 1 = = n p n 0.178, 2 2 2 = = n p n 0.188, 1 2 1 2 = + + = n n p n n 0.161, (1 )(1/ 1/ ) 1 2 1 2 = − + − = p p n n p p u 由 = 0.05, 可知 1.96, u / 2 = 由于 | | , u u / 2 故在显著性水平 = 0.05 下接受 . H0 课堂练习 1.丽华厂有批产品 10000 件,按规定的标准,出厂时的次品率不得超过 3%,质量检验 员从中任意抽取 100 件,发现其中有 5 件次品,问这批产品能否出厂( = 0.05) ?