二)对总体方差的估计(只介绍小 样本下的) 设样本(x,…x来自正态总体N,),由定理414 可知,z=如-S服从具有自由度n-的y分布对于给 定的a-,查分布表可以确定a和b,一般取 P(z≤a=P(b≥b)=,使得P(a≤Z≤b)=1-a 2 由此,的置信区间确定为 n-1s 2(n b O
(二)对总体方差的估计(只介绍小 样本下的) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) = − − − = = = − − − = 1 1 1 , 1 2 1 1 , , μ , 4.14 2 2 2 2 2 2 2 2 2 1 a n b n P P Z a P b b P a Z b a b n n Z N s s s x xn 由此, 的置信区间确定为: 使得 定的 ,查 分布表可以确定 和 ,一般取 可知, 服从具有自由度 的 分布。对于给 设样本 来自正态总体 , 由定理
总体方差区间估计的例题 例9在本节例8中,请对新生儿体重的方 差进行区间估计(α=0.05) 0=0.05n-1=11,查X2分布临界值表,得 a-=382b=219,a、b满足: p(Z>=a)=0.975p(Z>=b)=0.025 有上例知,s2=140900,所以(n-1)32=1549000 则2的置信区间为: 1549000/21.9<2<1549000/3.82 即70700<2<405000
总体方差区间估计的例题 例9 在本节例8中,请对新生儿体重的方 差进行区间估计( =0.05)。 =0.05 n-1=11 ,查X2分布临界值表,得 a=3.82 b=21.9 ,a、b满足: p(Z>=a)=0.975 p(Z>=b)=0.025 有上例知,s 2=140900 ,所以(n-1)s2=1549000, 则 2的置信区间为: 1549000/21.9< 2< 1549000/3.82 即 70700< 2<405000
(三)关于区间估计的几点说明 (1)区间估计在方法上是定理4134.17的应 用 (2)在进行屈驾估计时,应针对不同的情况, 采用不同的方法。例如分清分布的形式是已知 或是未知;是大样本或是小样本;小样本(估 计总体数学期望时)又分清是已知方差或是未 知方差等。充分利用分布信息可以得到较精确 的估计 (3)一般地,α越大置信度越低,置信区间越 小;反之,则反
(三)关于区间估计的几点说明 (1)区间估计在方法上是定理4.13~4.17的应 用。 (2)在进行屈驾估计时,应针对不同的情况, 采用不同的方法。例如分清分布的形式是已知 或是未知;是大样本或是小样本;小样本(估 计总体数学期望时)又分清是已知方差或是未 知方差等。充分利用分布信息可以得到较精确 的估计。 (3)一般地,越大置信度越低,置信区间越 小;反之,则反
第七节通过样本,估计总体(三)三 假设检验 一、假设检验的概念 二、两类错误 三、假设检验与区间佔计间的关系:置信区间 法 四、假设检验的应用 (一)正态总体的假设检验 二)两个正态总体的假设检验 (三)总体分布的假设检验 五、“小概率原理”在假设检验中的应用
第七节 通过样本,估计总体(三)— —假设检验 一、假设检验的概念 二、两类错误 三、假设检验与区间估计间的关系:置信区间 法 四、假设检验的应用 (一)正态总体的假设检验 (二)两个正态总体的假设检验 (三)总体分布的假设检验 五、“小概率原理”在假设检验中的应用
`假设检验的概念少 定义:称对任何一个随机变量未知分布的假设为统计 假设,简称假设 个仅涉及到随机变量分布中未知参数的假设称为参 数假设。一个仅涉及到随机变量分布的形式而不涉及 到未知参数的假设称为非参数假设 参数假设中对未知参数完全确定的假设称为单一假设, 否则称为复合假设。例如:H0μ=1,0=2为单一假设, 而H0μ=1,0<>2为复合假设,因为满足这个假设的分 布有无数个 提出一个统计假设的关键是将一个实际的研究问题用 数学语言转换为统计假设
一、假设检验的概念 定义:称对任何一个随机变量未知分布的假设为统计 假设,简称假设。 一个仅涉及到随机变量分布中未知参数的假设称为参 数假设。一个仅涉及到随机变量分布的形式而不涉及 到未知参数的假设称为非参数假设。 参数假设中对未知参数完全确定的假设称为单一假设, 否则称为复合假设。例如:H0:=1,=2为单一假设, 而H0:=1, 2为复合假设,因为满足这个假设的分 布有无数个。 提出一个统计假设的关键是将一个实际的研究问题用 数学语言转换为统计假设
例1检验一个硬币是否均匀 抛掷一个硬币100次,“正面”出现60次, 问此硬币是否均匀? 分析: 若用X描述抛掷硬币的试验,“Ⅹ=1”和 “X=03分别表示“出现正面”和“出现 反面”。上述问题就是检验X是否可以被 认为服从p=0.5的0-1分布。 问题是分布形式已知,检验参数p=0.5的 单一检验。记作,Hp=0.5HP∞0.5
例1.检验一个硬币是否均匀 抛掷一个硬币100次,“正面”出现60次, 问此硬币是否均匀? 分析: 若用X描述抛掷硬币的试验,“X=1”和 “X=0”分别表示“出现正面”和“出现 反面”。上述问题就是检验X是否可以被 认为服从p=0.5的0-1分布。 问题是分布形式已知,检验参数p=0.5的 单一检验。记作,H0 :p=0.5 HA:p<>0.5
零假设与备择假设 在统计假设HP0.5HAP∞0.5中 H称为零假设或无效假设或待假设,是 我们进行统计假设检验欲确定其是否成 立的假设—体现我们进行假设检验的 目的,而且往往是希望否定这个假设 否定其成立所冒的风险为 H称为备择假设,统计假设检验是二择 的判断,当不成立时,不得不接受它
零假设与备择假设 在统计假设——H0 :p=0.5 HA:p<>0.5中, H0称为零假设或无效假设或待假设,是 我们进行统计假设检验欲确定其是否成 立的假设——体现我们进行假设检验的 目的,而且往往是希望否定这个假设, 否定其成立所冒的风险为。 HA称为备择假设,统计假设检验是二择 一的判断,当不成立时,不得不接受它
例2检验1976年新生女婴体重是否等 某个既定值 从1999年出生的女婴中随机地抽取20名,测得 平均体重=3160克,标准差=300克,根据已有 的统计资料新生女婴的体重=3140克,问现在 与过去新生女婴的体重是否有变化? 分析:把1999年出生的女婴视为一个总体,用 Ⅹ描述,问题就是判断: H:EX=3140HAEX<>3140 因为通常可以假定经过量测得到的资料是服从 正态分布的,无须检验总体的分布形式,显然 这是一个关于参数的复合假设检验问题
例2.检验1976年新生女婴体重是否等 于某个既定值 从1999年出生的女婴中随机地抽取20名,测得 平均体重=3160克,标准差=300克,根据已有 的统计资料新生女婴的体重=3140克,问现在 与过去新生女婴的体重是否有变化? 分析:把1999年出生的女婴视为一个总体,用 X描述,问题就是判断: H0 :EX=3140 HA:EX 3140 因为通常可以假定经过量测得到的资料是服从 正态分布的,无须检验总体的分布形式,显然 这是一个关于参数的复合假设检验问题
、两类错误 (1)两类错误的概念 (2) Neyman-Pearson7⑨ (3)显著性水平
二、两类错误 (1)两类错误的概念 (2)Neyman-Pearson方法 (3)显著性水平
(1)两类错误的概念 由于我们作出判断的依据是一组样本,结论却是对于 总体的,即由局部→>全面,由特殊=>一般,由个别 整体,因而假设检验的结果不可能绝对正确,它有可 能是错误的。而且出现错误可能性的大小,也是以统 计规律(小概率原理)为依据的。所可能犯的错误有 两类 第一类—弃真,原假设符合实际情况,而检验结果把 它否定了。设犯这类错误的概率为α,那么 a=p(否定HOH0实际上为真)。α称为显著性水平 第二类纳伪,原假设不符合实际情况,而检验结果 却把它肯定下来。设犯这类错误的概率为β,那么 p(接受H0/H0实际上为不正确)。1-β称为检验能力
(1)两类错误的概念 由于我们作出判断的依据是一组样本,结论却是对于 总体的,即由局部=>全面,由特殊=>一般,由个别=> 整体,因而假设检验的结果不可能绝对正确,它有可 能是错误的。而且出现错误可能性的大小,也是以统 计规律(小概率原理)为依据的。所可能犯的错误有 两类: 第一类—弃真,原假设符合实际情况,而检验结果把 它否定了。设犯这类错误的概率为,那么 =p(否定H0/H0实际上为真)。 称为显著性水平 第二类—纳伪,原假设不符合实际情况,而检验结果 却把它肯定下来。设犯这类错误的概率为,那么 =p(接受H0/H0实际上为不正确)。1- 称为检验能力