假设检验
2 假设检验
假设检验的概念 任何一个有关随机变量未知分布的假设称为 统计假设或简称假设.一个仅牵涉到随机变 量分布中几个未知参数的假设称为参数假 设这里所说的"假设"只是一个设想,至于它 是否成立,在建立假设时并不知道,还需进 行考察 对一个样本进行考察,从而决定它能否合理地 被认为与假设相符,这一过程叫做假设检验 判别参数假设的检验称为参数检验.检验是 种决定规则,通过一定的程序作出是与否 的判断
3 假设检验的概念 任何一个有关随机变量未知分布的假设称为 统计假设或简称假设. 一个仅牵涉到随机变 量分布中几个未知参数的假设称为参数假 设. 这里所说的"假设"只是一个设想, 至于它 是否成立, 在建立假设时并不知道, 还需进 行考察. 对一个样本进行考察, 从而决定它能否合理地 被认为与假设相符, 这一过程叫做假设检验. 判别参数假设的检验称为参数检验. 检验是 一种决定规则, 通过一定的程序作出是与否 的判断
例1 抛掷一枚硬币100次,"正面"出现了40次,问这 枚硬币是否匀称? 若用ξ描述抛掷一枚硬币的试验,"1"及 "=-0"分别表示"出现正面"和"出现反面",上述 问题就是要检验x是否服从p=1/2的0-1分布?
4 例1 抛掷一枚硬币100次, "正面"出现了40次, 问这 枚硬币是否匀称? 若用x描述抛掷一枚硬币的试验, "x=1"及 "x=0"分别表示"出现正面"和"出现反面", 上述 问题就是要检验x是否服从p=1/2的0-1分布?
例2 从1975年的新生儿(女)中随机地抽取20个,测 得其平均体重为3160克,样本标准差为300克. 而根据过去统计资料,新生儿(女)平均体重为 3140克问现在与过去的新生儿(女)体重有无 显著差异(假设新生儿体重服从正态分布) 若把所有1975年新生儿(女)体重体现为一个 总体2,问题就是判断E3140是否成立?
5 例2 从1975年的新生儿(女)中随机地抽取20个, 测 得其平均体重为3160克, 样本标准差为300克. 而根据过去统计资料, 新生儿(女)平均体重为 3140克. 问现在与过去的新生儿(女)体重有无 显著差异(假设新生儿体重服从正态分布)? 若把所有1975年新生儿(女)体重体现为一个 总体x, 问题就是判断Ex=3140是否成立?
例3 在10个相同的地块上对甲,乙两种玉米进行对 比试验,得如下资料(单位:公斤 甲95196610081082983 乙730864742774990 从直观上看,二者差异显著.但是一方面由 于抽样的随机性,我们不能以个别值进行比 较就得出结论;另一方面直观的标准可能因 人而异.因此这实际上需要比较两个正态总 体的期望值是否相等
6 例3 在10个相同的地块上对甲,乙两种玉米进行对 比试验, 得如下资料(单位:公斤) 甲 951 966 1008 1082 983 乙 730 864 742 774 990 从直观上看, 二者差异显著. 但是一方面由 于抽样的随机性, 我们不能以个别值进行比 较就得出结论; 另一方面直观的标准可能因 人而异. 因此这实际上需要比较两个正态总 体的期望值是否相等
这种作为检验对象的假设称为待检假设,通常 用H表示, 例如,例1的假设是 H0:B(1,0.5) 例2的假设是 H0:E53140 例3的假设是 H0:EX=EY(X与Y是两种玉米的产量期望值) 如何根据样本的信息来判断关于总体分布的 某个设想是否成立,也就是检验假设H成立与 否的方法
7 这种作为检验对象的假设称为待检假设, 通常 用H0表示, 例如, 例1的假设是 H0 : x~B(1,0.5) 例2的假设是 H0 : Ex=3140 例3的假设是 H0 : EX=EY (X与Y是两种玉米的产量期望值) 如何根据样本的信息来判断关于总体分布的 某个设想是否成立, 也就是检验假设H0成立与 否的方法
置信区间方法 用置信区间的方法进行检验,基本思想是这样 的:首先设想H是真的成立;然后考虑在H条 件下,已经观测到的样本信息出现的概率.如 果这个概率很小,这就表明一个概率很小的事 件在一次试验中发生了而小概率原理认为, 概率很小的事件在一次试验中是几乎不可能 发生的,也就是说导出了一个违背小概率原理 的不合理的现象这表明事先的设想H是不正 确的,因此拒绝原假设H.否则,不能拒绝H
8 置信区间方法 用置信区间的方法进行检验, 基本思想是这样 的: 首先设想H0是真的成立; 然后考虑在H0条 件下, 已经观测到的样本信息出现的概率. 如 果这个概率很小, 这就表明一个概率很小的事 件在一次试验中发生了. 而小概率原理认为, 概率很小的事件在一次试验中是几乎不可能 发生的, 也就是说导出了一个违背小概率原理 的不合理的现象. 这表明事先的设想H0是不正 确的, 因此拒绝原假设H0 . 否则, 不能拒绝H0
至于什么算是"概率很小" 在检验之前都事先指定.比 如概率为5%,1%等,一般记 作a. Q是一个事先指定的小的正 数,称为显著性水平或检验 水平
9 至于什么算是"概率很小", 在检验之前都事先指定. 比 如概率为5%, 1%等, 一般记 作a. a是一个事先指定的小的正 数, 称为显著性水平或检验 水平
两类错误 由于人们作出判断的依据是样本,也就是由部 分来推断整体,因而假设检验不可能绝对准确, 它也可能犯错误.其可能性的大小,也是以统 计规律性为依据的,所可能犯的错误有两类. 第一类错误是:原偎设酽符合实际情况,而检 验结果把它否定了,这称为弃真错误. 第二类错误是:原假设H不符合实际情况,而 检验结果把它肯定下来了,这称为取伪错误
10 两类错误 由于人们作出判断的依据是样本, 也就是由部 分来推断整体, 因而假设检验不可能绝对准确, 它也可能犯错误. 其可能性的大小, 也是以统 计规律性为依据的, 所可能犯的错误有两类. 第一类错误是: 原假设H0符合实际情况, 而检 验结果把它否定了, 这称为弃真错误. 第二类错误是: 原假设H0不符合实际情况, 而 检验结果把它肯定下来了, 这称为取伪错误
个正态总体的假设检验 设总体为5N,a2)关于总体参数a的假设 检验问题,本节介绍下列四种 (1)已知方差a,检验假设H:4=; (2)未知方差a2,检验假设H4=p46; (3)未知期望检验假设H0:a2=a2 (4)未知期望八检验假设H0:a2≤a2 其中H中的a32,p都是已知数
11 一个正态总体的假设检验 设总体为x~N(m,s2 ). 关于总体参数m,s2的假设 检验问题, 本节介绍下列四种: (1) 已知方差s2 , 检验假设H0 :m=m0 ; (2) 未知方差s2 , 检验假设H0 :m=m0 ; (3) 未知期望m, 检验假设H0 :s2=s0 2 ; (4) 未知期望m, 检验假设H0 :s2s0 2 ; 其中H0中的s0 2 , m0都是已知数