第五章t检验( t-test) 前面第四章第六节讲了样本平均数抽样分布的 可题。抽样研究的目的是用样本信息来推断总体 特征,这就是我们将重点讨论的统计推断问题。 ·所谓统计推断是指根据样本以及问题的条件和 假定模型对未知事物(即总体作出的以概率形彐 表述的推断,它主要包括假设检验和参数估计两 个内容。 假设检验又叫显著性检验,其方法很多,常用 的有t检验、F检验和X检验等
第五章 t检验 (t-test) • 前面第四章第六节讲了样本平均数抽样分布的 问题。抽样研究的目的是用样本信息来推断总体 特征,这就是我们将重点讨论的统计推断问题。 • 所谓统计推断是指根据样本以及问题的条件和 假定模型对未知事物(即总体)作出的以概率形式 表述的推断,它主要包括假设检验和参数估计两 个内容。 • 假设检验又叫显著性检验,其方法很多,常用 的有t检验、F检验和χ 2检验等
尽管这些检验方法的用途及使用条件不 同,但其检验的基本原理是相同的。 本章以平均数的差异显著性检验为仞阐 明显著性检验的原理,介绍几种t检验的方 法,然后介绍总体均数的区间估计
• 尽管这些检验方法的用途及使用条件不 同,但其检验的基本原理是相同的。 • 本章以平均数的差异显著性检验为例阐 明显著性检验的原理,介绍几种t检验的方 法, 然后介绍总体均数的区间估计
第一节显著性检验的基本原理o 第二节样本均数与总体均数的差异显著 性检验 第三节两样本平均数的差异显者性检验① 第四节显著性检验中应注意的问题o 第五节总体均数的区间估计
• 第一节 显著性检验的基本原理 • 第二节 样本均数与总体均数的差异显著 性检验 • 第三节 两样本平均数的差异显著性检验 • 第四节 显著性检验中应注意的问题 • 第五节 总体均数的区间估计
第一节显著性检验的基本原理 显著性检验的意义回 二、显著性检验的基本步骤 三、显著水平与两类错误 四、双侧检验与单侧检验
第一节 显著性检验的基本原理 • 一、显著性检验的意义 • 二、显著性检验的基本步骤 • 三、显著水平与两类错误 • 四、双侧检验与单侧检验
显著性检验的意义 本节的内容主要是解决这样几个问题,即进行 显著性检验的目的、检验对象、基本思想和基本 前提是什么?下面结合具体例子来说明 (-)为什么要进行显著性检验? ·在某种猪场随机抽测了甲、乙两品种经产母猪 各10头的产仔初生窝重 甲品种10头母猪产仔平均初生窝重=1350kg 标准差|S1=1.81kg 乙品种10头母猪产仔平均初生窝重=1163kg 标准差S 2=1.63s
一、显著性检验的意义 • 本节的内容主要是解决这样几个问题,即进行 显著性检验的目的、检验对象、基本思想和基本 前提是什么 ?下面结合具体例子来说明。 • (一)为什么要进行显著性检验? • 在某种猪场随机抽测了甲、乙两品种经产母猪 各10头的产仔初生窝重: • 甲品种10头母猪产仔平均初生窝重 • 标准差 ; • 乙品种10头母猪产仔平均初生窝重 , • 标准差 。 x1 =13.50kg S1 =1.81kg x1 =11.63kg S2 =1.63kg
问题:能否仅凭这两个样本均数差值-=187kg 立即得出甲、乙两品种母猪经产仔初生窝重不同 的结论呢? 统计学认为,这样得出的结论是不可靠的。这 是因为试验指标既受处理因素的影响,又受试验 误差(或抽样误差)的影响。如果我们再分别随机 抽测10头甲、乙两品种猪母猪产仔初生窝重,又 可得到两个样本资料。两样本均数就不一定是 135kg和1163kg,其差值也不一定是1.87kg 怎样通过样本来推断总体呢?这正是显著 性检验要解决的问题
问题:能否仅凭这两个样本均数差值 • 立即得出甲、乙两品种母猪经产仔初生窝重不同 的结论呢? • 统计学认为, 这样得出的结论是不可靠的。这 是因为试验指标既受处理因素的影响,又受试验 误差(或抽样误差)的影响。如果我们再分别随机 抽测10头甲、乙两品种猪母猪产仔初生窝重,又 可得到两个样本资料。两样本均数就不一定是 13.5kg和11.63kg,其差值也不一定是1.87kg。 • 怎样通过样本来推断总体呢?——这正是显著 性检验要解决的问题。 x x 1.87kg 1 − 2 =
(二)检验对象 设甲品种猪经产母猪产仔初生窝重的总体均数 为品种的总体均数为四 试验研究(本例为抽样比较)的目的,就是要 给是否相同做出推断由于总体均数、_画知 在进行显著性检验时只能以样本均数、、对 验对象更确切地说,是以低-x险对象。事 实上,因为样本均数具有下述特征 0离均差的平方和∑xx)说明样本平均数 与样本各个观察值最接近,平均数是资料的代表 数
(二)检验对象 • 设甲品种猪经产母猪产仔初生窝重的总体均数 为 ,乙品种的总体均数为 。 • 试验研究(本例为抽样比较)的目的,就是要 给 、 是否相同做出推断,由于总体均数 、未知, 在进行显著性检验时只能以样本均数 、作为检 验对象,更确切地说,是以 作为检验对象。事 实上,因为样本均数具有下述特征: • 离均差的平方和 最小。说明样本平均数 与样本各个观察值最接近,平均数是资料的代表 数。 1 2 1 2 1 2 ( ) 1 2 x − x 1 2 x、x 2 (x − x)
2样本平均数是总体均数的无偏估计值,E(x)=A °统计学中心极限定理,样本平均数从或逼 近正态分布。 所以,以样本平均数作为检验对象,由两个样 本均数差异的大小去推断样本所属总体平均数是 否相同是有其依据的 由上所述,一方面我们有依据由样本均数 差异来推断总体均数与否,另一方面又 不能仅据样本均数表面上的差异直接作出结论 其根本原因在于试验误差(或抽样误差)的不可避 免性
样本平均数是总体均数的无偏估计值, • 统计学中心极限定理,样本平均数 服从或逼 近正态分布。 • 所以,以样本平均数作为检验对象,由两个样 本均数差异的大小去推断样本所属总体平均数是 否相同是有其依据的。 • 由上所述,一方面我们有依据由样本均数 的 差异来推断总体均数 、 相同与否,另一方面又 不能仅据样本均数表面上的差异直接作出结论, 其根本原因在于试验误差(或抽样误差)的不可避 免性。 E(x) = x 1 2 1 2 x、x
(三)基本思想 我们所得到的观察值由两部分组成,即x=+E 若样本含量为n,则可得到个观察值xxx于 是样本平均数阝=+明样本均数并非总体均数 它还包含试验误差的成分。 对于接受不同处理的两个样本来说,则有 +.X 15~2 E (x1-x2)=(1-l2)+(E1-E2) 两个样本均数之差试验的处理效应试验误差
(三)基本思想 • 我们所得到的观察值由两部分组成,即 • 若样本含量为n,则可得到n个观察值 。于 是样本平均数 。说明样本均数并非总体均数, 它还包含试验误差的成分。 • 对于接受不同处理的两个样本来说,则有: • i i x = + n x , x ,..., x 1 2 x = + 1 1 1 2 2 2 x = + , x = + ( ) ( ) ( ) x1 − x2 = 1 −2 + 1 − 2 两个样本均数之差 试验的处理效应 试验误差
样本平均数的差(x1-x2)含有试验误差 它不只是试验的表面效应。因此,仅凭远一对 总体均数、相同下结论是不可靠的只有 通过显著性检验才能从x-x)告论。 对国一)显著性检验就是要分析 (x-x)由处理效应A4A),还是主要由试 验误差所造成? 虽然处理效应【(A-A),但试验的表面效应是 可以计篁的,借助数理统计方法试验误差又是可 以估计的
样本平均数的差 包含有试验误差, • 它不只是试验的表面效应。因此,仅凭 就对 总体均数 、 是否相同下结论是不可靠的。 只有 通过显著性检验才能从 中提取结论。 • 对 进行显著性检验就是要分析: • 主要由处理效应 引起的,还是主要由试 验误差所造成? • 虽然处理效应 未知,但试验的表面效应是 可以计算的,借助数理统计方法试验误差又是可 以估计的。 ( ) x1 − x2 ( ) 1 2 x − x 1 2 ( ) 1 2 x − x ( ) 1 2 x − x ( ) 1 2 x − x ( ) 1 −2 ( ) 1 −2