第五节均数的抽样误差和总体均数的估计 三、总体均数可信区间的估计 点估计 参数估计 (point estimation) 统计推断 区间估计 (interval estimation) 假设检验 点估计就是用样本指标代表总体指标。由于 不能考虑抽样误差的大小,故很少用。 区间估计是按一定的概率(可信度)由样本 吉林大学远程教育学院
2 吉林大学远程教育学院 第五节 均数的抽样误差和总体均数的估计 三、总体均数可信区间的估计 统计推断 参数估计 假设检验 点估计 (point estimation) 区间估计 (interval estimation) 点估计就是用样本指标代表总体指标。由于 不能考虑抽样误差的大小,故很少用。 区间估计是按一定的概率(可信度)由样本
指标估计总体指标的可能范围。该范围常称某参 数的可信区间或置信区间(confidence interval,C)。 可信度=1-a,常取95%或99%。 总体均数的可信区间可用下述通式求得: X±tS 公式(10.24) 式中1,为界值,QF1-可信度,=n一1。ta值 可从教材后面附表2查得。 当样本例数n足够大(n>100)时,可用下 述近似式求得: X±unSx 公式(10.23) 吉林大学远程教育学院
3 吉林大学远程教育学院 指标估计总体指标的可能范围。该范围常称某参 数的可信区间或置信区间(confidence interval,CI)。 可信度=1-α,常取95%或99%。 总体均数的可信区间可用下述通式求得: X t SX , 公式(10.24) 式中tα,ν为t界值,=1-可信度,ν=n-1。tα,ν值 可从教材后面附表2查得。 当样本例数n足够大(n>100)时,可用下 述近似式求得: X X u S 公式(10.23)
公式(10.23)是公式(10.24的近似式,前者只能在 大样本(n>100)时用,后者则大小样本都可。 例10.15由例10.1中102名健康女大学生口腔温度均数 37.06(℃),标准差S-0.198(℃),试估计该地健康女大学生口腔、 温度总体均数。 本例n=102>100,用公式(10.23)求: 0.198 =0.0196(C)4005=1.964601=2.58 95%C1:37.06±1.96×0.0196→(37.02,37.10) 99%CI:37.06±2.58×0.0196(37.01,37.11) 例10.16由例10.2中10名女大学生口腔温度资料,估计该地 健康女大学生口腔温度总体均数。 吉林大学远程教育学院
4 吉林大学远程教育学院 公式(10.23)是公式(10.24)的近似式,前者只能在 大样本(n>100)时用,后者则大小样本都可。 例10.15 由例10.1中102名健康女大学生口腔温度均数 37.06(℃),标准差S=0.198(℃),试估计该地健康女大学生口腔、 温度总体均数 。 X = 本例n=102>100,用公式(10.23)求: 0.0196( ) 102 0.198 C n S SX = = = u0.05 =1.96 u0.01 = 2.58 95%CI :37.06±1.96×0.0196 → (37.02,37.10) 99%CI :37.06±2.58×0.0196 → (37.01,37.11) 例10.16 由例10.2中10名女大学生口腔温度资料,估计该地 健康女大学生口腔温度总体均数
根据资料可知,n=10<100,只能用公式10.24)求: 先求出379、S=0.269、0S85。 V=n-1=9,查界值表,t005,9=2.262,t0.019-3.25 95%CI:37.09±2.262×0.085→(36.90,37.28) 99%CI:37.09±3.25×0.085→(36.81,37.37) 第大节假设检验的基本步骤 假设检验(hypothesis test)是统计推断中另一类 重要的方法,是统计学中应用最广泛的方法。其意 义可通过下面的例题说明。 吉林大学远程教育学院
5 吉林大学远程教育学院 根据资料可知,n=10<100,只能用公式(10.24)求: 先求出 37.09、S=0.269、 0.085 。 ν=n-1=9,查t界值表, t0.05,9=2.262, t0.01,9=3.25, X = = X S 95%CI :37.09±2.262×0.085 → (36.90,37.28) 99%CI :37.09±3.25×0.085 → (36.81,37.37) 第六节 假设检验的基本步骤 假设检验(hypothesis test)是统计推断中另一类 重要的方法,是统计学中应用最广泛的方法。其意 义可通过下面的例题说明
例10.17根据大量调查,己知正常成年男子脉搏均数为72次 分。某医生在一山区随机抽查了25名健康成年男子,求得其脉搏均数 为74.2次/分,标准差为6.0次/分。能否据此认为该山区成年男子脉搏 均数高于一般成年男子脉搏均数? 在本例中,山区成年男子脉搏均数用4仙表示,一般成年 男子脉搏均数用4表示。 X=74.2次/分 4-72次/分 Mu= S=6.0次1分 n=25 般总体 山区总体 吉林大学远程教育学院
6 吉林大学远程教育学院 例10.17 根据大量调查,已知正常成年男子脉搏均数为72次/ 分。某医生在一山区随机抽查了25名健康成年男子,求得其脉搏均数 为74.2次/分,标准差为6.0次/分。能否据此认为该山区成年男子脉搏 均数高于一般成年男子脉搏均数? 在本例中,山区成年男子脉搏均数用μ山表示,一般成年 男子脉搏均数用μ0表示。 μ0=72次/分 一般总体 μ山= ? 山区总体 n=25 次 分 次 分 6.0 / 74.2 / = = S X
这里4山与4的关系只能有两种: ①山=6 山>40 ②山≠ 山。造成二种情况的原因有: ①山=4(同一总体)抽样误差 ②山6(不同总体)→本质不同 吉林大学远程教育学院
7 吉林大学远程教育学院 这里μ山与μ0的关系只能有两种: ① μ山=μ0 ② μ山≠μ0 μ山>μ0 μ山<μ0 这里根据专业知识μ山≠μ0的关系中只能是 μ山>μ0 。造成二种情况的原因有: ① μ山=μ0 (同一总体)→ 抽样误差 ② μ山≠μ0 (不同总体)→ 本质不同
假设检验的基本步骤如下: 一、建立检验假设和确定检验水准 检验假设有两种: ①检验假设(hypothesis under test)又称零/原 假设(null hypothesis))。用H表示。假定通常 为:某两个(或多个)总体参数相等,或某 两个总体参数之差等于0,或某资料服从某一 特定分布(正态分布、Poisson分布)等。本 例则为:H0:仙=0。 吉林大学远程教育学院
8 吉林大学远程教育学院 假设检验的基本步骤如下: 一、建立检验假设和确定检验水准 检验假设有两种: ① 检验假设(hypothesis under test)又称零/原 假设(null hypothesis)。用H0表示。假定通常 为:某两个(或多个)总体参数相等,或某 两个总体参数之差等于0,或某资料服从某一 特定分布(正态分布、Poisson分布)等。本 例则为:H0 : μ山=μ0
②备择假设(alternative hypothesis)又称对位 假设。用H表示。H与H对立。H的内容可 反映出检验的单双侧。本例为:H1:山>g 即为单侧检验(one-sided test)或单尾检验(one, tailed test)。若Hi:山≠,则为双侧检验 (two-sided test)或双尾检验(two-tailed test)。 单双侧的选择在检验之前由专业知识确定。 ③检验水准(size of a test)是假设检验作判断 结论的标准,是预先确定的概率值,常常取 小概率事件标准。用a表示。也为型错误 吉林大学远程教育学院
9 吉林大学远程教育学院 单双侧的选择在检验之前由专业知识确定。 ② 备择假设(alternative hypothesis)又称对立 假设。用H1表示。H1与H0对立。H1的内容可 反映出检验的单双侧。本例为:H1 : μ山>μ0 即为单侧检验(one-sided test)或单尾检验(onetailed test)。若H1 : μ山≠μ0 则为双侧检验 (two-sided test)或双尾检验(two-tailed test)。 ③ 检验水准(size of a test)是假设检验作判断 结论的标准,是预先确定的概率值,常常取 小概率事件标准。用α表示。也为I型错误
的概率大小(详后)。实际工作中,a常取0.05。 二、选定检验方法和计算检验统计量 应根据变量或资料的类型、分析的目的、设 计的方案、检验方法的适用条件等选择检验方法。 检验统计量(test statistic)是在H,假设的条件 下由统计学家推导出的可由样本指标计算出来用 于推断结论的数值。 检验方法常用检验统计量的名称命名。如检 验中的统计量、检验中的统计量、2检验中 的x统计量等。 10 吉林大学远程教育学院
10 吉林大学远程教育学院 的概率大小(详后)。实际工作中,α常取0.05。 二、选定检验方法和计算检验统计量 应根据变量或资料的类型、分析的目的、设 计的方案、检验方法的适用条件等选择检验方法。 检验统计量(test statistic)是在H0假设的条件 下由统计学家推导出的可由样本指标计算出来用 于推断结论的数值。 检验方法常用检验统计量的名称命名。如t检 验中的t统计量、 u检验中的u统计量、 χ 2检验中 的χ 2统计量等
三、确定P值和作出推断结论 P值的统计学含义是指从H规定的总体随机 抽得等于及大于(或等于及小于)现有样本获得 的检验统计量的概率。 通俗地讲,P值就代表了H成立与否的概率。 将P值与检验水准进行比较得出推断结论。 推断结论应包含统计结论和专业结论两部分。 若P<a,则按检验水准拒绝H,有统计学意 义(统计结论),可认为...不同或不等(专业 结论)。 吉林大学远程教育学院
11 吉林大学远程教育学院 三、确定P值和作出推断结论 P值的统计学含义是指从H0规定的总体随机 抽得等于及大于(或等于及小于)现有样本获得 的检验统计量的概率。 通俗地讲,P值就代表了H0成立与否的概率。 将P值与检验水准α进行比较得出推断结论。 推断结论应包含统计结论和专业结论两部分。 若P ≤α,则按α检验水准拒绝H0,有统计学意 义(统计结论),可认为……不同或不等(专业 结论)