第十七章分类资料的统计推断
第十七章 分类资料的统计推断
第一节率的抽样误差与区间估计 令一、率的抽样误差 令如同前面所讨论过的样本均数与总体均数存在 着抽样误差一样,样本率与总体率同样存在着抽样 误差。这个误差的大小我们用率的标准误来描述 冷用O表示。 由于抽样引起的样本率之间及样本率与总体率 之间的误差,称为率的抽样误差或率的标准误
第一节 率的抽样误差与区间估计 ❖ 一、率的抽样误差 ❖ 如同前面所讨论过的样本均数与总体均数存在 着抽样误差一样,样本率与总体率同样存在着抽样 误差。这个误差的大小我们用率的标准误来描述, ❖ 用 表示。 ❖ 由于抽样引起的样本率之间及样本率与总体率 之间的误差,称为率的抽样误差或率的标准误。 p p
(1-x) 式中光总体率,为样本例数
❖ 式中 为总体率, 为样本例数。 n p (1 ) − = n
令由于在实际中,总体率往往未知,我们常用 样本率P来近似代替总体率,则上述公式变 为 S=p(-p) 冷式中S为样本率的标准误,P为样本率 n为样本例数
❖由于在实际中,总体率往往未知,我们常用 样本率P来近似代替总体率,则上述公式变 为: ❖ ❖式中 为样本率的标准误,P为样本率, 为样本例数。 n p p S p (1− ) = p S n
例17-1某研究者为了解某地儿童结核的自然感染情况, 调查了500儿童,其中有20人感染了结核,结核的自然感 染率为4%.试估计该样本频率的抽样误差。 已知:p=4%,n=500代入公式得到标准误估计值: S=,(-p)_1004(1-0.04) =0.0088 500
例17-1 某研究者为了解某地儿童结核的自然感染情况, 调查了500儿童,其中有20人感染了结核,结核的自然感 染率为4%. 试估计该样本频率的抽样误差。 已知:p=4%,n=500,代入公式得到标准误估计值: (1 0.04 1 0.04 ) ( ) 0.0088 500 p p p S n − − = = =
总体率的估计 点估计p=P 令区间估计 正态近似法(P-lnSn,P+lnSn) 查表法
❖点估计 ❖区间估计 正态近似法 查表法 p ˆ = P ( , ) P u S P u S a a p p - + 总体率的估计
7-11) 二、率的区间估计 令(一)正态近似法 当n足够大,且np和n(1-p)均大于等于5时,P的 分布接近正态分布。可用下列公式来求总体率的可 信区间: (P s Ptus a/2 p2 P
二、率的区间估计 ❖(一)正态近似法 ❖当n足够大,且np和n(1-p)均大于等于5时,P的 分布接近正态分布。可用下列公式来求总体率的可 信区间: ( , ) P −u 2 Sp P + u 2 Sp (7 −11)
例17.1中结核感染率95%的可信区间为 p=1ln×S /2 p ⅩS C a/2~P (0.04-1.96×0.0088,0.04+1.96×0.0088 (002002
例17.1 中结核感染率95%的可信区间为 ( ) /2 /2 1.96 0.0088 0.0088 0.0228,0.0572 P P u s s − = − (p ,p+u ) (0.04 ,0.04+1.96 ) =
今(二)查表法 当样本含量较小时,比如ns50,特别是p接 近0或1,需查表(百分率的可信区间表),得 到总体率的可信区间
❖ (二)查表法 ❖ 当样本含量较小时,比如n≤50,特别是p接 近0或1,需查表(百分率的可信区间表),得 到总体率的可信区间
第二节率的u检验 令一、样本率与总体率的比较 丌
第二节 率的u检验 ❖一、样本率与总体率的比较 (1 ) p u n − = −