单样本检验
单样本检验
二项分布基本概念 今二项分布 ■对于 Bernoulli试验序列的n次试验,结局A出现 的次数X的概率分布服从二项分布 二项分布指的是概率的分布 注意:二项分布是一个离散型分布 X的取值 取值概率()m.(-xy-0()z(-z)y…()z(1-zy….(m)z"(-xy 其相应取值概率为P(x=6)=()x(1-z)yk
二项分布基本概念 ❖二项分布 ▪ 对于Bernoulli试验序列的n次试验,结局A出现 的次数X的概率分布服从二项分布 • 二项分布指的是概率的分布 • 注意:二项分布是一个离散型分布 X 的取值 0 1 … k … n 取值概率 ( ) 0 0 0 ( ) 1 − − n n ( ) 1 1 1 ( ) 1 − − n n … ( ) n k n k k − ( ) 1− … ( ) n n n n n − ( ) 1− 其相应取值概率为 P(X=k)= ( ) n k n k k − ( ) 1−
二项分布的两个参数 显然对于不同的n、不同的π有不同的二项分布。它们是二 项分布的两个参数 若(服从二项分布,则记B(n,π) 0.20 4 0.15 0.3 概 概 0.10 0.05 0.1 0.00 02468101214161820 n=20,π=0.5 n=5,=0.3
二项分布的两个参数 • 显然对于不同的n、不同的有不同的二项分布。它们是二 项分布的两个参数。 • 若X服从二项分布,则记X~B(n, )。 n=20,=0.5 n=5,=0.3
二项分布的基本特征 今二项分布的名称由来是因为计算公式中含有二项 式的展开项 今二项分布的均数和方差 n元 n方差=nr(1- (x) r(l-r- u=n o=nr(1-T x!(n-x
二项分布的基本特征 ❖二项分布的名称由来是因为计算公式中含有二项 式的展开项 ❖二项分布的均数和方差 ▪ μ=n ▪ 方差=n(1- ) ( ) ( − ) = = ( − ) − = − 1 1 ! ! ! Pr( ) n n x n x n x x n x
二项分布的基本特征 当兀=0.5时,图形对称;当元≠0.5时,图形呈偏态,但 随n的增大,图形逐渐对称。 因此,当n较大,π不太极端时,可以采用正态近似方法 计算概率分布规律(例如计算参考值范围) 0.20 0.15 0.10 0.05 0.0 0.00 2345678910 0510x15202530 n=10丌=0.3 n=30丌=0.3
二项分布的基本特征 • 当 =0.5时,图形对称;当 ≠0.5时,图形呈偏态,但 随n的增大,图形逐渐对称。 因此,当n较大, 不太极端时,可以采用正态近似方法 计算概率分布规律(例如计算参考值范围) n=10 =0.3 n=30 =0.3
样本率的抽样分布 今对于大量重复随机抽样而言,样本率p围绕着总体 率π附近随机波动,样本量n的值越大,这种波动的 幅度就越小。 令当n充分大时,p的分布就近似于均数为π,标准差 为sqrt(π(1-)/n)的正态分布 般的标准是n和n(1-丌)均大于5,且n>40 ■当样本情况接近此标准时,往往会进行校正 心注意:上文所说的样本率p的标准差,为了区分阳 性数x的标准差,亦称样本率的标准差为标准误
样本率的抽样分布 ❖对于大量重复随机抽样而言,样本率p围绕着总体 率附近随机波动,样本量n的值越大,这种波动的 幅度就越小。 ❖当n充分大时,p的分布就近似于均数为,标准差 为sqrt( (1- )/n)的正态分布。 ▪ 一般的标准是n和n(1- )均大于5,且n>40 ▪ 当样本情况接近此标准时,往往会进行校正 ❖注意:上文所说的样本率p的标准差,为了区分阳 性数x的标准差,亦称样本率的标准差为标准误
总体率的区间估计 今对一个总体参数都有点估计和区间估计,点估计 直接使用样本统计量即可 今区间估计:直接计算概率 在样本例数较小,且样本率接近1或0,即阳性 事件发生率很高或很低时,可按照率的抽样分 布规律确定总体率的可信区间,为方便应用, 统计学家根据二项分布原理,编制了总体率95% 和99%可信区间的百分率可信区间表
总体率的区间估计 ❖对一个总体参数都有点估计和区间估计,点估计 直接使用样本统计量即可 ❖区间估计:直接计算概率 ▪ 在样本例数较小,且样本率接近1或0,即阳性 事件发生率很高或很低时,可按照率的抽样分 布规律确定总体率的可信区间,为方便应用, 统计学家根据二项分布原理,编制了总体率95% 和99%可信区间的百分率可信区间表
总体率的区间估计 今区间估计:正态近似 当n较大,π和1-π均不太小时,样本率的抽 样分布近似正态分布,因此可按正态近似法求 总体率的1a可信区间。 Stata计算 没有这么麻烦,使用cii命令即自动完成 例6.1某疗法治疗某病28人,6人有效,求该 疗法有效率的95%可信区间 例6.2某疗法治疗某病10人,7人有效,求该 疗法有效率的95%可信区间
总体率的区间估计 ❖区间估计:正态近似 ▪ 当n较大, 和1- 均不太小时,样本率的抽 样分布近似正态分布,因此可按正态近似法求 总体率的1- 可信区间。 ❖Stata计算 ▪ 没有这么麻烦,使用cii命令即自动完成 ▪ 例6.1 某疗法治疗某病28人,6人有效,求该 疗法有效率的95%可信区间。 ▪ 例6.2 某疗法治疗某病10人,7人有效,求该 疗法有效率的95%可信区间
样本率与已知总体率的比较 今如前所述,当n较大,元和1-元均不太小时,样 本率的抽样分布近似正态分布,可利用正态分布 的原理作假设检验。 反之,则可使用二项分布自身的概率分布进行假 设检验,这种方法被称为确切概率法
样本率与已知总体率的比较 ❖如前所述,当n较大, 和1- 均不太小时,样 本率的抽样分布近似正态分布,可利用正态分布 的原理作假设检验。 反之,则可使用二项分布自身的概率分布进行假 设检验,这种方法被称为确切概率法
样本率与已知总体率的比较 例6.4用常规疗法治疗流行性出血热的病死率为 15%,现用某新法治疗50名患者,死亡6例,问新 法治疗流行性出血热的病死率是否不等于常规疗 法。 由于样本量较大,因此可以考虑采用正态近似 法分析
样本率与已知总体率的比较 例6.4 用常规疗法治疗流行性出血热的病死率为 15%,现用某新法治疗50名患者,死亡6例,问新 法治疗流行性出血热的病死率是否不等于常规疗 法。 ▪ 由于样本量较大,因此可以考虑采用正态近似 法分析