六章几种高常 变量的分布其应用 第一节二项分布
1 第六章 几种离散型 变量的分布及其应用 第一节 二项分布
例6-1某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人,试分别计算 这10人中有6人、7人、8人有效的概率
2 例6-1 某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人,试分别计算 这10人中有6人、7人、8人有效的概率
10 P(6)= 0.70°(1-0.70 10-6 0.20012 6(10-6)! 10! P(7) 0.707(1-0.70 10-7 0.26683 7!(10-7)! 10! P(8)= 0.70°(1-0.70)08=0.23347 8(10-8)
3 10! 6 10 6 (6) 0.70 (1 0.70) 0.20012 6!(10 6)! P − = − = − 10! 7 10 7 (7) 0.70 (1 0.70) 0.26683 7!(10 7)! P − = − = − 10! 8 10 8 (8) 0.70 (1 0.70) 0.23347 8!(10 8)! P − = − = −
、二项分布的概念 二项分布( binomial distribution)是指在只 会产生两种可能结果如“阳性”或“阴性”之 的n次独立重复试验(称为n重 Berno试验)中 当每次试验的“阳性”概率保持不变时,出现 “阳性”的次数X=0,1,2,∴,n的一种概率分 布
4 二项分布(binomial distribution)是指在只 会产生两种可能结果如“阳性”或“阴性”之一 的n次独立重复试验(称为n重Bernoulli试验)中 ,当每次试验的“阳性”概率保持不变时,出现 “阳性”的次数X=0,1,2,…,n的一种概率分 布。 一、二项分布的概念
从阳性率为m的总体中随机抽取大小为m的样 本,则出现阳性数为X的概率分布即呈二项分布, 记为X~B(n,m) P(XX!(n-X) 丌(1 r) n-r X=0.1.2
5 从阳性率为π的总体中随机抽取大小为n的样 本,则出现阳性数为X的概率分布即呈二项分布, 记为X~B(n,π), ! ( ) (1 ) 0,1,2, , !( )! n X n X P X X n X n X − = − = −
中国福利彩票 发行量1500万元,特等奖100个,金额5万元; 每张彩票面值2元,中奖概率1/75000。 投入金额100元1000元1万元10万元100万元 未中概率0.999330.99350.935510.51341000127 中奖概率0.000670.006640.06449048659099873
6 中国福利彩票 发行量1500万元,特等奖100个,金额5万元; 每张彩票面值2元,中奖概率1/75000。 100元 0.99933 0.00067 投入金额 未中概率 中奖概率 1000元 0.99336 0.00664 1万元 0.93551 0.06449 10万元 0.51341 0.48659 100万元 0.00127 0.99873
、二项分布的性质 1.当n较大时,只要丌不太靠近0或1,二项分布 B(n,丌)近似正态分布N(n丌,n丌(1-丌))。 率的标准误,用来描述样本率的抽样误差,率 的标准误越小,则率的抽样误差就越小 p(1-p)/n
7 2. 率的标准误,用来描述样本率的抽样误差,率 的标准误越小,则率的抽样误差就越小。 二、二项分布的性质 1. 当n较大时,只要π不太靠近0或1,二项分布 B(n,π)近似正态分布N(nπ, nπ(1-π)) 。 S p = p(1− p)/ n
三、总体率的区间佑计 当n较大、p和1-均不太小如mp和n(1p)均大于 5时,可利用样本率p的分布近似正态分布来估计 总体率的可信区间。 (p a/2 potus 界值: 02=1.9600≈2.58
8 当n较大、p和1-p均不太小如np和n(1-p)均大于 5时,可利用样本率p的分布近似正态分布来估计 总体率的可信区间。 三、总体率的区间估计 2 2 ( , ) p p p u S p u S − + 0.05 2 u =1.96 0.01 2 界值: u = 2.58
四、样本率与总体率的比较 例某药治疗某种疾病的有效率为070。用该药治 疗该疾病患者10人,结果2人有效。有何结论? P(X≤2)=Po+n1+n2=0.0016 假设检验: 0:x=0.70 H1:丌<0.70
9 四、样本率与总体率的比较 例 某药治疗某种疾病的有效率为0.70。用该药治 疗该疾病患者10人,结果2人有效。有何结论? 0 1 2 P X p p p ( 2) 0.0016 = + + = 假设检验: H0:π = 0.70 H1:π< 0.70
例某药治疗某病患者200人,结果70人有效。计 算总体有效率的95%可信区间。 (p-1.96S,p+1.96S) p=0.35 0.0362 95%可信区间:(27.9%,42.1%)
10 例 某药治疗某病患者200人,结果70人有效。计 算总体有效率的95%可信区间。 p = 0.35 ( 1.96 , 1.96 ) p p p S p S − + 0.0362 p S = 95%可信区间:( 27.9% ,42.1%)