第八章常用统计分布
第八章 常用统计分布
第一节超几何分布 适用:小群体的两分变量。假定总体为 K个成功类、(NK)个为失败类 1超几何分布为离散型随机变量的概率 分布,它的数学形式是 P(X=x)=H(r, N,n,K=AA K K 11-x N 0211221
2021/12/21 2 第一节 超几何分布 适用:小群体的两分变量。假定总体为 K个成功类、(N-K)个为失败类 1.超几何分布为离散型随机变量的概率 分布,它的数学形式是
2超几何分布的数学期望值和方差 nK =E(X) a'=D(X n(N-n)(N-KK N(N-1) K 如果用p 少9=1-p,则有 =E(X)=1p N O'=D(X)=npq 0211221
2021/12/21 3 2.超几何分布的数学期望值和方差 如果用 ,则有
例]以随机方式自5男3女的小群体中选出5人组成一个 委员会,求该委员会中女性委员人数的概率分布、期望值与 变异数。 解]由题意可知:N=8.K=3,N-K=5.n=5, 代入(8.1)式,故概率分布如下: 0 3 合计 P=(xX=x)1/5615/5630/5610/5656/56 K 3 由p ,代入(8.4)式、(8.5)式得 8 (1)H=np=5 1.875 8 1-n 38-5 (2) npg 0.5022 88-1 0211221
2021/12/21 4 [例] 以随机方式自5男3女的小群体中选出5人组成一个 委员会,求该委员会中女性委员人数的概率分布、期望值与 变异数。 [解] 由题意可知:N=8.K=3,N―K=5.n=5, 代入(8.1)式,故概率分布如下: • 由 , ,代入(8.4)式、(8.5)式得 • (1) • (2) X 0 1 2 3 合计 P=(X=x) 1/56 15/56 30/56 10/56 56/56
3关于超几何分布的近似 n-r K K P(X=x)= 设某校有000名大学生,其中有外国留学生10、名,现从该校 学生中任抽2人,求抽到外国留学生的概率分布。 解]抽到外国留学生人数X服从N=1000、K=10、n=2的超 几何分布,根据(8.1)式得 990×989 P(x=0)=C2 10c990 0.98009 1000 1000×999 10×990×2 P(X=1 10990 0.01982 1000×999 10×9 P(X=2) 990 0.00009 1000 1000×999 0211221
2021/12/21 5 3.关于超几何分布的近似 设某校有l000名大学生,其中有外国留学生10、名,现从该校 学生中任抽2人,求抽到外国留学生的概率分布。 [解] 抽到外国留学生人数X服从N=1000、K=10、n=2的超 几何分布,根据(8.1)式得
由于K_2=0.0020.1时,如此计算误差会比较大。 另外,二项分布的计算量仍不算小,有时还可以将二项分 布近似为泊松分布,这一点我们将在下一节讨论。 0211221
2021/12/21 6 由于 =0.002<0.1,用二项分布近 似 计算有 ,由(8.6)式得 两种方法计算结果比较一下,仅在小数点后第5位上 才出现误差。当然在>0.1时,如此计算误差会比较大。 另外,二项分布的计算量仍不算小,有时还可以将二项分 布近似为泊松分布,这一点我们将在下一节讨论
第二节泊松分布 适用:稀有事件的研究。一个事件的平均发生次数 是大量实验的结果,在这些试验中,此事件可能发生,但 是发生的概率非常小。 泊松分布亦为离散型随机变量的概率分布,随机变量 X为样本内成功事件的次数。若λ为成功次数的期望值, 假定它为已知。而且在某一时空中成功的次数很少,超过 5次的成功概率可忽不计,那么X的某一具体取值x(即稀 有事件出现的次数)的概率分布为 P(X=x)=P(x, 2) 0211221
2021/12/21 7 第二节 泊松分布 适用:稀有事件的研究。一个事件的平均发生次数 是大量实验的结果,在这些试验中,此事件可能发生,但 是发生的概率非常小。 泊松分布亦为离散型随机变量的概率分布,随机变量 X为样本内成功事件的次数。若λ为成功次数的期望值, 假定它为已知。而且在某一时空中成功的次数很少,超过 5次的成功概率可忽不计,那么X的某一具体取值x(即稀 有事件出现的次数)的概率分布为
泊松分布的性质:x的取值为零和一切正整数;图 形是非对称的,但随着的入增加,图形变得对称;泊松 分布的数学期望和方差均为入。 X=x)4x=2.5 E(X) ∑ 014 D(X)=E(X2)-[E(X) ∑ 22=元 101214161820X 0211221
2021/12/21 8 泊松分布的性质:x的取值为零和一切正整数;图 形是非对称的,但随着的λ增加,图形变得对称;泊松 分布的数学期望和方差均为λ
[例]某城市50天交通事故的频数分布如表所示,试求泊松 理论分布。 天交通事故数 0 合计 天数f 23 50 解]由资料知 ∑_40 0.8 查泊松分布表,得理论分布 X N 50 0 2 3 4合计 04493035950.14380.03830.00911.0000 理论频(50xP)22418072 1.9 0.550.0 将实测频数与理论频数比较,可知题中所述稀有事件是 满足泊松分布的。 0211221
2021/12/21 9 [例] 某城市50天交通事故的频数分布如 表所示,试求泊松 理论分布。 X 0 1 2 3 4 合计 P 0.4493 0.3595 0.1438 0.0383 0.0091 1.0000 理论频(50хPi ) 22.4 18.0 7.2 1.9 0.5 50.0 一天交通事故数 0 1 2 3 合计 天数f 23 17 7 3 50 [解] 由资料知 查泊松分布表,得理论分布 将实测频数与理论频数比较,可知题中所述稀有事件是 满足泊松分布的。 ≥
第三节卡方分布 卡方分布是一种连续型随机变量的概率分布,主要用于列联表 检验 1数学形式 设随机变量X1,Ⅹ2,…X,相互独立,且都服从同一的正态 分布N(,a2)。那么,我们可以先把它们变为标准正态变量 k个独立标准正态变量的平方和被定义为卡方分布 (x2分布)的随机变量x2(x2读作卡方),且 ……+ k ∑( i=1 我们把随机变量x的概率分布称为x2分布,其概率密度记 作(x)。其中k为卡方分布的自由度,它表示定义式中独立变 0212量的个数
2021/12/21 10 第三节 卡方分布 卡方分布是一种连续型随机变量的概率分布,主要用于列联表 检验。 1.数学形式 设随机变量X1,X2,…Xk,相互独立,且都服从同一的正态 分布N (μ,σ2 )。那么,我们可以先把它们变为标准正态变量 Z1,Z2,…Zk,k个独立标准正态变量的平方和被定义为卡方分布 ( 分布)的随机变量 ( 读作卡方),且 我们把随机变量 的概率分布称为 分布,其概率密度记 作 。其中k为卡方分布的自由度,它表示定义式中独立变 量的个数