Chapter 5 Parameters Estimating 参数佔计
Parameters Estimating 参数估计 Chapter 5
5.1点估计 52区间估计概述 53区间估计的例子 54小样本与T分布 55总体比率的估计 5.6样本容量的问题 57两正态总体问题 ●58抽样的方法
⚫ 5.1 点估计 ⚫ 5.2 区间估计概述 ⚫ 5.3 区间估计的例子 ⚫ 5.4 小样本与T分布 ⚫ 5.5 总体比率的估计 ⚫ 5.6 样本容量的问题 ⚫ 5.7 两正态总体问题 ⚫ 5.8 抽样的方法
51点估计 ●例:欲了解某地区男子平均身高 ◆办法一:普查,计算μ 缺点:费时、费力、成本高,加之人口有一定流动性,普查不易。 办法二:抽样,如随机抽取100名,计算,以估计μ值 缺点:z的取值有随机性,估计μ值比较粗糙 概念: 点估计就是估计总体的某特征量,如总体均值μ,总体方差o2 ●常用方法 以估计以,又记μ的估计量为,故这种用x估计μ的办法所得结果又表示为: A=X 以样本方差s2估计总体方差02,也就是:总体方差σ2未知时,抽样,计算样本方差 (x-M) n-1 以2估计。2,即合2=2。(注:计算时分母用n-1,解释之一是抽样数据的自由 度为n-1;此外,还请参见下一点的“无偏性”)
●对点估计效果的评价 ◆无偏性: 统计量、s2均是随机变量,由于抽样的随机性而将取不同的值。如果Fx)=以, 则称是μ的无偏估计。根据抽样定理,。Mk),证明确有)=以,也可理 解为:“平均”来看,用z估计μ是没有“偏差”的(又称以亙估计μ没有系统偏差) 无伯有偏 AX) X 图5 同样,以82估计。2时,可以证明E(s2)=02(这也是为什么计算2时分母用n-1,而 不用n的原因)
◆点估计的有效性: 例:抽样估计总体身高均值μ时,取n1=100,n2=200,根据抽样定理,知 E(20 R、都是以的无偏估计,但R的抽样分布的方差小于的抽样分布,即又比R更 集中在μ的左右,称用估计μ比元更有效 Efficiency有效性 PS X) =100 2=200 X 图5-2
52区间估计概述 ●点估计 抽样得到F,以估计μ值,太武断、太粗糙 ◆理论上没有利用抽样分布置3A)的分布形状,既没有利用抽样定理的大量 信息。 区间估计 为简单起见,首先分析总体分布σ2已知的情况下如何抽样估计μ值 ◆。2已知,则.口)的形状确定(注:分布的中线随μ偵而左有移动,但 形状不变) ◆充分利用所处区间与该区间对应的面积S的关系(参见图5-3) 区间估计的基本设计思想 ◆基础:2。M中 ◆关系:规定一个以μ为中点的区间±△,区间长度为2△ 在分布形状始定的情况下,S与△为一一对应关系
PSX) X 图5-3 ◆设计思路中,先给定S,称之为置信度,如S=95% 结论:有95%的可能(置信度,概率)在μ±△中 刁惯上常以1-α表示置信度 ◆利用逻辑等价关系: x有95%的可能在μ±△中 与μ的差距有95%的可能不超过△ u与x的差距有95%的可能不超过△ 有95%的可能在夏±△中 这就是对μ的区间估计
53区间估计的例子 某地区成年男士身高的区间估计 抽100名,得=171cm(设o已知,为20cm) 取置信度1-a为95%,求置信区间 解法: 由1a=95%,查表(参见P273),得ZP=1.96 ◆将2换算为A:4=2.·10+20=89am 故成年男士平均身高95%的置信区间为171±3.92cm 即(167.08,174.92) P267 Example5.2(数据见P259Tabe51) 此例中σ2未知,通过点估计,用5代替σ 其合理性见下节“应用”部分
54小样本与T分布 T分布 前有E。MA 即x-。N (,13) 其中,当2已知时,夏为随机变量,而且已得到它的分布规律。 当2未知时,直观上可想到用:2去替代,于是引发对 这个新随机变量的(式 √z 中与5均为随机变量)的研宄 有研究结果 称 X-A 为T统计量 有.mn-1 即该统计量服从自由度为n-1的T分布
→时,7(∞)=M(0,1 自由度增大 自由度减小 0 图5-4T分布图 T分布与n1的大小有关,n1越大,则图形越集中 当y→∞0时,T分布趋向标准正态分布