第6章参数估计 对给定的统计问题,在建立了统计模型以后,我们的任务就是依据样本对未知总体 进行各种推断,参数估计是统计推断的重要内容之一。本章主要介绍进行参数估计的方 法及其评价等。 6.1点估计 参数估计,就是要从样本出发去构造一个统计量作为总体中某未知参数的一个估计 量。若总体的分布函数的形式为已知,但它的一个或多个参数未知,则由总体厂的一 个样本去估计总体未知参数的值的问题就是参数的点估计问题。 例如,某钢筋厂日生产某种型号钢筋10000根,为了要得知这批钢筋的强度,质量 检察员从中抽取50跟进行检查。如何从抽查的50根钢筋强度的数据去估计整批钢筋强 度的平均值?这就是参数估计要解决的问题。在实际问题中,我们常常以统计量 =2X, nA 作为总体X的期望值的估计量。 设总体的分布函数为F(x,O),其中日为未知参数。K,五,,n为总体的 一个样本。点估计的问题就是由样本构造一个统计量 X,X2,…X) 作为未知参数0的一个估计量。若,,,xn是样本观察值,则代入估计量 0(X1,2.rn) 中即可以得到一个关于参数0的估计值。在不致混淆的情况下,我们把估计量或估计值 简称为估计。 构造估计的方法很多,下面介绍常用的方法。 1矩估计法 矩法是另一种进行估计的简捷方法,也是基于替换的一种方法,即用样本矩去近似 总体矩。我们知道,矩是由随机变量的分布唯一确定,而样本来源于总体,样本矩在一 定程度上反映总体矩的特征,用样本矩来估计总体矩的估计方法称为矩估计法。设总体 X的分布函数为F(日1,02,,0,日1,02,,日k为未知参数,,,, 为来自总体的样本,如果总体的阶矩 E() 存在,并设 Er)=4(81,02,0), 相应的r阶样本矩为 A=12K,r=1,26 71
第 第 6 6 章 章 参数估计 参数估计 对给定的统计问题,在建立了统计模型以后,我们的任务就是依据样本对未知总体 进行各种推断,参数估计是统计推断的重要内容之一。本章主要介绍进行参数估计的方 法及其评价等。 6.1 6.1 点估计 参数估计,就是要从样本出发去构造一个统计量作为总体中某未知参数的一个估计 量。若总体 X 的分布函数的形式为已知,但它的一个或多个参数未知,则由总体 X 的一 个样本去估计总体未知参数的值的问题就是参数的点估计问题。 例如,某钢筋厂日生产某种型号钢筋 10000 根,为了要得知这批钢筋的强度,质量 检察员从中抽取 50 跟进行检查。如何从抽查的 50 根钢筋强度的数据去估计整批钢筋强 度的平均值?这就是参数估计要解决的问题。在实际问题中,我们常常以统计量 n i X i n X 1 1 作为总体 X 的期望值的估计量。 设总体 X 的分布函数为 F (x, ),其中 为未知参数。X1,X2,…,Xn为总体 X 的 一个样本。点估计的问题就是由样本构造一个统计量 ( , ,.... ) X1 X 2 X n 作为未知参数 的一个估计量。若 x1,x2,…,xn是样本观察值,则代入估计量 ( , ,.... ) X1 X 2 X n 中即可以得到一个关于参数 的估计值。在不致混淆的情况下,我们把估计量或估计值 简称为估计。 构造估计的方法很多,下面介绍常用的方法。 1 1 矩估计法 矩法是另一种进行估计的简捷方法,也是基于替换的一种方法,即用样本矩去近似 总体矩。我们知道,矩是由随机变量的分布唯一确定,而样本来源于总体,样本矩在一 定程度上反映总体矩的特征,用样本矩来估计总体矩的估计方法称为矩估计法。设总体 X 的分布函数为 F (x; 1, 2,…, k), 1, 2,…, k为未知参数,X1,X2,…, Xn为来自总体 X 的样本,如果总体的 k 阶矩 ( ) r E X 存在,并设 E(Xr ) r (1 , 2 ,..., k ) , 相应的 r 阶样本矩为 . n i r r i X r k n A 1 , 1,2,... 1
以A,替代E(K,),即可得到关于01,02,…,0的方程组 4,060)=2r=12k 记解为 A.664, 称其分别为参数01,02,…,04的矩估计量 例1求总体均值4和方差σ2的矩估计。 解总体的二阶矩为μ2=4+σ2,由上述矩估计法得到方程组: 4=X=不 n 2+o2=2x 解此方程组,得到矩估计量为 a=元,62=1乃-f=2X,-万2 ni 在作矩估计时,也可用中心矩建立关于未知参数的方程组,因而矩估计不唯一,在矩估 计中最常用的是用样本均值作为总体期望的估计量,但若总体矩不存在,则矩法失效。 例2设总体r服从参数为入的Poisson分布,求参数2的矩估计。 解由于2=E()=D,故由例2可知: 充=不 均为入的矩估计量 例3设样本,,,X来自总体X,其密度函数为 fx01,02)= 。0,≤x≤0,求0,0:的矩估计 02-1 0 解 由 0=0+8,0= 2 128-8) 01+02=元, 得方程组: 2 后0,-=4=2(- 解此方程组,得到矩估计量: 6,=T-√3B,02=F+3B
以 A r替代 E (X r ),即可得到关于 1, 2,…, k 的方程组 n i r r k i X r k n 1 1 2 , 1,2,... 1 ( , ,..., ) 记解为 , k , ,... 1 2 称其分别为参数 1, 2,…, k 的矩估计量. 例 1 1 求总体均值 和方差 2 的矩估计。 解 总体的二阶矩为 2 = +2,由上述矩估计法得到方程组: n i i n i i X n X X n 1 2 2 2 1 1 , 1 解此方程组,得到矩估计量为 n i i n i i X X n X X n X 1 2 1 2 2 2 ( ) 1 1 ˆ , ˆ 在作矩估计时,也可用中心矩建立关于未知参数的方程组,因而矩估计不唯一,在矩估 计中最常用的是用样本均值作为总体期望的估计量,但若总体矩不存在,则矩法失效。 例 2 2 设总体 X 服从参数为 的 Poisson 分布,求参数的矩估计。 解 由于=E (X )=D (X ),故由例 2 可知: X, 均为 的矩估计量. 例 3 3 设样本 X1,X2,…,Xn来自总体 X, 其密度函数为 ,求 1, 2 的矩估计. 0 , 1 ( ; , ) 1 2 1 2 2 1 x f x 解 由 2 2 1 1 2 ( ) 12 1 , ( ) 2 ( ) E X D X 得方程组: n i X i X n B X 1 2 2 2 2 1 1 2 ( ) . 1 ( ) 12 1 , 2 解此方程组,得到矩估计量: 3 , 3 . ˆ 1 X B2 2 X B2
2极大似然估计法 在总体X的分布类型已知的情况下,极大似然估计法也是求未知参数点估计的一种 重要的方法。下面我们先来看一个例子。 例4设总体服从(0-1)分布,其分布率为 P{r=x}=f八x0)=0(1-0)1-x,x=0,1 其中0<0<1未知,样本为X,,,n。设样本察值为x,,,,xm,则事件 (==Y= 发生的概率为 X=4=4,=y-ix,8)=050-9=6点0-0)空 对于给定的样本观察值,上述概率为0的函数,我们称为似然函数,并记为L(0) 即 01=60-9 为了使上述随机事件的概率达到最大,应选取使L(0)达到最大的参数值(如果存在) 日,即选取的估计量日应满足: L(0)=max L(0) 这种寻求参数估计量的方法称为极大似然估计法。 上例的讨论也适用于一般的离散型总体。 设总体X为离散型,其分布律为 PK=x=fx0),0∈⊙ 这里0为待估参数,©是0可能取值的范围。设,五,…,X为取自总体X的一个样 本,则,5,,Xn的联合分布律为 Ix:0) 若,,…,xn是样本5,,Xn的一个观察值,则事件{=,…,n=x}发 生的概率为 PX=,X2=5X。=x}=Πx0),0eo 令 L(0)=L(xx,0)=/八x0) 则L(0)随日的取值而变化,它是0的函数,我们称L(0)为样本的似然函数 当样本观察值x,5,,n给定时,我们在日的取值范围⊙内挑选使概率L( ,…,xn;O)达到最大的参数值0,把0作为0的估计值,即选取日使
2 2 极大似然估计法 在总体 X 的分布类型已知的情况下,极大似然估计法也是求未知参数点估计的一种 重要的方法。下面我们先来看一个例子。 例 4 4 设总体 X 服从(0-1)分布,其分布率为 ( ; ) (1 ) , 0,1, 1 P X x f x x x x 其中 0< <1 未知,样本为 X1,X2,…,Xn。设样本察值为 x1,x2,…,xn,则事件 { , ,.... } 1 1 2 2 n n X x X x X x 发生的概率为 n i x n x x x n i n n i n i i n i i i i P X x X x X x f x 1 1 1 1 1 2 2 21 1 { , ,.... } ( ; ) (1 ) (1 ) 对于给定的样本观察值,上述概率为 的函数,我们称为似然函数,并记为 L ( ), 即 . n i i n i x i n x L 1 1 ( ) (1 ) 为了使上述随机事件的概率达到最大,应选取使 L ( )达到最大的参数值(如果存在) ˆ,即选取的估计量ˆ 应满足: ) max ( ) ˆ ( 0 1 L L 这种寻求参数估计量的方法称为极大似然估计法。 上例的讨论也适用于一般的离散型总体。 设总体 X 为离散型,其分布律为 PX x f (x; ), 这里 为待估参数,是 可能取值的范围。设 X1,X2,…,Xn为取自总体 X 的一个样 本,则 X1,X2,…,Xn的联合分布律为 n i i f x 1 ( ; ). 若 x1,x2,…,xn是样本 X2,…,Xn的一个观察值,则事件{X2= x1,…,Xn =xn}发 生的概率为 { , ,.... } ( ; ) , 1 1 1 2 2 n i n n i P X x X x X x f x 令 n i n i L L x x f x 1 1 ( ) ( ,..., ; ) ( ; ). 则 L ( )随 的取值而变化,它是 的函数,我们称 L ( )为样本的似然函数. 当样本观察值 x1,x2,…,xn给定时,我们在 的取值范围 内挑选使概率 L (x1, x2,…,xn ; )达到最大的参数值ˆ ,把ˆ作为 的估计值,即选取ˆ 使
L(x,xnθ)=max (x,5,xnθ) 0E0 这样得到的0与样本观察值有关,常记为(x,,xn),我们称(x1,,x)为参数0的 极大似然估计值,并称相应的统计量(x,,x)为参数0的极大似然估计量。 若r为连续型总体,其密度函数为f八x,0),日∈⊙为待估参数。设(n,,., )为总体X的样本,,,X的观察值,则,,.,的联合密度函数为 1/x,) 1 与离散型的情形类似,称 L40)=4x,xn0)=/八x0) 为样本的似然函数。若有(x,,x)使 L(0)=max{Lθ)}, 则称6为参数的极大似然估计值,相应地称日=(x,,x)为0的极大似然估计量。 一般地,设总体r的分布律或概率密度函数为f(:;01,02,日),其中01,02, 日为k个未知待估参数,又设(n,?,…,xn)为样本观察值,记 L0…,0)=Π/x:0020) = 则称L(01,02,日)为似然函数。若存在 ).0()0 使得 L01,02,,0)=maxL⑥L…,6) 则称日,61,6,分别为0,02,0的极大似然估计值,而称 6,(K,K2,n,02(,2Xn)2,0(X1,X2Xn) 为极大似然估计量 例5在一袋内放有很多的白球和黑球,己知两种球数目为13,但不知道哪一种颜 色的球多,现从中有放回地抽取3次,试求黑球所占比例的极大似然估计。 解设X表示3次抽球中黑球出现的次数,0表示黑球所占比例,由题意0=14或 3/4,则似然函数为:L(0)=P{r=x}=C0(1-0)3-r,x=0,1,2,3 将0值代入: 4=Gr2, 42=G
) max ( , ,.... ; ) ˆ ( ,..., ; 1 1 2 n n L x x L x x x 这样得到的ˆ与样本观察值有关,常记为ˆ ( x 1 ,.., x n ) ,我们称ˆ ( x 1 ,.., x n ) 为参数 的 极大似然估计值,并称相应的统计量ˆ ( x 1 ,.., x n ) 为参数 的极大似然估计量。 若 X 为连续型总体,其密度函数为 f (x, ), 为待估参数。设(x1,x2,…, xn)为总体 X 的样本 X1,X2,…,Xn的观察值,则 X1,X2,…,Xn的联合密度函数为 n i i f x 1 ( ;). 与离散型的情形类似,称 n i n i L L x x f x 1 1 ( ) ( ,..., ; ) ( ; ) 为样本的似然函数。若有ˆ ( x 1 ,.., x n ) 使 (ˆ ) max{ ( )}, L L 则称ˆ为参数的极大似然估计值,相应地称ˆ ˆ (x 1 ,.., x n ) 为 的极大似然估计量。 一般地,设总体 X 的分布律或概率密度函数为 f (xi ; 1, 2, k ),其中 1, 2, k 为 k 个未知待估参数,又设(x1,x2,…,xn)为样本观察值,记 n i k i k L f x 1 1 1 2 ( ,..., ) ( ; , ,... ). 则称 L ( 1, 2, k )为似然函数。若存在 ( , ,.... ), ˆ ( , ,.... ), ..., ˆ ( , ,.... ), ˆ 1 1 2 n 2 1 2 n k 1 2 n x x x x x x x x x 使得 ) ˆ ,..., ˆ ) max ( ˆ ,..., ˆ , ˆ ( 1 ,..., 1 2 1 L k L k k 则称ˆ 1 ,ˆ 1 ,...,ˆ 1分别为 1, 2, k的极大似然估计值,而称 ( , ,.... ), ˆ ( , ,.... ), ..., ˆ ( , ,...., ), ˆ1 X1 X 2 X n 2 X1 X 2 X n k X 1 X 2 X n 为极大似然估计量. 例 5 5 在一袋内放有很多的白球和黑球,已知两种球数目为 1:3,但不知道哪一种颜 色的球多,现从中有放回地抽取 3 次,试求黑球所占比例的极大似然估计。 解 设 X 表示 3 次抽球中黑球出现的次数, 表示黑球所占比例,由题意 =1/4 或 3/4,则似然函数为: ( ) (1 ) , 0,1,2,3. 3 3 L P X x C x x x x 将 值代入: ) , 4 3 ) ( 4 1 ) ( 4 1 ( 3 3 x x x L C ) , 4 1 ) ( 4 3 ) ( 4 3 ( 3 3 x x x L C
将的可能取值代入,其结果见下表: 0 3 始 27 27 9 1 64 64 64 64 1 9 27 27 64 64 64 64 X=0,1, 因此,日的极大似然估计值为 6(X)= 3 ,X=2,3 4 由上面的讨论可知,求待估参数的极大似然估计量,实际上是求似然函数的最大值 点。又由于ln(0)与(0)在同一点处取得极值,故可用对lnL(0)求最大值的方法求出参 数日的极大似然估计,一般方法如下: 先求出似然函数(0)并取对数,然后由ln(0)分别对0,求偏导 nL,使 a0, oinL0./=1.2..... a0, 解此方程组,即可得其解日,0,,01。当然,似然方程组的解是否为最大值点,仍需进 一步验证。 在例4中,我们以求出了似然函数10)=0产1-0)一李 下面先作对数变换: nI01=ng2a-0y21-空xh0+u-2-0) 2xn-∑x 再对0求导数: --1-90 解得 2xn-2 且 2-1-0)2 <0 因此,的极大似然估计为:6=下
将 X 的可能取值代入,其结果见下表: 因此, 的极大似然估计值为 , 2 ,3 . 4 3 , 0 ,1, 4 1 ( ) ˆ X X X 由上面的讨论可知,求待估参数的极大似然估计量,实际上是求似然函数的最大值 点。又由于 lnL( )与 L( )在同一点处取得极值,故可用对 lnL( )求最大值的方法求出参 数 的极大似然估计,一般方法如下: 先求出似然函数 L( )并取对数,然后由 lnL( )分别对 i,求偏导 ,使 i L ln i k L i 0, 1,2,..., ln 解此方程组,即可得其解ˆ 1 ,ˆ 1 ,...,ˆ 1 。当然,似然方程组的解是否为最大值点,仍需进 一步验证。 在例 4 中,我们以求出了似然函数, ( ) (1 ) , 1 1 n i i n i i x n x L 下面先作对数变换: n i i n i i x n x L x n x n i i n i i 1 1 ln ( ) ln[ (1 ) ] ln ( )ln(1 ) 1 1 再对 求导数: 0, 1 ln ( ) 1 1 n i i n i i x n x L d d 解得 x X n n i i 1 1 ˆ 且 0. (1 ) ln 2 1 2 1 2 2 n i i n i i x n x d d L 因此,的极大似然估计为: ˆ X x 0 1 2 3 ) 4 1 L( 64 27 64 27 64 9 64 1 ) 4 3 L( 64 1 64 9 64 27 64 27
例6设样本,,,n来自正态总体r~N(,σ),4,σ2未知,求4,σ2 的极大似然估计。 解设(x1,,…,xn)为对应的样本观察值,则关于4,σ2得似然函数为 4uo-12ae=2o)。2w 1- 1 于是 h4o学2-登a-2石24-m 2 2 anL-(x-w川=0 = oln L n 1 a=2a+2o2-W=0. 解之得 a=12,62=12x-2 易验证,立,62为(4,o2)得最大值点。因此,立,62的极大似然估计值为 a=2x,62=12x-2 n ia 注意,若参数4己知,则σ2的极大似然估计为 62-2(x-2 n 3.点估计的评价标准 从上节可以看出,对同一个未知参数,可以由多种方法进行估计,即使用同一种方 法,有时也可到多个估计量。我们总希望得到的估计量能代表总体的真实参数,那么在 同一参数的许多可能的估计量中那一个是最好的估计量呢?自然地想到,需要有一个评 价估计量优劣的标准。在本节中我们给出三个评价的标准。 (1)无偏性 估计量(X,X2,…,r)是一个随机变量,对一次具体的观察或实验的结果,估计值 可能较真实的参数值偏小或偏大,在多次试验中所得的估计量的平均值应与真实参数吻 合,这就是无偏性所要求的。 定义设,5,,xn为来自总体r的样本,0∈⊙为总体的未知参数,日为日
例 6 6 设样本 X1,X2,…,Xn来自正态总体 X N (,2 ),,2 未知,求, 2 的极大似然估计。 解 设 (x 1,x2,…,xn )为对应的样本观察值,则关于, 2得似然函数为 n i x x n n i i i e e L 1 ( ) 2 1 2 2 2 2 (2 ) , 2 1 ( , ) 1 2 2 2 2 于是 n i i x n n L 1 2 2 2 2 ( ) 2 1 ln 2 ln 2 2 ln ( , ) n i i n i i x L n x L 1 2 2 2 4 1 2 ( ) 0. 2 1 2 ln ( ) 0, ln 1 解之得 n i i n i i x x n x n 1 2 2 1 ( ) 1 , ˆ 1 ˆ 易验证, 为 L(, 2 ˆ ,ˆ 2 )得最大值点。因此, ˆ ,ˆ 2 的极大似然估计值为 n i i n i i x x n x n 1 2 2 1 ( ) 1 , ˆ 1 ˆ 注意,若参数 已知,则2 的极大似然估计为 n i i x n 1 2 2 ( ) 1 ˆ 3. 3. 点估计的评价标准 点估计的评价标准 点估计的评价标准 点估计的评价标准 从上节可以看出,对同一个未知参数,可以由多种方法进行估计,即使用同一种方 法,有时也可到多个估计量。我们总希望得到的估计量能代表总体的真实参数,那么在 同一参数的许多可能的估计量中那一个是最好的估计量呢?自然地想到,需要有一个评 价估计量优劣的标准。在本节中我们给出三个评价的标准。 (1) (1) 无偏性 估计量ˆ ( X1 , X 2 ,, X n ) 是一个随机变量,对一次具体的观察或实验的结果,估计值 可能较真实的参数值偏小或偏大,在多次试验中所得的估计量的平均值应与真实参数吻 合,这就是无偏性所要求的。 定义 设 X1,X2 ,…,Xn为来自总体 X 的样本, 为总体的未知参数,ˆ 为
的一个估计量,若 E0)=0 则称0为0的一个无偏估计量。 例7设总体的k阶矩存在,则样本的k阶矩是总体k阶矩的无偏估计。 证因为 4)=2)2的=之Ar)=Ar=4, 所以A是的无偏估计。 例8设总体~W(μ,o2),其中参数4,σ2未知,试用极大似然估计法求4,σ2 的估计量,并问心,G2是否是无偏估计?若不是,请修正它成为无偏估计。 解设K,巧,,为取自总体的一个样本,则由上节中的例7可知 4,σ2的极大似然估计为 A==2- 由于()=E(=4,可知i=r为u的无偏估计。又由第六章定理6.1可知, no2 2~X(n-1), 故 o )=-1, 即 且G)="-。2t02 所以62不是σ2的无偏估计,但 ”。2=2x,-=5 n-1 n-1 为σ2的无偏估计量 由此可知之(g-可不是G2的无偏估计量,而样本方差
的一个估计量,若 E(ˆ ) 则称ˆ为 的一个无偏估计量。 例 7 7 设总体的 k 阶矩存在,则样本的 k 阶矩是总体 k 阶矩的无偏估计。 证 因为 ( ) ( ) , 1 ( ) 1 ) 1 ( ) ( 1 1 1 k k n i k n i k i n i k k i E X E X n E X n X n E A E 所以 Ak 是 k 的无偏估计。 例 8 8 设总体 X N (, 2 ),其中参数, 2 未知,试用极大似然估计法求, 2 的估计量,并问 ˆ,ˆ 2 是否是无偏估计?若不是,请修正它成为无偏估计。 解 设 X1,X2 ,…,Xn为取自总体的一个样本,则由上节中的例 7 可知 , 2 的极大似然估计为 ( ) . 1 ˆ , ˆ 1 2 2 n i X i X n X 由于 E(ˆ) E(X ) ,可知 ˆ X 为 的无偏估计。又由第六章定理 6.1 可知, 2 ~ 2 ( 1) , 2 n n 故 ( 2 ) 1, 2 n n E 即 2 1 2 2 ( ) n n E 所以 不是 ˆ 2 2 的无偏估计,但 2 1 2 2 ( ) 1 1 1 X X S n n n n i i 为 2的无偏估计量. 由此可知 不是 2 的无偏估计量,而样本方差 n i i x x n 1 2 ( ) 1 n i X i X n S 1 2 2 ( ) 1 1
是。:的无偏估计,这他正是在实际中样本方差采用S=2比-列,而不用 (2)有效性 对于参数θ的无偏估计量,其取值在真值的附近波动,我们自然希望他与真值之间 的偏差越小越好,也就是说无偏估计量的方差越小越有效。 定义设日,0,均为未知参数0的无偏估计量,若 D0)≤D0,),V0∈日 且存在0。∈⊙,使上式左端严格小于右端,则称日,比02有效。 (3)一致性 在参数的估计中,很容易想到,如果样本容量越大,样本所含的总体分布的信息应 该越多,换一句话说就是样本容量越大就越能精确地估计总体的未知参数,随着的无 限增大,一个好的估计量与被估计参数的真值之间任意接近的可能性会越来越大。特别 对有限总体,若将其所有个体全部抽出,则其估计值应与真实参数一致,估计量的这种 性质称为一致性。 定义 设0为未知参数0的估计量,若对任意给定的ε>0都有 即0依概率收敛与参数0,则称0为0的一个一致估计量。 例9设X是总体X的样本均值,则当F作为总体期望E()的估计量时,F是E() 的一致估计量。 这是因为由大数定律可知,当n→o时, ▣本-外小但P2-f=o 所以F是E()的一致估计量 一般地,若总体的r阶矩4,=E()存在,则由大数定律可知, 之?依概率 收敛于μ,。故r阶样本矩都可以作为总体r阶矩的一致估计量
是 2 的无偏估计,这也正是在实际中样本方差采用 ,而不用 n i X i X n S 1 2 2 ( ) 1 1 原因。 n i n X i X n S 1 2 2 ( ) 1 1 (2) (2) 有效性 对于参数 的无偏估计量,其取值在真值的附近波动,我们自然希望他与真值之间 的偏差越小越好,也就是说无偏估计量的方差越小越有效。 定义 设ˆ 1 ,ˆ 2均为未知参数 的无偏估计量,若 D(ˆ 1) D(ˆ 2 ) , 且存在 0,使上式左端严格小于右端,则称ˆ 1比ˆ 2 有效。 (3) 3) 一致性 在参数的估计中,很容易想到,如果样本容量越大,样本所含的总体分布的信息应 该越多,换一句话说就是样本容量越大就越能精确地估计总体的未知参数,随着 n 的无 限增大,一个好的估计量与被估计参数的真值之间任意接近的可能性会越来越大。特别 对有限总体,若将其所有个体全部抽出,则其估计值应与真实参数一致,估计量的这种 性质称为一致性。 定义 设ˆ为未知参数 的估计量,若对任意给定的 0 都有 即ˆ依概率收敛与参数 ,则称ˆ为 的一个一致估计量。 例 9 9 设 X 是总体 X 的样本均值,则当 X 作为总体期望 E (X)的估计量时,X 是 E (X) 的一致估计量。 这是因为由大数定律可知,当n 时, 所以 X 是 E (X )的一致估计量. 一般地,若总体 X 的 r 阶矩 r E(Xr)存在,则由大数定律可知, 依概率 n i r X i n 1 1 收敛于 。故 r 阶样本矩都可以作为总体 r 阶矩的一致估计量. r lim 0 P n 0 1 lim lim 1 ( ) X E(X) n P X E X P n i i n n
例10设0为0的无偏估计量,若成立 mD0)=0, 则0为0的一致估计量 证有切贝雪夫不等式可知,对任意ε>0都成立 pll0-0)s0) 由题设条件limD0)=0可知 →00 mP9-l≥e=0 因此,6为的一致估计量 在实际问题中,我们自然希望估计量具有无偏性,一致性和有效性,但往往不能同 时满足,尤其是一致性,要求样本容量充分大,这在实际问题中不易做到,而无偏性和 有效性无论在直观还是理论上都比较合理,故应用的场合也较多。 6.2区间估计 在上一节中我们讨论了参数的点估计,只要给定样本的观测值就能算出参数0的估 计值,它是未知参数的近似值。但是,在理论与实际应用中,不仅需要知道参数日的近 似值,还需要知道这种估计的精度是多少。为此,我们要求由样本构造一个以较大的 概率包含真实参数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一 个置信区间对未知参数进行估计的方法称为区间估计。 定义设五,.,为来自总体的一个样本,日∈⊙为总体分布所包含的未知 参数。若对于给定的α(0<a<1),存在统计量0,和0,对所有的0∈⊙满足: P0,≤0≤0}=1-, 则称随机区间[旧,0]为参数0的置信度为1-a的置信区间,0,和0,分别称为置信下限 和上限。置信度1-也称置信水平。 由定义可知,置信区间是以统计量为端点的随机区间,对于给定的样本观察值 (:,…,n),由统计量6,(x,2,…,xn),0(:,x2,…,x)构成的置信区间[旧2,0]可能 包含真值θ,也可能不包含真值日,但在多次观察或实验中,每一个样本皆得到一个 置信区间[0,0],在这些区间中包含真值0的区间占100(1-a)%,不包含0的仅占100a %.例如取=0.05,在100次区间估计中,大约有95个区间包含真值0,而不包含得
例 10 10 设ˆ为 的无偏估计量,若成立 lim ( ) 0 , D n 则 为 的一致估计量. ˆ 证 有切贝雪夫不等式可知,对任意 0 都成立 2 , ( ) {| | } D p 由题设条件lim ( ) 0 可知 D n 因此, 为的一致估计量. ˆ 在实际问题中,我们自然希望估计量具有无偏性,一致性和有效性,但往往不能同 时满足,尤其是一致性,要求样本容量充分大,这在实际问题中不易做到,而无偏性和 有效性无论在直观还是理论上都比较合理,故应用的场合也较多。 6.2 6.2 区间估计 区间估计 在上一节中我们讨论了参数的点估计,只要给定样本的观测值就能算出参数 的估 计值,它是未知参数的近似值。但是,在理论与实际应用中,不仅需要知道参数 的近 似值,还需要知道这种估计的精度是多少。 为此,我们要求由样本构造一个以较大的 概率包含真实参数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一 个置信区间对未知参数进行估计的方法称为区间估计。 定义 设 X1 ,…,Xn为来自总体 X 的一个样本, 为总体分布所包含的未知 参数。若对于给定的(0< <1),存在统计量 ˆ L和ˆ U ,对所有的 满足: , P{ L U } 1 则称随机区间[ˆ L ,ˆ U ] 为参数 的置信度为 1- 的置信区间,ˆ L和ˆ U 分别称为置信下限 和上限。置信度 1- 也称置信水平。 由定义可知,置信区间是以统计量为端点的随机区间,对于给定的样本观察值 (x1 ,…,xn),由统计量ˆ L (x 1 , x 2 ,, x n ),ˆ U ( x 1 , x 2 ,, x n ) 构成的置信区间[ˆ L ,ˆ U ] 可能 包含真值 ,也可能不包含真值 , 但在多次观察或实验中,每一个样本皆得到一个 置信区间[ˆ L ,ˆ U ] ,在这些区间中包含真值 的区间占 1 0 0(1-)%,不包含的仅占 100 %. 例如取=0.05,在 100 次区间估计中,大约有 95 个区间包含真值 ,而不包含得 lim ˆ 0 P n
约占5个。 下面我们通过具体例子给出构造置信区间的方法与步骤。 例1设X,.,Xn为来自正态总体r~W(μ,o),其中σ2己知,4未知,试 求出4的置信水平为1-a的置信区间。 解由前述可知,样本均值厂是μ的极大似然估计量,且承~Wμ,) 故统计量 X-μN0,) GAn 2 于是又标准正态分布得上α分位点的定义可知, =1-0, 区间的定义可知,[X-元Zr+万乙。]即为μ的1-a的置 对此例进行分析,我们发现随机变量在区间的构造过程中起着关键作用,它具有 下属特点: (I)是待估参数4和估计量X的函数: (2)不含其他未知参数: (3)其分布已知且与未知参数μ无关。 我们称满足上述三条性质的量Q为枢轴量。 在引入枢轴量Q的概念后,便可把球置信区间的步骤归纳如下: (1)根据待估参数构造枢轴量Q,一般可由未知参数的极大似然估计量改造得到: (2)对于给定的置信水平1-,利用枢轴量Q的分布的上a分位点求出常数a,b,使 P{KOKb}=1-通常为方便起见,取a,b分别为Q的上1-a2和上a2分位点: (3)利用不等式的恒等变形,将(2)中的不等式变形即可得到置信区间[旧,0小。 这种利用枢轴量构造置信区间的方法称为枢轴量法 下面我们给出正态总体关于参数μ和σ2的置信区间。首先考虑单个正态总体X ~W(4,σ2)的情形,并设总体的样本为出,…, 1,均值μ的置信区间 (1)方差o2已知 X- 由例1可知,这时枢轴量 O=u=- W0,)
约占 5 个。 下面我们通过具体例子给出构造置信区间的方法与步骤。 例 1 1 设 X1 ,…,Xn为来自正态总体 X N (, 2 ),其中 2已知, 未知, 试 求出 的置信水平为 1-的置信区间。 解 由前述可知,样本均值 X 是 的极大似然估计量,且 ~ ( , ) 2 n X N 故统计量 ~ N(0,1), n X u 于是又标准正态分布得上 分位点的定义可知, 1 , 2 2 P Z u Z 即 , 1 2 2 2 2 Z n Z X n Z P X n X P Z 由置信区间的定义可知, [ ]即为 的 1- 的置信区间。 2 2 Z n Z X n X , 对此例进行分析,我们发现随机变量 u 在区间的构造过程中起着关键作用,它具有 下属特点: (1) 是待估参数 和估计量 X 的函数; (2) 不含其他未知参数; (3) 其分布已知且与未知参数 无关。 我们称满足上述三条性质的量 Q 为枢轴量。 在引入枢轴量 Q 的概念后,便可把球置信区间的步骤归纳如下: (1) 根据待估参数构造枢轴量 Q, 一般可由未知参数的极大似然估计量改造得到; (2) 对于给定的置信水平 1-,利用枢轴量 Q 的分布的上分位点求出常数 a,b,使 P{a<Q<b}=1-通常为方便起见,取 a,b 分别为 Q 的上 1- /2 和上 /2 分位点; (3) 利用不等式的恒等变形,将(2)中的不等式变形即可得到置信区间[ˆ L ,ˆ U ] 。 这种利用枢轴量构造置信区间的方法称为枢轴量法. 下面我们给出正态总体关于参数 和 2的置信区间。首先考虑单个正态总体 X N (, 2 )的情形,并设总体的样本为 X1 ,…,Xn。 1. 1. 均值 的置信区间 ( ( 1 1 ) ) 方差 2 2 已知 由例 1 可知, 这时枢轴量 ~ N(0,1) , n X Q u 2 2