这样看来,虽然矩估计法计算简单,不管总体服从什么分布,都能求出总体矩的估计量, 但它仍然存在着一定的缺陷:对于一个参数,可能会有多种估计量。比如下面的例子: 例4:设X~P(k,4),未知,(X1,X2,…,Xn)是X的一个样本,求λ。 ∵E(X)=λ,D(X)=元 所以由例3可知:E(X)=→=DX)=2→A=x1-x)2 由以上可看出,显然F与∑(x,-x)是两个不同的统计量,但都是的估计。这样,就会 给应用带来不便,为此,R. A Fisher提出了以下的改进的方法: 、最(极)大似然估计法:(R. 4. Fisher提出) 1基本思想: 若总体X的分布律为P(X=x)=p(x,O)[或密度函数为f(x;O)],其中b=(1,O2,…,O)为 待估参数(O∈)。 设(X13K2,…Xn)是来自总体X的一个样本,(x1,x2…x)是相应于样本的一样本值,易 知:样本(X1,X2…,X)取到观测值(x1,x2…,x)的概率为 P=PX=x,Xx2=x2…,X=x}=∏p(x;),[或样本(X1X2,…,X)落在点 (x1,x2,…,xn)的邻域(边长分别为dx1,dx2,…,axn的n维立方体)内的概率近似地为 p=∏f(x:0)(微分中值定理)],令L(0)=L(x,x2,…,x)=∏p(x,0)[或 L(0)=L(x,x2…,x)=∏f(x,0)],则概率p随的取值变化而变化,它是O的函数,L(O)称 为样本的似然函数(注意,这里的x1x2,…,xn是已知的样本值,它们都是常数)。如果已知当 θ=a∈⊙时使L(O)取最大值,我们自然认为作为未知参数O的估计较为合理 最大似然方法就是固定样本观测值(x1x2…xn),在θ取值的可能范围⊙内,挑选使似然 函数L(x1,x2…,x;)达到最大(从而概率p达到最大)的参数值6作为参数的估计值,即 L(x1,x2…,x;6)=maxl(x,x2…,x;),这样得到的与样本值(x,x2…x,)有关,常记为 θ(x,x2…x),称之为参数的最大似然估计值,而相应的统计量θ(X1X2…X)称为参数O的 最大似然估计量。这样将原来求参数θ的最大似然估计值问题就转化为求似然函数L(0)的最4 这样看来,虽然矩估计法计算简单,不管总体服从什么分布,都能求出总体矩的估计量, 但它仍然存在着一定的缺陷:对于一个参数,可能会有多种估计量。比如下面的例子: 例 4:设 X ~ P(k,), 未知, ( , , , ) X1 X2 Xn 是 X 的一个样本,求 。 E(X ) = , D(X ) = 所以由例 3 可知: E(X ) = ˆ = X = = = − n i Xi X n D X 1 2 ( ) 1 ˆ ( ) 由以上可看出,显然 = − n i Xi X n X 1 2 ( ) 1 与 是两个不同的统计量,但都是 的估计。这样,就会 给应用带来不便,为此,R.A.Fisher 提出了以下的改进的方法: 二、最(极)大似然估计法:(R.A.Fisher 提出) 1.基本思想: 若总体 X 的分布律为 P X x p x ( ) ( ; ) = = [或密度函数为 ( ; ) i f x ],其中 ( , , , ) = 1 2 k 为 待估参数( )。 设 ( , , , ) X1 X2 Xn 是来自总体 X 的一个样本, 1 2 ( , , , ) n x x x 是相应于样本的一样本值,易 知:样本 ( , , , ) X1 X2 Xn 取到观测值 1 2 ( , , , ) n x x x 的概率为 1 1 2 2 1 { , , , } ( ; ) n n n i i p P X x X x X x p x = = = = = = ,[或样本 1 2 ( , , , ) X X X n 落在点 1 2 ( , , , ) n x x x 的邻域(边长分别为 1 2 , , , n dx dx dx 的 n 维立方体)内的概率近似地为 1 ( ; ) n i i i p f x dx = (微分中值定理)],令 1 2 1 ( ) ( , , , ) ( ; ) n n i i L L x x x p x = = = [或 1 2 1 ( ) ( , , , ) ( ; ) n n i i L L x x x f x = = = ],则概率 p 随 的取值变化而变化,它是 的函数, L( ) 称 为样本的似然函数(注意,这里的 1 2 , , , n x x x 是已知的样本值,它们都是常数)。如果已知当 = 0 时使 L( ) 取最大值,我们自然认为 0 作为未知参数 的估计较为合理。 最大似然方法就是固定样本观测值 1 2 ( , , ) n x x x ,在 取值的可能范围 内,挑选使似然 函数 1 2 ( , , , ; ) L x x xn 达到最大(从而概率 p 达到最大)的参数值 ˆ 作为参数 的估计值,即 1 2 1 2 ˆ ( , , , ; ) max ( , , , ; ) L x x x L x x x n n = ,这样得到的 ˆ 与样本值 1 2 ( , , ) n x x x 有关,常记为 1 2 ˆ ( , , ) n x x x ,称之为参数 的最大似然估计值,而相应的统计量 1 2 ˆ ( , , ) X X X n 称为参数 的 最大似然估计量。这样将原来求参数 的最大似然估计值问题就转化为求似然函数 L( ) 的最