上海交通大学：《概率论与数理统计》课程教学资源（课件讲稿）16、估计3/3

团购合买资源类别：文库，文档格式：PDF，文档页数：22，文件大小：565.03KB

复习极大似然估计的求法选择参数的估计量，使实验结果具有最大概率估计量的几个评选标准。1 样本原点矩是总体原点矩的无偏估计量；无偏性一一 E(0)=0· 样本方差是总体方差的无偏估计量；无偏估计量的函数未必是无偏估计量有效性一一方差更小的无偏估计量. 在4的所有线性无偏估计量中，样本均值X是最有效的. 致性区间估计一一置信区间

复习极大似然估计的求法估计量的几个评选标准区间估计 ——选择参数的估计量, 使实验结果具有最大概率无偏性有效性一致性     —— ^ E( )= —— 方差更小的无偏估计量. • 样本原点矩是总体原点矩的无偏估计量; • 样本方差是总体方差的无偏估计量 ; • 无偏估计量的函数未必是无偏估计量 ─ • 在  的所有线性无偏估计量中, 样本均值X 是最有效的. —— 置信区间

§7.4」单个正态总体均值与方差的置信区间譬如，在估计湖中鱼数的问题中，若我们根据一个实际样本得到鱼数N的极大似然估计为1000条. 但实际上，N的真值可能大于1000条，也可能小于1000条. 若我们能给出一个区间，在此区间内我们合理地相信N的真值位于其中，这样对鱼数的估计就有把握多了. 也就是说，我们希望确定一个尽可能小的区间，使我们能以比较高的可靠程度相信它包含真参数值这里所说的“可靠程度”是用概率来度湖中鱼数的真值量的，称为置信概率，置信度或置信水平习惯上把置信水平记作1-a,这里α是一个很小的正数

若我们根据一个实际样本得到鱼数 N 的极大似然估计为1000条. 若我们能给出一个区间, 在此区间内我们合理地相信 N 的真值位于其中, 这样对鱼数的估计就有把握多了. 但实际上, N 的真值可能大于 1000 条, 也可能小于1000条. §7.4 单个正态总体均值与方差的置信区间也就是说, 我们希望确定一个尽可能小的区间, 使我们能以比较高的可靠程度相信它包含真参数值. 湖中鱼数的真值 [ ] 这里所说的“可靠程度”是用概率来度量的, 称为置信概率，置信度或置信水平. 习惯上把置信水平记作 1- , 这里  是一个很小的正数. 譬如，在估计湖中鱼数的问题中, •

置信水平的大小是根据实际需要选定的.例如，通常可取置信水平=0.95或0.9等等. 根据一个实际样本，由给定的置信水平1-，我们求出一个的区间(2,0)，使 P(0≤0≤0)=1-，如何寻找这种区间？我们选取未知参数的某个估计量0，根据置信水平1-，可以找到一个正数6，使得 P(6-0≤δ)=1-a, 只要知道0的概率分布就可以确定6.由不等式|0-1≤6 可以解出B: 6-6≤0≤0+6 这个不等式就是我们所求的置信区间（旦，0）. 下面我们就来正式给出置信区间的定义，并通过例子说明求置信区间的方法

根据置信水平1- , 可以找到一个正数  , 例如, 通常可取置信水平 = 0.95 或 0.9 等等. P(   )  1, 根据一个实际样本, 由给定的置信水平1- , 我们求出一个的区间 ( ,  ) , 使置信水平的大小是根据实际需要选定的. 如何寻找这种区间？ P(| ˆ  | )  1，使得我们选取未知参数的某个估计量 ^  , 只要知道 ^  的概率分布就可以确定  . 下面我们就来正式给出置信区间的定义, 并通过例子说明求置信区间的方法.        ˆ ˆ 由不等式   |  ˆ | 可以解出 ：这个不等式就是我们所求的置信区间 ( ,  )

一、置信区间的概念定义4(P.156定义7.4)设0是总体X的待估参数，X1,X,…,Xm 是取自总体X的样本，对给定值0<<1，若统计量O(X1,X2,…,Xm) 和0(X1,X2,…,Xn)满足 P(0<0<0)=1-a, 则称随机区间(Q,0)为0的置信水平为1-的双侧置信区间.日和0 分别称为置信下限和置信上限. 置信度置信概率作区间估计，就是要设法找出两个只依赖于样本的界限（构造统计量)旦和0.(8,0)是随机区间，代入样本值所得的普通区间称为置信区间的实现. 置信水平为0.95是指100组样本值所得置信区间的实现中，约有95个能覆盖0，而不是说一个实现以0.95的概率覆盖了0. 要求0以很大的可能被包含在置信区间内，就是说，概率 P(0<0<)=1-a要尽可能大.即要求估计尽量可靠. 估计的精度要尽可能的高.即要求区间置信的长度尽可能短，或能体现该要求的其它准则

代入样本值所得的普通区间称为置信区间的实现. 作区间估计, 就是要设法找出两个只依赖于样本的界限(构造统计量) 即要求区间置信的长度尽可能短, 或能体现该要求的其它准则. X1, X2, „, Xn 是取自总体X的样本, P(    )  1 ，对给定值0<<1, ( , , , )  X1 X2  Xn  (X1 , X2 ,  , Xn ) ( ,  ) 满足定义4(P.156 定义7.4) 设 是总体 X 的待估参数,  和 分别称为置信下限和置信上限. 一、置信区间的概念则称随机区间为 的置信水平为1- 的双侧置信区间. 若统计量和估计的精度要尽可能的高. 要求 以很大的可能被包含在置信区间内, ─ P( < < )= 1- 要尽可能大. ─ 即要求估计尽量可靠. 置信水平为 0.95 是指 100 组样本值所得置信区间的实现中, 就是说 , 概率置信度置信概率  和 . ( ,  ) 是随机区间, 约有95个能覆盖 , 而不是说一个实现以 0.95 的概率覆盖了

将样本值代入(Q,)所得的普通区间称为置信区间的实现. 置信水平的概率意义；并非一个实现以1-a的概率覆盖了0. 估计要尽量可靠，即P(0<0<0)=1-a要尽可能大. 估计的精度要尽可能的高.即要求置信区间的长度尽可能短. 可靠度与精度是一对矛盾，.一般是在保证可靠度的条件下尽可能提高精度

置信水平的概率意义; ( ,  ) 并非一个实现以 1- 的概率覆盖了 . 估计的精度要尽可能的高. 即要求置信区间的长度尽可能短. 估计要尽量可靠, ─ 即 P( < < )= 1- 要尽可能大. ─ 可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下尽可能提高精度. 将样本值代入所得的普通区间称为置信区间的实现

二、置信区间的求法 1.均值4 (1)已知方差。2 （一)单个正态总体) 1(2)未知方差σ2 (2.方差a20 已知均值4 (2)未知均值μ 1.均值41- (1)已知方差c3,o2 (二)两个正态总体 22)未知方差c品，品，但相等！ 2方差/8柔盘你么如何根据实际样本，由给定的置信水平1-，求出一个区间(Q,D),使 P(0≤0≤0)=1-a? 我们选取未知参数的某个估计量① 据置信水平1-a,可以找到一个正数δ，使得P(I8-0≤8)=1-a, 只要知道0的概率分布就可以确定6. 分布的分位数 ② 由不等式|6-01≤δ可以解出0：0-δ≤0≤6+δ③ 这个不等式就是我们所求的置信区间(Q,) 对于给定的置信水平，根据估计量U的分布，确定一个区间，使得U取值于该区间的概率为置信水平. >i

只要知道 ^ 的概率分布就可以确定 . 如何根据实际样本, 由给定的置信水平1- , 求出一个区间 , 使根据置信水平1- , 可以找到一个正数  , 二、置信区间的求法     (一) 单个正态总体 1. 均值 (1) 已知方差2          1. 均值 1 - 2 (1)已知方差1 2 ,2 2    (二) 两个正态总体 2. 方差 2 (2)未知方差2 P(   )  1 ？ ( ,  ) 使得 P(| ˆ  | )  1，我们选取未知参数的某个估计量 ^  ,      由不等式 | ˆ  |  可以解出 ： ˆ ˆ 这个不等式就是我们所求的置信区间 ( ,  ) . 分布的分位数 ① ② ③ (1)已知均值     (2) 未知均值  (2)未知方差1 2 ,2 2 2. 方差1 2/2 2 (1)已知均值 1 , 2    (2)未知均值 1 , 2 ,但相等! 对于给定的置信水平, 根据估计量U 的分布, 确定一个区间, 使得 U 取值于该区间的概率为置信水平

(一)单个正态总体置信区间的求法设X,,X是总体X~N(4,o2)的样本，X,S2分别是其样本均值和样本方差，求参数4、o2的置信水平为1-α的置信区间. 1.均值μ的置信区间 ①确定未知参数的 (1)已知方差o2时估计量及其函数的分布 :X=客X是μ的无偏估计量，放可用X作为BX的-个估计昼，由抽样分布定理知 .U= X-'~N(0,1), X~N(u,2/n), 有了分布就可求出U取值于任意区间的概率对给定的置信度1-， P.53 按标准正态分布的双侧a分位数的定义P(IUI≥a2)=a, 即令Φ(u2)=l-号，查正态分布表可得4a12,②由分布求分位数4 ③由ua2确定置信区间即得置信区间(X-员，X+a小，简记为X土： n

─ X , S 2 分别是其样本均值和样本方差, ─ X ~ N( , 2/n), 求参数  、 2 的置信水平为1- 的置信区间. 设 X1,„, Xn 是总体 X ~ N(,2)的样本, n X U  /    ① 确定未知参数的估计量及其函数的分布是的无偏估计量, ② 由分布求分位数 即得置信区间 (一) 单个正态总体置信区间的求法 (1)已知方差2 时 ─  故可用 X 作为 EX 的一个估计量,   n i Xi n X 1  1 ~ N(0, 1), 对给定的置信度 1- , 按标准正态分布的双侧分位数的定义 /2 / 2 / 2 | / |         u n u X n u X n X        (| | ) , P U  u /2  , 2 ( /2 ) 1  即令  u   查正态分布表可得 u/2 , ③ 由u/2确定置信区间 ( , ) ,  / 2  / 2   u n u X n X   有了分布就可求出U 取值于任意区间的概率 P .53 简记为  2  u n X  由抽样分布定理知 1. 均值  的置信区间

求置信区间首先要明确问题：是求什么参数的置信区间？置信水平1-α是多少？一般步骤如下： x=客Y 1.寻找未知参数0的一个良好的点估计量O(X,X2,…,X); 确定待估参数估计量函数U(O)的分布； U=X='~N0,) /n 2.对于给定的置信水平1-a,由概率P(IU≥xa)=x, 查表求出分布的分位数xa,(uan)=1-号 P(IU八≥wa2)=a 由分位数U≥x。确定置信区间，收-只：<<+ (0,0)就是0的100(1-a)%的置信区间. 总体分布的形式是否已知，是怎样 (-品a,+ 的类型，至关重要

 / 2  / 2    u n u X n X     是求什么参数的置信区间? 置信水平 1- 是多少? ^ 1. 寻找未知参数 的一个良好的点估计量  (X1, X2, „, Xn ); 确定待估参数估计量函数 ^ U( ) 的分布 ; 求置信区间首先要明确问题： 2. 对于给定的置信水平 1- , 由概率 ─ ( ,  ) 就是 的 100(1-)％的置信区间. ─ 一般步骤如下: ─ 3. 由分位数|U| x 确定置信区间 ( , ). ─ P(|U|  x )  , P(|U|  u /2 )  2 ( /2 ) 1   u   (  / 2 ,  / 2 )   u n u X n X   查表求出分布的分位数 x , ~ (0,1) / N n X U      n i Xi n X 1 1 总体分布的形式是否已知,是怎样的类型,至关重要

例1(P.157例1)某乡农民在联产承包责任制前人均纯收入X(单位：元)，且X~N(300,252).推行联产承包责任制后，在该乡抽得 n=16的样本，得x=325元，假设σ2=252没有变化，求μ的置信水平为0.95的置信区间. 解由于a=0.05, 查正态分布表得u0.025=1.96, 2 325-|<1.96 325-25 1.96<4<325+251.96 25/N16 V16 V16 即得置信区间 (312.75,337.25). 区间长度为24.25 如在上例中取a=0.01+0.04,由正态分布上侧分位数定义知 0.01+0.04=1-D(u.0i)+1-D(4.04)=1-Φ(40.01）+Φ(-40.04) =1-P(-uo.04<U<0.01) 长度为25.5 查表知1=2.33，W04=1.75今325-252.33<山<325+251.75 V16 V16 +同一置信水平下的置信区间不唯一，其长度也不相等个Φx) 当然区间长度越短的估计，精度就越高. 谁是 0.4 由于标准正态分布密度函数的图形是单峰且对称的，在保持面积不变的条件下，以对称区间的长度为最短！！

某乡农民在联产承包责任制前人均纯收入X(单位:元), 求 的置信水平为0. 95 的置信区间. 推行联产承包责任制后, 在该乡抽得 n=16 的样本, 且 X ~ N (300, 252). 解由于  =0.05 , 查正态分布表得例1(P.157 例1) 得 ─ x =325元, 假设 2 = 252 没有变化, /2 | / |    u n X   | 1.96 25/ 16 325 |    1.96 16 25 1.96 325 16 25  325      即得置信区间 ( 312. 75 , 337. 25 ). 同一置信水平下的置信区间不唯一, 如在上例中取  =0. 01+ 0. 04 , 0.01 0.04  1(u0.01 )1(u0.04 ) u0.01 2.33 , u0.04 1.75 由正态分布上侧分位数定义知  1 P( u0.04  U  u0.01 )  1(u0.01 )(u0.04 ) 查表知 1.75 16 25 2.33 325 16 25  325      u0. 025 =1.96 , 当然区间长度越短的估计, 精度就越高. 其长度也不相等. 区间长度为 24. 25 长度为 25. 5 谁是精度最高的？由于标准正态分布密度函数的图形是单峰且对称的,  x x 在保持面积不变的条件下, 以对称区间的长度为最短 ! !

同一置信水平下的置信区间不唯一.其长度也不相等。但 -+是的长度是最短的，故我们总取它作为置信水平为1-α的置信区间一般地，在概率密度为单峰且对称的情形下，=-b对应的置信区间的长度为最短. l与n,a的关系：置信区间的长度1为：1=2g 由置信区间公式K-9,K+员)可知， Ual2 ①(x 10若给定n,l随着a的减小而增大；则ua2越大，(uaw2)就越大，这时a就越小. 2若给定a,1随着n的增大而减小；且由于l与√n成反比，减小的速度并不快，例如，n由100增至400时，1才能减小一半. D(ua2)=1-号

但的长度是最短的, l 与 n ,  的关系： (  / 2 ,  / 2 )   u n u X n X   可知, 置信区间的长度 l 为: , 2  / 2  u n l  由置信区间公式 l 随着  的减小而增大; 2 0 若给定  , l 随着 n 的增大而减小; 2 ( /2 ) 1   u   (x) 同一置信水平下的置信区间不唯一. 其长度也不相等. (  / 2 ,  / 2 )   u n u X n X   故我们总取它作为置信水平为 1- 的置信区间. 若给定 n, 且由于 l 与 n 成反比, 减小的速度并不快, 例如, n 由 100 增至 400 时, l 才能减小一半. 则 u/2 越大, l 就越大, 这时 就越小. 1 0 (u/2)就越大, 一般地, 在概率密度为单峰且对称的情形下, a =-b 对应的置信区间的长度为最短

点击下载完整版文档（PDF格式）

共22页，试读已结束，阅读完整版请下载

点击下载（PDF格式）

浏览记录