当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

上海交通大学:《概率论与数理统计》课程教学资源(课件讲稿)16、估计3/3

资源类别:文库,文档格式:PDF,文档页数:22,文件大小:565.03KB,团购合买
点击下载完整版文档(PDF)

复习 极大似然估计的求法 选择参数的估计量,使实验结果具有最大概率 估计量的几个评选标准 。1 样本原点矩是总体原点矩的无偏估计量; 无偏性一一 E(0)=0· 样本方差是总体方差的无偏估计量; 无偏估计量的函数未必是无偏估计量 有效性一一 方差更小的无偏估计量. 在4的所有线性无偏估计量中,样本均值X是最有效的. 致性 区间估计一一置信区间

复习 极大似然估计的求法 估计量的几个评选标准 区间估计 ——选择参数的估计量, 使实验结果具有最大概率 无偏性 有效性 一致性     —— ^ E( )= —— 方差更小的无偏估计量. • 样本原点矩是总体原点矩的无偏估计量; • 样本方差是总体方差的无偏估计量 ; • 无偏估计量的函数未必是无偏估计量 ─ • 在  的所有线性无偏估计量中, 样本均值X 是最有效的. —— 置信区间

§7.4」 单个正态总体均值与方差的置信区间 譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本 得到鱼数N的极大似然估计为1000条. 但实际上,N的真值可能大于1000条,也 可能小于1000条. 若我们能给出一个区间,在此区间内我们合 理地相信N的真值位于其中,这样对鱼数的估计就有把握多了. 也就是说,我们希望确定一个尽可能小的区间,使我们能以 比较高的可靠程度相信它包含真参数值 这里所说的“可靠程度”是用概率来度 湖中鱼数的真值 量的,称为置信概率,置信度或置信水平 习惯上把置信水平记作1-a,这里α是一个很小的正数

若我们根据一个实际样本 得到鱼数 N 的极大似然估计为1000条. 若我们能给出一个区间, 在此区间内我们合 理地相信 N 的真值位于其中, 这样对鱼数的估计就有把握多了. 但实际上, N 的真值可能大于 1000 条, 也 可能小于1000条. §7.4 单个正态总体均值与方差的置信区间 也就是说, 我们希望确定一个尽可能小的区间, 使我们能以 比较高的可靠程度相信它包含真参数值. 湖中鱼数的真值 [ ] 这里所说的“可靠程度”是用概率来度 量的, 称为置信概率,置信度或置信水平. 习惯上把置信水平记作 1- , 这里  是一个很小的正数. 譬如,在估计湖中鱼数的问题中, •

置信水平的大小是根据实际需要选定的.例如,通常可取置信 水平=0.95或0.9等等. 根据一个实际样本,由给定的置信水平1-,我们求出一个的 区间(2,0),使 P(0≤0≤0)=1-, 如何寻找这种区间? 我们选取未知参数的某个估计量0,根据置信水平1-,可以 找到一个正数6,使得 P(6-0≤δ)=1-a, 只要知道0的概率分布就可以确定6.由不等式|0-1≤6 可以解出B: 6-6≤0≤0+6 这个不等式就是我们所求的置信区间(旦,0). 下面我们就来正式给出置信区间的定义,并通过例子说明求 置信区间的方法

根据置信水平1- , 可以 找到一个正数  , 例如, 通常可取置信 水平 = 0.95 或 0.9 等等. P(   )  1, 根据一个实际样本, 由给定的置信水平1- , 我们求出一个的 区间 ( ,  ) , 使 置信水平的大小是根据实际需要选定的. 如何寻找这种区间? P(| ˆ  | )  1, 使得 我们选取未知参数的某个估计量 ^  , 只要知道 ^  的概率分布就可以确定  . 下面我们就来正式给出置信区间的定义, 并通过例子说明求 置信区间的方法.        ˆ ˆ 由不等式   |  ˆ | 可以解出 : 这个不等式就是我们所求的置信区间 ( ,  )

一、置信区间的概念 定义4(P.156定义7.4)设0是总体X的待估参数,X1,X,…,Xm 是取自总体X的样本,对给定值0<<1,若统计量O(X1,X2,…,Xm) 和0(X1,X2,…,Xn)满足 P(0<0<0)=1-a, 则称随机区间(Q,0)为0的置信水平为1-的双侧置信区间.日和0 分别称为置信下限和置信上限. 置信度置信概率 作区间估计,就是要设法找出两个只依赖于样本的界限(构造 统计量)旦和0.(8,0)是随机区间,代入样本值所得的普通区间称 为置信区间的实现. 置信水平为0.95是指100组样本值所得置信区间的实现中, 约有95个能覆盖0,而不是说一个实现以0.95的概率覆盖了0. 要求0以很大的可能被包含在置信区间内,就是说,概率 P(0<0<)=1-a要尽可能大.即要求估计尽量可靠. 估计的精度要尽可能的高.即要求区间置信的长度尽可能 短,或能体现该要求的其它准则

代入样本值所得的普通区间称 为置信区间的实现. 作区间估计, 就是要设法找出两个只依赖于样本的界限(构造 统计量) 即要求区间置信的长度尽可能 短, 或能体现该要求的其它准则. X1, X2, „, Xn 是取自总体X的样本, P(    )  1 , 对给定值0<<1, ( , , , )  X1 X2  Xn  (X1 , X2 ,  , Xn ) ( ,  ) 满足 定义4(P.156 定义7.4) 设 是总体 X 的待估参数,  和 分别称为置信下限和置信上限. 一、 置信区间的概念 则称随机区间 为 的置信水平为1- 的双侧置信区间. 若统计量 和 估计的精度要尽可能的高. 要求 以很大的可能被包含在置信区间内, ─ P( < < )= 1- 要尽可能大. ─ 即要求估计尽量可靠. 置信水平为 0.95 是指 100 组样本值所得置信区间的实现中, 就是说 , 概率 置信度 置信概率  和 . ( ,  ) 是随机区间, 约有95个能覆盖 , 而不是说一个实现以 0.95 的概率覆盖了

将样本值代入(Q,)所得的普通区间称为置信区间的实现. 置信水平的概率意义;并非一个实现以1-a的概率覆盖了0. 估计要尽量可靠,即P(0<0<0)=1-a要尽可能大. 估计的精度要尽可能的高.即要求置信区间的长度尽可能短. 可靠度与精度是一对矛盾,.一般是在 保证可靠度的条件下尽可能提高精度

置信水平的概率意义; ( ,  ) 并非一个实现以 1- 的概率覆盖了 . 估计的精度要尽可能的高. 即要求置信区间的长度尽可能短. 估计要尽量可靠, ─ 即 P( < < )= 1- 要尽可能大. ─ 可靠度与精度是一对矛盾, 一般是在 保证可靠度的条件下尽可能提高精度. 将样本值代入 所得的普通区间称为置信区间的实现

二、置信区间的求法 1.均值4 (1)已知方差。2 (一)单个正态总体) 1(2)未知方差σ2 (2.方差a20 已知均值4 (2)未知均值μ 1.均值41- (1)已知方差c3,o2 (二)两个正态总体 22)未知方差c品,品,但相等! 2方差/8柔盘你么 如何根据实际样本,由给定的置信水平1-,求出一个区间(Q,D),使 P(0≤0≤0)=1-a? 我们选取未知参数的某个估计量① 据置信水平1-a,可以 找到一个正数δ,使得P(I8-0≤8)=1-a, 只要知道0的概率分布就可以确定6. 分布的分位数 ② 由不等式|6-01≤δ可以解出0:0-δ≤0≤6+δ③ 这个不等式就是我们所求的置信区间(Q,) 对于给定的置信水平,根据估计量U的分布,确定 一个区间,使得U取值于该区间的概率为置信水平. >i

只要知道 ^ 的概率分布就可以确定 . 如何根据实际样本, 由给定的置信水平1- , 求出一个区间 , 使 根据置信水平1- , 可以 找到一个正数  , 二、置信区间的求法     (一) 单个正态总体 1. 均值 (1) 已知方差2          1. 均值 1 - 2 (1)已知方差1 2 ,2 2    (二) 两个正态总体 2. 方差 2 (2)未知方差2 P(   )  1 ? ( ,  ) 使得 P(| ˆ  | )  1, 我们选取未知参数的某个估计量 ^  ,      由不等式 | ˆ  |  可以解出 : ˆ ˆ 这个不等式就是我们所求的置信区间 ( ,  ) . 分布的分位数 ① ② ③ (1)已知均值     (2) 未知均值  (2)未知方差1 2 ,2 2 2. 方差1 2/2 2 (1)已知均值 1 , 2    (2)未知均值 1 , 2 ,但相等! 对于给定的置信水平, 根据估计量U 的分布, 确定 一个区间, 使得 U 取值于该区间的概率为置信水平

(一)单个正态总体置信区间的求法 设X,,X是总体X~N(4,o2)的样本,X,S2分别是其样本 均值和样本方差,求参数4、o2的置信水平为1-α的置信区间. 1.均值μ的置信区间 ①确定未知参数的 (1)已知方差o2时 估计量及其函数的分布 :X=客X是μ的无偏估计量,放可用X作为BX的-个估计昼, 由抽样分布定理知 .U= X-'~N(0,1), X~N(u,2/n), 有了分布就可求出U取值于任意区间的概率 对给定的置信度1-, P.53 按标准正态分布的双侧a分位数的定义P(IUI≥a2)=a, 即令Φ(u2)=l-号,查正态分布表可得4a12,②由分布求分位数4 ③由ua2确 定置信区间 即得置信区间(X-员,X+a小,简记为X土: n

─ X , S 2 分别是其样本 均值和样本方差, ─ X ~ N( , 2/n), 求参数  、 2 的置信水平为1- 的置信区间. 设 X1,„, Xn 是总体 X ~ N(,2)的样本, n X U  /    ① 确定未知参数的 估计量及其函数的分布 是的无偏估计量, ② 由分布求分位数 即得置信区间 (一) 单个正态总体置信区间的求法 (1)已知方差2 时 ─  故可用 X 作为 EX 的一个估计量,   n i Xi n X 1  1 ~ N(0, 1), 对给定的置信度 1- , 按标准正态分布的双侧分位数的定义 /2 / 2 / 2 | / |         u n u X n u X n X        (| | ) , P U  u /2  , 2 ( /2 ) 1  即令  u   查正态分布表可得 u/2 , ③ 由u/2确 定置信区间 ( , ) ,  / 2  / 2   u n u X n X   有了分布就可求出U 取值于任意区间的概率 P .53 简记为  2  u n X  由抽样分布定理知 1. 均值  的置信区间

求置信区间首先要明确问题: 是求什么参数的置信区间?置信水平1-α是多少? 一般步骤如下: x=客Y 1.寻找未知参数0的一个良好的点估计量O(X,X2,…,X); 确定待估参数估计量函数U(O)的分布; U=X='~N0,) /n 2.对于给定的置信水平1-a,由概率P(IU≥xa)=x, 查表求出分布的分位数xa,(uan)=1-号 P(IU八≥wa2)=a 由分位数U≥x。确定置信区间,收-只:<<+ (0,0)就是0的100(1-a)%的置信区间. 总体分布的形式是否已知,是怎样 (-品a,+ 的类型,至关重要

 / 2  / 2    u n u X n X     是求什么参数的置信区间? 置信水平 1- 是多少? ^ 1. 寻找未知参数 的一个良好的点估计量  (X1, X2, „, Xn ); 确定待估参数估计量函数 ^ U( ) 的分布 ; 求置信区间首先要明确问题: 2. 对于给定的置信水平 1- , 由概率 ─ ( ,  ) 就是 的 100(1-)% 的置信区间. ─ 一般步骤如下: ─ 3. 由分位数|U| x 确定置信区间 ( , ). ─ P(|U|  x )  , P(|U|  u /2 )  2 ( /2 ) 1   u   (  / 2 ,  / 2 )   u n u X n X   查表求出分布的分位数 x , ~ (0,1) / N n X U      n i Xi n X 1 1 总体分布的形式是否已知,是怎样 的类型,至关重要

例1(P.157例1)某乡农民在联产承包责任制前人均纯收入X(单 位:元),且X~N(300,252).推行联产承包责任制后,在该乡抽得 n=16的样本,得x=325元,假设σ2=252没有变化,求μ的置信水 平为0.95的置信区间. 解由于a=0.05, 查正态分布表得u0.025=1.96, 2 325-|<1.96 325-25 1.96<4<325+251.96 25/N16 V16 V16 即得置信区间 (312.75,337.25). 区间长度为24.25 如在上例中取a=0.01+0.04,由正态分布上侧分位数定义知 0.01+0.04=1-D(u.0i)+1-D(4.04)=1-Φ(40.01)+Φ(-40.04) =1-P(-uo.04<U<0.01) 长度为25.5 查表知1=2.33,W04=1.75今325-252.33<山<325+251.75 V16 V16 +同一置信水平下的置信区间不唯一,其长度也不相等 个Φx) 当然区间长度越短的估计,精度就越高. 谁是 0.4 由于标准正态分布密度函数的图形是单峰且对称的, 在保持面积不变的条件下,以对称区间的长度为最短!!

某乡农民在联产承包责任制前人均纯收入X(单 位:元), 求 的置信水 平为0. 95 的置信区间. 推行联产承包责任制后, 在该乡抽得 n=16 的样本, 且 X ~ N (300, 252). 解 由于  =0.05 , 查正态分布表得 例1(P.157 例1) 得 ─ x =325元, 假设 2 = 252 没有变化, /2 | / |    u n X   | 1.96 25/ 16 325 |    1.96 16 25 1.96 325 16 25  325      即得置信区间 ( 312. 75 , 337. 25 ). 同一置信水平下的置信区间不唯一, 如在上例中取  =0. 01+ 0. 04 , 0.01 0.04  1(u0.01 )1(u0.04 ) u0.01 2.33 , u0.04 1.75 由正态分布上侧分位数定义知  1 P( u0.04  U  u0.01 )  1(u0.01 )(u0.04 ) 查表知 1.75 16 25 2.33 325 16 25  325      u0. 025 =1.96 , 当然区间长度越短的估计, 精度就越高. 其长度也不相等. 区间长度为 24. 25 长度为 25. 5 谁是精度最高的? 由于标准正态分布密度函数的图形是单峰且对称的,  x x 在保持面积不变的条件下, 以对称区间的长度为最短 ! !

同一置信水平下的置信区间不唯一.其长度也不相等。但 -+是 的长度是最短的,故我们总取它作为置信水平为1-α的置信区间 一般地,在概率密度为单峰且对称的情形下,=-b对应的 置信区间的长度为最短. l与n,a的关系: 置信区间的长度1为:1=2g 由置信区间公式K-9,K+员)可知, Ual2 ①(x 10若给定n,l随着a的减小而增大; 则ua2越大,(uaw2)就越大, 这时a就越小. 2若给定a,1随着n的增大而减小; 且由于l与√n成反比,减小的速度并不快, 例如,n由100增至400时,1才能减小一半. D(ua2)=1-号

但 的长度是最短的, l 与 n ,  的关系: (  / 2 ,  / 2 )   u n u X n X   可知, 置信区间的长度 l 为: , 2  / 2  u n l  由置信区间公式 l 随着  的减小而增大; 2 0 若给定  , l 随着 n 的增大而减小; 2 ( /2 ) 1   u   (x) 同一置信水平下的置信区间不唯一. 其长度也不相等. (  / 2 ,  / 2 )   u n u X n X   故我们总取它作为置信水平为 1- 的置信区间. 若给定 n, 且由于 l 与 n 成反比, 减小的速度并不快, 例如, n 由 100 增至 400 时, l 才能减小一半. 则 u/2 越大, l 就越大, 这时 就越小. 1 0 (u/2)就越大, 一般地, 在概率密度为单峰且对称的情形下, a =-b 对应的 置信区间的长度为最短

点击下载完整版文档(PDF)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
共22页,试读已结束,阅读完整版请下载
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有