复习 极大似然估计的求法 选择参数的估计量,使实验结果具有最大概率 估计量的几个评选标准 。1 样本原点矩是总体原点矩的无偏估计量; 无偏性一一 E(0)=0· 样本方差是总体方差的无偏估计量; 无偏估计量的函数未必是无偏估计量 有效性一一 方差更小的无偏估计量. 在4的所有线性无偏估计量中,样本均值X是最有效的. 致性 区间估计一一置信区间
复习 极大似然估计的求法 估计量的几个评选标准 区间估计 ——选择参数的估计量, 使实验结果具有最大概率 无偏性 有效性 一致性 —— ^ E( )= —— 方差更小的无偏估计量. • 样本原点矩是总体原点矩的无偏估计量; • 样本方差是总体方差的无偏估计量 ; • 无偏估计量的函数未必是无偏估计量 ─ • 在 的所有线性无偏估计量中, 样本均值X 是最有效的. —— 置信区间
§7.4」 单个正态总体均值与方差的置信区间 譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本 得到鱼数N的极大似然估计为1000条. 但实际上,N的真值可能大于1000条,也 可能小于1000条. 若我们能给出一个区间,在此区间内我们合 理地相信N的真值位于其中,这样对鱼数的估计就有把握多了. 也就是说,我们希望确定一个尽可能小的区间,使我们能以 比较高的可靠程度相信它包含真参数值 这里所说的“可靠程度”是用概率来度 湖中鱼数的真值 量的,称为置信概率,置信度或置信水平 习惯上把置信水平记作1-a,这里α是一个很小的正数
若我们根据一个实际样本 得到鱼数 N 的极大似然估计为1000条. 若我们能给出一个区间, 在此区间内我们合 理地相信 N 的真值位于其中, 这样对鱼数的估计就有把握多了. 但实际上, N 的真值可能大于 1000 条, 也 可能小于1000条. §7.4 单个正态总体均值与方差的置信区间 也就是说, 我们希望确定一个尽可能小的区间, 使我们能以 比较高的可靠程度相信它包含真参数值. 湖中鱼数的真值 [ ] 这里所说的“可靠程度”是用概率来度 量的, 称为置信概率,置信度或置信水平. 习惯上把置信水平记作 1- , 这里 是一个很小的正数. 譬如,在估计湖中鱼数的问题中, •
置信水平的大小是根据实际需要选定的.例如,通常可取置信 水平=0.95或0.9等等. 根据一个实际样本,由给定的置信水平1-,我们求出一个的 区间(2,0),使 P(0≤0≤0)=1-, 如何寻找这种区间? 我们选取未知参数的某个估计量0,根据置信水平1-,可以 找到一个正数6,使得 P(6-0≤δ)=1-a, 只要知道0的概率分布就可以确定6.由不等式|0-1≤6 可以解出B: 6-6≤0≤0+6 这个不等式就是我们所求的置信区间(旦,0). 下面我们就来正式给出置信区间的定义,并通过例子说明求 置信区间的方法
根据置信水平1- , 可以 找到一个正数 , 例如, 通常可取置信 水平 = 0.95 或 0.9 等等. P( ) 1, 根据一个实际样本, 由给定的置信水平1- , 我们求出一个的 区间 ( , ) , 使 置信水平的大小是根据实际需要选定的. 如何寻找这种区间? P(| ˆ | ) 1, 使得 我们选取未知参数的某个估计量 ^ , 只要知道 ^ 的概率分布就可以确定 . 下面我们就来正式给出置信区间的定义, 并通过例子说明求 置信区间的方法. ˆ ˆ 由不等式 | ˆ | 可以解出 : 这个不等式就是我们所求的置信区间 ( , )
一、置信区间的概念 定义4(P.156定义7.4)设0是总体X的待估参数,X1,X,…,Xm 是取自总体X的样本,对给定值0<<1,若统计量O(X1,X2,…,Xm) 和0(X1,X2,…,Xn)满足 P(0<0<0)=1-a, 则称随机区间(Q,0)为0的置信水平为1-的双侧置信区间.日和0 分别称为置信下限和置信上限. 置信度置信概率 作区间估计,就是要设法找出两个只依赖于样本的界限(构造 统计量)旦和0.(8,0)是随机区间,代入样本值所得的普通区间称 为置信区间的实现. 置信水平为0.95是指100组样本值所得置信区间的实现中, 约有95个能覆盖0,而不是说一个实现以0.95的概率覆盖了0. 要求0以很大的可能被包含在置信区间内,就是说,概率 P(0<0<)=1-a要尽可能大.即要求估计尽量可靠. 估计的精度要尽可能的高.即要求区间置信的长度尽可能 短,或能体现该要求的其它准则
代入样本值所得的普通区间称 为置信区间的实现. 作区间估计, 就是要设法找出两个只依赖于样本的界限(构造 统计量) 即要求区间置信的长度尽可能 短, 或能体现该要求的其它准则. X1, X2, „, Xn 是取自总体X的样本, P( ) 1 , 对给定值0<<1, ( , , , ) X1 X2 Xn (X1 , X2 , , Xn ) ( , ) 满足 定义4(P.156 定义7.4) 设 是总体 X 的待估参数, 和 分别称为置信下限和置信上限. 一、 置信区间的概念 则称随机区间 为 的置信水平为1- 的双侧置信区间. 若统计量 和 估计的精度要尽可能的高. 要求 以很大的可能被包含在置信区间内, ─ P( < < )= 1- 要尽可能大. ─ 即要求估计尽量可靠. 置信水平为 0.95 是指 100 组样本值所得置信区间的实现中, 就是说 , 概率 置信度 置信概率 和 . ( , ) 是随机区间, 约有95个能覆盖 , 而不是说一个实现以 0.95 的概率覆盖了
将样本值代入(Q,)所得的普通区间称为置信区间的实现. 置信水平的概率意义;并非一个实现以1-a的概率覆盖了0. 估计要尽量可靠,即P(0<0<0)=1-a要尽可能大. 估计的精度要尽可能的高.即要求置信区间的长度尽可能短. 可靠度与精度是一对矛盾,.一般是在 保证可靠度的条件下尽可能提高精度
置信水平的概率意义; ( , ) 并非一个实现以 1- 的概率覆盖了 . 估计的精度要尽可能的高. 即要求置信区间的长度尽可能短. 估计要尽量可靠, ─ 即 P( < < )= 1- 要尽可能大. ─ 可靠度与精度是一对矛盾, 一般是在 保证可靠度的条件下尽可能提高精度. 将样本值代入 所得的普通区间称为置信区间的实现
二、置信区间的求法 1.均值4 (1)已知方差。2 (一)单个正态总体) 1(2)未知方差σ2 (2.方差a20 已知均值4 (2)未知均值μ 1.均值41- (1)已知方差c3,o2 (二)两个正态总体 22)未知方差c品,品,但相等! 2方差/8柔盘你么 如何根据实际样本,由给定的置信水平1-,求出一个区间(Q,D),使 P(0≤0≤0)=1-a? 我们选取未知参数的某个估计量① 据置信水平1-a,可以 找到一个正数δ,使得P(I8-0≤8)=1-a, 只要知道0的概率分布就可以确定6. 分布的分位数 ② 由不等式|6-01≤δ可以解出0:0-δ≤0≤6+δ③ 这个不等式就是我们所求的置信区间(Q,) 对于给定的置信水平,根据估计量U的分布,确定 一个区间,使得U取值于该区间的概率为置信水平. >i
只要知道 ^ 的概率分布就可以确定 . 如何根据实际样本, 由给定的置信水平1- , 求出一个区间 , 使 根据置信水平1- , 可以 找到一个正数 , 二、置信区间的求法 (一) 单个正态总体 1. 均值 (1) 已知方差2 1. 均值 1 - 2 (1)已知方差1 2 ,2 2 (二) 两个正态总体 2. 方差 2 (2)未知方差2 P( ) 1 ? ( , ) 使得 P(| ˆ | ) 1, 我们选取未知参数的某个估计量 ^ , 由不等式 | ˆ | 可以解出 : ˆ ˆ 这个不等式就是我们所求的置信区间 ( , ) . 分布的分位数 ① ② ③ (1)已知均值 (2) 未知均值 (2)未知方差1 2 ,2 2 2. 方差1 2/2 2 (1)已知均值 1 , 2 (2)未知均值 1 , 2 ,但相等! 对于给定的置信水平, 根据估计量U 的分布, 确定 一个区间, 使得 U 取值于该区间的概率为置信水平
(一)单个正态总体置信区间的求法 设X,,X是总体X~N(4,o2)的样本,X,S2分别是其样本 均值和样本方差,求参数4、o2的置信水平为1-α的置信区间. 1.均值μ的置信区间 ①确定未知参数的 (1)已知方差o2时 估计量及其函数的分布 :X=客X是μ的无偏估计量,放可用X作为BX的-个估计昼, 由抽样分布定理知 .U= X-'~N(0,1), X~N(u,2/n), 有了分布就可求出U取值于任意区间的概率 对给定的置信度1-, P.53 按标准正态分布的双侧a分位数的定义P(IUI≥a2)=a, 即令Φ(u2)=l-号,查正态分布表可得4a12,②由分布求分位数4 ③由ua2确 定置信区间 即得置信区间(X-员,X+a小,简记为X土: n
─ X , S 2 分别是其样本 均值和样本方差, ─ X ~ N( , 2/n), 求参数 、 2 的置信水平为1- 的置信区间. 设 X1,„, Xn 是总体 X ~ N(,2)的样本, n X U / ① 确定未知参数的 估计量及其函数的分布 是的无偏估计量, ② 由分布求分位数 即得置信区间 (一) 单个正态总体置信区间的求法 (1)已知方差2 时 ─ 故可用 X 作为 EX 的一个估计量, n i Xi n X 1 1 ~ N(0, 1), 对给定的置信度 1- , 按标准正态分布的双侧分位数的定义 /2 / 2 / 2 | / | u n u X n u X n X (| | ) , P U u /2 , 2 ( /2 ) 1 即令 u 查正态分布表可得 u/2 , ③ 由u/2确 定置信区间 ( , ) , / 2 / 2 u n u X n X 有了分布就可求出U 取值于任意区间的概率 P .53 简记为 2 u n X 由抽样分布定理知 1. 均值 的置信区间
求置信区间首先要明确问题: 是求什么参数的置信区间?置信水平1-α是多少? 一般步骤如下: x=客Y 1.寻找未知参数0的一个良好的点估计量O(X,X2,…,X); 确定待估参数估计量函数U(O)的分布; U=X='~N0,) /n 2.对于给定的置信水平1-a,由概率P(IU≥xa)=x, 查表求出分布的分位数xa,(uan)=1-号 P(IU八≥wa2)=a 由分位数U≥x。确定置信区间,收-只:<<+ (0,0)就是0的100(1-a)%的置信区间. 总体分布的形式是否已知,是怎样 (-品a,+ 的类型,至关重要
/ 2 / 2 u n u X n X 是求什么参数的置信区间? 置信水平 1- 是多少? ^ 1. 寻找未知参数 的一个良好的点估计量 (X1, X2, „, Xn ); 确定待估参数估计量函数 ^ U( ) 的分布 ; 求置信区间首先要明确问题: 2. 对于给定的置信水平 1- , 由概率 ─ ( , ) 就是 的 100(1-)% 的置信区间. ─ 一般步骤如下: ─ 3. 由分位数|U| x 确定置信区间 ( , ). ─ P(|U| x ) , P(|U| u /2 ) 2 ( /2 ) 1 u ( / 2 , / 2 ) u n u X n X 查表求出分布的分位数 x , ~ (0,1) / N n X U n i Xi n X 1 1 总体分布的形式是否已知,是怎样 的类型,至关重要
例1(P.157例1)某乡农民在联产承包责任制前人均纯收入X(单 位:元),且X~N(300,252).推行联产承包责任制后,在该乡抽得 n=16的样本,得x=325元,假设σ2=252没有变化,求μ的置信水 平为0.95的置信区间. 解由于a=0.05, 查正态分布表得u0.025=1.96, 2 325-|<1.96 325-25 1.96<4<325+251.96 25/N16 V16 V16 即得置信区间 (312.75,337.25). 区间长度为24.25 如在上例中取a=0.01+0.04,由正态分布上侧分位数定义知 0.01+0.04=1-D(u.0i)+1-D(4.04)=1-Φ(40.01)+Φ(-40.04) =1-P(-uo.04<U<0.01) 长度为25.5 查表知1=2.33,W04=1.75今325-252.33<山<325+251.75 V16 V16 +同一置信水平下的置信区间不唯一,其长度也不相等 个Φx) 当然区间长度越短的估计,精度就越高. 谁是 0.4 由于标准正态分布密度函数的图形是单峰且对称的, 在保持面积不变的条件下,以对称区间的长度为最短!!
某乡农民在联产承包责任制前人均纯收入X(单 位:元), 求 的置信水 平为0. 95 的置信区间. 推行联产承包责任制后, 在该乡抽得 n=16 的样本, 且 X ~ N (300, 252). 解 由于 =0.05 , 查正态分布表得 例1(P.157 例1) 得 ─ x =325元, 假设 2 = 252 没有变化, /2 | / | u n X | 1.96 25/ 16 325 | 1.96 16 25 1.96 325 16 25 325 即得置信区间 ( 312. 75 , 337. 25 ). 同一置信水平下的置信区间不唯一, 如在上例中取 =0. 01+ 0. 04 , 0.01 0.04 1(u0.01 )1(u0.04 ) u0.01 2.33 , u0.04 1.75 由正态分布上侧分位数定义知 1 P( u0.04 U u0.01 ) 1(u0.01 )(u0.04 ) 查表知 1.75 16 25 2.33 325 16 25 325 u0. 025 =1.96 , 当然区间长度越短的估计, 精度就越高. 其长度也不相等. 区间长度为 24. 25 长度为 25. 5 谁是精度最高的? 由于标准正态分布密度函数的图形是单峰且对称的, x x 在保持面积不变的条件下, 以对称区间的长度为最短 ! !
同一置信水平下的置信区间不唯一.其长度也不相等。但 -+是 的长度是最短的,故我们总取它作为置信水平为1-α的置信区间 一般地,在概率密度为单峰且对称的情形下,=-b对应的 置信区间的长度为最短. l与n,a的关系: 置信区间的长度1为:1=2g 由置信区间公式K-9,K+员)可知, Ual2 ①(x 10若给定n,l随着a的减小而增大; 则ua2越大,(uaw2)就越大, 这时a就越小. 2若给定a,1随着n的增大而减小; 且由于l与√n成反比,减小的速度并不快, 例如,n由100增至400时,1才能减小一半. D(ua2)=1-号
但 的长度是最短的, l 与 n , 的关系: ( / 2 , / 2 ) u n u X n X 可知, 置信区间的长度 l 为: , 2 / 2 u n l 由置信区间公式 l 随着 的减小而增大; 2 0 若给定 , l 随着 n 的增大而减小; 2 ( /2 ) 1 u (x) 同一置信水平下的置信区间不唯一. 其长度也不相等. ( / 2 , / 2 ) u n u X n X 故我们总取它作为置信水平为 1- 的置信区间. 若给定 n, 且由于 l 与 n 成反比, 减小的速度并不快, 例如, n 由 100 增至 400 时, l 才能减小一半. 则 u/2 越大, l 就越大, 这时 就越小. 1 0 (u/2)就越大, 一般地, 在概率密度为单峰且对称的情形下, a =-b 对应的 置信区间的长度为最短