复习 极大似然估计的求法 选择参数的估计量,使实验结果具有最大概率 估计量的几个评选标准 无偏性 E()=8·样本原点矩是总体原点矩的无偏估计量; 样本方差是总体方差的无偏估计量 无偏估计量的函数未必是无偏估计量 有效性—方差更小的无偏估计量 一·在的所有线性无偏估计量中,样本均值X是最有效的 区间估计—一置信区间
复习 极大似然估计的求法 估计量的几个评选标准 区间估计 ——选择参数的估计量, 使实验结果具有最大概率 无偏性 有效性 一致性 — — ^ E( )= —— 方差更小的无偏估计量. • 样本原点矩是总体原点矩的无偏估计量; • 样本方差是总体方差的无偏估计量 ; • 无偏估计量的函数未必是无偏估计量 ─ • 在 的所有线性无偏估计量中, 样本均值X是最有效的. —— 置信区间
s4单个正态总体均值与方差的置信区间 譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本 得到鱼数N的极大似然估计为1000条 但实际上,N的真值可能大于10003,也“ 可能小于1000条. 若我们能给出一个区间,在此区间内我们合A 理地相信N的真值位于其中,这样对鱼数的估计就有把握多了 也就是说,我们希望确定一个尽可能小的区间,使我们能以 比较高的可靠程度相信它包含真参数值 这里所说的“可靠程度”是用概率来度 湖中鱼数的真值 量的,称为置信概率,置信度或置信水平. 习惯上把置信水平记作1-a,这里a是一个很小的正数
若我们根据一个实际样本 得到鱼数 N 的极大似然估计为1000条. 若我们能给出一个区间, 在此区间内我们合 理地相信 N 的真值位于其中, 这样对鱼数的估计就有把握多了. 但实际上, N 的真值可能大于 1000 条, 也 可能小于1000条. §4 单个正态总体均值与方差的置信区间 也就是说, 我们希望确定一个尽可能小的区间, 使我们能以 比较高的可靠程度相信它包含真参数值. 湖中鱼数的真值 [ ] 这里所说的“可靠程度”是用概率来度 量的, 称为置信概率,置信度或置信水平. 习惯上把置信水平记作 1- , 这里 是一个很小的正数. 譬如,在估计湖中鱼数的问题中, •
置信水平的大小是根据实际需要选定的.例如,通常可取置信 水平=0.95或0.9等等 根据一个实际样本,由给定的置信水平1-a,我们求出一个的 区间(Q,日),使 P(≤0≤6)=1-a, 如何寻找这种区间? 我们选取未知参数的某个估计量,根据置信水平1-a,可以 找到一个正数δ,使得 P(-0|≤δ)=1-a, 只要知道θ的概率分布就可以确定δ.由不等式|6-0|≤8 可以解出: 6-6<6≤b+6 这个不等式就是我们所求的置信区间(,) 下面我们就来正式给出置信区间的定义,并通过例子说明求 置信区间的方法
根据置信水平1- , 可以 找到一个正数 , 例如, 通常可取置信 水平 = 0.95 或 0.9 等等. P( ) 1, 根据一个实际样本, 由给定的置信水平1- , 我们求出一个的 区间( , ), 使 置信水平的大小是根据实际需要选定的. 如何寻找这种区间? P(| ˆ | ) 1 , 使得 ^ 我们选取未知参数的某个估计量 , ^ 只要知道 的概率分布就可以确定 . 下面我们就来正式给出置信区间的定义, 并通过例子说明求 置信区间的方法. ˆ ˆ 由不等式 | ˆ | 可以解出 : 这个不等式就是我们所求的置信区间 ( , )
置信区间的概念 定义4设e是总体X的待估参数,X,X2,…,X是取自 总体X的样本, 对给定值0<a<1,若统计量θ(X1,X2,…,Xn) 和b(X1,X2,…,Xn)满足 P(e<6<6)=1-a, 则称随机区间Q,)为6的置信水平为1-a的双侧置信区间.Q和b 分别称为置信下限和置信上限 置信度置信概率 作区间估计,就是要设法找出两个只依赖于样本的界限(构造 统计量)和日.(旦,0)是随机区间,代入样本值所得的普通区间称 为置信区间的实现 4置信水平为0.95是指100组样本值所得置信区间的实现中, 约有95个能覆盖θ,而不是说一个实现以0.95的概率覆盖了θ 4要求日以很大的可能被包含在置信区间内,就是说,概率 P(0<0<6)=1-a要尽可能大即要求估计尽量可靠 估计的精度要尽可能的高.即要求区间置信的长度尽可能 短,或能体现该要求的其它准则
代入样本值所得的普通区间称 为置信区间的实现. 作区间估计, 就是要设法找出两个只依赖于样本的界限(构造 统计量) 即要求区间置信的长度尽可能 短, 或能体现该要求的其它准则. X1, X2, …, Xn是取自 总体X的样本, P ( ) 1 , 对给定值0<<1, ( , , , ) X1 X2 Xn (X1 , X2 ,, Xn ) ( , ) 满足 定义4 设 是总体 X 的待估参数, 和 分别称为置信下限和置信上限. 一、 置信区间的概念 则称随机区间 为 的置信水平为1- 的双侧置信区间. 若统计量 和 估计的精度要尽可能的高. 要求 以很大的可能被包含在置信区间内, ─ P( < < )= 1- 要尽可能大. ─ 即要求估计尽量可靠. 置信水平为 0.95 是指 100 组样本值所得置信区间的实现中, 就是说 , 概率 置信度 置信概率 和 . ( , )是随机区间, 约有95个能覆盖 , 而不是说一个实现以 0.95 的概率覆盖了
将样本值代入(,)所得的普通区间称为置信区间的实现 置信水平的概率意义;并非一个实现以1a的概率覆盖了θ 估计要尽量可靠,即P(<6<)=1-a要尽可能大 估计的精度要尽可能的高.即要求置信区间的长度尽可能短 可靠度与精度是一对矛盾,一般是在 保证可靠度的条件下尽可能提高精度
置信水平的概率意义; (, ) 并非一个实现以 1- 的概率覆盖了 . 估计的精度要尽可能的高. 即要求置信区间的长度尽可能短. 估计要尽量可靠, ─ 即 P( < < )= 1- 要尽可能大. ─ 可靠度与精度是一对矛盾, 一般是在 保证可靠度的条件下尽可能提高精度. 将样本值代入 所得的普通区间称为置信区间的实现
置信区间的求法 (1)已知方差a2 ()单个正态总体 1.均值{(2)未知方差a2 2.方差a2 (1)已知均值p (2)未知均值p (1)已知方差a2, (二)两个正态总体 1.均值H{(2)未知方差G,2,但相等! (1)已知均值p,p2 2.方差/1(2)未知均值1,p 如何根据实际样本,由给定的置信水平1-a,求出一个区间(旦,日),使 P(≤6≤6)=1-a? 我们选取未知参数的某个估计量e根据置信水平1-a,可以 找到一个正数δ,使得P(6-≤δ)=1-a, 只要知道的概率分布就可以确定δ.分布的分位数② 由不等式|-0|≤δ可以解出e:b-≤6≤6+6③ 这个不等式就是我们所求的置信区间(, 对于给定的置信水平,根据估计量U的分布,确定 一个区间,使得U取值于该区间的概率为置信水平
只 要 知 道 ^ 的概率分布就可以确定 . 如何根据实际样本, 由给定的置信水平1- , 求出一个区间 , 使 根据置信水平1- , 可以 找到一个正数 , 二、置信区间的求法 (一) 单个正态总体 1. 均值 (1) 已知方差 2 1. 均值 1- 2 (1) 已知方差1 2 ,2 2 (二) 两个正态总体 2. 方差 2 (2)未知方差 2 P( ) 1 ? ( , ) 使得P(| ˆ | ) 1, ^ 我们选取未知参数的某个估计量 , 由不等式 | ˆ | 可以解出 : ˆ ˆ 这个不等式就是我们所求的置信区间( , ) . 分布的分位数 ① ② ③ (1) 已知均值 (2) 未知均值 (2) 未知方差1 2 ,2 2 2. 方差1 2/2 2 (1) 已知均值 1 , 2 (2)未知均值 1 , 2 ,但相等! 对于给定的置信水平, 根据估计量U 的分布, 确定 一个区间, 使得 U 取值于该区间的概率为置信水平
()单个正态总体置信区间的求法 设X1,…,X是总体X~N(,02)的样本,,S2分别是其样本 均值和样本方差,求参数 a2的置信水平为1-a的置信区间 1.均值μ的置信区间 ①确定未知参数的 (1)已知方差a2时 估计量及其函数的分布 X=1∑X1是的无偏估计量故可用X作为EX的一个估计量, 由抽样分布定理知 X-u-N(O, 1) XN n 4有了分布就可求出U取值于任意区间的概率 对给定的置信度1-a, P66 按标准正态分布的双侧a分位数的定义P(U|≥ua2)=a, 即令(ua2)=1-号,查正态分布表可得la2,②由分布求分位数 x-kk<ua e x-o V4a2<<X+%na/2③由a2 确 定置信区间 即得置信区间(X ual 5 X+gla2),简记为x±na2
─X , S 2分别是其样本 均值和样本方差, ─X ~ N( , 2/n), 求参数 、 2的置信水平为1- 的置信区间. 设 X1,…, Xn是总体 X~ N(, 2)的样本, n X U / ① 确定未知参数的 估计量及其函数的分布 是 的无偏估计量, ② 由分布求分位数 即得置信区间 (一) 单个正态总体置信区间的求法 (1)已知方差 2 时 ─ 故可用 X 作为 EX 的一个估计量, n i Xi n X 1 1 ~ N(0, 1), 对给定的置信度 1- , 按标准正态分布的双侧 分位数的定义 /2 / 2 / 2 | / | u n u X n u X n X (| | ) , P U u /2 , 2 ( /2 ) 1 即令 u 查正态分布表可得 u/2 , ③ 由u/2确 定置信区间 ( , ) , / 2 / 2 u n u X n X 有了分布就可求出U 取值于任意区间的概率 P 66 简记为 2 u n X 由抽样分布定理知 1. 均值 的置信区间
求置信区间首先要明确问题: 是求什么参数的置信区间?置信水平1-a是多少? 般步骤如下: X 1.寻找未知参数的一个良好的点估计量θ(X1,X2,…,Xn) 确定待估参数估计量函数U()的分布 U X-~N(0 2.对于给定的置信水平1-a,由概率P(U|≥xa)=a, 查表求出分布的分位数xa,①(nan2)=1- P(U|≥La2)=a 3由分位数U≥xa确定置信区间(B,6)x-an2<<x+gl2 (θ,θ)航就是θ的100(1a)%的置信区间. n 总体分布的形式是否已知,是怎样的(x-m02,x+mna2) 类型,至关重要
/2 /2 u n u X n X 是求什么参数的置信区间? 置信水平 1- 是多少? ^ 1. 寻找未知参数 的一个良好的点估计量 (X1, X2, …, Xn ); 确 定 待 估 参 数 估 计 量 函 数 ^ U( ) 的分布 ; 求置信区间首先要明确问题: 2. 对于给定的置信水平 1- , 由概率 ─ ( , ) 就是 的100(1-)% 的置信区间. ─一般步骤如下: ─ 3. 由分位数|U| x 确定置信区间 ( , ). ─ P(|U | x ) , P(|U | u /2 ) 2 ( / 2 ) 1 u ( / 2 , / 2 ) u n u X n X 查表求出分布的分位数 x , ~ (0,1) / N n X U n i Xi n X 1 1 总体分布的形式是否已知,是怎样的 类型,至关重要
例1某乡农民在联产承包责任制前人均纯收入X(单位:元 且X~N(300,252)推行联产承包责任制后,在该乡抽得 n=16的样本,得=325元,假设a2=252没有变化求p的置信水 平为0.95的置信区间 解由于a=0.05,查正态分布表得 0u,1325≠<1%÷35-30.025=1.96, X 196<m<32S 1.96 25/16 即得置信区间(312.75,337.25).区间长度为24.25 如在上例中取a=0.01+0.04,由正态分布上侧分位数定义知 0.01+0.04=1-φ(u0)+1-①(u04)=1-①(u0)+(-l0.04) 1-P(-0.04<U<L0) 长度为25.5 查表知on=23,u=1.75→325-252.33<<325+25175 16 4同一置信水平下的置信区间不唯一,其长度也不相等 当然区间长度越短的估计,精度就越高 谁是 由于标准正态分布密度函数的图形是单峰且对称的, 在保持面积不变的条件下,以对称区间的长度为最短!!
某乡农民在联产承包责任制前人均纯收入 X(单位:元), 求 的置信水 平为 0. 95 的置信区间. 推行联产承包责任制后, 在该乡抽得 n=16 的样本, 且 X ~ N (300, 25 2). 解 由于 =0.05 , 查正态分布表得 例1 得 ─x =325元, 假设 2 = 25 2没有变化, /2 | / | u n X | 1.96 25/ 16 325 | 1.96 16 25 1.96 325 16 25 325 即得置信区间 ( 312. 75 , 337. 25 ). 同一置信水平下的置信区间不唯一, 如在上例中取 =0. 01+ 0. 04 , 0.01 0.04 1 (u0.01) 1(u0.04 ) u0.01 2.33 , u0.04 1.75 由正态分布上侧分位数定义知 1 P( u0.04 U u0.01 ) 1 (u0.01) (u0.04 ) 查表知 1.75 16 25 2.33 325 16 25 325 u0. 025 =1.96 , 当然区间长度越短的估计, 精度就越高. 其长度也不相等. 区间长度为 24. 25 长度为 25. 5 谁是精度最高的? 由于标准正态分布密度函数的图形是单峰且对称的, x x 在保持面积不变的条件下, 以对称区间的长度为最短 ! !
同一置信水平下的置信区间不唯一.其长度也不相等.但 (X u c/2 X+ o ual 的长度是最短的,故我们总取它作为置信水平为1-a的置信区间 般地,在概率密度为单峰且对称的情形下,a=-b对应的 置信区间的长度为最短 l与n,a的关系:由置信区间公式(X-42,又+2)可知, 置信区间的长度为:1=2 ua/2, 10若给定n,I随着a的减小而增大; 则uan2越大,Φ(ua2)就越大,这时a就越小 0.5 20若给定a,l随着n的增大而减小; 且由于l与n成反比,减小的速度并不快, 0 例如,n由100增至400时,才能减小一半 (ua2)=1-
但 的长度是最短的, l 与 n , 的关系: ( / 2 , / 2 ) u n u X n X 可知, 置信区间的长度 l 为: , 2 / 2 u n l 由置信区间公式 l 随着 的减小而增大; 20 若给定 , l 随着 n 的增大而减小; 2 ( /2 ) 1 u ( x ) 同一置信水平下的置信区间不唯一. 其长度也不相等. ( / 2 , / 2 ) u n u X n X 故我们总取它作为置信水平为 1- 的置信区间. 若给定 n, 且由于 l 与 n 成反比, 减小的速度并不快, 例如, n 由 100 增至 400 时, l 才能减小一半. 则 u/2越大, l 就越大, 这时 就越小. 10 (u/2)就越大, 一般地, 在概率密度为单峰且对称的情形下, a =-b 对应的 置信区间的长度为最短