7.3 区间估计 引例己知X~N(4,1),x,x2…,xn是一组样本值 4的无偏、有效点估计为X 1 ↓ 常数 随机变量 不同的样本值算得的山的估计值不同, 因此除了给出未知参数的点估计外,还希望 根据所给的样本确定一个随机区间,使其包 含参数真值的概率达到指定的要求
7.3 区间估计 引例 已知 X ~ N ( µ ,1), x1,x2,…,xn 是一组样本值 不同的样本值算得的 µ 的估计值不同, 因此除了给出未知参数的点估计外, 还希望 根据所给的样本确定一个随机区间,使其包 含参数真值的概率达到指定的要求. µ 的无偏、有效点估计为 X 常数 随机变量
如引例中,若要找一个区间,使其包含山的真 值的概率为0.95.(设n=5) v. 之 <z)=1- 取 a=0.05 查表得 =1.96
如引例中,若要找一个区间,使其包含µ 的真 值的概率为0.95. ( 设 n = 5 ) 5 1 X ~ N µ , ~ (0, 1) 5 1 N X − µ ⇒ 取 α = 0.05 查表得 1.96 zα / 2 = 2 2 ( ) 1 1 5 X Pz z α α µ α − − < < =−
置信区间的意义 反复抽取容量为5的样本,都可得到一个 区间,这个区间可能包含未知参数山的真值, 也可能不包含未知参数的真值,包含真值的区 间占95%. (区-196%,+196,%)— 4的置信区间 X-16,乃 4的置信下限 +196乃- 的置信上限 1- 置信度
反复抽取容量为5 的样本, 都可得到一个 区间,这个区间可能包含未知参数 µ 的真值, 也可能不包含未知参数的真值, 包含真值的区 间占95%. ) 5 1 , 1.96 5 1 ( X −1.96 X + 5 1 X −1.96 5 1 X +1.96 1−α 置信区间的意义 µ 的置信区间 µ 的置信上限 置信度 µ 的置信下限
若测得一组样本值,算得x=1.86 则得一区间(1.86-0.877,1.86+0.877) 它可能包含μ的真值,也可能不包含u的真值 反复抽样得到的区间中有95%包含4的真值. 为什么要取za2? 当置信区间为(不-V乃,+:)时 风间的长度为22√%— 达到最短
若测得 一组样本值, 它可能包含 µ 的真值,也可能不包含µ 的真值 2 2 1 1 (, ) 5 5 当置信区间为 Xz Xz − + α α 时 则得一区间 (1.86 – 0.877, 1.86 + 0.877) 反复抽样得到的区间中有95%包含 µ 的真值. / 2 z ? 为什么要取 α 算得 x = 1.86 区间的长度为 5 2 1 2 zα ——— 达到最短
0 0.3 取a=0.05 0.2 0.1 -2号=1.96-(-1.96) =3.92 0.3 0.2 0.1 2-号=1.84-(-2.13) 2号 =3.97
3.97 1.84 ( 2.13) 3 3 2 1 = − = − − − z α z α 3.92 1.96 ( 1.96) 2 2 1 = − = − − − zα z α -2 -1 1 2 0.1 0.2 0.3 0.4 3 z 2α 3 1 α− z -2 -1 1 2 0.1 0.2 0.3 0.4 2 zα 2 1 α− z 取 α = 0.05
置信区间的定义 设0是一个待估计的参数,α是一给定的数. (0<a<1).若能找到两个统计量 0(X1,X2,…,Xn)202(X1,X2,…,Xn) 使得P(0,<0<02)=1- 0∈⊙ 则称随机区间(0,0)为参数0的置信度为1-o 的置信区间,分别称0,02为置信下限与置信上限, 1-α称为置信水平或置信度
设 θ 是一个待估计的参数, α 是一给定的数, ( 0 < α < 1). 若能找到两个统计量 ( , , , ) ˆ ), θ 2 X1 X2 Xn ( , , , ˆ θ1 X1 X2 X n 使得 P(θ ˆ 1 < θ < θ ˆ 2 ) = 1−α θ ∈Θ 则称随机区间 ) ˆ , ˆ (θ1 θ 2 为参数 θ 的置信度为1 - α 的置信区间, 1 2 ˆ , ˆ 分别称θ θ 为置信下限与置信上限, 1 - α 称为置信水平或置信度. 置信区间的定义
几点说明 ▣置信区间的长度0,-0,反映了估计的精度 ,-0,越小,估计的精度越高 口反映了估计的可靠程度,越小,越可靠 越小,1-α越大,估计的可靠程度越高,但 这时,0,-,往往增大,因而估计的精度降低。 口α确定后,置信区间的选取方法不唯一,常 选最小的一个
α 反映了估计的可靠程度, α 越小, 越可靠. 置信区间的长度 θ ˆ 2 −θ ˆ 1 反映了估计的精度 α 越小, 1- α 越大, 估计的可靠程度越高,但 这时, 往往增大, 因而估计的精度降低. 2 1 ˆ ˆ θ −θ 2 1 ˆ ˆ θ −θ 越小, 估计的精度越高. α 确定后, 置信区间 的选取方法不唯一 , 常 选最小的一个. 几点说明
口在求参数的置信区间时,一般先保证可靠性. 在保证可靠性的基础上,再提高精度. 通常,增大样本容量可以提高精度
通常, 增大样本容量可以提高精度. 在求参数的置信区间时, 一般先保证可靠性. 在保证可靠性的基础上, 再提高精度
求置信区间的步骤 口寻找一个样本的函数 g(Xx,X2,…,Xn,9)一称为枢轴量 它含有待估参数,不含其它未知参数,它的 分布已知,且分布不依赖于待估参数(常由0 的点估计出发考虑) 例如州么写) ='=g(X,X2,…,X)-N0,10
寻找一个样本的函数 ( , , , , ) g X x X2 Xn θ 它含有待估参数, 不含其它未知参数, 它的 分布已知, 且分布不依赖于待估参数 (常由θ 的点估计出发考虑 ). 5 1 X~N µ, ( , , , , ) ~ (0,1) 5 1 g X1 X2 X N X n µ µ = − ⇒ 例如 求置信区间的步骤 — 称为枢轴量
口给定置信度1-a,定出两个常数α,b,使得 P(a<g(X1,X2,Xn,0)<b)=1- (引例中a=-1.96,b=1.96) 0 由a<g(X1,X2,Xn,0)<b解出 0(X1,X2,…,Xn) 0(X1,X2,…,Xm)) 得置信区间(0,0) 引例中, (@,0)=(-1.96,V5,+1.965)
给定置信度 1 − α , 定出两个常数 a , b ,使得 P(a < g(X1, X2 , Xn ,θ ) < b) = 1−α ( 引例中a = −1.96,b =1.96) 由a g X X X b < ( 1, 2 , n ,θ ) < 解出 ( , , , ) θ X1 X2 Xn ( , , , ) θ X1 X2 Xn 得置信区间(θ , θ ) 引例中, ) 5 1 , 1.96 5 1 (θ , θ ) = ( X −1.96 X +