第七章参数估计 §7.1点估计 9§7.2基于截尾样本的最大似然估计 9§7.3估计量的评选标准 9§7.4区间估计 。§7.5正态总体均值和方差的区间估计 9§7.6(0一1)分布参数的区间估计 9§7.7单侧置信区间 1/48
第七章 参数估计 §7.1 点估计 §7.2 基于截尾样本的最大似然估计 §7.3 估计量的评选标准 §7.4 区间估计 §7.5 正态总体均值和方差的区间估计 §7.6 (0-1)分布参数的区间估计 §7.7 单侧置信区间 1/48
第七章参数估计 9§7.1点估计 。§7.2基于截尾样本的最大似然估计 9§7.3估计量的评选标准 9§7.4区间估计 。§7.5正态总体均值和方差的区间估计 §7.6(0一)分布参数的区间估计 9§7.7单侧置信区间 2/48
第七章 参数估计 §7.1 点估计 §7.2 基于截尾样本的最大似然估计 §7.3 估计量的评选标准 §7.4 区间估计 §7.5 正态总体均值和方差的区间估计 §7.6 (0-1)分布参数的区间估计 §7.7 单侧置信区间 2/48
§7.4区间估计 对于一个待估参数,在测量或计算时,常不以得到近似值 为满足,还需要估计误差,即要求知道近似值的精确程度, 亦即所求真值所在的范围 9设总体X,参数为待估参数 1)选一个符合评选标准的合适的估计量:无偏的,有 效的,相合的 2)点估计:得到参数0的一个近似值 3)区间估计:对于未知参数0,除了求出它的点估计 外,还希望估计出一个范围,并希望知道这个范围包含参 数真值的可信程度。 ·这个范围通常以区间形式给出,同时还给出该区间包含参 数真值的可信程度。这种形式的估计称为区间估计,这样 的区间称为置信区间 区间估计的两个要素:一个是区间,一个是置信水平 3/48
§7.4 区间估计 对于一个待估参数,在测量或计算时,常不以得到近似值 为满足,还需要估计误差,即要求知道近似值的精确程度, 亦即所求真值所在的范围 设总体X,参数θ为待估参数 1)选一个符合评选标准的合适的估计量:无偏的,有 效的,相合的 2)点估计:得到参数θ的一个近似值 3)区间估计:对于未知参数θ,除了求出它的点估计 外,还希望估计出一个范围,并希望知道这个范围包含参 数θ真值的可信程度。 这个范围通常以区间形式给出,同时还给出该区间包含参 数θ真值的可信程度。这种形式的估计称为区间估计,这样 的区间称为置信区间 区间估计的两个要素:一个是区间,一个是置信水平 3/48
§7.4区间估计 置信区间的定义 设总体X的分布函数F(x;)含有一个未知参 数0,0∈⊙,对于给定值(0<a<1)若由样本X1,X2,., Xn确定的两个统计量=(X1,X2,.,Xn) 和B=B(X1,X2,.,Xm),对于任意的0∈⊙,满足 P{0≤0≤0}≥1-a 则称随机区闻8,B]是0的置信度为-α的置信区 间,和B分别称为置信度为-α的双侧置信区间 的置信下限和置信上限一为置信度 4/48
置信区间的定义 { } 1 ( , , , ), ( , , , ) , , (0 1) , , , ( ; ) 1 2 1 2 1 2 P X X X X X X X X X X F x n n n 和 对于任意的 ,满足 确定的两个统计量 数 对于给定值 若由样本 设总体 的分布函数 含有一个未知参 , 1 . , 1 [ , ] 1 的置信下限和置信上限 为置信度 间 和 分别称为置信度为 的双侧置信区间 则称随机区间 是 的置信度为 的置信区 §7.4 区间估计 4/48
§7.4区间估计 关于定义的说明 被估计的参数虽然未知但它是一个常数 没有随机性而区间8,O)是随机的 因此定义中以下表达式 P{0<0<0}=1-a 的本质是: 随机区间0,0)以1-a的概率包含着参数的真值 而不能说参数9以1-a的概率落入随机区间8,B), 5/48
关于定义的说明 , ( , ) . , , 没有随机性 而区间 是随机的 被估计的参数 虽然未知 但它是一个常数 : { } 1 的本质是 因此定义中以下表达式 P 1 ( , ). ( , ) 1 , 而不能说参数 以 的概率落入随机区间 随机区间 以 的概率包含着参数的真值 §7.4 区间估计 5/48
§7.4区间估计 s当X是连续型随机变量时,对于给定的a, 总是按要求P(0<0<D)=1-a求出置信区 间。 9当X是离散型随机变量时,对于给定的α, 常常找不到区间(8,D)使得P(日<B<B)恰为 1一a,此时去找区间(0,0使得P(0<0<0) 至少为1一a,且尽可能的接近1一a。 6/48
§7.4 区间估计 当X是连续型随机变量时,对于给定的α, 总是按要求 求出置信区 间。 当X是离散型随机变量时,对于给定的α, 常常找不到区间 使得 恰为 1-α,此时去找区间 使得 至少为1-α,且尽可能的接近1-α。 P( ) 1 ( , ) P( ) ( , ) P( ) 6/48
§7.4区间估计 ·置信区间的计算方法 例:设总体X~N(山,G2),G2为已知,为未知,设X1,X2,.,X 是来自X的样本,求的置信水平为1一的置信区间 解:置信区间由样本来确定,X是的无偏估计,可由样本获 得观察值,且X~N(4,σ2n),所以 X-严~N0,1) oIn 它不依赖于任何未知参数,按标准正态分布的上分位点 的定义,有 om-1-a a/2 a12 /2 7/48
置信区间的计算方法 例:设总体X~N(μ,σ 2 ),σ 2为已知,μ为未知,设X1 ,X2 ,.,Xn 是来自X的样本,求μ的置信水平为1-α的置信区间 解:置信区间由样本来确定, 是μ的无偏估计,可由样本获 得观察值,且 ~N(μ,σ 2 /n),所以 ~N(0,1) 它不依赖于任何未知参数,按标准正态分布的上α分位点 的定义,有 §7.4 区间估计 / 2 x z / 2 z / 2 / 2 - X n X / 1 / / 2 z n X P X 7/48
§7.4区间估计 即PF-o an ion)=1-a 这样就得到了的一个置信水平为1一a的置信区间 (-2,X+ Nnah常写成(土。2) 如:取a=0.05,即1-a=0.95,又若o=1,n=16, 查表得z.025=1.96,可得置信水平为0.95的置信区间 (X±0.49) 若由一个样本值算得观察值=5.20,则得到一个 区间(5.20±0.49)即(4.71,5.69)该区间仍称为置信水 平为0.95的置信区间。其含义是该区间包含真值w 的可信程度为95% 8/48
§7.4 区间估计 即 这样就得到了μ的一个置信水平为1-α的置信区间 ,常写成 如:取α=0.05,即1-α=0.95,又若σ=1,n=16, 查表得z0.025=1.96,可得置信水平为0.95的置信区间 ( ±0.49) 若由一个样本值算得观察值 =5.20,则得到一个 区间(5.20±0.49)即(4.71,5.69)该区间仍称为置信水 平为0.95的置信区间。其含义是该区间包含真值μ 的可信程度为95% { / 2 z / 2 } 1 n z X n P X ( , ) / 2 / 2 z n z X n X ( ) / 2 z n X X x 8/48
§7.4区间估计 置信度与精度是一对矛盾, 置信区间长度与估计精度 一般是在保证置信度的条件 置信水平为1一α的置信区间不下,尽可能提高精度 给定a=0.05,则以下概率也成立 Pf-tnmsx-u oIn <z01}=0.95 即PX-O4<<+ z.01}=0.95 n n 0 故置信区间为(仅-乙,X+可 水平为0.95的置信☒简 o),也是置信 ·与区间的取法和样本容量有关 。在相同的置信水平下,置信区间越短,估计精度越高 /48
§7.4 区间估计 置信区间长度与估计精度 置信水平为1-α的置信区间不是唯一的,如在例1中若 给定α=0.05,则以下概率也成立 即 故置信区间为 ,也是置信 水平为0.95的置信区间 与区间的取法和样本容量有关 在相同的置信水平下,置信区间越短,估计精度越高 } 0.95 / { 0.0 4 0.0 1 z n X P z { 0.0 4 z0.0 1} 0.95 n z X n P X ( , ) 0.0 4 0.0 1 z n z X n X 置信度与精度是一对矛盾, 一般是在保证置信度的条件 下,尽可能提高精度 9/48
§7.4区间估计 9现在比较一下两个置信区间的长度,当a=0.05时 对于例1的置信区间长度为n2as×2=3,92 n 对于本例置信区间长度为,。亿4+co)=408g n 9一般的,对于像标准正态分布概率密度函数那样, 其图象单峰且对称的情况,当固定时,取形如例 1那样的按图象对称规律所取的置信区间其长度为 最短,估计精度最高。 另外,在多数情况下,当样本容量增大时,区间 长度减小,精度增高。但往往在实际应用中得到 足够多的大量的样本是不实际的。 10/48
§7.4 区间估计 现在比较一下两个置信区间的长度,当α=0.05时 对于例1的置信区间长度为 对于本例置信区间长度为 一般的,对于像标准正态分布概率密度函数那样, 其图象单峰且对称的情况,当n固定时,取形如例 1那样的按图象对称规律所取的置信区间其长度为 最短,估计精度最高。 另外,在多数情况下,当样本容量增大时,区间 长度减小,精度增高。但往往在实际应用中得到 足够多的大量的样本是不实际的。 n z n 0.025 2 3.922 n z z n ( 0.0 4 0.0 1 ) 4.08 10/48