定义4设X,X,.,Xn是总体X的一个样本,0∈⊙为 未知参数(⊙为0的可能取值范围),对于给定值 a(0<a<1),如果存在两个统计量0,(X,X2,.,X,)和 O2(X1,X2,.,Xn)满足 P{0(X1,X2,.,Xm)<0<02(X,X2,.,Xn)}=1-u, 则称随机区间(0,0,)是0的置信度为1-ax的置信区间 (confidence interval),O,g,分别称为置信度为l-a 的双侧置信区间的置信下限(confidence lower limit) 和置信上限(confidence upper limit),l-a称为置信 度或置信水平(confidence level). 2024年8月27日星期二 3 目录 上页」 下页 返回
2024年8月27日星期二 3 目录 上页 下页 返回 定义 4 设 1 2 , , , X X Xn 是总体 X 的一个样本, 为 未知参数( 为 的可能取值范围),对于给定值 ( 0 1 ),如果存在两个统计量 1 1 2 ( , , , ) X X X n 和 2 1 2 ( , , , ) X X X n 满足 P X X X X X X 1 1 2 2 1 2 ( , , , ) ( , , , ) 1 n n = − , 则称随机区间 1 2 ( , ) 是 的置信度为1− 的置信区间 (confidence interval),1 ,2 分别称为置信度为1− 的双侧置信区间的置信下限(confidence lower limit) 和置信上限(confidence upper limit),1− 称为置信 度或置信水平(confidence level).
关于定义的说明 被估计的参数虽然未知但它是一个常数 没有随机性而区间(8,O,)是随机的 因此定义中下表达式 P{0(X1,X2,L,Xm) 下页 返回
2024年8月27日星期二 4 目录 上页 下页 返回 关于定义的说明 , ( , ) . , , 没有随机性 而区间 1 2 是随机的 被估计的参数 虽然未知 但它是一个常数 : { ( , , , ) ( , , , )} 1 1 1 2 2 1 2 的本质是 因此定义中下表达式 P X X L Xn X X L Xn = − 1 ( , ). ( , ) 1 , 1 2 1 2 而不能说参数 以 的概率落入随机区间 随机区间 以 的概率包含着参数 的真值 − −
另外定义中的表达式 P{0(X1,X2,L,Xn)<0<02(X1,X2,L,Xn)}=1-a 还可以描述为: 若反复抽样多次(各次得到的样本容量相等,都是) 每个样本值确定一个间(0,0), 每个这样的区间或包含0的真值或不包含O的真值, 在这样多的区间中, 包含真值的约占100(1-ax)%,不包含的约占100a%. 2024年8月27日星期二 5 目录 上页 下页 返回
2024年8月27日星期二 5 目录 上页 下页 返回 : { ( , , , ) ( , , , )} 1 1 1 2 2 1 2 还可以描述为 另外定义中的表达式 P X X L Xn X X L Xn = − 若反复抽样多次(各次得到的样本容量相等,都是n) ( , ), 每个样本值确定一个区间1 2 在这样多的区间中, 包含真值的约占100(1−)%,不包含的约占100%. 每个这样的区间或包含 的真值或不包含 的真值
【例14】 设X1,X2,.,Xn为来自正态总体 X~N(4,o2)的样本,其中o2已知,4未知,求μ的 置信度为1-α的置信区间. 解因为总体均值山可用样本均值来估计,且 ~N(u,a),从而有统计量 U= -'-N0,) o//n 由标准正态分布的对称性以及α分位数的定义可知 P{U<u2}=P{-42<U<4a2}=1-a 2024年8月27日星期二 6 目录○ 上页○ 下页 返回
2024年8月27日星期二 6 目录 上页 下页 返回 【 例 14 】 设 1 2 , , , X X Xn 为 来 自 正 态 总 体 2 X N~ ( , ) 的样本,其中 2 已知, 未知,求 的 置信度为1− 的置信区间. 解 因为总体均值 可用样本均值 X 来估计,且 2 X N ~ ( , ) n ,从而有统计量 ~ (0,1). / X U N n − = 由标准正态分布的对称性以及 分位数的定义可知 P U u P u U u / 2 / 2 / 2 1 . = − = −
即 由置信区间的定义知μ的置信度为1-α的置信区间为 例如,取1-=0.95,即a=0.05,若o=1,n=25, 查表得u2=4s=1.96.于是得到一个置信度为0.95的 置信区间 √25 由x=3.6,得到估计区间为(3.208,3.992). 2024年8月27日星期二 7 目录 上页 下页 返回
2024年8月27日星期二 7 目录 上页 下页 返回 即 / 2 / 2 / 2 / 2 1 / X P u u P X u X u n n n − − = − + = − 由置信区间的定义知 的置信度为1− 的置信区间为 / 2 / 2 X u X u , . n n − + 例如,取 1 0.95 − = ,即 = 0.05,若 =1,n = 25, 查表得 / 2 0.025 u u 1.96 = = .于是得到一个置信度为 0.95 的 置信区间 1 1 ( 1.96, 1.96) 25 25 X X − + . 由 x = 3.6,得到估计区间为(3.208,3.992).
置信度为1-的置信区间可能有无穷多个,只要随 机区间包含参数的概率等于1-α,则该区间就可以作为 该参数的置信区间.例如例14中4的1-α的置信区间 也可由 给出,此时对应的置信区间为 宝-云 2024年8月27日星期二 8 目录 上页> 下页 返回
2024年8月27日星期二 8 目录 上页 下页 返回 置信度为 1− 的置信区间可能有无穷多个,只要随 机区间包含参数的概率等于 1− ,则该区间就可以作为 该参数的置信区间.例如例 14 中 的1− 的置信区间 也可由 / 4 3 / 4 1 / X P u u n − − = − , 给出,此时对应的置信区间为 3 / 4 / 4 X u X u , n n − + .
一般而言,这些区间的长度是不一样的,也就是说 精度各不相同.显然,区间长度越短越好.为此,我们 约定:当置信度1-固定时,参数0的置信区间可能有 无穷多个,我们取最优的那个作为它的置信区间.所谓 最优,就是区间长度最短的那个置信区间.对于像标准 正态分布,由于其概率密度关于y轴对称,因此,其最 优的置信区间即为关于y轴对称的区间.如果统计量的 分布不是对称分布,则一般取两端的尾概率都为。的临 界值来确定置信区间,即取对称的分位点(如分布中 取分位点2.12(n-1)与x22(n-1)来确定置信区间. 2024年8月27日星期二 目录 上页 下页 返回
2024年8月27日星期二 9 目录 上页 下页 返回 一般而言,这些区间的长度是不一样的,也就是说 精度各不相同.显然,区间长度越短越好.为此,我们 约定:当置信度1− 固定时,参数 的置信区间可能有 无穷多个,我们取最优的那个作为它的置信区间.所谓 最优,就是区间长度最短的那个置信区间.对于像标准 正态分布,由于其概率密度关于 y 轴对称,因此,其最 优的置信区间即为关于 y 轴对称的区间.如果统计量的 分布不是对称分布,则一般取两端的尾概率都为 2 的临 界值来确定置信区间,即取对称的分位点(如 2 分布中 取分位点 2 1 / 2 − ( 1) n − 与 2 / 2 ( 1) n − )来确定置信区间.
求未知参数置信区间的具体步骤如下: (1)寻求样本X1,X2,.,Xn的一个函数 W=W(X1,X2,.,XnO) 它包含待估参数0,但不包含其它未知参数,并且要求W 的分布已知. (2)对于给定的置信度1-a,定出两个常数a<b,使得 P{a<W(X1,X2,.,Xm0)<b}≥1-, 通常取b为严的号分位点,a为刚的1-号分位点, 2024年8月27日星期二 10 、目录 上页 下页 返回
2024年8月27日星期二 10 目录 上页 下页 返回 求未知参数置信区间的具体步骤如下: (1)寻求样本 1 2 , , , X X Xn 的一个函数 1 2 ( , , , ; ) W W X X X = n 它包含待估参数 ,但不包含其它未知参数,并且要求W 的分布已知. (2)对于给定的置信度 1− ,定出两个常数a b ,使得 P a W X X X b − ( , , , ; ) 1 1 2 n , 通常取b 为W 的 2 分位点,a为W 的 1 2 − 分位点.
求未知参数置信区间的具体步骤如下: (3)将a<W(X,X2,.,Xn;0)<b变形得到等价不等式 0(X1,X2,.,Xn)<0<02(X1,X2,.,Xn) 其中日=9(X,X2,.,Xn)和02=日,(X1,X2,.,Xn)都是 统计量,则(0,0,)就是0的一个置信度为1-a的置信区 间. 函数W(X1,X2,.,Xm;0)通常可由未知参数O的点 估计量变化得到. 2024年8月27日星期二 11 目录 上页 下页 返回
2024年8月27日星期二 11 目录 上页 下页 返回 求未知参数置信区间的具体步骤如下: (3)将 1 2 ( , , , ; ) a W X X X b n 变形得到等价不等式 1 1 2 2 1 2 ( , , , ) ( , , , ) X X X X X X n n 其 中 1 1 1 2 ( , , , ) = X X X n 和 2 2 1 2 ( , , , ) = X X X n 都 是 统计量,则 1 2 ( , ) 就是 的一个置信度为1− 的置信区 间. 函 数 1 2 ( , , , ; ) W X X Xn 通 常可由未知参数 的 点 估计量变化得到.