正在加载图片...
Lec7:区间估计(一):置信区间 张伟平 2011年3月28日 区间估计的基本概念 一、参数的区间估计问题 使用点估计(X)估计9()的缺点是:单从所给出的估计值上,无法看出它的精度有多大.当 然你可以定义某种指标,如估计的均方误差之类去刻画它的精度,但也还是间接的.更直接的方 法是指出了一个误差限d(X),而把估计写成(X)士d(X)的形式.这实际上就是一种区间估计, 即估计g()的取值在(X)-d(X),(X)+d(X)】之内.将其一般化,给出区间估计的下列定义 定义1设有一个参数分布族多={f(x,),0∈日},g()是定义在参数空间日的一个已 知函数,X=(X1,·,Xn)是从分布族中某总体f(x,)中抽取的样本,令g1(X)和2(X)为定 义在样本空间2上,取值在日上的两个统计量,且g1(X)≤2(X),则称随机区间[1(X),2(X)】 为g(g)的一个区间估计(nterval estimation). 根据这个定义,从形式上看,任何一个满足条件1≤2的统计量1,2都可构成g()的一 个区间估计[©1,2].既然一个未知参数的区间估计有很多种,如何从中挑选一个好的区间估计 呢?这就涉及到评价一个区间估计优劣的标准问题.评价一个区间估计优劣的标准有两个要素: 可靠性与精确度(也称精度).可靠性是指待估参数g()被包含在[©1,2]内的可能性有多大.可能 性越大,可靠性越高.精确度可由随机区间的平均长度来度量.长度越短,精确度越高 不言而喻,我们希望所作的区间估计既有高的可靠性,又有高的精确度.但这二者往往是彼 此矛盾的,不可能同时都很高.当样本大小固定时,若精确度提高了,可靠性就降低了:反之,若 可靠度提高了,则精确度就降低了. 如何构造尽可能高的可靠性和高精确度的区间估计呢?通常采用的方法是在保证一定可靠 度的前提下选择精确度尽可能高的区间估计.这就是著名统计学家Neyman提出的一种妥协方 案 当然,如果在应用中人们要求可靠性和精度都很高,则必须加大样本容量,也就是说要多做 一些试验,才可能实现 二、置信区间 为书写简单计,本节以下假定被估计的g()就是9自身,这与一般情况没有原则区别.Lec7: ´mO(ò): ò&´m ‹ï² 2011 c 3  28 F 1 ´mOƒVg ò!ÎÍ´mOØK ¶^:Ogˆ(X)Og(θ)":¥: ¸l§â—Oä˛, Ã{w—ß°›kıå.  ,\å±½¬,´çI, XO˛êÿ Éaèxß°›, èÑ¥m. çÜê {¥ç— òáÿ Åd(X), rO§gˆ(X) ± d(X)/™. ˘¢S˛“¥ò´´mO, =Og(θ) ä3[ˆg(X) − d(X), gˆ(X) + d(X)] ÉS. ÚŸòÑz, â—´mOe½¬. ½¬1 kòáÎÍ©ŸxF = {f(x, θ), θ ∈ Θ}, g(θ) ¥½¬3ÎÍòmΘ òáÆ ºÍ, X = (X1, · · · , Xn) ¥l©Ÿx•,oNf(x, θ) •ƒ, -gˆ1(X) ⁄gˆ2(X) è½ ¬3òmX ˛, ä3Θ ˛¸á⁄O˛, Ögˆ1(X) ≤ gˆ2(X), K°ëÅ´m[ˆg1(X), gˆ2(X)] èg(θ) òá´mO(Interval estimation). ä‚˘á½¬, l/™˛w, ?¤òá˜v^ágˆ1 ≤ gˆ2 ⁄O˛gˆ1, gˆ2 —å§g(θ) ò á´mO[ˆg1, gˆ2]. Q,òáôÎÍ´mOkÈı´, X¤l•]¿òá–´mO Q? ˘“9µdòá´mO`IOØK. µdòá´mO`IOk¸ááÉ: åÇ5Ü°(›(è°°›). åÇ5¥çñÎÍg(θ) ù¹3[ˆg1, gˆ2] SåU5kıå. åU 5å, åÇ5p. °(›ådëÅ´m²˛›5›˛. ›·, °(›p. ÿÛ í, ·ÇF"§ä´mOQkpåÇ5, qkp°(›. ˘ˆ ¥* dgÒ, ÿåU”û—Èp. å½û, e°(›Jp , åÇ5“¸$ ; áÉ, e åÇ›Jp , K°(›“¸$ . X¤E¶åUpåÇ5⁄p°(›´mOQ? œ~Ê^ê{¥3yò½åÇ ›cJe¿J°(›¶åUp´mO. ˘“¥Õ¶⁄OÆ[Neyman J—ò´˛ê Y. ,, XJ3A^•<Çá¶åÇ5⁄°›—Èp, K7L\åN˛, è“¥`áıâ ò £, ‚åU¢y. !ò&´m è÷{¸O, !±eb½Og(θ) “¥θ g, ˘ÜòÑú¹vkK´O.
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有