§25单方程线性模型的区间估计 Interval Estimation of Multiple linear Regression model 、参数估计量的区间估计一不做介绍 二、预测值的区间估计
§2.5单方程线性模型的区间估计 Interval Estimation of Multiple Linear Regression Model 一、参数估计量的区间估计—不做介绍 二、预测值的区间估计
、预测的念 预测通常指利用现有信息对不知道的或 尚未发生的数据和事件所作的估计。 由于在经济活动中,谁能对未知事件或 尚未发生的事件作出准确的估计,谁就 能够掌握主动权,并在经济活动中受益 所以预测在经济活动中具有重要作用。 它是计量经济学的核心任务之
一、预测的概念 • 预测通常指利用现有信息对不知道的或 尚未发生的数据和事件所作的估计。 • 由于在经济活动中,谁能对未知事件或 尚未发生的事件作出准确的估计,谁就 能够掌握主动权,并在经济活动中受益, 所以预测在经济活动中具有重要作用。 • 它是计量经济学的核心任务之一
·例如:我们可能希望利用现有汽油消费量和价格数据 预测汽油价提高后相应的消费量。或者利用现有数据 预测明年我国的GDP的增长幅度。 通常情况下,要预测的是与样本观测值之外的x值对应 的y值。 如:样本观测值范围为1985-2003年,预测2004年的 居民消费。 用于预测的变量通常用x0和v表示,指利用x的值来预 测与相对应的被解释变量v的值。 对于多元而言,用于预测的变量可用(x10,x20…x0)和 y表示(书中P53页为矩阵表示,含虚变量) 注意:下标为0,表示该值为预测期产生的值。 当然用于预测的x也可以在样本观测值的范围内
• 例如:我们可能希望利用现有汽油消费量和价格数据 预测汽油价提高后相应的消费量。或者利用现有数据 预测明年我国的GDP的增长幅度。 • 通常情况下,要预测的是与样本观测值之外的x值对应 的y值。 • 如:样本观测值范围为1985-2003年,预测2004年的 居民消费。 • 用于预测的变量通常用x0和y0表示,指利用x0的值来预 测与相对应的被解释变量y0的值。 • 对于多元而言,用于预测的变量可用(x10 , x20 ,… xk0 )和 y0 表示(书中P53页为矩阵表示,含虚变量) • 注意:下标为0,表示该值为预测期产生的值。 • 当然用于预测的x0也可以在样本观测值的范围内
、区间估计 估计:人人都做过。如: 上课时,你会估计一下老师提问你的可 能性有多大? 过马路闯红灯时,你会估计一下被罚款 的可能性有多大? 推销员年初时要估让今年超额完成任务 的可能性有多大?
二、区间估计 • 估计:人人都做过。如: • 上课时,你会估计一下老师提问你的可 能性有多大? • 过马路闯红灯时,你会估计一下被罚款 的可能性有多大? • 推销员年初时要估计今年超额完成任务 的可能性有多大?
区间估计定义 估计的类型包括: 、点估计:只有一个取值。 2、区间估计:以一定的可靠性给出被估计参数的一个 可能的取值范围 例如:销售经理想估计一下明年的出口总值,甲估计 是53万美元,乙估计是5056万美元之间,并可以确 切地说“有95%的把握”。 ▲两种估计类型哪一种更科学? 显然后者的可信程度大于前者。 它在给出估计区间时,还可以给予一个“可信程度” 这就是区间估计的优点所在:在给出估计区间(而非 个具体的取值)时,还可以给予一个“可信程度
• 估计的类型包括: • 1、点估计:只有一个取值。 • 2、区间估计:以一定的可靠性给出被估计参数的一个 可能的取值范围。 • 例如:销售经理想估计一下明年的出口总值,甲估计 是53万美元,乙估计是50—56万美元之间,并可以确 切地说“有95%的把握”。 • ▲两种估计类型哪一种更科学? • 显然后者的可信程度大于前者。 • 它在给出估计区间时,还可以给予一个“可信程度”。 这就是 区间估计的优点所在:在给出估计区间(而非 一个具体的取值)时,还可以给予一个“可信程度” 区间估计定义
对区间估计的形象比喻 我们经常说甲的成绩“大概80分左右”,可以看成 个区间估计问题。(某甲的真实成绩0为被估计的参数) 大概80分左右” 下限 上限 如 P(75<0<852=095=1-0.05 (75,85) 置信区间 置信水平
对区间估计的形象比喻 • 我们经常说甲的成绩“大概80分左右”,可以看成一 个区间估计问题。(某甲的真实成绩为被估计的参数) • 如: P(75 < <85 )=0.95=1-0.05 • (75,85) • “大概80分左右” 置信水平 下限 上限 置信区间
区间估计中几个常用概念 置信水平(置信度):它是指与一个估计区间相联 系的概率,它表示该区间将包括总体参数的可能程度。 用1-表示。置信水平越大,估计区间内所包含总体参 数的可信度越高。(68.3%、95.5%、997%都是置信 度) (本题中的置信度:95%) 2、置信区间:与一个“置信水平”相联系的估计值的 取值范围。 (本题中的置信区间:(75,85) 3、置信限:与置信区间相联系的界限,包括上限和下 限。如上题中下限:75,上限:85
• 1、置信水平(置信度):它是指与一个估计区间相联 系的概率,它表示该区间将包括总体参数的可能程度。 用1-α表示。置信水平越大,估计区间内所包含总体参 数的可信度越高。(68.3%、95.5%、99.7%都是置信 度) • (本题中的置信度:95% ) • 2、置信区间:与一个“置信水平”相联系的估计值的 取值范围。 • (本题中的置信区间:(75,85) • 3、置信限:与置信区间相联系的界限,包括上限和下 限。如上题中下限:75,上限:85 区间估计中几个常用概念
区间估计就是要构造总体参数的一个置信区间 置信水平, fidence coefficient)包含该参 数。根据 P(1<6<62)=1-a 得,在置信水平1-a下,硝的置信区间为(O1,O2) 要找到置信区间,就必须找到一个服从确定分布 形式的统计量,然后依据该统计量的概率分布求 得一定概率(置信水平)下的置信区间
• 区间估计就是要构造总体参数的一个置信区间 (confidence interval) ,该区间以一定的概率 (置信水平,confidence coefficient )包含该参 数。根据 得,在置信水平1- α下, θ的置信区间为(θ1 ,θ2) • 要找到置信区间,就必须找到一个服从确定分布 形式的统计量,然后依据该统计量的概率分布求 得一定概率(置信水平)下的置信区间。 P(1 2 ) =1−
例新生儿体重的置信区间 假设新生儿(男)的体重服从正态分布。随机抽取12 名新生儿,测得体重如下表,试以95%的置信度估计 新生儿(男)的平均体重 序号123456789101112 新生儿体重310025203000300036003160356033202880260034002540 ∵C=0.05 12 a(12-1) 2201(表的图有错) 再计第x=3037511(-3)=3753 u置信度为95%的置信区间是 30573753 375.3 ×2.201<<3057+ √12 ×2.201 即2820<4<3300
例 新生儿体重的置信区间 • 假设新生儿(男)的体重服从正态分布。随机抽取12 名新生儿,测得体重如下表,试以95%的置信度估计 新生儿(男)的平均体重。 序 号 1 2 3 4 5 6 7 8 9 10 11 12 新生儿体重 3100 2520 3000 3000 3600 3160 3560 3320 2880 2600 3400 2540 ( ) 2820 3300 2.201 12 375.3 2.201 3057 12 375.3 3057 μ 95% 3057 375.3 11 1 3057 0.05 12 2.201 ( 1 2 1 2 (1 2 1) − + = = = = = = − = − 即 置信度为 的置信区间是 再计算 表的图有错) i x t i x s n