§25单方程线性模型的区间估计 Interval Estimation of Multiple linear Regression model 、参数估计量的区间估计一不做介绍 二、预测值的区间估计
§2.5单方程线性模型的区间估计 Interval Estimation of Multiple Linear Regression Model 一、参数估计量的区间估计—不做介绍 二、预测值的区间估计
预测值的区间估计
预测值的区间估计
、预测的念 预测通常指利用现有信息对不知道的或 尚未发生的数据和事件所作的估计。 由于在经济活动中,谁能对未知事件或 尚未发生的事件作出准确的估计,谁就 能够掌握主动权,并在经济活动中受益 所以预测在经济活动中具有重要作用。 它是计量经济学的核心任务之
一、预测的概念 • 预测通常指利用现有信息对不知道的或 尚未发生的数据和事件所作的估计。 • 由于在经济活动中,谁能对未知事件或 尚未发生的事件作出准确的估计,谁就 能够掌握主动权,并在经济活动中受益, 所以预测在经济活动中具有重要作用。 • 它是计量经济学的核心任务之一
·例如:我们可能希望利用现有汽油消费量和价格数据 预测汽油价提高后相应的消费量。或者利用现有数据 预测明年我国的GDP的增长幅度。 通常情况下,要预测的是与样本观测值之外的x值对应 的y值。 如:样本观测值范围为1985-2003年,预测2004年的 居民消费。 用于预测的变量通常用x0和v表示,指利用x的值来预 测与相对应的被解释变量v的值。 对于多元而言,用于预测的变量可用(x10,x20…x0)和 y表示(书中P53页为矩阵表示,含虚变量) 注意:下标为0,表示该值为预测期产生的值。 当然用于预测的x也可以在样本观测值的范围内
• 例如:我们可能希望利用现有汽油消费量和价格数据 预测汽油价提高后相应的消费量。或者利用现有数据 预测明年我国的GDP的增长幅度。 • 通常情况下,要预测的是与样本观测值之外的x值对应 的y值。 • 如:样本观测值范围为1985-2003年,预测2004年的 居民消费。 • 用于预测的变量通常用x0和y0表示,指利用x0的值来预 测与相对应的被解释变量y0的值。 • 对于多元而言,用于预测的变量可用(x10 , x20 ,… xk0 )和 y0 表示(书中P53页为矩阵表示,含虚变量) • 注意:下标为0,表示该值为预测期产生的值。 • 当然用于预测的x0也可以在样本观测值的范围内
、区间估计 估计:人人都做过。如: 上课时,你会估计一下老师提问你的可 能性有多大? 过马路闯红灯时,你会估计一下被罚款 的可能性有多大? 推销员年初时要估让今年超额完成任务 的可能性有多大?
二、区间估计 • 估计:人人都做过。如: • 上课时,你会估计一下老师提问你的可 能性有多大? • 过马路闯红灯时,你会估计一下被罚款 的可能性有多大? • 推销员年初时要估计今年超额完成任务 的可能性有多大?
区间估计定义 估计的类型包括: 、点估计:只有一个取值。 2、区间估计:以一定的可靠性给出被估计参数的一个 可能的取值范围 例如:销售经理想估计一下明年的出口总值,甲估计 是53万美元,乙估计是5056万美元之间,并可以确 切地说“有95%的把握”。 ▲两种估计类型哪一种更科学? 显然后者的可信程度大于前者。 它在给出估计区间时,还可以给予一个“可信程度” 这就是区间估计的优点所在:在给出估计区间(而非 个具体的取值)时,还可以给予一个“可信程度
• 估计的类型包括: • 1、点估计:只有一个取值。 • 2、区间估计:以一定的可靠性给出被估计参数的一个 可能的取值范围。 • 例如:销售经理想估计一下明年的出口总值,甲估计 是53万美元,乙估计是50—56万美元之间,并可以确 切地说“有95%的把握”。 • ▲两种估计类型哪一种更科学? • 显然后者的可信程度大于前者。 • 它在给出估计区间时,还可以给予一个“可信程度”。 这就是 区间估计的优点所在:在给出估计区间(而非 一个具体的取值)时,还可以给予一个“可信程度” 区间估计定义
对区间估计的形象比喻 我们经常说甲的成绩“大概80分左右”,可以看成 个区间估计问题。(某甲的真实成绩0为被估计的参数) 大概80分左右” 下限 上限 如 P(75<0<852=095=1-0.05 (75,85) 置信区间 置信水平
对区间估计的形象比喻 • 我们经常说甲的成绩“大概80分左右”,可以看成一 个区间估计问题。(某甲的真实成绩为被估计的参数) • 如: P(75 < <85 )=0.95=1-0.05 • (75,85) • “大概80分左右” 置信水平 下限 上限 置信区间
区间估计中几个常用概念 置信水平(置信度):它是指与一个估计区间相联 系的概率,它表示该区间将包括总体参数的可能程度。 用1-表示。置信水平越大,估计区间内所包含总体参 数的可信度越高。(68.3%、95.5%、997%都是置信 度) (本题中的置信度:95%) 2、置信区间:与一个“置信水平”相联系的估计值的 取值范围。 (本题中的置信区间:(75,85) 3、置信限:与置信区间相联系的界限,包括上限和下 限。如上题中下限:75,上限:85
• 1、置信水平(置信度):它是指与一个估计区间相联 系的概率,它表示该区间将包括总体参数的可能程度。 用1-α表示。置信水平越大,估计区间内所包含总体参 数的可信度越高。(68.3%、95.5%、99.7%都是置信 度) • (本题中的置信度:95% ) • 2、置信区间:与一个“置信水平”相联系的估计值的 取值范围。 • (本题中的置信区间:(75,85) • 3、置信限:与置信区间相联系的界限,包括上限和下 限。如上题中下限:75,上限:85 区间估计中几个常用概念
区间估计就是要构造总体参数的一个置信区间 置信水平, fidence coefficient)包含该参 数。根据 P(1<6<62)=1-a 得,在置信水平1-a下,硝的置信区间为(O1,O2) 要找到置信区间,就必须找到一个服从确定分布 形式的统计量,然后依据该统计量的概率分布求 得一定概率(置信水平)下的置信区间
• 区间估计就是要构造总体参数的一个置信区间 (confidence interval) ,该区间以一定的概率 (置信水平,confidence coefficient )包含该参 数。根据 得,在置信水平1- α下, θ的置信区间为(θ1 ,θ2) • 要找到置信区间,就必须找到一个服从确定分布 形式的统计量,然后依据该统计量的概率分布求 得一定概率(置信水平)下的置信区间。 P(1 2 ) =1−
例新生儿体重的置信区间 假设新生儿(男)的体重服从正态分布。随机抽取12 名新生儿,测得体重如下表,试以95%的置信度估计 新生儿(男)的平均体重 序号123456789101112 新生儿体重310025203000300036003160356033202880260034002540 ∵C=0.05 12 a(12-1) 2201(表的图有错) 再计第x=3037511(-3)=3753 u置信度为95%的置信区间是 30573753 375.3 ×2.201<<3057+ √12 ×2.201 即2820<4<3300
例 新生儿体重的置信区间 • 假设新生儿(男)的体重服从正态分布。随机抽取12 名新生儿,测得体重如下表,试以95%的置信度估计 新生儿(男)的平均体重。 序 号 1 2 3 4 5 6 7 8 9 10 11 12 新生儿体重 3100 2520 3000 3000 3600 3160 3560 3320 2880 2600 3400 2540 ( ) 2820 3300 2.201 12 375.3 2.201 3057 12 375.3 3057 μ 95% 3057 375.3 11 1 3057 0.05 12 2.201 ( 1 2 1 2 (1 2 1) − + = = = = = = − = − 即 置信度为 的置信区间是 再计算 表的图有错) i x t i x s n