第7章回归分析 第7.1节 元回归分析模型 第7.2节回归系数的最小二乘估计 第7.3节回归估计的统计推断 第7.4节预测 第7.5节多元回归分析 返回(8
返回 •第7.1节 一元回归分析模型 •第7.2节 回归系数的最小二乘估计 •第7.3节 回归估计的统计推断 •第7.4节 预测 •第7.5节 多元回归分析 返回
第7.1节一元回归分析模型 变 定性关系或函数关系y=f(x 人的身高和体重 X+→实变量 间的关系 庭的收入和消费 品的广告费和销售额 确定性关系 粮食的产量和施肥量 股票的价格和时间 Y 随机变量 生的期中和期末考试成绩, 如果对于任何已知的x值,变量y和按某个概率取 某些特殊的值,则x和y之间的关系为随机的 返回(0)
返回 变 量 间 的 关 系 确定性关系或函数关系y=f(x) 人的身高和体重 家庭的收入和消费 商品的广告费和销售额 粮食的产量和施肥量 股票的价格和时间 学生的期中和期末考试成绩,… 非 确 定 性 关 系 x Y 实变量 随机变量 非确定性关系 第7.1节 一元回归分析模型
基本思想(xy) 回归分析 采集样本信息(x,y) 回归方程 散点图1 回归方程的显著性检验 HDuunDDUuaDD U 对现实进行预测与控制 AsiTy 返回(0)
返回 (x,y) 采集样本信息(xi,yi) 回归分析 散点图 回归方程 回归方程的显著性检验 对现实进行预测与控制 基本思想
回归分析是根据变量观测数据分析变量间关系的常用统计 分析方法 通常把变量观测数据称为样本. 如果数学关系式描写了一个变量与另一个变量之间的关系, 刂称其为一元回归分析; 如果数学关系式描写了一个变量与另多个变量之间的关系 则称其为多元回归分析,并且称这一个变量是被影响变量 (因变量: Dependent variable); 称这多个变量是影响变量(自变量 : IndependentⅤ ariable) AsiTy 返回(0)
返回 如果数学关系式描写了一个变量与另一个变量之间的关系, 则称其为一元回归分析; 如果数学关系式描写了一个变量与另多个变量之间的关系, 则称其为多元回归分析,并且称这一个变量是被影响变量 (因变量:Dependent Variable); 称这多个变量是影响变量(自变量:Independent Variable). 回归分析是根据变量观测数据分析变量间关系的常用统计 分析方法. 通常把变量观测数据称为样本
例如 某市场在t时刻黄瓜销量的数据如下(其中q表示t时刻销售 黄瓜的数量,单位为:斤,p1表示t时刻的销售价格,单位为 P qt 2.5 2.0 1.5 1.0 7 0.5 这是一个确定性关系:q1=11-4p1 AsiTy 返回(0)
返回 某市场在t时刻黄瓜销量的数据如下(其中qt表示t时刻销售 黄瓜的数量,单位为:斤,pt表示t时刻的销售价格,单位为: 元): pt qt 2.5 2.0 1.5 1.0 0.5 0 1 3 5 7 9 11 这是一个确定性关系: t t q 11 4 p 例如
若ⅹ、y之间的关系是随机的,例如 pr qn 概率 0.25 2.5 0.50 0.25 0.25 2.0 0.50 0.25 0.25 0.50 0.25 这时,方程的形式为q1=1-4p+6 AsiTy 返回(0)
返回 若x、y之间的关系是随机的,例如 t p t q 概率 2.5 0 1 2 0.25 0.50 0.25 2.0 2 3 4 0.25 0.50 0.25 … … … 0 10 11 12 0.25 0.50 0.25 这时,方程的形式为 t t q 11 4 p t
其中E;为随机变量 E 概率 0.25 0 0.50 0.25 E;称为随机扰动或随机误差项 返回(0)
返回 t 概率 -1 0 1 0.25 0.50 0.25 称为随机扰动或随机误差项. t 其中 为随机变量. t
两个变量之间的线性关系,其回归模型为 y=a+bx,+8 y称为因变量,x称为自变量,称为随机扰动,a,b称为 待估计的回归参数,下标i表示第i个观测值。 对于回归模型,我们假设:E1~N(0,2),=1,2;…,n E(EE1)=0,i≠j 可得到:y~N(a+bx,2) 如果给出a和b的估计量分别为ab,则经验回归方程为: y =a+bx 一般地, =y2-,称为残差, AsiTy 残差e;可视为扰动£;的“估计量” 返回(0)
返回 对于回归模型,我们假设: E( ) 0,i j ~ N(0, ),i 1,2, ,n i j 2 i 可得到: y ~ N( a bx , ) 2 i i 如果给出a和b的估计量分别为a ˆ ,b ˆ ,则经验回归方程为: i i bx ˆ ˆ y a ˆ 一般地, i i i e y ˆ y 称为残差, y称为因变量,x称为自变量, 称为随机扰动,a,b称为 待估计的回归参数,下标i表示第i个观测值。 两个变量之间的线性关系,其回归模型为 i i i y a bx 残差 ei 可视为扰动 i 的“估计量”
第7.2节回归系数的最小二乘估计_ 设对y及x做n次观测得数据(x1y)(i=1,2,,n) 以(x1y)为坐标在平面直角坐标系中描点,所得到的这张 图便称之为散点图 若散点呈直线趋势,则认为y与x的关系可以用一元回归 模型来描述 设线性回归方程为Y=a+bx+ε 其中:ε是随机误差,ε~MO,σ2) 将(x,y;)(i=1,2,…,n)逐一代入上式: y a+bx.+E:i=1.2 AsiTy (=12,n)独立同正态分布NO0a3)返 页)
返回 设对y及x做n次观测得数据(xi ,yi) (i=1,2,…,n ). 以(xi ,yi)为坐标在平面直角坐标系中描点,所得到的这张 图便称之为散点图. 若散点呈直线趋势,则认为y 与x的关系可以用一元回归 模型来描述. 设线性回归方程为 Y=a + bx+ε 其中:ε是随机误差, ε~N(0,σ2). 将(xi,yi) (i=1,2,…,n)逐一代入上式: ( 1,2, , ) (0, ) 1,2, , 2 i n N y a bx i n i i i i 独立同正态分布 第7.2节 回归系数的最小二乘估计
记ab=∑:2=∑y-(a+bx) 元函数ab)的最小值点(a,b)称为a,b的最小二乘估 计(简记为OLSE). 2∑(y-(a+bx=0 na+nxb=ny ab 2∑y-(a+bx)x1=0 a+△∑x2=∑xy 其中 XX ki,y 12 返回(0)
返回 二元函数 的最小值点 称为a,b的最小二乘估 计(简记为OLSE ). Q(a,b) ) ˆ (a ˆ ,b n i i i n i Q a b i y a bx 1 2 1 2 记 ( , ) [ ( )] n i 1 2 ( yi ( a bxi )) 0 a Q n i 1 i i i 2 [ y ( a bx )]x 0 b Q n i 1 i i n i 1 2 i nxa ( x )b x y na nxb ny , 1 , 1 1 1 n i i n i i y n x y n x 其中