(六)逐步回归方程的获得和回归效果检验 ●1标准回归方程P83 ●2回归方程 X-X ●代入关系式y Y-y b t ●得回归方程P83 V, =y+ r(xn-x)(40
1 (六)逐步回归方程的获得和回归效果检验 ⚫ 1.标准回归方程 P83 ⚫ 2.回归方程 ⚫ 代入关系式: ⚫ 得:回归方程 P83 ⚫ ⚫ (4-40) i p i yt =bi x =1 i i i yy i i i t i t yy t t b s s b s x x x s y y y = − = − = , , ( ) ( ) 1 i t i l i y p i i i yy t r x x s s y = y + − =
●3回归效果检验 ●(1)复相关系数 可以证明:=05 R= (4-41)R越接近1越好。 (2)剩余标准差 (4-42) 越小越好
2 ⚫ 3.回归效果检验 ⚫ (1)复相关系数 ⚫ 可以证明: ⚫ ⚫ (4-41) R越接近1越好。 (2)剩余标准差 (4-42) 越小越好。 1 1 ( ) − − = − − = n p r s n p Q s l yy y yy yy l yy l Q r .s ( ) ( ) = ( ) 1 l yy R = − r Syy Q R = 1−
(七)逐步回归计算步骤及个例 ●步骤:见P87计算过程示意图 ●数值例子:P84
3 (七)逐步回归计算步骤及个例 ⚫ 步骤:见P87 计算过程示意图 ⚫ 数值例子:P84
(八)逐步回归中与多元回归的讨论 p92
4 ⚫ (八)逐步回归中与多元回归的讨论 ⚫ p92
第二节线性回归模型的推广 有些非线性的固定函数关系,通过适当的变形使得非 线性问题线性化。P109 1抛物线关系 ●2指数关系 3幂函数关系 角函数关系
5 第二节线性回归模型的推广 ⚫ 有些非线性的固定函数关系,通过适当的变形使得非 线性问题线性化。P109 ⚫ 1.抛物线关系 ⚫ 2.指数关系 ⚫ 3.幂函数关系 ⚫ 4.三角函数关系
第三节AC准则 引人目的 ●在建立多元、逐步回归模型时,方程中因子的个数与 所取的信度有关,带有一定的人为性。为此,提出用 函数作为确定因子个数(自回归的阶数)的标准,以 消除人为因素,使回归模型有具有较好的拟合效果
6 第三节 AIC准则 ⚫ 一、引人目的 ⚫ 在建立多元、逐步回归模型时,方程中因子的个数与 所取的信度有关,带有一定的人为性。为此,提出用 函数作为确定因子个数(自回归的阶数)的标准,以 消除人为因素,使回归模型有具有较好的拟合效果
基本思想P1ll 确定一个依赖于样本数n与因子个数p的函数,在所 有可能的p中,选出使此函数达到最小的p以这p,个 因子作为入选因子的数量(自回归的阶数),来建立 方程。 函数 AlC(p)=no (p)+<p (4-44) a(P)为P个中心化(距平)因子的残差方差,P为中 心化变元的个数(自回归阶数) hrV是随着p的增加而单调下降的,而2p却随着p的 增加而增加。 ●第一项代表拟合优度。第二项代表增加因子后的惩罚
7 ⚫ 二、 基本思想 P111 ⚫ 确定一个依赖于样本数n与因子个数p的函数,在所 有可能的p中,选出使此函数达到最小的p。以这p。 个 因子作为入选因子的数量(自回归的阶数),来建立 方程。 ⚫ 三、 函数的形式 ⚫ (4-44) ⚫ 为P个中心化(距平)因子的残差方差,P为中 心化变元的个数(自回归阶数) ⚫ 是随着p的增加而单调下降的,而2p/n却随着p的 增加而增加。 ⚫ 第一项代表拟合优度。第二项代表增加因子后的惩罚。 n p AIC p p 2 ( ) ln ( ) 2 = + ln ( ) 2 p ( ) 2 p
将AC(P)=极小值时的P作为最佳因子个数(自回 归的阶数) ●四、AIC的应用 1确定因子的个数或自回归的阶数 ●分别计算1,2,…m个因子的AC(1),AC (2)…AIC(m),取使AC达最小值的因子数p为因 子个数。 ●2确定因子的重要性 ●分别计算各因子的AC,AIC达最小的因子最重要
8 ⚫ 将AIC(P0)=极小值时的 P0作为最佳因子个数(自回 归的阶数) ⚫ 四、 AIC的应用 ⚫ 1.确定因子的个数或自回归的阶数 ⚫ 分别计算1,2,……m个因子的AIC(1), AIC (2)…… AIC(m),取使AIC达最小值的因子数p为因 子个数。 ⚫ 2.确定因子的重要性 ⚫ 分别计算各因子的AIC, AIC达最小的因子最重要
第四节非线性模型 非线性模型简介 模型 y=f(X, b, b2>b 112(4-46 其中提待定参数b,b2…b的非线性函数。X可以是 单个因子,也可以是p个因子X=bb2…b 2.待定参数确定思路 给出初始值后,用最小二乘法确定关于误差国的方 程组(4-50),采用逐次逼近法求得b。理论上可行, 但实际误差大,求解困难。 逐段线性化的门限回归模型 基本思想p14 将非线性的函数关系按照某一变元不同的取值范围, 采取若干线性模型来描述(逐段线性化 ●2.模型P115(4-53
9 第四节 非线性模型 一、非线性模型简介 1 .模型 p112(4-46) ⚫ 其中f是待定参数b1 ,b2……bp的非线性函数。X可以是 单个因子,也可以是p个因子X=(b1 ,b2……bp ), 2 . 待定参数确定思路 给出初始值后,用最小二乘法确定关于误差 的方 程组(4-50),采用逐次逼近法求得 bi。理论上可行, 但实际误差大,求解困难。 二、逐段线性化的门限回归模型 ⚫ 1.基本思想p114 ⚫ 将非线性的函数关系,按照某一变元不同的取值范围, 采取若干线性模型来描述(逐段线性化)。 ⚫ 2.模型 P115 (4-53) ( , , ,... ) X b1 b2 bp y = f i
b*x1+…,b*x1+…+b0*xn+E1当x1≤ b2*x1+…,b2)*x1+……+b2)*xm+E1当x< it-ds. b*x,+…b*x,+…+b)*x+ x.1< it-d< oo p为P个自变元(预报因子 p ●(2)x为门限自变元,是自变元中的一个其选择见P115 ●(3)据门限自变元x的数值(性质)把x分为r段分界点的 值为为门限值x,x2…x1(一般为转折点分段原则 P116 ●(4)d为延迟量。 ●用两天前的因子作预报d=2 3数值例子116
10 ⚫ (1) x1t, x2t,…xit,……xpt,为P个自变元(预报因子) i=1….p ⚫ (2) xit为门限自变元,是自变元中的一个.其选择见P115 ⚫ (3)据门限自变元xit 的数值(性质),把xi分为r段,分界点的 值为为门限值x1 ,x2……xr-1 (一般为转折点),分段原则 P116 ⚫ (4)d为延迟量。 ⚫ 用两天前的因子作预报d=2 ⚫ 3.数值例子 116 + + + + + + + + + + + + = − − − − p t t r i t d r i t p r t i r t i i t p p t t i t d t i i t p p t t i t d t b x b x b x x x b x b x b x x x x b x b x b x x x Y 1 ( ) ( ) 1 ( ) 1 1 2 (2) (2) 1 (2) 1 1 (1) (1) 1 (1) 1 ...... ...... ...................................................................................... ...... ...... ...... ...... 当 当 当