●上次课重要内容: 第三章长期水文过程的因子挑选 ●物理考察:大气环流、太阳、宇宙、地球物理 前期下垫面、前期地面水文气象因素、经验 和韵律的应用 ●统计考察:相关概率、单相关系数、等级相关 系数 ●第四章回归分模型 ●概念、一元回归模型、回归系数的求解和意义 ●本次课主要内容: ●一元回归效果的检验、多元回归、逐步回归
⚫ 上次课重要内容: ⚫ 第三章 长期水文过程的因子挑选 ⚫ 物理考察:大气环流、太阳、宇宙、地球物理、 前期下垫面、前期地面水文气象因素、 经验 和韵律的应用 ⚫ 统计考察:相关概率、单相关系数、等级相关 系数 ⚫ 第四章 回归分模型 ⚫ 概念、一元回归模型、回归系数的求解和意义 ⚫ 本次课主要内容: ⚫ 一元回归效果的检验、多元回归、逐步回归
多元线性回归分析 (一)模型p50 ●预报对象Y,m个预报因子x(i=1,2.m)。建立它们 之间的相关关系得到多元线性回归方程。如下 y=b+bx1+b2x2n+…+b m~m(4-18 b1(i=0,1,2……m)为回归系数;根据实测资料确定。 ●t=1 n为资料长度。 多 是指因变量y依赖于不止一个自变量x ●线性是指回归方程是关于参数bi(i=0,1,2.…m) 的线性函数
三、多元线性回归分析 ⚫ (一)模型 p 50 ⚫ 预报对象Y,m个预报因子xi (i=1,2……m)。建立它们 之间的相关关系得到多元线性回归方程。如下: (4-18) ⚫ bi (i=0,1,2……m)为回归系数;根据实测资料确定。 ⚫ t=1,2,……..n.为资料长度。 ⚫ 多元——是指因变量y依赖于不止一个自变量x; ⚫ 线性——是指回归方程是关于参数bi (i=0,1,2……m) 的线性函数 t t t m mt y ˆ = b +b x +b x +......+b x 0 1 1 2 2
(二)回归系数的最小二乘估计 把各个x的每个观测值代入方程(418)后,得到m个y 的估计值。这样就有n方程,m+1未知数 总残差平方和为: p=∑0y-1i) ∑(y-b-bx1-b2x2 t=1 其依赖于bi(i=0,1,2.m),要使其最小,则 OO
⚫ (二)回归系数的最小二乘估计 ⚫ 把各个xt的每个观测值代入方程(4-18)后,得到n个y 的估计值 。这样就有n方程,m+1未知数。 总残差平方和为 : , (4-23) 其依赖于bi (i=0,1,2……m),要使其最小,则 . t y = = = − − − − − = − n t t t t m m t n t t t y b b x b x b x Q y y 1 2 0 1 1 2 2 1 2 ( ...... ) ( ˆ ) = 0 bi Q
。将(420)式分别对hb…bm,令其为零。经归 并整理后,得到如下止规万程组: S1*b1+S12*b2 S*6=s *b1+S2*b2 + 52m (424) Sm*b1+Sn2*b2+……+Sm*bn=Smy ●其中: ∑(x1-)x1-2)…(=12…m n=∑(x1-x ●当资料给定,S,s为已知,解此方程组 以—求出。國
⚫ 将(4-20)式分别对 求导,令其为零。经归 并整理后,得到如下正规方程组: ⚫ (4-24) ⚫ 其中: ⚫ 当资料给定, 为已知,解此方程组, 可 以一一求出。 b b bm , ...... 0 1 + + + = + + + = + + + = m m mm m m y m m y m m y S b S b S b S S b S b S b S S b S b S b S ...... ............................................................. ...... ...... 1 1 2 2 2 1 1 2 2 2 2 2 1 1 1 1 2 2 1 1 ( )( ) ( )( )...........( , 1,2...... ) 1 1 S x x y y S S x x x x i j m t n t i y i t i n t i j j i i t i j t j = − − = = − − = = = sij ,siy i b
●(三)多元回归系数的物理意义p54 ●在一元的情况下,得 ●表示x距平变化一个单位平均变化的大小。以 此类比, 的物理意义为:其他因素不变的情况下 x;距平变化一个单位y平均变化的大小
⚫ (三)多元回归系数的物理意义p54 ⚫ 在一元的情况下,得: ⚫ 表示x 距平变化一个单位y平均变化的大小。以 此类比, ⚫ 的 物理意义为:其他因素不变的情况下, xi 距平变化一个单位y平均变化的大小 。 x x y y b − − = 1 i b
●(四)标准回归系数 ●为消除单位的影响,引入标准回归系数的概念。对式 (4-24)进行变换。 令 ●有如下方程组 b1+12*b2+…+Fn*bn=F 21*b1+2*b2+…+互m*bmn=P2y (4-25) b1+r*b,+……+F,米b my
⚫ (四)标准回归系数 ⚫ 为消除单位的影响,引入标准回归系数的概念。对式 (4-24)进行变换。 ⚫ 令: ⚫ 有如下方程组: .....................( 1,2...... ) ' b i m S S b S S S r i yy i i i i i j j i j i j = = = .................(4 25) ...... ........................................................ ...... ...... ' ' 2 2 ' 1 1 2 ' 2 ' 2 2 2 ' 2 1 1 1 ' 1 ' 1 2 2 ' 1 1 1 − + + + = + + + = + + + = m m m m m m y m m y m m y r b r b r b r r b r b r b r r b r b r b r
●方程组(4-25)关于标准化回归系数的标准化正规方 程组,其中的回归系数b与X及y所取的单位无关。称 为标准回归系数。它的绝对值越大,相应的因素对y的 影响就越大。 为洇因子与因子的相关系数 为洇因子与预报对象的相关系数 ●资料一定,v知,b可以求得,因子的相对 重要性可通过比较p伸大小来确定
⚫ 方程组(4-25)关于标准化回归系数的标准化正规方 程组,其中的回归系数b’ i与x及y所取的单位无关。称 为标准回归系数。它的绝对值越大,相应的因素对y的 影响就越大。 ⚫ 资料一定, 已知, b’ I可以求得,因子的相对 ⚫ 重要性可通过比较 的大小来确定。 为 因子与 预报对象的相关系数 为 因子与 因子的相关系数 r i j r i j i y i j ij iy r ,r ' bi
(五)回归效果的检验 1离差分析及复相关系数 ●与一元线性回归相似 总离差平方和=回归平方和+离差平方和。即S=Q+0 卩=∑b*S(=12m=∑(-i R2- U 或R ●R为复相关系数,这一无量纲指标R可用来衡量回归效 果的好坏。R越接近1,回归效果越好。 ●当自变量只有一个时,R为一元回归中的单相关系数
(五)回归效果的检验 ⚫ 1.离差分析及复相关系数 ⚫ 与一元线性回归相似。 ⚫ 总离差平方和=回归平方和+离差平方和。即 ⚫ R为复相关系数,这一无量纲指标R可用来衡量回归效 果的好坏。R越接近1,回归效果越好。 ⚫ 当自变量只有一个时,R为一元回归中的单相关系数。 = = − n t t t Q y y 1 2 ( ˆ ) Syy = Q +U .......( 1,2...... ) 1 U b S i m m t = i i y = = yy Syy Q R S U R = = 1− 2 或
讨论:P56 ●问题:P56 ●R显著性检验(检验) 据m给定的信度直表(P37表41)得[ R)R回归效果显著 R≤R回归效果不显著 2.剩余标准差 ●多元残差平方和的自由度:f。=f-f=n-1-m ●剩余标准差 O (429) ●s越小回归效果越好
⚫ 讨论:P56 ⚫ 问题:P56 ⚫ R显著性检验(t检验): ⚫ 据m,n及给定的信度查表(P57表4-1)得 ⚫ 2.剩余标准差 ⚫ 多元残差平方和的自由度: ⚫ 剩余标准差: ⚫ (4-29) ⚫ sy越小回归效果越好。 回归效果不显著 回归效果显著 R R R R f Q = f − f U = n −1− m n m Q sy − − = 1 R
3回归效果的检验(回归平方和明显大于残差 平方和的检验) (1)定义 回归方差 F 残差方差 O (4-30) 1-h 可见,F值越大,回归方差越大,回归效果越好。 (2)讨论P59 (3)检验 查表:给定一信度α,查出相应的临界值Fo 比较:若FFa,回归效果显著。反之,不显著
⚫ 3.回归效果的F检验(回归平方和明显大于残差 平方和的检验) (1)定义 (4-30) 可见,F值越大,回归方差越大,回归效果越好。 (2)讨论 P59 (3)检验 查表:给定一信度,查出相应的临界值F 比较:若F>F,回归效果显著。反之,不显著。 − −1 = = n m Q m U F 残差方差 回归方差