正在加载图片...
作 物 学 报 第32卷 需要指出的是,式())并不是普骗成立的。一种 接危害。 21不能精确估计回归参数 一或某些列元素正好是另一或另一些列元素的线 回归系数的误差均方为 性函数。这称为共线性或多重共线性(collinearity o V(b,)=s'c multicollinearity),X的共线性必然导致XX的列间 上式的2为离回归均方,c为(XX)·1中的主对角 和行间存在共线性,并使X'X为奇异(singular),即 线(第i行i列)元素。故(XX)的膨胀必使回归 其行列式值为0 系数具有很大的误差,导致本来可能较好配合的回 det('x)=0 (3) 归模型知配合失败 由于在计算待解元b时,都要用到以d(XX)为除 例1设有以下资料: 数,故当式(3)成立时,X'X将无逆,b将无解,或者 44777171 说无确定解。 X21616494950.4151.41 以上结论在数学上可能是早已明确的,但应用 Y192037393638 上仍常被忽视。例如近年一些学者建议的复杂遗传 用二元回归模型E()=。+月,X+2X进行配合 模型(即X矩阵)就存在明显的共线性。这类模型 [此例X,=X,故也可以说用多项式回归模型E(Y) 如果不添加限制条件,就不可能进行常规的回归分 析。 =民+月X+品,X作配合,结果相同]。这里的 在回归分析中,还存在近似于但不同于式(3)的 4 16 191 另一类情况,即虽然det(X'x)≠0,但近于0 16 > det(X'X) 49 X= Y 符合式(4)的XX,通常称为病态矩阵或近奇异矩 1 7 49 2079 阵。病态矩阵是由X的列间存在高度的线性依 7.1 50.41 赖引起的,它对回归分析的影响尚缺少研究。本文 7.1 50.41 38 试图从应用统计学角度,研讨病态矩阵的问题以及 由之得正规方程组和解为 如何发现XX为病态而做出相应改进的方法,供应 6 36.2 230.82 189.0 用回归分析的研究者参考。 36.2 230.82 1529.822 6, 1213.4 由于回归资料数量级的千差万别,“近于0”的 1230.83 1529.822 10396.3362 .b2 8078.34 数量界限至今尚不明确。在数学专业文献中,亦只 b XY 是将方程组“参数的小改变会引起解的大改变”定义 为病态矩阵们,并未涉及“大”和“小”的具体界限 8574.1602 -3357.8456 303.74341 189.0 -3357.8456 1315.1877 -118.9789 1213.4 为便于分析研究,本文提出的建议标准为,当X'X 中的元素以标准化变量一线性相关系数,表示时 303.7434 ,118.9789 10.7641 8078.34 (即将XX变换为相关矩阵R)刀,若 (Xx)- XY det(R)=0+0.01 (5 -151.18631 即在-0.01-0.01区间内但非0,可认为“近于0” 63.5315 对应于该R的XX为病态:若 -5.2150」 det(R)=0±0.000 (6 即在-0.0001-0.0001区间内但非0,则认为“非常 即有二元回归方程V= -151.1863+65.5315X 近于0”,对应于该R的X'X为严重病态。de(R)> 5.2150X,。其有关标准误为s。=113.4078,s, 10.011的XX则视为良态”。 4.4162,5=4.0182:二元决定系数为R2=0.9897。 上述结果表明,本例X和X,的变异已能说明 2病态矩阵的问题 Y变异的98.97%,但bb,和b2都与0无显著若 病态矩阵只是近于奇异,故仍能进行回归分析 异,即上述二元回归无显著意义。进一步分析可知, 但结果不可靠。这主要由于d(XX)为小值,而对 上述结果正是源于X中X,和X2的高度线性依赖 XX求逆时必须用到该小值为除数,因而造成(X 其r=0.99996937,导敛d(R)=0.6125×10-,XX x)中元索联棉的极度“膨胀”。由之产生以下直 具有严重病态。需要指出的是,式(!)并不是普遍成立的。一种 例外情形是 ! 的列间存在完全的线性依赖,即它的 某一或某些列元素正好是另一或另一些列元素的线 性函数。这称为共线性或多重共线性("#$$%&’()%*+ #) ,-$*%"#$$%&’()%*+)。 ! 的共线性必然导致 !. ! 的列间 和行间存在共线性,并使 !. ! 为奇异(/%&0-$()),即 其行列式值为 1 [2] 3’(* !.!)4 1 (5) 由于在计算待解元 " 时,都要用到以 3’(* !.!)为除 数,故当式(5)成立时,!. ! 将无逆," 将无解,或者 说无确定解。 以上结论在数学上可能是早已明确的,但应用 上仍常被忽视。例如近年一些学者建议的复杂遗传 模型(即 ! 矩阵)就存在明显的共线性。这类模型, 如果不添加限制条件,就不可能进行常规的回归分 析[6] 。 在回归分析中,还存在近似于但不同于式(5)的 另一类情况,即虽然 3’(* !.!)!1,但近于 1 3’(* !.!)" 1 (2) 符合式(2)的 !. !,通常称为病态矩阵或近奇异矩 阵[6,7] 。病态矩阵是由 ! 的列间存在高度的线性依 赖引起的,它对回归分析的影响尚缺少研究。本文 试图从应用统计学角度,研讨病态矩阵的问题以及 如何发现 !.! 为病态而做出相应改进的方法,供应 用回归分析的研究者参考。 由于回归资料数量级的千差万别,“近于 1”的 数量界限至今尚不明确。在数学专业文献中,亦只 是将方程组“参数的小改变会引起解的大改变”定义 为“病态矩阵”[7] ,并未涉及“大”和“小”的具体界限。 为便于分析研究,本文提出的建议标准为,当 !. ! 中的元素以标准化变量—线性相关系数 ! 表示时 (即将 !.! 变换为相关矩阵 #)[8] ,若 3’(* #)4 1 9 1 :1; (6) 即在 < 1 :1; = 1 :1; 区间内但非 1,可认为“近于 1”, 对应于该 # 的 !.! 为病态;若 3’(* #)4 1 9 1 :111; (7) 即在 < 1 :111; = 1 :111; 区间内但非 1,则认为“非常 近于 1”,对应于该 # 的 !.! 为严重病态。3’(* #)> ? 1 :1; ? 的 !.! 则视为“良态”。 ! 病态矩阵的问题 病态矩阵只是近于奇异,故仍能进行回归分析, 但结果不可靠。这主要由于 3’(* !. !)为小值,而对 !.! 求逆时必须用到该小值为除数,因而造成( !. !)< ; 中元素取值的极度“膨胀”。由之产生以下直 接危害。 ! "# 不能精确估计回归参数 回归系数的误差均方为[8] "( #$)4 % ! &$$ 上式的 % ! 为离回归均方,&$$ 为( !. !)< ; 中的主对角 线(第 $ 行 $ 列)元素。故( !. !)< ; 的膨胀必使回归 系数具有很大的误差,导致本来可能较好配合的回 归模型却配合失败。 例 # 设有以下资料: ’; 2 2 8 8 8 @; 8 @; ’! ;7 ;7 2A 2A 61 @2; 6; @2; ( ;A !1 58 5A 57 5B 用二元回归模型 C( ()4!1 D!; ’; D!! ’! 进行配合 [此例 ’! 4 ’! ;,故也可以说用多项式回归模型 C( () 4!1 D!; ’; D!! ’! ; 作配合,结果相同]。这里的 ! 4 ; 2 ;7 ; 2 ;7 ; 8 2A ; 8 2A ; 8 :; 61 :2;                  ; 8 :; 61 :2;  $ 4 ;A !1 58 5A 57                  5B  由之得正规方程组和解为 7 57:! !51:B! 57:! !51:B! ;6!A:B!!          !51 @B5 ;6!A @B!! ;15A7:557! #1 #; #           ! 4 ;BA:1 ;!;5:2          B18B:52  !.! " 4 !.$ #1 #; #           ! 4 B682 @;71! < 5568 @B267 515 @8252 < 5568 @B267 ;5;6 @;B88 < ;;B @A8BA 515 @8252 <          ;;B @A8BA ;1 @872;  ;BA:1 ;!;5:2          B18B:52  " 4 ( !.!)< ; !.$ 4 < ;6; :;B75 75 :65;6 <          6 :!;61  即有 二 元 回 归 方 程 ( E 4 < ;6; :;B75 D 76 :65;6 ’; < 6 :!;61 ’!。其 有 关 标 准 误 为 %#1 4 ;;5 :218B,%#; 4 22 :2;7!,%#! 4 2 :1;B!;二元决定系数为 )! 4 1 :ABA8。 上述结果表明,本例 ’; 和 ’! 的变异已能说明 ( 变异的 AB @ A8F,但 #1、#; 和 #! 都与 1 无显著差 异,即上述二元回归无显著意义。进一步分析可知, 上述结果正是源于 ! 中 ’; 和 ’! 的高度线性依赖, 其 ! 4 1 :AAAA7A58,导致 3’(* #)4 1 :7;!6 G ;1 < 2,!.! 具有严重病态。 ! 作 物 学 报 第 5! 卷 万方数据
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有