第四章方差分量线性回归模型 本章考虑的线性模型不仅有固定效应、随机误差,而且有随机效应。我们先从随机效应 角度理解回归概念,导出方差分量模型,然后硏究模型三种主要解法。最后本章介绍关于方差 分量模型的两个前沿研究成果,是作者近期在《应用数学学报》与国际数学杂志 《 Communications in statistics》上发表的。 第一节随机效应与方差分量模型 随机效应回归模型 前面所介绍的回归模型不仅都是线性的,而且自变量看作是固定效应。我们从资料对 {Y,X1,…Xm}出发建立回归模型,过去一直是把Y看作随机的,X,…,X看作非随机的。 但是实际上,自变量也经常是随机的,而并不是我们可以事先设计好的设计矩阵。我们把自变 量也是随机变量的回归模型称为随机效应回归模型。 究竟一个回归模型的自变量是随机的还是非随机的,要视具体情况而定。比如一般情况下 消费函数可写为 C=Co+b(r (4.1.1) 这里X是居民收入,T是税收,Co是生存基本消费,b是待估系数。加上随机扰动项,就是一 元线性回归模型 C=Co+b(x-T)+8 (4.1.2) 那么自变量到底是固定效应还是随机效应?那要看你采样情况。如果你是按一定收入的家庭去 调查他的消费,那是取设计矩阵,固定效应。如果你是随机抽取一些家庭,不管他收入如何都 登记他的收入与消费,那就是随机效应。 对于随机效应的回归模型,我们可以从条件期望的角度推导出与最小二乘法则等价的回归 函数 我们希望通过X预测Y,也就是要寻找一个函数Y=M(X)=M(X1,…,X),当X的 观察值为x时,这个预测的误差平均起来应达到最小,即 Elr -M(X=min ETY-L() (4.1.3)
1 第四章 方差分量线性回归模型 本章考虑的线性模型不仅有固定效应、随机误差,而且有随机效应。我们先从随机效应 角度理解回归概念,导出方差分量模型,然后研究模型三种主要解法。最后本章介绍关于方差 分量模型的 两个前沿 研究成 果,是作 者近期在 《应用 数学学报 》与国际 数学杂志 《Communications in Statistics》上发表的。 第一节 随机效应与方差分量模型 一、随机效应回归模型 前面所介绍的回归模型不仅都是线性的,而且自变量看作是固定效应。我们从资料对 n Yi X1i X pi 1 { , , } 出发建立回归模型,过去一直是把 Y 看作随机的,X1,…,Xp 看作非随机的。 但是实际上,自变量也经常是随机的,而并不是我们可以事先设计好的设计矩阵。我们把自变 量也是随机变量的回归模型称为随机效应回归模型。 究竟一个回归模型的自变量是随机的还是非随机的,要视具体情况而定。比如一般情况下 消费函数可写为 ( ) C = C0 + b X −T (4.1.1) 这里 X 是居民收入,T 是税收,C0 是生存基本消费,b 是待估系数。加上随机扰动项,就是一 元线性回归模型 = + ( − ) + C C0 b X T (4.1.2) 那么自变量到底是固定效应还是随机效应?那要看你采样情况。如果你是按一定收入的家庭去 调查他的消费,那是取设计矩阵,固定效应。如果你是随机抽取一些家庭,不管他收入如何都 登记他的收入与消费,那就是随机效应。 对于随机效应的回归模型,我们可以从条件期望的角度推导出与最小二乘法则等价的回归 函数。 我们希望通过 X 预测 Y,也就是要寻找一个函数 ( ) ( , , ) Y = M X = M X1 X p ,当 X 的 观察值为 x 时,这个预测的误差平均起来应达到最小,即 2 2 E[Y M (X )] min E[Y L(X )] L − = − (4.1.3)
这里min是对一切X的可测函数LX)取极小。由于当 M(X=E(rX) 时,容易证明 ELY-MOXJIM(X)-L(XJ=0 (41.5) 故当M(X)=E(Y|X)时 ElY -L(X=ElY-M(X]+ELM(X-L(XI (41.6) 要使上式左边极小,只有取L(X)=M(X)=E(|X) 这个结果告诉我们,预测函数取作条件期望E(Y时,可使预测误差最小。我们还可以证 明,此时M()=E(YX与Y具有最大相关,即 p(r, M(X))=max P(Y, L(X) (4.1.7) 这里p表示相关系数 这是因为当M(X)=E(H|X)时,易证Cov(,L(X)=Cov(M(X),L(X),同时 Cov(Y,M(X)=Cov(M(X),M(x),于是 Cov (r, L(X)) Cov(M,L(X)) D2=(,L(X) D(YDLL(] D(YDIL(X) Cov(M(X,L(X)) DIM(XI DIM(XI DIM(XJDILOX D(Y) DIM(X) P(M(X), L(X).P(Y,M(D) P(,M(X) 等号当且仅当 p(M(X),L(X)=1 (4.1.8) 时成立,此时L(X是M(X)的线性函数 (41.3)与(4.1.7表达了M(X)=E(Y|X)的极好性质,我们称 Y=MOX=E(rX) (4.1.9) 为Y关于X的回归曲线。 上面的L(X)可取一切函数。如果限定L(X是X的线性函数,即要限定
2 这里 min 是对一切 X 的可测函数 L(X)取极小。由于当 M (X ) = E(Y | X ) (4.1.4) 时,容易证明 E[Y − M (X )][M (X ) − L(X )] = 0 (4.1.5) 故当 M (X ) = E(Y | X ) 时, 2 2 2 E[Y − L(X)] = E[Y − M(X)] + E[M(X) − L(X)] (4.1.6) 要使上式左边极小,只有取 L(X ) = M (X ) = E(Y | X )。 这个结果告诉我们,预测函数取作条件期望 E(Y|X)时,可使预测误差最小。我们还可以证 明,此时 M(X)=E(Y|X)与 Y 具有最大相关,即 ( , ( )) max ( , ( )) L Y M X = Y L X (4.1.7) 这里ρ表示相关系数。 这是 因为 当 M (X ) = E(Y | X ) 时 , 易证 Cov(Y, L(X )) = Cov(M (X ), L(X )) , 同 时 Cov(Y,M (X )) = Cov(M (X ), M (X )),于是 ( , ( )) ( ( ), ( )) ( , ( )) [ ( )] [ ( )] ( ) [ ( )] [ ( )] [ ( )] Cov ( ( ), ( )) ( ) [ ( )] Cov ( , ( )) ( ) [ ( )] Cov ( , ( )) ( , ( )) 2 2 2 2 2 2 2 Y M X M X L X Y M X D M X D M X D Y D M X D M X D L X M X L X D Y D L X M L X D Y D L X Y L X Y L X = = = = = 等号当且仅当 | (M (X ), L(X )) |= 1 (4.1.8) 时成立,此时 L(X)是 M(X)的线性函数。 (4.1.3)与(4.1.7)表达了 M (X ) = E(Y | X ) 的极好性质,我们称 Y = M (X ) = E(Y | X ) (4.1.9) 为 Y 关于 X 的回归曲线。 上面的 L(X)可取一切函数。如果限定 L(X)是 X 的线性函数,即要限定
ElY-(Bo+BX+.+BnXm)F]=min (4.1.10) 这里min是对X的一切线性函数取极小,则称满足上式的线性函数为Y关于X的回归直线 我们可以求出B0,B1,…Bn的解。记B=(B1,…Bm),则 L(Bo, B)=El Y-(Po+B,,+.+BnxmF b-+BRxxB-2BRxy+D(n) (4.1.11) E(r)-(Bo+ B,EX+.+ BnEXm) (41.12) Rxx= elx -EX( -Ext X2) V(XX) (4.1.13) Cov(Xm, Xi Cov(Xm,X,) D(X) Ry =(cov(r, x,,, Cov(r, Xm) (4.1.14) 对L(B0,B)求微分(矩阵微商公式(XAX)=2AX)得: 0 IRxrB=R (41.15) 解得 JBo=EY-B'EC B=rary (4.1.16) 这里当然假定R存在,否则使用广义逆 此时的预测误差方差是 L(B0,B)=印Y-(B+B1X1+…+BnXm)2] BRyB-2BR =o-RR-LR (4.1.17) xY =(Rxy rexx)2/o
3 L 2 E[| Y − ( 0 + 1X1 ++ m X m ) | ] = min (4.1.10) 这里 L min 是对 X 的一切线性函数取极小,则称满足上式的线性函数为 Y 关于 X 的回归直线。 我们可以求出 m , , , 0 1 的解。记 ( , ) 1 = m ,则 ( , ) [| ( ) | ] 2 L 0 = E Y − 0 + 1X1 ++ m X m 2 ( ) 2 b + RXX − RXY + D Y (4.1.11) 这里 ( ) ( ) b = E Y − 0 + 1EX1 ++ m EX m (4.1.12) R = E[(X − EX)(X − EX)] XX = Cov( , ) Cov( , ) D( ) Cov( , ) Cov( , ) 1 2 1 1 2 1 m m m m X X X X X DX X X X X (4.1.13) (Cov( , ), ,Cov( , ) 1 = RXY Y X Y X m (4.1.14) 对 L(β0,β)求微分(矩阵微商公式 X AX AX X ( ) = 2 )得: = = RXX RXY b 0 (4.1.15) 解得 = = − − RXX RXY EY E X 1 0 ˆ ( ) ˆ ˆ (4.1.16) 这里当然假定 −1 RXX 存在,否则使用广义逆。 此时的预测误差方差是 ( ) ˆ 2 ˆ ˆ ) | ] ˆ ˆ ˆ ) [| ( ˆ , ˆ ( 2 0 0 1 1 R R D Y L E Y X X XY XY m m = − + = − + + + Y RXYRXX RXY 2 −1 = − (4.1.17) XY RXY RXX RXY Y ( ) / 2 1 −1 = (4.1.18)
为复相关系数。它指出了Y与多元变量X=X1…Xm之间的线性相关程度,是一元相关系数 Cov(,y) (4.1.19) DX√ 的推广。 从条件期望角度我们导出的随机效应回归模型的回归直线表达式,与从最小二乘角度导出 的固定效应的回归方程,表达式是等价的,所以从计算角度,我们不怎么区分 方差分量模型概念 上段我们建立了随机效应概念,将自变量也视作随机变量,这就可以导出方差分量模型 方差分量模型研究工作的奠基人是我国最早的统计学家许宝驭骠先生。 还是刚才提到的消费函数回归模型,我们作随机抽样。考虑居民按职业的分类,如工人 教师、医生、律师、店员等等,记为X,i=1,…,m,我们从这些职业中随机抽取了n个样本, 则模型可写为 C=C0+b(X1-1)+En,j=1…,n,=1,…,m (4.1.20) 这里X1可看作是第i种职业对收入的效应。如果我们事先安排好取哪个职业的,当然X是固 定效应。可是我们现在对职业选取是随机的,而且我们还想研究职业效应的方差,这就导入了 方差分量模型,因为现在C的方差由两部分组成 Var(Ci)=o=b-o (4.1.21) 为了数学符号统一,我们将经济学中的符号改过来,刚才建立的模型是 1=+U15n+En,i=l…,mj=l,…n (4.1.22) 它有一项固定效应μ,一项随机效应ξ1,一项随机误差ε。如果还要考虑地区因素对消费的 影响,还可以加进第二个随机效应52,于是可得模型 H+U151+U252 (4.1.23) 这次我们省掉了取值的标记,Y的方差由三项组成 般地,我们建立方差分量模型如下 Y=BB+U151+…+Um5m (4.1.24) 这里有固定效应向量B,随机效应向量 并且将随机误差项ε也并入了随机效应向量去。设计矩阵X以及
4 为复相关系数。它指出了 Y与多元变量 X X X m , , = 1 之间的线性相关程度,是一元相关系数 DY X Y rXY DX Cov( , ) = (4.1.19) 的推广。 从条件期望角度我们导出的随机效应回归模型的回归直线表达式,与从最小二乘角度导出 的固定效应的回归方程,表达式是等价的,所以从计算角度,我们不怎么区分。 二、方差分量模型概念 上段我们建立了随机效应概念,将自变量也视作随机变量,这就可以导出方差分量模型。 方差分量模型研究工作的奠基人是我国最早的统计学家许宝驭马录先生。 还是刚才提到的消费函数回归模型,我们作随机抽样。考虑居民按职业的分类,如工人、 教师、医生、律师、店员等等,记为 Xi ,i = 1, ,m ,我们从这些职业中随机抽取了 n 个样本, 则模型可写为 Ci j = C0 + b(Xi −Ti ) + i j , j = 1, ,n,i = 1, ,m (4.1.20) 这里 Xi 可看作是第 i 种职业对收入的效应。如果我们事先安排好取哪个职业的,当然 Xi 是固 定效应。可是我们现在对职业选取是随机的,而且我们还想研究职业效应的方差,这就导入了 方差分量模型,因为现在 Cij 的方差由两部分组成: 2 2 2 2 0 Var( ) Cij = = b X + (4.1.21) 为了数学符号统一,我们将经济学中的符号改过来,刚才建立的模型是 Yi j = +U1 1i + i j , i = 1, ,m, j = 1, ,n (4.1.22) 它有一项固定效应μ,一项随机效应ξ1,一项随机误差ε。如果还要考虑地区因素对消费的 影响,还可以加进第二个随机效应ξ2,于是可得模型 = + + + Y U1 1 U2 2 (4.1.23) 这次我们省掉了取值的标记,Y 的方差由三项组成。 一般地,我们建立方差分量模型如下: Y = X +U1 1 ++Um m (4.1.24) 这里有固定效应向量β,随机效应向量 ( , , , ) 1 2 = m (4.1.25) 并且将随机误差项ε也并入了随机效应向量去。设计矩阵 X 以及
(4.1.26) 都是已知的。对于随机效应,i=1…,m,合理的假定是 E(51)=0Co515)=0,≠j (4.1.27) D()=a2,i=1 当然以后有时还可以考虑5;是向量的情况,不过这里假定每个5;是一维变量。记 V=UUi=1 1V1+ (4.1.28) 则方差分量模型可记为 E(Y)=XB,var(Y)=∑ (41.29) 模型的主要任务是要估计固定效应向量B与方差分量σ2,a2,…,O2。和一般的多元线性回归 模型相比,就是待估的方差多了 通过这些介绍,我们就可以方便地将各种经济方面的普通线性回归模型改造成方差分量模 型,当然要根据实际 第二节方差分量模型的解法 对于方差分量模型 =XB+U151 E()=B,Var(Y)=∑UA 般都采用二步估计法,首先估计方差分量σ2,…口n,然后再估计固定效应B。按照广义最 小二乘 B*=(X21X)X 其中 ∑=>GU (42.3) 所以方差分量模型解法的关键是估计方差分量。以下介绍的方法,也都是针对方差分量估计方 法而言的
5 ( , , , ) U = U1 U2 Um (4.1.26) 都是已知的。对于随机效应 i ,i =1, ,m ,合理的假定是 = = = = D i m E i j i i i i j ( ) , 1, , ( ) 0,Cov( , ) 0, 2 (4.1.27) 当然以后有时还可以考虑ξi 是向量的情况,不过这里假定每个ξi 是一维变量。记 i i i m V mVm V U U i 2 1 2 1 = , = 1, , , = ++ , (4.1.28) 则方差分量模型可记为 E(Y) = X, Var(Y) = (4.1.29) 模型的主要任务是要估计固定效应向量β与方差分量 2 2 2 2 1 , , , m 。和一般的多元线性回归 模型相比,就是待估的方差多了。 通过这些介绍,我们就可以方便地将各种经济方面的普通线性回归模型改造成方差分量模 型,当然要根据实际。 第二节 方差分量模型的解法 对于方差分量模型 = = = + + + = i i i m i p m n p m p n p p n n p E Y X Y U U Y X U U m m 2 1 1 1 1 1 1 1 ( ) , Var( ) 1 1 (4.2.1) 一般都采用二步估计法,首先估计方差分量 2 2 1 , , m ,然后再估计固定效应β。按照广义最 小二乘 X X X Y 1 1 ˆ ) ˆ * ( − − − = (4.2.2) 其中 i i i m i = U U = 2 1 ˆ ˆ (4.2.3) 所以方差分量模型解法的关键是估计方差分量。以下介绍的方法,也都是针对方差分量估计方 法而言的
、方差分析法 先从一个简单的模型结合数据结构形象地说明方法。考虑模型 y=B6+5+6n,i=1…,m,j=1,…,n (42.4) B0为总平均,是固定效应,51,…,m是随机效应,E51=0,CoV5,5)=0,i≠j, var()=a2=1…,m。对于随机误差5g,var(sn)=σ2。这个模型如果记作方差分量模 型的标准形式是 Y=XBo+U5+8 (42.5) 其中设计阵X=(1,1,…,1)′,随机效应矩阵为 0 0 01 (42.6) k 我们手中资料只有Y=(Y12…,H1k,Y21,…,2k2…,Fm) 们采用(42.4)记法方便一些,将资料y排成表 k 组内平均 YIK Y Y 2k Yn y
6 一、方差分析法 先从一个简单的模型结合数据结构形象地说明方法。考虑模型 Yij = 0 + i + ij , i = 1, ,m, j = 1, ,n (4.2.4) β0 为总平均,是固定效应,ξ1,…,ξm 是随机效应, E i j i = 0,Cov( i , j ) = 0, , Var( i ) A ,i 1, ,m = 2 = 。对于随机误差 2 ,Var( ) ij ij = 。这个模型如果记作方差分量模 型的标准形式是 Y = X +U + 0 (4.2.5) 其中设计阵 X=(1,1,…,1)′,随机效应矩阵为 m U 1 0 1 0 1 0 1 1 0 0 1 0 = mk k (4.2.6) 我们手中资料只有 ( , , , , , , , ) Y = Y11 Y1k Y21 Y2k Ymk 我们采用(4.2.4)记法方便一些,将资料 Y 排成表 j i 1 2 … k 组内平均 1 Y11 Y12 … Y1k Y1 2 Y21 Y22 … Y2k Y2 m Ym1 Ym2 … Ymk Ym
方差分析主要掌握三点,一是计算组内差、组间差,二是作平方和分解,三是计算各自的 自由度 先计算总平均 总变差(全体资料与总平均的偏差平方和) S=∑∑(-)2 各组平均(各组资料横向相加并平均) (4.2.9) 组间差(各组平均数与总平均数的偏差平方和) ∑(x-Y) j=l i=l 组内差(各组数据与本组平均数的偏差平方和) ∑∑(-F (4.2.11) i=l j=l 则必有平方和分解 (42.12) 将各平方和除以各自的自由度。Sr有一个约束Y(427),自由度为n-1=mk-1:Sa 有m组差,1个约束,自由度为m-1:S有mk组差,m个约束,自由度为mk-m。注意有 自由度分解: fr=tfe, mk-1=(m-1)+(mk-m (42.13) 于是算出均方: er Q (42.15) (42.16) 因为假定为随机效应,可以算出各均方的均值:
7 方差分析主要掌握三点,一是计算组内差、组间差,二是作平方和分解,三是计算各自的 自由度。 先计算总平均: ij k j m i Y mk Y = = = 1 1 1 (4.2.7) 总变差(全体资料与总平均的偏差平方和): 2 1 1 ( ) = = S = Yij −Y k j m i T (4.2.8) 各组平均(各组资料横向相加并平均) Y i m k Y ij k j i , 1, , 1 1 = = = (4.2.9) 组间差(各组平均数与总平均数的偏差平方和) ( ) 1 1 = = S = Yi −Y m i k j A (4.2.10) 组内差(各组数据与本组平均数的偏差平方和) 2 1 1 ( ) = = = ij − i k j m i S Y Y (4.2.11) 则必有平方和分解 ST = S A + S (4.2.12) 将各平方和除以各自的自由度。ST 有一个约束 Y.. (4.2.7),自由度为 n −1= mk −1 ;SA 有 m 组差,1 个约束,自由度为 m -1;Se有 mk 组差,m 个约束,自由度为 mk-m。注意有 自由度分解: f f f , mk 1 (m 1) (mk m) T = A + e − = − + − (4.2.13) 于是算出均方: T ST mk Q 1 1 − = (4.2.14) A S A m Q 1 1 − = (4.2.15) S mk m Q − = 1 (4.2.16) 因为假定为随机效应,可以算出各均方的均值:
E(2)=kod+o (42.17) E(O=0 (42.18) 以Q4代者E(QA),Q代替E(Q),得方程组: ko4+0:=ea (42.19) 解得 62=0 =(Q4-Q2)k (4.2.20) 这样就作好了方差分量的估计,然后可以按(42.2)作出B的估计。因为这里的方差分量是由方 差分析法作出的,故称为方差分析法 推广到一般的方差分量模型时,基本原则是类似的。我们不妨考虑方差分量模型 ∫Y=XB+U5+V252+E (42.21) Cov(n)=010101+020202+ofI 先对总平方和Y′Y作平方和分解 yr=SB+Sa+Sa2+Se (4.2.22) 其中Sa是在模型Y=XB+E中,B的回归平方和 SB=SES (B)=YX(rX)Xr (42.23) Sa是在模型Y=B+U151+E中,消去P影响后51的平方和 Sa= Ses (B,50)-SEs(B) (42.24) 类似地,S:2是在模型Y=B+U151+U252+E中消去B和51影响后,52的平方和 2=EEs(B,51,52)-Ss(B,51) (42.25) 最后的S为残差平方和 S=Y-Ss(B,51,92) (4.2.26) 可以验证 Sa=r(-D) (42.27) SAI=Y(D-D,r (4.2.28)
8 2 2 ( ) = + E Q k A (4.2.17) 2 ( ) E Q = (4.2.18) 以 QA 代者 ( ) E QA ,Q 代替 ( ) E Q ,得方程组: = + = Q k A QA 2 2 2 (4.2.19) 解得 Q Q Q k e A A ˆ , ˆ ( )/ 2 2 = = − (4.2.20) 这样就作好了方差分量的估计,然后可以按(4.2.2)作出β的估计。因为这里的方差分量是由方 差分析法作出的,故称为方差分析法。 推广到一般的方差分量模型时,基本原则是类似的。我们不妨考虑方差分量模型 = + + = + + + Y U U U U I Y X U U 2 2 2 2 1 1 2 2 1 1 1 2 2 Cov( ) (4.2.21) 先对总平方和 Y′Y 作平方和分解 Y Y = S + S + S + S 1 2 (4.2.22) 其中 Sβ是在模型 Y=Xβ+ε中,β的回归平方和: S = SES = YX XX XY − () ( ) (4.2.23) 1 S 是在模型 = + + Y X U1 1 中,消去β影响后ξ1 的平方和 ( , ) ( ) S1 = S ES 1 − S ES (4.2.24) 类似地, 2 S 是在模型 = + + + Y X U1 1 U2 2 中消去β和ξ1 影响后,ξ2 的平方和: ( , , ) ( , ) S 2 = EES 1 2 − S ES 1 (4.2.25) 最后的 Sε为残差平方和 ( , , ) S Y Y − SES 1 2 = (4.2.26) 可以验证 S = Y (I − D)Y (4.2.27) S1 = Y (D − D1 )Y (4.2.28)
S=2=Y(D1-D12)y (42.29) S=DMR 这里 D=7-X(XXX=l-Px (42.31) DU(UIDUJUD=D-PD D12=D1-DU2(),=D, -Pou (42.33) 这里P,表示关于*的投影阵 下面计算各平方和的均值。 E(SE)=BX(D-D)XB+tr(D-D) U1Uσ2+U2U22+a2门 BY(D-D)XB+tr(U,DU )02 tr(U'DU1o +tr(U,DU, )o tr(U,DU,)o,+tr(D-Do (42.34) 因为DX=0,DX=0,所以上式第一项为0。在第三项中, tr(U,DU=trUIDU-UIDU,(UIDUUDU=0 (42.35) 在第六项中 tr(D-Di)=tr[DU(UIDUD-UIDI trL(UDUUDUI k(UDU=rk(UID) rk(l X'-rk(X) rk(U X)-rk(X) (4.3.36) 所以最后有 (Sa)=cG2+(c2-c32+r2a2 (43.37) 其中 (UIDUD)
9 S 2 = Y (D1 − D12 )Y (4.2.29) S = YD12Y (4.2.30) 这里 PX D = I − X X X X = I − − ( ) (4.2.31) 1 1 1 1 1 1 ( ) D D DU U DU U D = D − PDU = − − (4.2.32) 12 1 1 2 2 1 2 2 1 1 1 2 ( ) D D DU U DU U D = D − PDU = − − (4.2.33) 这里 P*表示关于*的投影阵。 下面计算各平方和的均值。 2 2 2 2 2 1 1 1 1 2 1 1 1 1 2 2 2 2 2 2 1 1 1 1 1 1 tr( ) tr( ) ( ) tr( ) [ ] ( ) ( ) tr( ) U D U U DU X D D X U DU U U U U I E S X D D X D D − + = − + + + = − + − 2 1 2 2 1 2 2 tr( ) tr( ) U D U + D − D − (4.2.34) 因为 DX = 0,D1X = 0 ,所以上式第一项为 0。在第三项中, tr( 1 1 1 ) = tr[ 1 1 − 1 1 ( 1 1 ) 1 1 ] = 0 − U D U U DU U DU U DU U DU (4.2.35) 在第六项中 rk( ) rk( ) rk( ) rk( ) tr[( ) ] tr( ) tr[ ( ) ] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 U X X U D U U D U D U U D U D D D U U D U U D = − = = = − = − − rk( ) rk( ) = U1 X − X (4.3.36) 所以最后有 2 2 2 2 3 2 2 1 1 1 ( ) ( ) E S = c + c − c + r (4.3.37) 其中 tr( ) 1 U1DU1 c = (4.2.38)
C2=t(2DU2) c3=tr(U,,U2) (4.2.40) 1=k(X),n+n2=k(U1|X (42.41) 类似还可以求得 E(S2)=c2a2+n2 (42.42) E(S)=(n-n-r2-n1)2 r3=k(x:U1:U2)-r-2 (42.44) 于是我们得到方程组 C +rg 20 (n-r1-r2-r3)o 解此方程组,就可以得到2,G2,a2的估计。然后进入二步估计的第二步,就可以得到关于 固定效应的估计。 算例421市场收益率与股利和换手率的关系 考虑一个随机效应的多元线性模型 Y =X B+U5 U的形式如同(426) 问题的实际背景是,观测对象被分成了m组,可能存在一个随机效应向量对各组资料有 不同的作用。模型也可以写作 数据结构及具体数值如下表所示,m=6,k=6。这些资料采自《96上海股票市场资料总汇》。 我们研究目的一是看过去一年的股利收入与当年换手率对当年市场收益率有何影响,二是 想知道是否存在一个潜在的尚未观测到的随机效应,对行业有明显影响。当然这种情况采用方 差分量模型比较合适。 要注意本例是两个方差量,上一章第二节模型(32.10)也是两个待估的方差量。它们的随 机效应作用范围不一样,不是一回事
10 tr( ) 2 U2DU2 c = (4.2.39) tr( ) 3 U2D1U2 c = (4.2.40) rk( ), rk( | ) r1 = X r1 + r2 = U1 X (4.2.41) 类似还可以求得 2 3 2 2 2 2 ( ) E S = c + r (4.2.42) 2 1 2 3 ( ) ( ) E S = n − r − r − r (4.2.43) 3 1 2 1 2 r = rk(X U U ) − r − r (4.2.44) 于是我们得到方程组 = − − − = + = + − + 2 1 2 3 2 3 2 2 2 2 2 2 2 2 3 2 2 1 1 1 ( ) ( ) S n r r r S c r S c c c r (4.2.45) 解此方程组,就可以得到 2 2 2 2 1 , , 的估计。然后进入二步估计的第二步,就可以得到关于 固定效应的估计。 算例 4.2.1 市场收益率与股利和换手率的关系 考虑一个随机效应的多元线性模型 = + + 1 1 1 p n m m n n p Y X U U 的形式如同(4.2.6)。 问题的实际背景是,观测对象被分成了 m 组,可能存在一个随机效应向量对各组资料有 不同的作用。模型也可以写作 Y X i m j k ij ij i ij = + + , = 1, , , = 1, , 数据结构及具体数值如下表所示,m=6,k=6。这些资料采自《'96 上海股票市场资料总汇》。 我们研究目的一是看过去一年的股利收入与当年换手率对当年市场收益率有何影响,二是 想知道是否存在一个潜在的尚未观测到的随机效应,对行业有明显影响。当然这种情况采用方 差分量模型比较合适。 要注意本例是两个方差量,上一章第二节模型(3.2.10)也是两个待估的方差量。它们的随 机效应作用范围不一样,不是一回事