★特征值与特征向量 定义1(1)对n阶方阵A=(an)mn,称多项式 p(a)=det(al-A)=det ”-(a1+a2+…+am)2n+(的次数≤n2的项) 为A的特征多项式,方程 q?()=det(I-A)=0 (1.1 为A的特征方程,特征方程的根为A的特征值。用(A)表示A的所有特征值的集合(k重 特征值视为k个相同的特征值)。 (2)设λ为n阶方阵A的特征值,则称齐次线性代数方程组 (I-A)x=0 (1.2) 的非零解x为A的对应于λ的特征向量 矩阵A的特征值问题就是求数A和非零向量x,使得 Ax=a 物理、力学和工程技术中的许多问题(如工程技术中求一个力学、结构或电学系统的固有或 自然频率)在数学上都归结为矩阵的特征值问题。 例1求矩阵A的特征值和特征向量,其中 401 解A的特征方程为 qp()=de(aI-A)=(-2)(2-1)-4]=0 求得A的特征值为 1=3,2=2,A3=-1, 对应于各特征值的特征向量分别为 0 n阶方阵A在复数域上有n个特征值(重特征值按重数计算)。当A为实矩阵时,复特 征值共轭成对出现 当n较大时,如果按展开行列式的办法先求出特征多项式q(),再求9(4)的根,最 后求相应的特征向量的话,计算工作量会非常大
158 * 特征值与特征向量 定义 1 (1)对 n 阶方阵 ( ) A a = ij n n ,称多项式 11 12 1 21 22 2 1 2 - - - - - - ( ) det( ) det - - - n n n n nn a a a a a a A a a a = − = 1 11 22 ( ) ( -2 ) n n nn a a a n − = − + + + + 的次数 的项 为 A 的特征多项式,方程 ( ) det( ) 0 = − = A (1.1) 为 A 的特征方程,特征方程的根为 A 的特征值。用 (A) 表示 A 的所有特征值的集合( k 重 特征值视为 k 个相同的特征值)。 (2)设 为 n 阶方阵 A 的特征值,则称齐次线性代数方程组 ( ) 0 − = A x (1.2) 的非零解 x 为 A 的对应于 的特征向量。 矩阵 A 的特征值问题就是求数 和非零向量 x ,使得 Ax = x . (1.3) 物理、力学和工程技术中的许多问题(如工程技术中求一个力学、结构或电学系统的固有或 自然频率)在数学上都归结为矩阵的特征值问题。 例 1 求矩阵 A 的特征值和特征向量,其中 1 0 1 1 2 2 4 0 1 A = . 解 A 的特征方程为 2 ( ) det( ) ( 2)[( 1) 4] 0 = − = − − − = A , 求得 A 的特征值为 3, 2, 1, 1 = 2 = 3 = − 对应于各特征值的特征向量分别为 1 2 3 1 0 1 5 , 1 , 1 2 0 -2 x x x = = = . n 阶方阵 A 在复数域上有 n 个特征值(重特征值按重数计算)。当 A 为实矩阵时,复特 征值共轭成对出现。 当 n 较大时,如果按展开行列式的办法先求出特征多项式 ( ) ,再求 ( ) 的根,最 后求相应的特征向量的话,计算工作量会非常大
其基本思想是:直接从矩阵A或其经过相似变换后得到的具有更简单形式的矩阵入手, 设计迭代过程,最后求得A的近似特征值和相应的特征向量 下面列出有关特征值及特征向量的若干结果。 定理1设A为方阵A的特征值,x为对应于A的特征向量,则 (1)对任意非零常数a,a为a4的特征值,且aAx=(a)x (2)对任意常数B,A-B为A-B的特征值,且(A-BD)x=(-B)x (3)对任意正整数k,为A的特征值,且Ax=x (4)若A为非奇异阵,则A≠0且x为A的特征值,且A-x=xlx 定理2设1,2,…,为方阵A=(an)xm的n个特征值(重特征值按重数计算,则 ∑λ=∑q,412…1=e4) 定理3若记A为方阵A的转置阵,则 定理4若A为分块上三角阵,即 A2…A2 其中每个对角块A均为方阵,则a(A)=Ua(41) 定理5若方阵A与B为相似阵(即存在非奇异阵P,使得B=PAP),则 (1)G(A)=(B); (2)若y是B的对应于特征值A的特征向量,则Py是A的对应于特征值λ的特征向 定理6(1)n阶实方阵A可对角化(即与对角阵相似)的充分必要条件是A有n个线 性无关的特征向量 (2)方阵A的对应于不同特征值的特征向量线性无关。 定理7若A为n阶实对称阵,则 (1)A的特征值均为实数; (2)A有n个线性无关的特征向量 (3)存在正交矩阵P(即P=P),使得
159 其基本思想是:直接从矩阵 A 或其经过相似变换后得到的具有更简单形式的矩阵入手, 设计迭代过程,最后求得 A 的近似特征值和相应的特征向量。 下面列出有关特征值及特征向量的若干结果。 定理 1 设 为方阵 A 的特征值, x 为对应于 的特征向量,则 (1)对任意非零常数 , 为 A 的特征值,且 Ax = ()x ; (2)对任意常数 , − 为 A − I 的特征值,且 (A− I)x = ( − )x ; (3)对任意正整数 k , k 为 k A 的特征值,且 k k A x x = ; (4)若 A 为非奇异阵,则 0 且 −1 为 1 A − 的特征值,且 A x x −1 −1 = 。 定理 2 设 1 2 , , , n 为方阵 A = aij nn ( ) 的 n 个特征值(重特征值按重数计算),则 1 2 1 1 , det( ) n n i ii n i i a A = = = = . 定理 3 若记 T A 为方阵 A 的转置阵,则 (A ) (A) T = . 定理 4 若 A 为分块上三角阵,即 11 12 1 22 2 m m mm A A A A A A A = , 其中每个对角块 Aii 均为方阵,则 m i A Aii 1 ( ) ( ) = = . 定理 5 若方阵 A 与 B 为相似阵(即存在非奇异阵 P ,使得 1 B P AP − = ),则 (1) (A) = (B) ; (2)若 y 是 B 的对应于特征值 的特征向量,则 Py 是 A 的对应于特征值 的特征向 量。 定理 6 (1) n 阶实方阵 A 可对角化(即与对角阵相似)的充分必要条件是 A 有 n 个线 性无关的特征向量; (2)方阵 A 的对应于不同特征值的特征向量线性无关。 定理 7 若 A 为 n 阶实对称阵,则 (1) A 的特征值均为实数; (2) A 有 n 个线性无关的特征向量; (3)存在正交矩阵 P (即 1 T P P − = ),使得
P AP= 从而4(=1,2,…,m)为A的特征值,P的列向量a(G=1,2,…,n)为A的对应于,的特征 向量 定理8对n阶实方阵A, (1)存在酉阵U(即U-1=UH=U1),使得 1hi2…n UAU (上三角阵), 其中r(=1,2,…,n)为A的特征值; (2)存在正交阵Q使得 RI R 其中R(=1,2,…,m)为1阶或2阶方阵,且每个1阶R为A的实特征值,每个2阶对角 线块R的两个特征值为A的两个共轭复特征值 ★特征值的估计及扰动问题 了解特征值在复平面上的分布以及对矩阵扰动的敏感性,对选择、设计求解特征值问题 的数值方法并提高方法的收敛速度具有重要的指导意义 对任何实方阵A=(an)xn,其特征值满足 A2≤|4‖ 其中4为A的任何范数,常见的有 4=max∑l 4l2=Vp(A),p(4)表示A的谱半径
160 1 2 T n P AP = , 从而 ( 1,2, , ) i i n = 为 A 的特征值, P 的列向量 ( 1,2, , ) j u j n = 为 A 的对应于 j 的特征 向量。 定理 8 对 n 阶实方阵 A , (1)存在酉阵 U (即 H T U =U =U −1 ),使得 11 12 1 22 2 n H n nn r r r r r U AU r = (上三角阵), 其中 ( 1,2, , ) ii r i n = 为 A 的特征值; (2)存在正交阵 Q 使得 11 12 1 22 2 m T m mm R R R R R Q AQ R = , 其中 ( 1,2, , ) R i m ii = 为 1 阶或 2 阶方阵,且每个 1 阶 Rii 为 A 的实特征值,每个 2 阶对角 线块 Rjj 的两个特征值为 A 的两个共轭复特征值。 * 特征值的估计及扰动问题 了解特征值在复平面上的分布以及对矩阵扰动的敏感性,对选择、设计求解特征值问题 的数值方法并提高方法的收敛速度具有重要的指导意义。 对任何实方阵 A = aij nn ( ) ,其特征值 满足 A , 其中 A 为 A 的任何范数,常见的有 1 max n ij i j A a = = , 1 1 max n ij j i A a = = , 2 ( ) T A A A = , ( ) A 表示 A 的谱半径
定义2设A=(an)m为实方阵,则称复平面上以a为中心,=∑为半径的圆 盘 D(0={4|-a≤,1=12,…n 为A的 Gerschgorin圆盘 定理9设A=(an)m为实方阵,则 (1)A的任一特征值必落在A的某个 Gerschgorin圆盘之中 (2)如果A的k个 Gerschgorin圆盘的并集S与其他圆盘不相连,则S内恰包含A的 k个特征值。特别地,孤立圆盘(即不与其他圆盘相连)恰包含A的1个特征值 证明仅就(1)给出证明。设4为A的特征值,x=(x1,x2,…,x)为对应于的特 征向量,则Ax=Ax的第i个方程为 air=nx, 或 (2-an)x=∑qx 不妨令=max,则x≠0(因x≠0),且 asl=ri 这表明λ落在第k个圆盘中。 例2估计矩阵A的特征值的范围,其中 201 015 解A的3个 Gerschgorin圆盘是 2|≤1 D2:{非+13} D 5≤1 其中D3为孤立圆盘,故恰好包含了1个特征值,并有估计 4≤A3≤6 而另外2个特征值和2则包含在D与D2的并集中。为获得和2的较准确的估计,现 对A作相似变换
161 定义 2 设 ( ) A a = ij n n 为实方阵,则称复平面上以 ii a 为中心, 1 n i ij j j i r a = = 为半径的圆 盘 D (A) z z a r, i 1,2, ,n, i = − ii i = (1.5) 为 A 的 Gerschgorin 圆盘。 定理 9 设 ( ) A a = ij n n 为实方阵,则 (1) A 的任一特征值必落在 A 的某个 Gerschgorin 圆盘之中; (2)如果 A 的 k 个 Gerschgorin 圆盘的并集 S 与其他圆盘不相连,则 S 内恰包含 A 的 k 个特征值。特别地,孤立圆盘(即不与其他圆盘相连)恰包含 A 的 1 个特征值。 证明 仅就(1)给出证明。设 为 A 的特征值, 1 2 ( , , , )T n x x x x = 为对应于 的特 征向量,则 Ax x = 的第 i 个方程为 1 , 1,2, , , n ij j i j a x x i n = = = 或 1 ( ) n ii i ij j j j i a x a x = − = . 不妨令 1 max k j j n x x = ,则 0 k x (因 x 0 ),且 1 1 , n n j kk kj kj k j j k j k j k x a a a r x = = − = 这表明 落在第 k 个圆盘中。 ■ 例 2 估计矩阵 A 的特征值的范围,其中 2 0 1 1 -1 2 0 1 5 A = . 解 A 的 3 个 Gerschgorin 圆盘是 1 2 3 : 2 1 , : 1 3 , : 5 1 , D z z D z z D z z − + − 其中 D3 为孤立圆盘,故恰好包含了 1 个特征值 3 ,并有估计 3 4 6 , 而另外 2 个特征值 1 和 2 则包含在 D1 与 D2 的并集中。为获得 1 和 2 的较准确的估计,现 对 A 作相似变换:
其中 201 B -1 B的3个 Gerschgorin圆盘为 D:{|=-21s} D:{非+% D:{-5% 都是孤立圆盘。故A的特征值分布为 ≤A≤3,1≤2≤3,≤λ≤3 定义3设A=(an)m为实方阵,非零向量x=(x1,x2…,x)∈R",则称 R(x) (Ax, x) xAx (1.6) (x, x) x'x 为矩阵A的关于向量x的 Rayleigh(雷利)商。 定理10设A为n阶实对称矩阵,其特征值排列次序为A≥A2≥…≥L,则 R(x) n,=min R(x) 证明由定理7,A是实数,且A有规范正交特征向量1,使得 (u;, ui )=8U 于是,对任何非零向量x∈R",有 从而 R(x) (Ax, x)i= ∑2∑a)∑ a2∑ax)∑ 推得n≤R(x)≤A1。特别地,若取x=1,则 R(1)=(Al12)=A1
162 1 B P AP − = , 其中 5 3 1 1 P = , 3 6 5 5 5 3 2 0 1 -1 0 5 B = . B 的 3 个 Gerschgorin 圆盘为: 1 9 2 5 5 3 3 : 2 1 , : 1 , : 5 , D z z D z z D z z − + − 都是孤立圆盘。故 A 的特征值分布为 14 4 10 20 5 5 3 3 1 2 3 − , 1 3, . 定义 3 设 ( ) A a = ij n n 为实方阵,非零向量 1 2 ( , , , )T n n x x x x R = ,则称 ( , ) ( ) ( , ) T T Ax x x Ax R x x x x x = = (1.6) 为矩阵 A 的关于向量 x 的 Rayleigh(雷利)商。 定理 10 设 A 为 n 阶实对称矩阵,其特征值排列次序为 1 2 n ,则 1 0 max ( ), n x R x R x = min ( ). 0 R x x x R n n = (1.7) 证明 由定理 7, i 是实数,且 A 有规范正交特征向量 i u ,使得 , ( , ) Au u u u i i i i j ij = = , i, j = 1,2, ,n. 于是,对任何非零向量 n x R ,有 1 n i i i x u = = , 从而 2 1 1 1 2 1 1 1 ( , ) ( , ) ( ) ( , ) ( , ) n n n i i i j j i i i j i n n n i i j j i i j i u u Ax x R x x x u u = = = = = = = = = , 推得 1 ( ) n R x 。特别地,若取 1 x u = ,则 1 1 1 1 R u Au u ( ) ( , ) = =
故有A1=maxR(x)。同理可证n=minR(x)。 下面考虑矩阵扰动对特征值的影响问题。 例3计算并比较n阶方阵A和B的特征值,其中 A B ≠0.E>0 E 解A的特征值(4)=a(n重特征值),B的特征值(B)=a+E"e j=1,2,…,n,其中i=√-1。于是,特征值的相对误差 A(B)-λ (4) 若取n=20,E=10-20,则当a=1、0.5和0.1时,相对误差分别达到10%、20%和100%。 由此可见,矩阵A的微小扰动(仅有元素an发生了微小变化)使得特征值发生了大的变化, 本例中,A的特征值对元素an1的扰动非常敏感 定理11( Bauer-Fike)设n阶方阵A可对角化,矩阵P使得 PAP=dag(41,2…)=A, (1.8) 则A经扰动后的矩阵A+E的特征值有估计式 min-列|≤P|Pl (1.9) 其中H为矩阵的p-范数(p≥1) 证明若μ∈o(A),则(1.9)自然成立。现设Hga(A),x是A+E的对应于的 特征向量,于是 (Al-A)x=Ex 从而 (山-A)Px=P-EPPx 推得 P-x=(u1-A-P-EPP-lx 于是 ku1-A)'l=max(u-2, )=(min,p-l 所以 163
163 故有 1 0 max ( ) n x R x R x = 。同理可证 0 min ( ) n n x R x R x = 。 ■ 下面考虑矩阵扰动对特征值的影响问题。 例 3 计算并比较 n 阶方阵 A 和 B 的特征值,其中 1 1 A = , 1 1 B = , 0, 0 . 解 A 的特征值 ( ) j A = ( n 重特征值), B 的特征值 n i j n j B e 1/ 2 / ( ) = + , j n =1, 2, , ,其中 i = −1 。于是,特征值的相对误差 n j j j A B A j e 1/ ( ) ( ) ( ) = = − . 若取 n = 20, 20 10− = ,则当 =1、0.5 和 0.1 时,相对误差分别达到 10%、20%和 100%。 由此可见,矩阵 A 的微小扰动(仅有元素 n1 a 发生了微小变化)使得特征值发生了大的变化, 本例中, A 的特征值对元素 n1 a 的扰动非常敏感。 定理 11(Bauer-Fike)设 n 阶方阵 A 可对角化,矩阵 P 使得 1 1 2, ( , , ) P AP diag n − = = , (1.8) 则 A 经扰动后的矩阵 A+ E 的特征值 有估计式 1 1 min i p p p i n P P E − − , (1.9) 其中 p 为矩阵的 p −范数( p 1 )。 证明 若 (A) ,则(1.9)自然成立。现设 (A) ,x 是 A+ E 的对应于 的 特征向量,于是 ( ) A E x x + = , 即 (I − A)x = Ex, 从而 ( ) , 1 1 1 I P x P EPP x − − − − = 推得 ( ) . 1 1 1 1 P x I P EPP x − − − − = − 于是 1 1 1 1 ( ) p p p p p p P x I P E P P x − − − − − . 由于 1 1 1 1 1 ( ) max ( ) (min ) i i p i n i n I − − − − = − = − , 所以
1s(minJu-2p-P-l Il mm-列4≤1|Pp叫E 若A为对称矩阵,则可选P为正交矩阵,这时P2=1,从而有如下推论 推论1若A为实对称方阵,为扰动矩阵A+E的特征值,则有 lu-asEll
164 1 1 1 1 (min )i p p p i n P P E − − − , 即 1 1 min i p p p i n P P E − − . ■ 若 A 为对称矩阵,则可选 P 为正交矩阵,这时 2 P =1 ,从而有如下推论: 推论 1 若 A 为实对称方阵, 为扰动矩阵 A+ E 的特征值,则有 2 ( ) min A E − . ■