第四章方阵的特征问题与相似对角化 本章所要讨论的矩阵特征问题,是指方阵的特征值与特征向量的有关问题, 它们是线性代数中重要的基本概念,不仅在线性代数体系中占有重要地位,而 且在工程技术领域(例如振动问题、稳定性问题)也具有重要的理论意义和应 用价值。 本章还将讨论矩阵相似于对角矩阵(即相似对角化)问题。这一工作的意 义在于:如能在一定条件下以对角矩阵代替一般方阵,会使某些工作得以简化。 第一节矩阵的特征值与特征向量 定义1对于n阶矩阵A=[am],把含有字母2的矩阵 λ-a1 -a12 AE-A= -a21 1-a22 一an 一a2 入-am 称为A的特征矩阵。 行列式E-A|的表达式w()是入的一个n次多项 式,称为A的特征多项式.方程W()=0称为A的特征方程,特征方程的根称 为A的特征值或特征根
2 第四章 方阵的特征问题与相似对角化 第一节 矩阵的特征值与特征向量 n n nn n n a a a a a a a a a 1 2 21 22 2 11 12 1 E A 定义1 对于n 阶矩阵A [a ij ] ,把含有字母 的矩阵 称为 A 的特征矩阵. 本章所要讨论的矩阵特征问题,是指方阵的特征值与特征向量的有关问题, 它们是线性代数中重要的基本概念,不仅在线性代数体系中占有重要地位,而 且在工程技术领域(例如振动问题、稳定性问题)也具有重要的理论意义和应 用价值。 本章还将讨论矩阵相似于对角矩阵(即相似对角化)问题。这一工作的意 义在于:如能在一定条件下以对角矩阵代替一般方阵,会使某些工作得以简化。 行列式 的表达式 是 的一个n次多项 式,称为 的特征多项式.方程 称为 的特征方程,特征方程的根称 为 的特征值或特征根. | E A| () A ()0 A A
矩阵的特征值是和所考虑的数域有关的.今后,在不加声明的 场合,总是在实数域上考虑矩阵的特征值. 例1矩阵A 的特征多项式为w(元)=(2-1)(九+2)九 0 特征值为九=1,入2=-2,元3=0. 由例1可见,对角矩阵的特征值就是主对角线上的诸元素. 设入是方阵A的一个特征值,(2)是A的特征多项式,则有 w(2)=0,即|2,E-A=0. 于是,入,E-A是降秩矩阵.从而,齐次线性方程组 (2,E-A)x=0 (1) 必有非零解.假设α是(1)的非零解,则有 Aa=九a, (2) 这样的列向量α称为特征向量
3 例1 矩阵 0 2 1 A 的特征多项式为 ( ) ( 1)( 2 ) ; 特征值为 1 2 3 1, 2, 0. 由例1可见,对角矩阵的特征值就是主对角线上的诸元素. 于是, 0 E A 是降秩矩阵.从而,齐次线性方程组 ( E A)x 0 0 (1) 必有非零解. 设 是方阵 的一个特征值, 是 的特征多项式,则有 ,即 . 0 () | | 0 ( ) 0 0E A 0 A A 假设α 是(1)的非零解,则有 Aα 0α , (2) 这样的列向量 α 称为特征向量. 矩阵的特征值是和所考虑的数域有关的.今后,在不加声明的 场合,总是在实数域上考虑矩阵的特征值.
定义2对于方阵A的特征值九。,若有非零向量使2成立, 则称a为矩阵A对应于特征值入的特征向量. 可以证明:方阵A的每一个特征向量只能对应于某一个确定的 特征值. 定理1对于方阵A,只要有数,及非零向量a使Aa=八a成立, 则,必是A的特征值,0必是A对应于特征值,的特征向量. 证由Aa=2,a知非零向量Q满足线性方程组(2,E-A)x=0, 既然该方程组有非零解,则其系数矩阵几,E-A必然是降秩的,于 是应有 九E-A=0, 可见几,是A的特征值.再由a满足Aa=,a,按定义2又知a为A 对应于特征值入。的特征向量.定理证毕
4 定义2 对于方阵 的特征值 ,若有非零向量 使(2)成立, 则称 为矩阵 对应于特征值 的特征向量. A 0 α α A 0 可以证明:方阵 的每一个特征向量只能对应于某一个确定的 特征值. A 定理1 对于方阵 ,只要有数 及非零向量 使 成立, 则 必是 的特征值, 必是 对应于特征值 的特征向量. A 0 α Aα 0α 0 A α A 0 证 由 知非零向量 满足线性方程组 , 既然该方程组有非零解,则其系数矩阵 必然是降秩的,于 是应有 Aα 0α α (0E A)x 0 0E A 0 | E A | 0, 可见 是 的特征值.再由 满足 ,按定义2又知 为 对应于特征值 的特征向量.定理证毕. 0 A α Aα 0α α A 0
对于方阵A,求其特征值与特征向量的方法步骤如下: i.写出A的特征矩阵几E-A,并计算A的特征多项式 w(九)=|元E-A ⅱ.在指明的数域内(如未明确指出,可以理解为实数域内),求 出W(2)=0的全部根,即A的全部特征值.记互异的特征值为 九1,九2,…,九,· i.对每一个兄,(i=1,2,…,t),求出齐次线性方程组 (2,E-A)x=0 (3) 的全部非零解,也就是A对应于特征值人的全部特征向量.通常是 求出(3)的一个基础解系51,52,…,5,于是A对应于特征值2,的全 部特征向量可表示为 k51+k52+…+k5, 其中k1,k2,…,k,是(所指明数域上)不同时为零的任意数组
5 对于方阵 A ,求其特征值与特征向量的方法步骤如下: i.写出 A 的特征矩阵E A ,并计算 A 的特征多项式 ( ) | E A | ii.在指明的数域内(如未明确指出,可以理解为实数域内),求 出 的全部根,即 的全部特征值.记互异的特征值为 . ( ) 0 A t , , , 1 2 iii.对每一个 ( ),求出齐次线性方程组 (3) 的全部非零解,也就是 对应于特征值 的全部特征向量.通常是 求出(3)的一个基础解系 ,于是 对应于特征值 的全 部特征向量可表示为 , 其中 是(所指明数域上)不同时为零的任意数组. i i 1, 2, , t ( E A) x 0 i A i s ξ ,ξ , ,ξ 1 2 A i s s k ξ k ξ k ξ 1 1 2 2 s k , k , , k 1 2
0 例2求矩阵A 3 0 的特征值和特征向量, 0 2 解A的特征多项式为 2+1 -1 0 w(2)=元E-A月 4 1-3 0=(-2)元-1)2 -1 0 1-2 可得A的实特征值为九1=2,几2=元3=1(二重). 对于2,=2,求解(几E-A)x=0,即 3 -1 0 0 -1 0 0 得基础解系51=(0,0,1) 于是,A对应于特征值入=2的全部特征向量为 k51(k为任意非零实数) 7
7 1 0 2 4 3 0 1 1 0 例2 求矩阵 A 的特征值和特征向量. 对于 求解 ,即 ( 0 , 0 , 1) 1 ξ 0 0 0 1 0 0 4 1 0 3 1 0 3 2 1 x x x 1 2, ( E A)x 0 1 得基础解系 1 1 k ξ 于是,A 对应于特征值 1 2 的全部特征向量为 ( 为任意非零实数). 1 k 解 A的特征多项式为 可得 的实特征值为 1 2 3 2, 1 2 1 1 0 ( ) | | 4 3 0 ( 2)( 1) . 1 0 2 E A A (二重).
对于,=1,求解(2,E-A)x=0,即 2 -1 -1 0 解得基础解系52=(L,2,-1) 于是,A对应于特征值22=1的全部特征向量为 k52(k2为任意非零实数). 3 2-1 例3求矩阵B= -2-2 2 的特征值和特征向量. 6-1 解 计算B的特征多项式 1-3 -2 4 -元 0 4 - )HE-B上 2 -5+ 9+9 2+2 -2 2 元+2 -2 0 元+2 2 -3 6 +1 -3 6 +1 2-2 6 2+1 =(-2)2(2+4), 8
8 对于 ,求解 ,即 0 0 0 1 0 1 4 2 0 2 1 0 3 2 1 x x x 解得基础解系 2 ξ (1, 2, 1). 1 (2E A)x 0 2 于是,A对应于特征值2 1的全部特征向量为 2 2 k ξ ( k 2为任意非零实数). 例3 求矩阵 3 6 1 2 2 2 3 2 1 B 的特征值和特征向量. 解 计算 的特征多项式 3 1 3 1 2 3 2 1 4 0 4 ( ) | | 2 2 2 2 2 2 0 2 2 3 6 1 3 6 1 2 6 1 ( 2) ( 4), r r c c E B B
可得B的特征值为,=元2=2,(二重),人3=-4, 对于2,=2,求解齐次线性方程组(亿E-B)x=0,得基础解系 -2 51= 52= 0 0 于是,B对应于特征值九,=2的全部特征向量为 k5,+k52(k,k2是不同时为零的任意实数) 对于入=-4,求解齐次线性方程组(2,E-B)x=0,得基础解系 53=(1,-2,3) 于是,B对应于特征值九2=4的全部特征向量为 k53(k为任意非零实数) 请仔细观察,例2、3中的两个矩阵的特征值和特征向量有那些相 同点,又有那些不同点?
9 可得 B 的特征值为 1 2 2 ,(二重), 3 4, 对于 1 2,求解齐次线性方程组 (1E B)x 0 ,得基础解系 1 0 1 , 0 1 2 1 2 ξ ξ 于是, 对应于特征值 的全部特征向量为 ( 是不同时为零的任意实数). B 2 1 1 1 2 2 k ξ k ξ 1 2 k , k 对于 3 4, 求解齐次线性方程组(3E B) x 0,得基础解系 (1, 2, 3) 3 ξ 于是, 对应于特征值 的全部特征向量为 ( 为任意非零实数). B 3 k 3 3 k ξ 2 4 请仔细观察,例2、3中的两个矩阵的特征值和特征向量有那些相 同点,又有那些不同点?
例4设矩阵A满足A2=A(这样的矩阵叫做幂等矩阵),证 明A的特征值只能是0或1. 证设2为A的任一特征值,a是A对应于几的特征向量.于是 a≠0,且有 Aa=入a 利用已知条件又可得 Aa=Aa=A0a)=1(Aa)=λ2a, 于是有 12a=1a, 即 (2-2)a=0, 因为,0≠0所以必有22-1=0,即2=0或几=1· 10
10 例4 设矩阵 满足 (这样的矩阵叫做幂等矩阵),证 明 的特征值只能是0或 1. A A A 2 A 证 设 为 的任一特征值, 是 对应于 的特征向量.于是 ,且有 A α A α 0 Aα λ α 利用已知条件又可得 Aα A α A α Aα α 2 2 (λ ) λ ( ) λ , , 于是有 λ α λ α 2 即 ( )α 0 2 . 因为 ,α 0 所以必有 2 0,即 0 或 1 .
在本节最后,我们来讨论矩阵特征多项式和特征值的一些简单 性质. 设n阶矩阵A=[a,】,则A的特征多项式为 2-41 -a12 -41n W(2)2E-A= -021 1-a22 (4) -anl -an2 -am 由行列式的定义可知,()的最高次项必取决于均布项 (2-a1)(2-a22)…(2-anm) (5) 由此可知, 1°n阶矩阵A的特征多项式w(2)是一个首项系数为1的n次 多项式 若设 M)=2”+C12"++G2+C, 并设A的全部特征值为入1,几2,…,n,则可证明如下结果:1
11 在本节最后,我们来讨论矩阵特征多项式和特征值的一些简单 性质. 设 n 阶矩阵 A [aij ] ,则 A 的特征多项式为 n n nn n n a a a a a a a a a 1 2 21 22 2 11 12 1 ( ) | E A| (4) 由行列式的定义可知, ()的最高次项必取决于均布项 ( a11 )( a22 )( ann ). (5) 若设 1 1 1 0 ( ) , n n n c c c 并设 A 的全部特征值为 1 , 2 , , n ,则可证明如下结果: 由此可知, 1° n 阶矩阵 A 的特征多项式 () 是一个首项系数为1的 n次 多项式.
2°C-1=-(a1+a2++am) 3°( =(-1)”|A5 4°1A=22…2m 具体证明如下:行列式(4)中异于(⑤)的任何一个均布项至少有一 个因子为某常数-a,,于是九-a,及九-a,都不再是该均布项的因 子.与(⑤)相比,该均布项最多只能是1的n-2次多项式. 因此,w(2)的2”-项系数Cm-1也仅取决于均布项(5).而(5)式乘开 后,入”-的系数显然是 -(a11+a22+…+amm), 故2°成立. 又C=O)H0E-AH-A=(-1)”|A即得3°. 最后,因为A的每一个特征值2都对应着y(2)中一个一次因式 (-2),所以A的特征多项式必可表示为 w(2)=(元-1)(2-元2)…(2-人n) 12
12 具体证明如下:行列式(4)中异于(5)的任何一个均布项至少有一 个因子为某常数 ,于是 及 都不再是该均布项的因 子.与(5)相比,该均布项最多只能是 的 次多项式. ij a ii a a jj n 2 2° 1 11 22 ( ); n nn c a a a 1 2 | | . A n 0 ( 1) | |; n 3° c A 4° 因此, 的 项系数 也仅取决于均布项(5).而(5)式乘开 后, 的系数显然是 () n 1 n1 c n1 11 22 ( ), nn a a a 故2°成立. 又 0 (0) |0 | | | ( 1) | | 即得3°. n c EA A A 最后,因为 A 的每一个特征值 都对应着 中一个一次因式 1 2 ( ) ( )( ) ( ), n i () ( ), i 所以 A 的特征多项式必可表示为