第五章 线性变换 上一章中介绍了线性空间的概念,本章将讨论线性空间之间的联系.它们之间的联系主要反映为线性空间 之间的映射,所以研究定义域和值域都是线性(子)空间的映射是数学分析的基本目标之一,其中最简单和最基 本的一类映射是线性变换 Linear Transformation.它也是线性代数中一个主要研究对象 5.1线性变换基本概念 先来讨论线性空间V到自身的映射,常称为V的一个变换用符号a表示,即σ:→V 5.1.1线性变换定义与性质 定义51.数域F上的n维线性空间V的一个变换a,对于V中的任意两个向量x,y和数c∈F,若满足下列条件: (1)a(x+y)=a(x)+a(y) (2)o(cx)=co(x) 则称σ为线性变换 例1.设V是数域F上的线性空间,给定c∈F定义变换σe:V→V,其中σ(x)=cx显然它满足线性变换定义 中的两个条件若c=1,则称a1为V上的恒等变换若c=0,则称o0为V上的零变换 例2.数域F上的n次多项式空间F]n,变换d/dx:Fln→Fln,是对F[x]n中的任意多项式求它导数即 +aIr+ anxn d/dr →a1+2a2x+ t na rn-I 显然d/dr满足线性变换的两个条件 例3.设f:R2→R2,其中 [n1n1],[x2v]和c∈R有 2(x1+x2) 3( )-2(+y) 2y2 y1 可见,∫是线性变换 例4.平面几何中的向量的旋转映射oe,即将向量d映射为绕原点逆时针旋转角后的向量d.它满足对任意 的d,b和常数c Go(a+6=00(+00 6), ao(ca)=coo (a) 因此旋转变换是线性变换
第五章 线性变换 上一章中介绍了线性空间的概念, 本章将讨论线性空间之间的联系. 它们之间的联系主要反映为线性空间 之间的映射, 所以研究定义域和值域都是线性(子)空间的映射是数学分析的基本目标之一, 其中最简单和最基 本的一类映射是线性变换(Linear Transformation). 它也是线性代数中一个主要研究对象. 5.1 线性变换基本概念 先来讨论线性空间 V 到自身的映射, 常称为V 的一个变换. 用符号σ表示, 即σ : V 7→ V . 5.1.1 线性变换定义与性质 定义 5.1. 数域F上的n维线性空间V 的一个变换σ, 对于V 中的任意两个向量x, y 和数c ∈ F, 若满足下列条件: (1) σ (x + y) = σ (x) + σ (y). (2) σ (cx) = cσ (x). 则称σ为线性变换. 例 1. 设V 是数域F上的线性空间, 给定c ∈ F定义变换σc : V 7→ V , 其中 σc (x) = cx, 显然它满足线性变换定义 中的两个条件. 若c = 1, 则称σ1为V 上的恒等变换, 若c = 0, 则称σ0为V 上的零变换. 例 2. 数域F上的n次多项式空间F[x]n, 变换d/dx : F[x]n 7→ F[x]n, 是对F[x]n中的任意多项式求它导数, 即 a0 + a1x + a2x 2 + · · · + anx n d/dx 7−→ a1 + 2a2x + · · · + nanx n−1 显然d/dx满足线性变换的两个条件. 例 3. 设 f : R 2 7→ R 2 , 其中 x y f 7−→ 2x 3x − 2y ∀ x1 y1 T , x2 y2 T和c ∈ R, 有 x1 + x2 y1 + y2 f 7−→ 2(x1 + x2) 3(x1 + x2) − 2(y1 + y2) = 2x1 3x1 − 2y1 + 2x2 3x2 − 2y2 c x1 y1 f 7−→ 2cx1 3cx1 − 2cy1 = c 2x1 3x1 − 2y1 可见, f是线性变换. 例 4. 平面几何中的向量的旋转映射 σθ, 即将向量~a映射为绕原点逆时针旋转θ角后的向量~a0 . 它满足对任意 的~a,~b和常数c. σθ ~a +~b = σθ (~a) + σθ ~b , σθ (c~a) = cσθ (~a) 因此旋转变换是线性变换. 1
(+o(b)-9(a (b 图51:旋转变换 帆5,单位向量门是镜面L的法向,即n⊥L,对任意向量它的镜像正为:正在法 三维几何空间中关于平面的镜像变换σ,就是以过原点的平面L为“镜面 向n上的投影的反射-(·n)n与在镜面L上的投影向量正一(x,n)之和,即 a:→x,其中=王-2(x·n)元 对任意向量式y和实数c有 σ(+刃=正+y-2[(x+·司n 图5.2:镜像变换 =+y-2(x.n)n-2(y·n)n=a()+a(y g(ci)= cT-2(ci.)i=c(I-2(E n)n)=co(E) σ是线性变换 设σ是线性空间V的任意线性变换,则具有下列性质 (1)对任意的v中元素x有(-x)=-0(x),及(0)=0 (2)线性变换保持线性组合或线性关系式不变 a(c1x1+c1x2+…+cnxn)=c1a(x1)+c20(x2)+…+cna( (3)线性相关的向量组经线性变换后仍保持线性相关 定义5.2.设σ是数域F上线性空间V的线性变换,则将下列两个集合 Ker(o)=N(o)=ixxEVAo(x)=0 m(o)=R(o)=yly 分别称为变换σ的核和σ的值域或像 定理511.设σ是数域F上线性空间V的线性变换,则Ker()和Im(a)是V的子空间 证:(1)Ker(o)和Im()均包含了0.所以它们非空 (2).加法封闭性 x,y∈Ker(),σ(x+y)=a(x)+σ(y)=0→x+y∈her(a) vy1,y2∈Im(o),3x1,x2∈V使得y1=a(x1),y2=a(x2) y1+y2=0(x1)+0(x2)=0(x1+x2)∈Im(o) (3).数乘封闭性,对c∈F x∈Ker(a),a(x)=c0(x)=c0=0→cx∈Ker(a) vy∈Im(a),丑x∈V使得y=a(x),则cy=c(x)=a(cx)∈Im(a) 例6.数域F上的n次多项式空间Fxn,设o=d/dr,则Ker()=F,Im(a)=Fn-1 定理5.12.数域F上的线性空间V的线性变换是一一映射,当且仅当Ker(o)={0}
~a ~a +~b ~b σθ(~a) σθ(~a) + σθ( ~b) σθ( ~b) 图 5.1: 旋转变换 例 5. 三维几何空间中关于平面的镜像变换σ, 就是以过原点的平面L为“镜面”, 单位向量~n是镜面L的法向, 即 ~n ⊥ L, 对任意向量~x 它的镜像x~0为: ~x在法 向~n上的投影的反射−(~x · ~n)~n与~x在镜面L上的投影向量~x − (~x · ~n)~n之和, 即 σ : ~x 7→ x~0 , 其中x~0 = ~x − 2 (~x · ~n) ~n 对任意向量 ~x, ~y 和实数c, 有 σ (~x + ~y) = ~x + ~y − 2 [(~x + ~y) · ~n] ~n = ~x + ~y − 2 (~x · ~n) ~n − 2 (~y · ~n) ~n = σ (~x) + σ (~y) σ (c~x) = c~x − 2 (c~x · ~n) ~n = c (~x − 2 (~x · ~n) ~n) = cσ (~x) σ是线性变换. ~n L ~x x~0 O ~x · ~n 图5.2: 镜像变换 设σ是线性空间V 的任意线性变换, 则具有下列性质: (1) 对任意的V 中元素x 有 σ (−x) = −σ (x), 及 σ (0) = 0. (2) 线性变换保持线性组合或线性关系式不变: σ (c1x1 + c1x2 + · · · + cnxn) = c1σ (x1) + c2σ (x2) + · · · + cnσ (xn) (3) 线性相关的向量组经线性变换后仍保持线性相关. 定义 5.2. 设σ 是数域F上线性空间V 的线性变换, 则将下列两个集合 Ker (σ) = N (σ) = x x ∈ V ∧ σ (x) = 0 Im (σ) = R (σ) = y y = σ (x), ∀x ∈ V (5.1) 分别称为变换σ的核和σ的值域或像. 定理 5.1.1. 设σ是数域F上线性空间V 的线性变换, 则Ker (σ)和Im (σ)是V 的子空间. 证: (1). Ker (σ) 和 Im (σ) 均包含了0, 所以它们非空. (2). 加法封闭性 ∀x, y ∈ Ker (σ), σ (x + y) = σ (x) + σ (y) = 0 ⇒ x + y ∈ Ker (σ) ∀y1, y2 ∈ Im (σ), ∃x1, x2 ∈ V, 使得y1 = σ (x1), y2 = σ (x2), ∴ y1 + y2 = σ (x1) + σ (x2) = σ (x1 + x2) ∈ Im (σ) (3). 数乘封闭性, 对∀c ∈ F ∀x ∈ Ker (σ), σ (cx) = cσ (x) = c0 = 0 ⇒ cx ∈ Ker (σ) ∀y ∈ Im (σ), ∃x ∈ V 使得y = σ (x), 则cy = cσ (x) = σ (cx) ∈ Im (σ) 例 6. 数域F上的n次多项式空间F[x]n, 设 σ = d/dx, 则Ker (σ) = F, Im (σ) = F[x]n−1. 定理 5.1.2. 数域F上的线性空间V 的线性变换σ是一一映射, 当且仅当Ker (σ) = {0}. 2
证:若是一一映射,设σ(x)=0,根据线性变换性质(1)x=0 反之,若Ker(a)={0},假设存在x1,x2∈V使得σ(x1)=σ(x2),则根据线性变换的条件,有 0=0(x1)-0(x2)=a(x1-x2) 因x1-x2∈Ker(a)即x1=x2,说明σ是单射的,同时σ:V→V,又是满射,因此a是一一映射 5.12线性变换的运算 定义5.3.设σ,T是数域F上线性空间V的任意线性变换,定义σ+τ为V→V的映射,且 x∈V,(σ+r)(x)=a(x)+T(x) 同时,对任意的c∈F,定义c是V→V的映射: vx∈V,(co)(x)=ca(x) 定义5.3给出了线性变换间的加法和数乘运算,根据定义易证线性变换的和与数乘也是线性变换即满足线 性变换的线性条件 对任意的x,y∈V和c,d∈F,有 (a+7)(x+y)=a(x+y)+r(x+y) g(x)+y)+T(x)+Ty (a+7)(x)+(a+r)(y) (co)(dx)= co(dx)=cdo(x)=dco(x)=d(co)(x) 关于线性空间V上线性变换定义集合L(V)={|是V的线性变换},则有 定理5.13.L(V)关于定义5.3中的线性变换间的加法和数乘构成线性空间. (留给读者证明) 定义54.设A是数域F上的线性空间,在A上定义“乘法”运算,用符号“”表示,事实上“”A×A→A.它使得 时A中的任意元素a,B,和数c∈F,满足以下条件 (1)“乘法”成立结合律即a·(B·)=(a·B) (2)A中存在元素e,使得e·a=a·e=a. (3)“乘法”成立分配律,即 a·(B+)=a:B+a:, (左分配律) (B+7)a=B.a+y·a (右分配率) (ca)·B=c(a·B)=a(c 则称A是数域F上的代数,而元素e称为A的恒等元 有时常用“1表示恒等元,但注意与数域F中的1的区别 定义55.对线性空间L(V)定义线性变换的“乘法”即vU,r∈L(V) (r(·) 定理5.14.设V是数域F上的线性空间,则L(V)是F上的代数
证: 若 σ是一一映射, 设 σ (x) = 0, 根据线性变换性质(1)x = 0. 反之, 若 Ker (σ) = {0}, 假设存在 x1, x2 ∈ V 使得 σ (x1) = σ (x2), 则根据线性变换的条件, 有 0 = σ (x1) − σ (x2) = σ (x1 − x2) 因 x1 − x2 ∈ Ker (σ) 即 x1 = x2, 说明 σ 是单射的, 同时σ : V 7→ V , 又是满射, 因此σ是一一映射. 5.1.2 线性变换的运算 定义 5.3. 设 σ, τ是数域F上线性空间V 的任意线性变换, 定义 σ + τ 为 V 7→ V 的映射, 且 ∀x ∈ V, (σ + τ ) (x) = σ (x) + τ (x) 同时, 对任意的c ∈ F, 定义 cσ 是 V 7→ V 的映射: ∀x ∈ V, (cσ) (x) = cσ (x) 定义5.3给出了线性变换间的加法和数乘运算, 根据定义易证线性变换的和与数乘也是线性变换,即满足线 性变换的线性条件: 对任意的x, y ∈ V 和c, d ∈ F, 有 (σ + τ ) (x + y) = σ (x + y) + τ (x + y) = σ (x) + σ (y) + τ (x) + τ (y) = (σ + τ ) (x) + (σ + τ ) (y) (cσ) (dx) = cσ (dx) = cdσ (x) = dcσ (x) = d (cσ) (x) 关于线性空间V 上线性变换定义集合L(V ) = σ σ是V 的线性变换 , 则有 定理 5.1.3. L(V )关于定义5.3中的线性变换间的加法和数乘构成线性空间. (留给读者证明) 定义 5.4. 设A是数域F上的线性空间, 在A上定义“乘法”运算, 用符号“·”表示, 事实上“·”: A × A 7→ A. 它使得 对A中的任意元素α, β, γ 和数c ∈ F, 满足以下条件: (1) “乘法”成立结合律, 即α · (β · γ) = (α · β) · γ; (2) A中存在元素e, 使得e · α = α · e = α. (3) “乘法”成立分配律, 即 α · (β + γ) = α · β + α · γ, (左分配律) (β + γ) · α = β · α + γ · α, (右分配率) (cα) · β = c (α · β) = α · (cβ) 则称A是数域F上的代数, 而元素e称为A的恒等元. 有时常用“1”表示恒等元, 但注意与数域F中的1的区别. 定义 5.5. 对线性空间L(V ) 定义线性变换的“乘法”, 即∀σ, τ ∈ L(V ), σ · τ = σ (τ (•)) 定理 5.1.4. 设V 是数域F上的线性空间, 则L(V )是F上的代数. 3
证:验证L(V)上关于线性变换的乘法满足定义54中的三个条件 (1)对V,T,丌∈L(V),有 (a·r)·丌=(a·T)(丌(·)=0((丌(·)=a(x:丌)(·)=σ·(T (2)L()中元素V上的恒等变换“1y”即为e,且对va∈V,满足1v:σ=σ·1v=σ,因此恒等变换 是L(V)的恒等元 (3)对v0,r,丌∈L(V),有 (r+丌)()=a((7+丌)(·)=a(7(·)+丌(·) =a(7()+a(丌(·)=(a·T)(·)+(a:丌)() 由此左分配律成立即a·(T+丌)=σ·T+σ·π.同理可证明右分配律成立 对vc∈F,0,T∈L(V,有 [(ca)·](·)=(co)(r(·)=co(x()=c(·T)() 从而,(co)·T=c(σ·T)成立.同理可证a·(r)=c() 综上所述,L(V)是F上的代数 例7.设0,为R2空间上的线性变换,分别定义如下 y 求a=[-32在变换a,T和r·a下的像 解:根据变换的定义先求出变换乘积 =((])=(2)=[D 将a代入,得变换口下的像为[25],在下的像为[-53 下面定义线性变换的幂运算,即对va∈L(V) 1v(V上的恒等变换) n∈N+ 根据L(V)上的乘法成立结合律,可证明L(V)上的幂运算成立指数律,即对vn,m∈N,有 对于数域F上的任意多项式 f(r) t alI+a2I"+.+anI 根据它,可定义线性变换的多项式 f()=a1v+a10+a202+…+anon 若σ是一一映射,则变换σ可逆,记为σ-1,又称它为σ的逆变换.显然,它们也是V→V的自同构映射.因而在σ可 的前提下,可定义它的负数次暴:o-n=(0-1) 因L(V)上的乘法一般不满足交换律,所以a,T∈L(V),一般a:T≠T·0,且(·r)≠σ"rn;若σ,T都可逆,则 有:(0r)-1=r-1·a-1;对于非零数k∈F有:(ka)-1=k-1-1(这些结论读者自行证明)
证: 验证L(V )上关于线性变换的乘法满足定义5.4中的三个条件: (1) 对 ∀σ, τ, π ∈ L(V ), 有 (σ · τ ) · π = (σ · τ ) (π (•)) = σ (τ (π (•))) = σ ((τ · π) (•)) = σ · (τ · π) (2) L(V )中元素V 上的恒等变换“1V ”即为e, 且对∀σ ∈ V , 满足 1V · σ = σ · 1V = σ, 因此恒等变换 是L(V )的恒等元. (3) 对∀σ, τ, π ∈ L(V ), 有 [σ · (τ + π)] (•) = σ ((τ + π) (•)) = σ (τ (•) + π (•)) = σ (τ (•)) + σ (π (•)) = (σ · τ ) (•) + (σ · π) (•) 由此左分配律成立,即 σ · (τ + π) = σ · τ + σ · π. 同理可证明右分配律成立. 对∀c ∈ F, σ, τ ∈ L(V ), 有 [(cσ) · τ ] (•) = (cσ) (τ (•)) = cσ (τ (•)) = c (σ · τ ) (•) 从而, (cσ) · τ = c (σ · τ )成立. 同理可证 σ · (cτ ) = c (σ·). 综上所述, L(V )是F上的代数. 例 7. 设σ, τ为R 2空间上的线性变换, 分别定义如下: ∀ x y ∈ R 2 , σ x y = x x − y , τ x y = y x 求 α = −3 2 T 在变换 σ · τ 和τ · σ 下的像. 解: 根据变换的定义先求出变换乘积, σ · τ = σ τ x y = σ y x = y y − x τ · σ = τ σ x y = τ x x − y = x − y x 将α代入, 得变换σ · τ下的像为 2 5 T , 在τ · σ下的像为 −5 3 T . 下面定义线性变换的幂运算, 即对∀σ ∈ L(V ) σ 0 = 1V (V 上的恒等变换) σ n+1 = σ n · σ, n ∈ N + 根据L(V )上的乘法成立结合律, 可证明L(V )上的幂运算成立指数律, 即对∀n, m ∈ N, 有 σ n · σ m = σ n+m, (σ n ) m = σ nm (5.2) 对于数域F上的任意多项式: f(x) = a0 + a1x + a2x 2 + · · · + anx n 根据它, 可定义线性变换的多项式: f(σ) = a01V + a1σ + a2σ 2 + · · · + anσ n 若σ是一一映射, 则变换σ可逆, 记为σ −1 , 又称它为σ的逆变换. 显然, 它们也是V 7→ V 的自同构映射. 因而在σ可 逆的前提下, 可定义它的负数次幂:σ −n = σ −1 n . 因L(V )上的乘法一般不满足交换律, 所以 σ, τ ∈ L(V ), 一般 σ · τ 6= τ · σ, 且 (σ · τ ) n 6= σ nτ n; 若σ, τ都可逆, 则 有:(σ · τ ) −1 = τ −1 · σ −1 ; 对于非零数k ∈ F有: (kσ) −1 = k −1σ −1 .(这些结论读者自行证明) 4
52线性变换与矩阵 下面研究线性变换与矩阵之间的关系 521线性变换的矩阵表示 设V是数域F上的n维线性空间,9={1,=2,…,n}是V的基,则对x∈V可表示成x=∑s,考 察V上的线性变换a有 Tio(Ei) 可见,V中任意向量在线性变换下的像可表示为V中的基在线性变换下的像的线性组合因是V到V的线性变 换,因此a(E)(=1,2,,n)在基9下可表示成 [o()σ(=2)…a(sn)]=[e1e2 a21a22 上式中矩阵的第列向量a,事实上是(=)在基下的坐标,按上一章中坐标的记法,如向量x在基下的 坐标表示为区x]g,可将矩阵[]记为[o(g,则V中任意向量x经线性变换a后的像可表示成 a(x)=0[a(9{x]9 (54) 由式(54)可知,当V选定基以后,V上的线性变换与矩阵[(2)9对应.由任意向量在基下表示的唯一性,线 性变换对应的矩阵[(是唯一的.反之,对于n阶方阵A∈Fx是否唯一对应一个线性变换?下述定理 说明结论是成立的 定理5.2.1.数域F上的n维线性空间V,对A∈Fnxn都存在V上唯一的线性变换与之对应 证:设9={=1,E2,…,n}是线性空间V的基,对vA∈F按下列方式构造一组向量 其中a;为矩阵A的第j列向量,从向量构造形式看就是将矩阵A的第j列向量视作a;在基9下的坐标 由坐标的唯一性可知,向量组a(=1,2,…,n)由矩阵A唯一确定.同时,对V的任意向量x,在基下 的坐标表示为区x]ys,即x=区x]现定义V上的变换a,它满足下列条件,对vx∈V有 (x)=[ C1 (2 J x]o=2A(x (5.6) 利用[]9是V上的同构映射,对x,y∈V,有 d(x+y)=[ an]((xlg+[ylg)=a(x)+o(y) 同理,对vk∈F, (kx)=[ a1 (2 就证明了σ是V上的线性变换若令x=则区x]9=e,根据定义式(56)有a(=)=ay同样根据 式(56)可知这种对应关系是唯一的 定理5.2.2.数域F上n维线性空间V的所有线性变换构成的线性空间L(V),则L(V)和Fxn同构 根据本节开始的叙述,在选取V的基后,存在一种L(V)到Fnxn的一种一一对应关系,只需证明这种对应关 系同时对线性变换的加法、数乘、乘法和矩阵的加法、数乘、乘法之间满足线性条件.详细证明留作练习 例8.分别求例14中线性变换对应的矩阵
5.2 线性变换与矩阵 下面研究线性变换与矩阵之间的关系. 5.2.1 线性变换的矩阵表示 设V 是数域F上的n维线性空间, B = {ε1, ε2, . . . , εn} 是V 的基, 则对∀x ∈ V 可表示成 x = Xn i=1 xiεi , 考 察V 上的线性变换 σ 有: σ (x) = Xn i=1 xiσ (εi) 可见, V 中任意向量在线性变换下的像可表示为V 中的基在线性变换下的像的线性组合. 因σ是V 到V 的线性变 换, 因此σ (εi)(i = 1, 2, . . . , n) 在基B下可表示成 σ (ε1) σ (ε2) · · · σ (εn) = ε1 ε2 · · · εn a11 a12 · · · a1n a21 a22 · · · a2n . . . . . . . . . . . . an1 an2 · · · ann (5.3) 上式中矩阵[aij ]的第j列向量aj事实上是σ (εj )在基 B下的坐标, 按上一章中坐标的记法, 如 向量x在基B下的 坐标表示为 [x]B, 可将矩阵[aij ] 记为 [σ (B)]B, 则V 中任意向量x 经线性变换 σ后的像可表示成: σ (x) = B [σ (B)]B [x]B (5.4) 由式(5.4)可知, 当V 选定基B以后, V 上的线性变换与矩阵 [σ (B)]B对应. 由任意向量在基下表示的唯一性, 线 性变换σ对应的矩阵[σ (B)]B是唯一的. 反之, 对于n阶方阵A ∈ F n×n 是否唯一对应一个线性变换? 下述定理 说明结论是成立的. 定理 5.2.1. 数域F上的n维线性空间V , 对∀A ∈ F n×n 都存在V 上唯一的线性变换与之对应. 证: 设 B = {ε1, ε2, . . . , εn} 是线性空间V 的基, 对∀A ∈ F n×n 按下列方式构造一组向量 αj = Baj , j = 1, 2, . . . , n (5.5) 其中 aj为矩阵A的第j列向量, 从向量构造形式看就是将矩阵A的第 j 列向量视作 αj 在基B下的坐标. 由坐标的唯一性可知, 向量组αj (j = 1, 2, . . . , n)由矩阵A唯一确定. 同时, 对V 的任意向量x, 在基B下 的坐标表示为[x]B, 即x = B [x]B. 现定义V 上的变换σ, 它满足下列条件, 对∀x ∈ V 有 σ (x) = α1 α2 · · · α3 [x]B = BA [x]B (5.6) 利用[•]B是V 上的同构映射, 对∀x, y ∈ V , 有 σ (x + y) = α1 α2 · · · αn [x + y]B = α1 α2 · · · αn ([x]B + [y]B) = σ (x) + σ (y) 同理, 对∀k ∈ F, σ (kx) = α1 α2 · · · αn [kx]B = k α1 α2 · · · αn [x]B = kσ (x) 这就证明了 σ 是V 上的线性变换. 若令x = εj , 则[x]B = ej , 根据定义式(5.6)有 σ (εj ) = αj . 同样根据 式(5.6)可知这种对应关系是唯一的. 定理 5.2.2. 数域F上n维线性空间V 的所有线性变换构成的线性空间L(V ), 则 L(V )和F n×n 同构. 根据本节开始的叙述, 在选取V 的基后, 存在一种L(V )到F n×n的一种一一对应关系, 只需证明这种对应关 系同时对线性变换的加法、数乘、乘法和矩阵的加法、数乘、乘法之间满足线性条件. 详细证明留作练习. 例 8. 分别求例1—4中线性变换对应的矩阵. 5
解:(1)对例1定义的线性变换σ,取V的基={1,E2,…,En},则有 [o(1)o(2)…a(=n)]=[c1c2 CEn=BcE 对应矩阵为cE (2).选取空间F]n的基为={1,x,x2,…,x},则 d 0 =9D 0 则D为线性变换d/dx对应的矩阵 (3).取 0 0 为R2的基,在线性变换∫下有 0 则矩阵f为线性变换∫对应的矩阵 取二维几何空间中的标准正交向量,为基,实施旋转变换oe后 为2,了(如图) o((]=[j cos 6 ng cos e 小节建立了线性变换与矩阵之间的联系,即线性变换与矩阵之间一一对应,从而可通过矩阵工具来研究 线性变换 522线性变换在不同基下的矩阵间的关系 上一小节讨论了线性空间V中的任意线性变换在选定基以后与矩阵唯一对应本节将讨论若选择不同的 基,则与线性变换相应的矩阵之间有怎样的关系? 定理523.设仍1= an}和92={B1,B2,…,Bn}为数域F上的n维线性空间V的两个基,σ为V 上的任意线性变换,则在两个基下对应的矩阵[(1)9,[u(2),之间成立下列关系 (1)g,=M[(四2月9,M (5.8) 其中M是基92到91的过渡矩阵 证:Wx∈V,根据式(54),在基1,2下有 (x)=91(51)s2xm1=52(032)g2x8 由M为92到1的过渡矩阵,有91M1=92及两个基下坐标之间转换关系区x],=M区xg,将它 们代入上式中,得 91{(1)g2xgs1=01M-(2)s2Mxg1 由91为V的基和向量x的任意性,得到
解: (1) 对例1定义的线性变换σ, 取V 的基B = {ε1, ε2, . . . , εn}, 则有 σ (ε1) σ (ε2) · · · σ (εn) = cε1 cε2 · · · cεn = BcE 对应矩阵为cE. (2). 选取空间F[x]n的基为 B = 1, x, x2 , · · · , xn ,则 d dx (1) d dx (x) d dx x 2 · · · d dx (x n ) = 1 x x2 · · · x n 0 1 0 · · · 0 . . . 0 2 · · · 0 . . . . . . . . . . . . . . . 0 0 · · · 0 n 0 0 · · · · · · 0 = BD 则D为线性变换d/dx对应的矩阵. (3). 取B = 1 0 , 0 1 为 R 2的基, 在线性变换f下有 f 1 0 f 1 0 = 1 0 0 1 2 0 3 −2 = Bf 则矩阵f为线性变换f对应的矩阵. (4). ~i ~j ~i 0 ~j 0 θ 取 二 维 几 何 空 间 中 的 标 准 正 交 向 量~i,~j为 基, 实 施 旋 转 变 换σθ后 为~i 0 ,~j 0 (如图) h σθ ~i σθ ~j i = ~i ~j cos θ − sin θ sin θ cos θ (5.7) 这小节建立了线性变换与矩阵之间的联系, 即线性变换与矩阵之间一一对应, 从而可通过矩阵工具来研究 线性变换. 5.2.2 线性变换在不同基下的矩阵间的关系 上一小节讨论了线性空间V 中的任意线性变换在选定基以后与矩阵唯一对应. 本节将讨论若选择不同的 基, 则与线性变换相应的矩阵之间有怎样的关系? 定理 5.2.3. 设B1 = {α1, α2, . . . , αn} 和 B2 = {β1, β2, . . . , βn} 为数域F上的n维线性空间V 的两个基, σ 为 V 上的任意线性变换, 则σ在两个基下对应的矩阵[σ (B1)]B1 , [σ (B2)]B2之间成立下列关系: [σ (B1)]B1 = M−1 [σ (B2)]B2 M (5.8) 其中M是基B2到B1的过渡矩阵. 证: ∀x ∈ V , 根据式(5.4), 在基B1, B2 下有 σ (x) = B1 [σ (B1)]B1 [x]B1 = B2 [σ (B2)]B2 [x]B2 由M 为B2到B1的过渡矩阵, 有B1M−1 = B2 及两个基下坐标之间转换关系 [x]B2 = M[x]B1 , 将它 们代入上式中, 得 B1 [σ (B1)]B1 [x]B1 = B1M−1 [σ (B2)]B2 M[x]B1 由B1为V 的基和向量x的任意性, 得到 [σ (B1)]B1 = M−1 [σ (B2)]B2 M 6
定义56.设A,B∈FnXn,若存在可逆矩阵P∈FXn使得 PAP=B 则称矩阵A相似于B,记为A~B 将相似视作Fnxn上矩阵之间的关系,它具有下述性质:A,B,C∈Fnx (1)自反性,设E为F上的单位矩阵,使得E-1AE=A,即A~A 2)对称性若A~B,则存在可逆矩阵P使得PAP=B,而A=(P1)BP-,即B~A (3)传递性,若A~B,B~C,则存在可逆矩阵P,Q,使得P-1AP=B和Q-1BQ=C,则 (PQ)-A(PQ)=C.即A~C 因此矩阵的相似关系是FnXm上的一种等价关系.如果不考虑线性变换的基的选择,则一个线性变换对 应Fn×中的一个相似等价类 例9.设1={=1,E2,E3}和92={m,m,m3}为线性空间R3的两个基,从01到B2的过渡矩阵M为 即92=男1M R3上线性变换在基91的矩阵为 (1)s1=320 123 求a在基92下对应的矩阵 解因(1)g1=M(92)lg2M-1,所以 100 0-11「1001「0-1-1 (92)2=110 320 10 531 例10.面上的旋转变换在标准正交基B1={(下的矩阵如式57所示基2={,其中=+ b=1-2j,求旋转变换在基92下的矩阵 解:根据题意有:92=91M,其中 e(2)s2=M(2)22M 1「2 1「3cos-sin65sin 2sin6 3 cos 6+ sin 0 上述建立了同一变换在不同基下的矩阵表示之间的相似关系.反之,两个相似的矩阵也可以理解为 性变换在不同基下的表示.对于一个线性变换σ,如何寻找适当的基,使得它在这组基下的矩阵表示具有间单的 形式,这将是下一节讨论的问题 53特征值和特征向量 5.31不变子空间 利用线性变换可生成子空间,如线性变换的核和像.反之,与子空间相关的线性变换也会提供一些重要信 息,例如:哪些子空间在线性变换下的具有不变性.下面先给出不变子空间的定义
定义 5.6. 设A, B ∈ F n×n, 若存在可逆矩阵P ∈ F n×n使得 P −1AP = B (5.9) 则称矩阵A相似于B, 记为A ∼ B 将相似视作F n×n上矩阵之间的关系, 它具有下述性质:∀A, B, C ∈ F n×n (1) 自反性, 设E为F上的单位矩阵, 使得E−1AE = A, 即A ∼ A. (2) 对称性, 若A ∼ B, 则存在可逆矩阵P, 使得P−1AP = B, 而A = P−1 −1 BP−1 , 即 B ∼ A. (3) 传递性, 若A ∼ B, B ∼ C, 则存在可逆矩阵 P, Q, 使得 P−1AP = B 和Q−1BQ = C, 则 (PQ) −1 A (PQ) = C, 即 A ∼ C. 因此矩阵的相似关系是F n×n上的一种等价关系. 如果不考虑线性变换的基的选择, 则一个线性变换对 应F n×n中的一个相似等价类. 例 9. 设B1 = {ε1, ε2, ε3} 和 B2 = {η1, η2, η3} 为线性空间R 3的两个基, 从B1到B2的过渡矩阵M为 M = 1 0 0 1 1 0 1 1 1 , 即 B2 = B1M R 3上线性变换σ在基B1的矩阵为 [σ (B1)]B1 = 1 0 −1 3 2 0 −1 2 3 求σ在基B2下对应的矩阵. 解: 因[σ (B1)]B1 = M[σ (B2)]B2 M−1 , 所以 [σ (B2)]B2 = 1 0 0 1 1 0 1 1 1 −1 1 0 −1 3 2 0 −1 2 3 1 0 0 1 1 0 1 1 1 = 0 −1 −1 5 3 1 −1 3 3 例 10. 平面上的旋转变换在标准正交基B1 = n ~i,~j o 下的矩阵如式(5.7)所示, 基B2 = n ~a,~b o , 其中 ~a = ~i + ~j, ~b =~i − 2~j, 求旋转变换在基B2下的矩阵. 解: 根据题意有: B2 = B1M, 其中 M = 1 1 1 −2 则 [σθ (B2)]B2 = M−1 [σθ (B2)]B2 M = 1 3 2 1 1 −1 cos θ − sin θ sin θ cos θ 1 1 1 −2 = 1 3 3 cos θ − sin θ 5 sin θ −2 sin θ 3 cos θ + sin θ 上述建立了同一变换在不同基下的矩阵表示之间的相似关系. 反之, 两个相似的矩阵也可以理解为同一线 性变换在不同基下的表示. 对于一个线性变换σ, 如何寻找适当的基, 使得它在这组基下的矩阵表示具有间单的 形式, 这将是下一节讨论的问题. 5.3 特征值和特征向量 5.3.1 不变子空间 利用线性变换可生成子空间, 如线性变换的核和像. 反之, 与子空间相关的线性变换也会提供一些重要信 息, 例如: 哪些子空间在线性变换下的 具有不变性. 下面先给出不变子空间的定义. 7
定义57.设σ是线性空间V上的线性变换,S是V的子空间,若S在变换σ下的像a(S)S,则称S是σ不变子 例11.线性变换a的核五er(o)和像Im()是σ-不变子空间 例12.设是V上的数乘变换,即存在常数c0(x)=cx,则V的任意子空间均是a-不变子空间 定理531.S是n维线性空间V上线性变换σ的不变子空闻,设S的基为9s={=1,∈2,…,Er}(0<r<n).将它 扩充成V的基v={=1,e2,…,Er,Er+1,…,En}=[9sg],则在基v下的矩阵具有下列形状 a11a12 a1(r+1) arr ar(r+1) 0a(r+1(x+1) 00 证:因S是a的不变子空间,则 a(1)a(e2) (=r)]=98 (=r)]=[s|9E 其中 a11 aIr 1(7+1) a(r+1)(r+1) A1= an(r+1) 则 [a(1) 0 A 反之,若矩阵具有式(5.10)形式,因矩阵与线性变换之间一一对应,则与该矩阵对应的线性变换必存在不变 子空间 推论1.设V=V⊕V且V1,V都是线性变换的不变子空间,若V的基为1={a1,a2,…,ar},V2的基 为2={B1,B2,…,Bn-r},则在基={51,92}下的矩阵形式为 类似定理53.1即可证明 例1.口为R的线性换在基9={,2下的变换矩阵为22-1今=2=日1+2+23 且S=span{B1,B2}.求证:S是变换o的不变子空间 证:易证,B1,B2线性无关,构成S的一组基 31-1 0 (61)=9(9)s1ls=922-10= B2∈S 220 0()=(91B2=22-11 262∈S 220 对vx∈S,x=x1B1+x2B2,则 a(x)=x10(1)+x2a(B2)=2x11+(2x2-x1)B2∈S 因此S是a不变子空间 下面讨论在给定线性变换对应的矩阵后,如何寻找它的不变子空间
定义 5.7. 设σ是线性空间V 上的线性变换, S 是V 的子空间, 若S在变换σ下的像 σ (S) ⊆ S, 则称 S 是σ-不变子 空间. 例 11. 线性变换σ的核Ker (σ) 和像Im (σ) 是 σ-不变子空间. 例 12. 设σ是V 上的数乘变换, 即存在常数c, σ (x) = cx, 则V 的任意子空间均是σ-不变子空间. 定理 5.3.1. S是n维线性空间V 上线性变换σ的不变子空间, 设S的基为BS = {ε1, ε2, . . . , εr}(0 < r < n), 将它 扩充成V 的基BV = {ε1, ε2, . . . , εr, εr+1, . . . , εn} = BS BE , 则σ在基BV 下的矩阵具有下列形状: a11 a12 · · · a1r a1(r+1) · · · a1n · · · · · · · · · · · · · · · · · · · · · ar1 ar2 · · · arr ar(r+1) · · · arn 0 0 · · · 0 a(r+1)(r+1) · · · · · · · · · · · · · · · · · · · · · · · · · · · 0 0 · · · 0 an(r+1) · · · ann (5.10) 证: 因S是σ的不变子空间, 则 σ (ε1) σ (ε2) · · · σ (εr) = BSAS σ (εr+1) · · · σ (εr) = BS BE A1 A2 其中 As = a11 · · · a1r · · · · · · · · · ar1 · · · arr , A1 = a1(r+1) · · · a1n · · · · · · · · · ar(r+1) · · · arn , A2 = a(r+1)(r+1) · · · a(r+1)n · · · · · · · · · an(r+1) · · · ann , 则 σ (ε1) · · · σ (εr) σ (εr+1) · · · σ (εn) = BS BE AS A1 0 A2 反之, 若矩阵具有式(5.10)形式, 因矩阵与线性变换之间一一对应, 则与该矩阵对应的线性变换必存在不变 子空间. 推论 1. 设V = V1 ⊕ V2且V1, V2都是线性变换σ的不变子空间, 若V1的基为B1 = {α1, α2, . . . , αr}, V2的基 为B2 = {β1, β2, . . . , βn−r}, 则σ 在基B = {B1, B2} 下的矩阵形式为 A1 0 0 A2 (5.11) 类似定理5.3.1即可证明. 例 13. σ为R 3的线性变换, 在基B = {ε1, ε2, ε3}下的变换矩阵为 3 1 −1 2 2 −1 2 2 0 , 令β1 = ε3,β2 = ε1 + ε2 + 2ε3, 且 S = span {β1, β2}. 求证: S是变换σ的不变子空间. 证: 易证, β1, β2线性无关, 构成S的一组基. σ (β1) = B [σ (B)]B [β1]B = B 3 1 −1 2 2 −1 2 2 0 0 0 1 = B −1 −1 0 = 2β1 − β2 ∈ S σ (β2) = B [σ (B)]B [β2]B = B 3 1 −1 2 2 −1 2 2 0 1 1 2 = B 2 2 4 = 2β2 ∈ S 对∀x ∈ S, x = x1β1 + x2β2, 则 σ (x) = x1σ (β1) + x2σ (β2) = 2x1β1 + (2x2 − x1)β2 ∈ S 因此S是σ-不变子空间. 下面讨论在给定线性变换对应的矩阵后, 如何寻找它的不变子空间. 8
532特征值与特征向量 后续的讨论中若无特殊交代,数域F取实数域R.设n维欧式空间R的某个线性变换在选定基下(如自然基 e2,,en)对应的矩阵为A∈Rn,若S是a-不变子空间,则对x∈S,有σ(x)∈S.特别地当dimS=1时, 有a(x)=Ax,其中A∈R.关于如何求线性变换的不变子空间有如下定义 定义5.8.设σ是数域F上线性空间V的一个线性变换,存在某个数∈F和x∈V,且x≠0.,使得 则称λ为线性变换σ的一个特征值,而称x为关于特征值λ的特征向量 将a关于特征值入的所有特征向量和零向量构成的集合记为VA,即 V={xx∈vAa(x)=Xx} 则关于V有下列性质 定理53.2.由式(5.13)定义的V是V的线性子空间,而且是σ-不变子空间 证:考察线性空间V的加法与数乘在V入上的封闭性,即对x,y∈认和c∈F,有 o(x+y)=o(x)+o(y)=A(x+y)EVA a(cx)=c(x)=A(∞x)∈ 可见V中元素关于加法和数乘是封闭的,因此它是V的子空间.另外,V中任意向量在变换a下的像还 是属于V,即V是a-不变子空间 通常将称为线性变换σ的特征子空间 例14.例5中的镜像变换σ,其中平面L中的点构成a对应特征值为1的不变子空间.而过原点与法向n平行的直 线上的点构成特征值为-1的σ-不变子空间 接下来讨论:给定一个线性变换,如何求它的特征值和特征向量? 根据本章第2节的结论,当n维线性空间V选定一个基后,V上的线性变换与矩阵一一对应,线性变换σ在 基9={=1,E2,……,En}下对应矩阵为[()9s,根据特征值和特征向量的定义,有 2()9x]9=A区x]9 为方便起见,令A=[()]9,而特征向量在基下的坐标用向量X表示,即X=区x],由此得到特征值、特征 向量坐标必须满足下列方程 AX=AX 移项后得 (AE-A)X=0.X≠0 由齐次线性方程组的解理论知,方程组(515)有非零解x≠0,当且仅当rank(E-A)<n或 det(E-A)=0 也就是若入是线性变换的特征值,则它必须满足方程(5.16).将入视作未知量,用f(入)表示行列式det(AE-A) 则称f(入)为矩阵A的特征多项式而f(A)=0的根称为特征根,它们就是矩阵A的特征值 关于特征多项式f()有下述性质: 1)线性变换a的特征多项式f()与基的选择无关 证:因线性变换在不同基下对应矩阵之间的有相似关系(定理523),设在两组不同基下对应的矩阵分 别为A和B,则存在一个可逆矩阵(两个基之间的过渡矩阵)P使得P-AP=B,则 fB(a)=det(AE-B)=det(aP-iP-P-aP)=detP-(E-A)P det(p-)det(P)det(AE-A)=det(AE-A)=fA(A)
5.3.2 特征值与特征向量 后续的讨论中若无特殊交代, 数域F取实数域R. 设n维欧式空间R n的某个线性变换在选定基下(如自然基 e1, e2, . . . , en)对应的矩阵为A ∈ R n×n, 若S是σ-不变子空间, 则对 ∀x ∈ S, 有 σ (x) ∈ S. 特别地当dim S = 1时, 有 σ (x) = λx, 其中λ ∈ R. 关于如何求线性变换的不变子空间有如下定义. 定义 5.8. 设σ是数域F上线性空间V 的一个线性变换, 存在某个数λ ∈ F和x ∈ V , 且x 6= 0, 使得 σ (x) = λx (5.12) 则称λ为线性变换σ的一个特征值, 而称x为关于特征值λ的特征向量. 将σ关于特征值λ的所有特征向量和零向量构成的集合记为Vλ, 即 Vλ = x x ∈ V ∧ σ (x) = λx (5.13) 则关于Vλ有下列性质: 定理 5.3.2. 由式(5.13)定义的Vλ是V 的线性子空间, 而且是σ-不变子空间. 证: 考察线性空间V 的加法与数乘在Vλ上的封闭性, 即对∀x, y ∈ Vλ和c ∈ F, 有 σ (x + y) = σ (x) + σ (y) = λ (x + y) ∈ Vλ σ (cx) = cσ (x) = λ (cx) ∈ Vλ 可见Vλ中元素关于加法和数乘是封闭的, 因此它是V 的子空间. 另外, Vλ中任意向量在变换σ下的像还 是属于Vλ, 即Vλ是σ-不变子空间. 通常将Vλ 称为线性变换σ的特征子空间. 例 14. 例5中的镜像变换σ, 其中平面L中的点构成σ对应特征值为1的不变子空间. 而过原点与法向 ~n平行的直 线上的点构成特征值为−1的σ-不变子空间. 接下来讨论: 给定一个线性变换, 如何求它的特征值和特征向量? 根据本章第2节的结论, 当n维线性空间V 选定一个基后, V 上的线性变换与矩阵一一对应, 线性变换σ 在 基B = {ε1, ε2, . . . , εn}下对应矩阵为[σ (B)]B, 根据特征值和特征向量的定义, 有 B [σ (B)]B [x]B = λB [x]B 为方便起见, 令A = [σ (B)]B, 而特征向量在基B下的坐标用向量X表示, 即X = [x]B, 由此得到特征值、特征 向量坐标必须满足下列方程 AX = λX (5.14) 移项后得: (λE − A) X = 0, X 6= 0 (5.15) 由齐次线性方程组的解理论知, 方程组(5.15)有非零解x 6= 0, 当且仅当 rank (λE − A) < n 或 det (λE − A) = 0 (5.16) 也就是若λ是线性变换的特征值, 则它必须满足方程(5.16). 将λ视作未知量, 用f (λ) 表示行列式 det (λE − A), 则称f(λ)为矩阵A的特征多项式, 而 f (λ) = 0的根称为特征根, 它们就是矩阵A的特征值. 关于特征多项式f(λ)有下述性质: (1) 线性变换σ的特征多项式f(λ)与基的选择无关. 证: 因线性变换在不同基下对应矩阵之间的有相似关系(定理5.2.3), 设σ在两组不同基下对应的矩阵分 别为A 和B, 则存在一个可逆矩阵(两个基之间的过渡矩阵)P使得 P−1AP = B, 则 fB (λ) = det (λE − B) = det λP−1P − P−1AP = det P−1 (λE − A) P = det P−1 det (P) det (λE − A) = det (λE − A) = fA (λ) 9
(2)利用行列式展开法,可知特征多项式的展开式形如 f(A)=+(-1)21x-1+…+(-1)n-blpn-1A+(-1)pn (5.17) 其中p是矩阵A的所有i阶主子式之和(=1,2,,n).因此 m1=∑a= trace(A) Pn=det(a) 根据多项式根相关理论可知,在复数域内n次多项式恰含n个根(包括重根),设f()的n个根分别为 A1,A2,…,n,则根据根与系数的关系有 ∑A=m1=A的1阶主子式的和= trace(A) DI入=pn=dt(A) 所有这些特征值也称为矩阵A的特征谱或谱,假设特征多项式互不相同的根有m(1≤m≤n)个, 为1,A2,…,m,则特征多项式f()可分解成如下因式的乘积 f()=Ⅱ(A-A),∑m=n 其中n(i=1,2,,m)称为根入的代数重数,若n1=1相应的根称为非退化特征值,若n>1则相应的根称为 退化特征值 在求得特征多项式的根(特征根或特征值)以后,再将特征值代入方程(515),得 (入E-A)X=0 此时,因det(入E-A)=0.,所以方程必有非零解,它的基础解系的秩等于核空间Ker(AE-A)的维数,通常 将入对应特征方程组的基础解系的秩或 dim Ker(AE-A)称为入的几何重数特征值的几何重数和代数重数 间成立下列定 定理5.3.3.设入是n阶方阵A的任一特征值,则入0的几何重数不超过它的代数重数.即 1≤ dim Ker(A0E-A)≤A0的代数重数 证:设特征方程组(E-A)X=0的基础解系为x1,X2,,Xk,即入0的几何重数为k,不妨设它们相互 正交且标准化,即(x,X)=10.≠,否则可通过 Gram-Schmidt过程将它们正交标准化将这 组基础解系扩充成n维空间的一组标准正交基,令矩阵业由这些标准正交基为列向量构成 , Xn 因此亚是正交矩阵(或酉矩阵),即亚-1 酉矩阵时用共轭转置),进一步将重分块成 其中 B=业A业=[业1重21A[业1业/=4EkA亚2 0业2A业2 显然,矩阵A与B相似,它们的特征多项式相同,即 det(ae-a)=det(AE-B)=(-Xo)"det(E-V2AY2 由上式可见入0的代数重数至少是k(A的几何重数)
(2) 利用行列式展开法,可知特征多项式的展开式形如: f(λ) = λ n + (−1)1 p1λ n−1 + · · · + (−1)n−1 pn−1λ + (−1)n pn (5.17) 其中 pi是矩阵A的所有i阶主子式之和(i = 1, 2, . . . , n). 因此 p1 = Xn i=1 aii = trace (A) pn = det (A) 根据多项式根相关理论可知, 在复数域内n次多项式恰含n个根(包括重根), 设f(λ)的n个根分别为: λ1, λ2, . . . , λn, 则根据根与系数的关系有 (I) Xn i=1 λi = p1 = A的1阶主子式的和 = trace (A) (II) Yn i=1 λi = pn = det (A) 所有这些特征值也称为矩阵A的特征谱或谱, 假设特征多项式互不相同的根有m(1 ≤ m ≤ n)个, 为λ1, λ2, . . . , λm, 则特征多项式f(λ)可分解成如下因式的乘积: f (λ) = Ym i=1 (λ − λi) ni , Xm i=1 ni = n 其中ni(i = 1, 2, . . . , m)称为根λi的代数重数, 若ni = 1相应的根称为非退化特征值, 若 ni > 1则相应的根称为 退化特征值. 在求得特征多项式的根(特征根或特征值)以后, 再将特征值λi代入方程(5.15), 得 (λiE − A) X = 0 此时, 因det (λiE − A) = 0, 所以方程必有非零解, 它的基础解系的秩等于核空间 Ker (λiE − A)的维数, 通常 将λi对应特征方程组的基础解系的秩或 dim Ker (λiE − A)称为λi的几何重数. 特征值的几何重数和代数重数 之间成立下列定理: 定理 5.3.3. 设λ0是n阶方阵A的任一特征值, 则λ0的几何重数不超过它的代数重数. 即 1 ≤ dim Ker (λ0E − A) ≤ λ0的代数重数 (5.18) 证: 设特征方程组(λ0E − A) X = 0的基础解系为 X1, X2, . . . , Xk,即λ0的几何重数为k, 不妨设它们相互 正交且标准化, 即 (Xi , Xj ) = 1, i = j 0, i 6= j , 否则可通过Gram-Schmidt过程将它们正交标准化, 将这 组基础解系扩充成n维空间的一组标准正交基, 令矩阵 Ψ 由这些标准正交基为列向量构成: Ψ = [X1, X2, . . . , Xk, Xk+1, . . . , Xn] 因此 Ψ是正交矩阵(或酉矩阵), 即Ψ−1 = ΨT (酉矩阵时用共轭转置), 进一步将 Ψ 分块成: Ψ = Ψ1 Ψ2 其中 Ψ1 = X1 X2 · · · Xr , Ψ2 = Xr+1 Xr+2 · · · Xn 则 B = ΨT AΨ = Ψ1 Ψ2 T A Ψ1 Ψ2 = λ0Ek ΨT 1 AΨ2 0 ΨT 2 AΨ2 显然, 矩阵A与B相似, 它们的特征多项式相同, 即 det (λE − A) = det (λE − B) = (λ − λ0) k det λE − ΨT 2 AΨ2 由上式可见λ0的代数重数至少是k(λ0的几何重数). 10