华东师范大学：《矩阵计算》课程教学资源（课堂讲义）第四讲非对称特征值问题.pdf_大学文库

· 112 · 第四讲非对称特征值问题 7: k = k + 1 8: end while 下面讨论幂迭代的收敛性. 假设 (1) A ∈ R n×n 是可对角化的, 即 A = V ΛV −1 , 其中 Λ = diag(λ1, λ2, . . . , λn) ∈ C n×n, V = [v1, v2, . . . , vn] ∈ C n×n, 且 ∥vi∥2 = 1, i = 1, 2, . . . , n. (2) 同时, 我们还假设 |λ1| > |λ2| ≥ |λ3| ≥ · · · ≥ |λn|. 由于 V ∈ C n×n 非奇异, 所以它的列向量组构成 C n 的一组基. 因此迭代初始向量 x (0) 可表示为 x (0) = α1v1 + α2v2 + · · · + αnvn = V [α1, α2, . . . , αn] ⊺ . 我们假定 α1 ̸= 0, 即 x (0) 不属于 span{v2, v3, . . . , vn} (由于 x (0) 是随机选取的, 从概率意义上讲, 这个假设通常是成立的). 于是我们可得 A kx (0) = (V ΛV −1 ) kV        α1 α2 . . . αn        = V Λ k        α1 α2 . . . αn        = V        α1λ k 1 α2λ k 2 . . . αnλ k n        = α1λ k 1V           1 α2 α1 ( λ2 λ1 )k . . . αn α1 ( λn λ1 )k           . 又 |λi/λ1| < 1, i = 2, 3, . . . , n, 所以 lim k→∞ ( λi λ1 )k = 0, i = 2, 3, . . . , n. 故当 k 趋向于无穷大时, 向量 [ 1, α2 α1 ( λ2 λ1 )k , . . . , αn α1 ( λn λ1 )k ]⊺ , k = 0, 1, 2, . . . 收敛到 e1 = [1, 0, . . . , 0]⊺ . 所以向量 x (k) = Akx (0)/∥Akx (0)∥2 收敛到 ±v1, 即 A 的对应于 (模) 最大的特征值 λ1 的特征向量. 而 µk = (x (k) ) ∗Ax(k) 则收敛到 v ∗ 1Av1 = λ1. 显然, 幂迭代的收敛快慢取决于 |λ2/λ1| 的大小, |λ2/λ1| 越小, 收敛越快. 通过上面的分析可知, 幂迭代只能用于计算矩阵的模最大的特征值和其相应的特征向量. 如果 A 的模最大的特征值是唯一的, 则称其为主特征值. 当 |λ2/λ1| 接近于 1 时, 收敛速度会非常慢. 同时, 如果 A 的模最大特征值是一对共轭复数, 则幂迭代就可能就会失效. 4.2 反迭代方法前面已经提到, 幂迭代算法的收敛速度取决于 |λ2/λ1| 的大小. 当它的值接近于 1 时, 收敛速度会非常缓慢. 因此, 为了加快幂迭代算法的收敛速度, 我们希望 |λ2/λ1| 的值越小越好. 一个简单易用的方法就是使用位移策略, 即将计算 A 的特征值转化为计算 A − σI 的特征值, 即对 A 做一个移位. 这里 σ 是一个给定的数, 称 σ 为位移 (shift). 为了使得幂迭代作用到 A − σI 时具有更快的收敛速度, 我们要求 σ 满足下面的两个条件:

第四讲非对称特征值问题.120所以，带位移的QR算法中所得到的矩阵A仍然与A1=A正交相似在带位移的QR迭代算法中，一个很重要的问题就是位移k的选取，在前面的分析中我们已经知道，As+1(n，n）将收敛到A的模最小的特征值，且收敛速度取决于模最小特征值与模第二小特征值之间的比值.显然，若k就是A的一个特征值，则A一kI的模最小特征值为0,故QR算法选代一步就收敛.此时[A(n-1)x(n-1)A+1=RQ+I:0(a-1)x(n-1)使用带位移的QR选代算法如果需要计算A的其它特征值，则可对子矩阵A通常，如果k与A的某个特征值非常接近，则收敛速度通常会很快.由于A(n，n）收敛到A的一个特征值，所以在实际使用中，一个比较直观的位移选择策略是k=Ak(（n，n).事实上，这样的位移选取方法通常会使得OR选代有二次收敛速度例4.4带位移的QR选代算法演示.所有数据与设置与例4.3相同，在选代过程中，取ak=A（n,n).如果A(n,n)已经收敛，则取k=A(n-1,n-1)(见Eig_QR_shift.m)4.5带位移的隐式QR选代QR选代算法中需要考虑的另一个重要问题就是运算量：每一步送代都需要做一次QR分解和矩阵乘积，运算量为O(n3).即使每计算一个特征值只需选代一步，则计算所有特征值也需要(n4）的运算量.这是令人无法忍受的.下面我们就想办法将总运算量从On*）减小到O(n3)为了实现这个目标，我们需要利用Hessenberg矩阵.具体步骤如下：首先通过相似变化将A转化成一个上Hessenberg矩阵，然后再对这个Hessenberg矩阵实施隐式QR选代.所谓隐式QR迭代，就是在QR选代中，我们不需要进行显式的QR分解.这样就可以将QR选代的每一步运算量从O(n3）降低到O（n2).从而将总的运算量降低到O(n3)4.5.1上Hessenberg矩阵设H=（hi)ERnxn,若当i>j+1时,有hii=0,则称H为上Hessenberg矩阵定理4.4设AeRnxn，则存在正交矩阵QeIRnxn，使得QAQT是上Hessenberg矩阵下面我们给出具体的转化过程.这里我们主要使用Householder变换：对任意向量rERn，总存在个Householder矩阵H=I-BuvT使得Hr=rl2e1,其中e1=[1,0,...,0]T.我们以一个5×5的矩阵A为例第一步：令Q1=diag(Iix1,Hi),其中Hi是对应于向量A(2：5,1)的Householder矩阵.于是可得Q1A=0

· 120 · 第四讲非对称特征值问题所以, 带位移的 QR 算法中所得到的矩阵 Ak 仍然与 A1 = A 正交相似. 在带位移的 QR 迭代算法中, 一个很重要的问题就是位移 σk 的选取. 在前面的分析中我们已经知道, Ak+1(n, n) 将收敛到 A 的模最小的特征值, 且收敛速度取决于模最小特征值与模第二小特征值之间的比值. 显然, 若 σk 就是 A 的一个特征值, 则 Ak − σkI 的模最小特征值为 0, 故 QR 算法迭代一步就收敛. 此时 Ak+1 = RkQk + σkI = [ A (n−1)×(n−1) k+1 ∗ 0 σk ] . 如果需要计算 A 的其它特征值, 则可对子矩阵 A (n−1)×(n−1) k+1 使用带位移的 QR 迭代算法. 通常, 如果 σk 与 A 的某个特征值非常接近, 则收敛速度通常会很快. 由于 Ak(n, n) 收敛到 A 的一个特征值, 所以在实际使用中, 一个比较直观的位移选择策略是 σk = Ak(n, n). 事实上, 这样的位移选取方法通常会使得 QR 迭代有二次收敛速度. 例 4.4 带位移的 QR 迭代算法演示. 所有数据与设置与例 4.3 相同, 在迭代过程中, 取 σk = Ak(n, n). 如果 Ak(n, n) 已经收敛, 则取 σk = Ak(n − 1, n − 1). (见 Eig_QR_shift.m) 4.5 带位移的隐式 QR 迭代 QR 迭代算法中需要考虑的另一个重要问题就是运算量: 每一步迭代都需要做一次 QR 分解和矩阵乘积, 运算量为 O(n 3 ). 即使每计算一个特征值只需迭代一步, 则计算所有特征值也需要 O(n 4 ) 的运算量. 这是令人无法忍受的. 下面我们就想办法将总运算量从 O(n 4 ) 减小到 O(n 3 ). 为了实现这个目标, 我们需要利用 Hessenberg 矩阵. 具体步骤如下: 首先通过相似变化将 A 转化成一个上 Hessenberg 矩阵, 然后再对这个 Hessenberg 矩阵实施隐式 QR 迭代. 所谓隐式 QR 迭代, 就是在 QR 迭代中, 我们不需要进行显式的 QR 分解. 这样就可以将 QR 迭代的每一步运算量从 O(n 3 ) 降低到 O(n 2 ). 从而将总的运算量降低到 O(n 3 ). 4.5.1 上 Hessenberg 矩阵设 H = (hij ) ∈ R n×n, 若当 i > j + 1 时, 有 hij = 0, 则称 H 为上 Hessenberg 矩阵. 定理 4.4 设 A ∈ R n×n, 则存在正交矩阵 Q ∈ R n×n, 使得 QAQ⊺ 是上 Hessenberg 矩阵. 下面我们给出具体的转化过程. 这里我们主要使用 Householder 变换: 对任意向量 x ∈ R n, 总存在一个 Householder 矩阵 H = I − βvv⊺ 使得 Hx = ∥x∥2e1, 其中 e1 = [1, 0, . . . , 0]⊺ . 我们以一个 5 × 5 的矩阵 A 为例. 第一步: 令 Q1 = diag(I1×1, H1), 其中 H1 是对应于向量 A(2 : 5, 1) 的 Householder 矩阵. 于是可得 Q1A =          ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ 0 ∗ ∗ ∗ ∗ 0 ∗ ∗ ∗ ∗ 0 ∗ ∗ ∗ ∗         

华东师范大学：《矩阵计算》课程教学资源（课堂讲义）第四讲 非对称特征值问题

华东师范大学：《矩阵计算》课程教学资源（课堂讲义）第四讲非对称特征值问题