华东师范大学：《矩阵计算》课程教学资源（课堂讲义）第八讲预处理.pdf_大学文库

· 238 · 第八讲预处理另外, 我们也可以将 P 分解成两个矩阵的乘积, 即 P = LR. 于是我们可以用下面的方式对原方程组 (8.1) 进行预处理 L −1AR−1u = b, x = R −1u. (8.4) 这就是两边预处理. 以上是三种常用的预处理方式. 这三种方式预处理后的系数矩阵分别为 P −1A, AP −1 和L −1AR−1 . 由于它们是相似的, 所以具有相同的特征值分布. 如果 A 是对称正定的, 则使用共轭梯度法求解时, 这三种方式的预处理效果基本上是一样的. 但对于非对称 (特别是非正规) 情形, 效果可能会相差很大. 在实际使用中, 该选取哪种预处理方式, 需要根据问题本身和所用的方法来确定. 如对于对称正定线性方程组的 CG 方法, 三种方式都可以, 而对于 GMRES 方法, 则选取右预处理比较合适. 一方面是实际使用时, 得到的残量范数与原方程组的残量范数是一样的, 另一方面是, 右预处理极小化的是原始残量范数, 而左预处理极小化的是预处理后的残量. 这里需要指出的是, 在实际求解预处理后的方程组时, 我们并不会显式地计算 P −1 (除非 P −1 非常容易计算), 更不会显式地计算 P −1A. 8.1.1 预处理 CG 方法设 A ∈ R n×n 对称正定, 并假定预处理子 P 也是对称正定的. 为了保证预处理后的系数矩阵仍然是对称正定的, 我们考虑使用两边预处理方式. 设 P 的 Cholesky 分解为 P = LL⊺ . 于是我们得到下面的预处理方程组 L −1A(L ⊺ ) −1u = L −1 b, x = (L ⊺ ) −1u. (8.5) 用 CG 方法求解上述方程组, 迭代 k 步后, 得到的近似解记为 u (k) , 预处理残量记为 r˜k ≜ L −1 b − L −1A(L ⊺ ) −1u (k) . 于是, 求解预处理方程组 (8.5) 的 CG 方法可描述如下: 算法 8.1. 两边预处理 CG 方法 1: 给定初值 x (0) 2: 计算 r0 = b − Ax(0) 3: 令 r˜0 = L −1 r0, p˜1 = ˜r0 4: for k = 1, 2, . . . do 5: ξk = (˜rk−1, r˜k−1) (L−1A(L⊺)−1p˜k, p˜k) 6: u (k) = u (k−1) + ξkp˜k 7: r˜k = ˜rk−1 − ξkL −1A(L ⊺ ) −1p˜k 8: µk = (˜rk, r˜k) (˜rk−1, r˜k−1) 9: p˜k+1 = ˜rk + µkp˜k

· 244 · 第八讲预处理 30: 计算 y (m) = R−1 m ξ (m) , 其中 Rm = H(1 : m, 1 : m), ξ (m) = ξ(1 : m) 31: 计算近似解 x (m) = x (0) + P −1Vmy (m) 两边预处理方式如果预处理子 P 是由乘积形式给出的, 即 P = PLPR, 则可以构造下面的两边预处理方程组 P −1 L AP −1 R u = P −1 L b, x = P −1 R u. 将 GMRES 用于求解上述线性方程组, 则可得到两边预处理 GMRES 方法. 具体推导过程与前面类似, 留作练习. 需要指出的是, 对于两边预处理 GMRES 方法, 其预处理后的残量为 r˜k = L −1 (b − Ax(k) ). † 由于左预处理方式和两边预处理方式所得到的残量并不是原方程组的残量, 因此它们都可能会导致迭代提前终止或延迟终止., 特别是当预处理子 P 的条件数较大时. 因此, 通常情况下建议采用右预处理方式. 8.1.3 左、右预处理 GMRES 的最优性质设 x (0) 是迭代初始值, 记 x (k) L 和 x (k) R 分别是左预处理 GMRES 方法和右预处理 GMRES 方法迭代 k 步后得到的近似解. 根据 GMRES 方法的最优性质可知, 对于左预处理 GMRES 方法, 有 x (k) L = argmin x∈x(0)+Kk(P −1A,P −1r0) ∥P −1 (b − Ax)∥2. (8.10) 而对于右预处理 GMRES, 我们有 x (k) R = P −1u (k) , 其中 u (k) = argmin u∈u(0)+Kk(AP −1,r0) ∥b − AP −1u∥2. 通过变量代换 x = P −1u, 可得 x (k) R = argmin x∈x(0)+P −1Kk(AP −1,r0) ∥b − Ax∥2. (8.11) 又 P −1Kk(AP −1 , r0) = P −1 span{r0, AP −1 r0,(AP −1 ) 2 r0, . . . ,(AP −1 ) k−1 r0} = span{P −1 r0, P −1AP −1 r0, P −1 (AP −1 ) 2 r0, . . . , P −1 (AP −1 ) k−1 r0} = span{P −1 r0,(P −1A)P −1 r0,(P −1A) 2P −1 r0, . . . ,(P −1A) k−1P −1 r0} = Kk(P −1A, P −1 r0), 由 (8.10) 和 (8.11) 可知, x (k) L 和 x (k) R 属于同一个子空间中. 不同之处在于, x (k) L 极小化的是预处理后残量的范数, 即 ∥P −1 (b − Ax)∥2, 而 x (k) R 极小化的是原方程组残量的范数, 即 ∥b − Ax∥2

8.2预处理技术.245 定理8.1设(）和）分别是左预处理GMRES方法和右预处理GMRES方法选代k步后得到的近似解,且选代初始值均为(0),则r(k)是P-1(b-Az)l2在(0)+K(P-1A,P-1ro)的极小值点,而r(k）则是6-Arl2在同一个子空间中的极小值点R8.2预处理技术Finding a good preconditioner to solve a given sparse linear system is often viewed as a combinationof art and science.Theoretical results are rare and some methods work surprisingly well, often despiteexpectations.—Saad[64],2003预处理能否取得成功的关键是能否找到一个好的预处理子。预处理子的构造与问题本身是密切相关的，通用的“好预处理子”是不存在的，关于预处理技术的理论分析很少，大多数情况下只能根据经验来构造，尽管如此，在实际应用中，这些根据经验构造出来的预处理子往往能取得好好的效果，有时甚至会大大出乎人们的意外一般来说，预处理子可以分为两大类(a）代数预处理子（AlgebraicPreconditioner)，即仅仅根据所给的矩阵来构造预处理子(b）专用预处理子(Problem-SpecificPreconditioner)，即根据问题的物理背景所构造的预处理子显然，由于专用预处理子充分利用了问题的物理背景知识，所以它们往往具有很好的数值表现，如多重网格，区域分解，快速变换等等，但它们严重依赖于原问题的物理背景，因此不具有通用性我们这里只介绍代数预处理子，即仅仅根据所给的系数矩阵来构造预处理方法.这种预处理方法具有一定的通用性预处理子的选取通常与具体问题本身是密切有关的，一般的选取方法有·设有矩阵分裂A=M-N则M可作为一个预处理子；·不完全LU分解；·近似逆，即选取矩阵P，使得P-1～A-1·对角矩阵，块对角矩阵，三角矩阵，块三角矩阵等等8.2.1矩阵分裂预处理子考虑线性方程组Ar = b,AERnxn对A做如下的矩阵分裂A-M-N(8.12)其中M非奇异，则可以得到下面的选代方法(k+1) = M-1N(k) + M-1b = 2(k) + (M-1b - M-1Ar(k) . k = 0,1,2

8.2 预处理技术 · 245 · 定理 8.1 设 x (k) L 和 x (k) R 分别是左预处理 GMRES 方法和右预处理 GMRES 方法迭代 k 步后得到的近似解, 且迭代初始值均为 x (0) . 则 x (k) L 是 ∥P −1 (b − Ax)∥2 在 x (0) + Kk(P −1A, P −1 r0) 的极小值点, 而 x (k) R 则是 ∥b − Ax∥2 在同一个子空间中的极小值点. 8.2 预处理技术 Finding a good preconditioner to solve a given sparse linear system is often viewed as a combination of art and science. Theoretical results are rare and some methods work surprisingly well, often despite expectations. — Saad [64], 2003. 预处理能否取得成功的关键是能否找到一个好的预处理子. 预处理子的构造与问题本身是密切相关的, 通用的 “好预处理子” 是不存在的. 关于预处理技术的理论分析很少, 大多数情况下只能根据经验来构造. 尽管如此, 在实际应用中, 这些根据经验构造出来的预处理子往往能取得好好的效果, 有时甚至会大大出乎人们的意外. 一般来说, 预处理子可以分为两大类 (a) 代数预处理子 (Algebraic Preconditioner), 即仅仅根据所给的矩阵来构造预处理子. (b) 专用预处理子 (Problem-Specific Preconditioner), 即根据问题的物理背景所构造的预处理子. 显然, 由于专用预处理子充分利用了问题的物理背景知识, 所以它们往往具有很好的数值表现, 如多重网格, 区域分解, 快速变换等等. 但它们严重依赖于原问题的物理背景, 因此不具有通用性. 我们这里只介绍代数预处理子, 即仅仅根据所给的系数矩阵来构造预处理方法. 这种预处理方法具有一定的通用性. 预处理子的选取通常与具体问题本身是密切有关的. 一般的选取方法有 • 设有矩阵分裂 A = M − N, 则 M 可作为一个预处理子; • 不完全 LU 分解; • 近似逆, 即选取矩阵 P, 使得 P −1 ≈ A−1 ; • 对角矩阵, 块对角矩阵, 三角矩阵, 块三角矩阵等等. 8.2.1 矩阵分裂预处理子考虑线性方程组 Ax = b, A ∈ R n×n , 对 A 做如下的矩阵分裂: A = M − N (8.12) 其中 M 非奇异, 则可以得到下面的迭代方法 x (k+1) = M−1Nx(k) + M−1 b = x (k) + ( M−1 b − M−1Ax(k) ) . k = 0, 1, 2, . . .

:246.第八讲预处理这等价于求解下面的方程组M-1Ar = M-1b.(8.13)这就是与矩阵分裂（8.12）相对应的预处理线性方程组.将Krylov子空间方法用于求解方程组（8.13)，就得到预处理Krvlov子空间方法.矩阵M就是由矩阵分裂（8.12）所定义的预处理子理论上讲，任何一个矩阵分裂都可以定义一个预处理子.但为了使得预处理子能有很好的预处理效果，往往需要其在一定意义下与A充分接近设A=D-L-U,其中D,-L,-U分别是A的对角部分，严格下三角部分和严格上三角部分,并假定D非奇异则由我们之前讨论的定常迭代法，可以立即得到下面的预处理子·Jacobi预处理子，即取A的对角部分作为预处理子：Pj = D.·G-S预处理子，即取A的下三角部分作为预处理子：PGs =D-L.·SOR预处理子，即(wD - L).PsOR=·SSOR预处理子，即Pso = u(2- (1-) + wl] -[1 - u) + u] .由于SSOR对参数w的取值不是很敏感，因此我们通常令w=1，即PsSOR = (D - L)D-1(D - U).8.2.2不完全LU分解One of the most popular preconditioners is the class of incomplete factorization preconditioners which areusually effective for large and sparse matrices. The incomplete factorization methods were first introduced by Buleev[13, 14] in the late 1950s, and independently by Varga [77]; see also [45]. However, a major breakthrough tookplace in 1977, by Meijerink and van der Vorst [54] where the incomplete Cholesky-conjugate gradient (ICCG)algorithm was proposed. Since then, a number of improvements and extensions have been made, including level offll and drop tolerance-based incomplete factorizations, and so on.When the LU decomposition of a sparse matrix A is carried out through Gaussian elimination, fill-in usuallytakes place.This means that the triangular factors L and U are considerably less sparse than A.However, bydropping part of the fill-in in the processing of the factorization, we can obtain a simple but useful preconditionerof theform P=LU,where L and U arethe incompleteLUfactors.In general, the incomplete LU factorization (ILU) is a process that computes a sparse unit lower-triangularmatrix L and a sparse upper-triangular matrix U such thatA=LU-R

· 246 · 第八讲预处理这等价于求解下面的方程组 M−1Ax = M−1 b. (8.13) 这就是与矩阵分裂 (8.12) 相对应的预处理线性方程组. 将 Krylov 子空间方法用于求解方程组 (8.13), 就得到预处理 Krylov 子空间方法. 矩阵 M 就是由矩阵分裂 (8.12) 所定义的预处理子. 理论上讲, 任何一个矩阵分裂都可以定义一个预处理子. 但为了使得预处理子能有很好的预处理效果, 往往需要其在一定意义下与 A 充分接近. 设 A = D − L − U, 其中 D, −L, −U 分别是 A 的对角部分, 严格下三角部分和严格上三角部分, 并假定 D 非奇异. 则由我们之前讨论的定常迭代法, 可以立即得到下面的预处理子: • Jacobi 预处理子, 即取 A 的对角部分作为预处理子: PJ = D. • G-S 预处理子, 即取 A 的下三角部分作为预处理子: PGS = D − L. • SOR 预处理子, 即 PSOR = 1 ω (ωD − L). • SSOR 预处理子, 即 PSSOR = 1 ω(2 − ω) [ (1 − ω)D + ωL] D−1 [ (1 − ω)D + ωU] . 由于 SSOR 对参数 ω 的取值不是很敏感, 因此我们通常令 ω = 1, 即 PSSOR = (D − L)D−1 (D − U). 8.2.2 不完全 LU 分解 One of the most popular preconditioners is the class of incomplete factorization preconditioners which are usually effective for large and sparse matrices. The incomplete factorization methods were first introduced by Buleev [13, 14] in the late 1950s, and independently by Varga [77]; see also [45]. However, a major breakthrough took place in 1977, by Meijerink and van der Vorst [54] where the incomplete Cholesky-conjugate gradient (ICCG) algorithm was proposed. Since then, a number of improvements and extensions have been made, including level of fill and drop tolerance-based incomplete factorizations, and so on. When the LU decomposition of a sparse matrix A is carried out through Gaussian elimination, fill-in usually takes place. This means that the triangular factors L and U are considerably less sparse than A. However, by dropping part of the fill-in in the processing of the factorization, we can obtain a simple but useful preconditioner of the form P = LU, where L and U are the incomplete LU factors. In general, the incomplete LU factorization (ILU ) is a process that computes a sparse unit lower-triangular matrix L and a sparse upper-triangular matrix U such that A = LU − R

华东师范大学：《矩阵计算》课程教学资源（课堂讲义）第八讲 预处理

华东师范大学：《矩阵计算》课程教学资源（课堂讲义）第八讲预处理