《矩阵计算》课程教学资源（讲义）第二讲线性方程组直接方法.pdf_大学文库

第二讲线性方程组直接方法Linear algebrain particular, the solution oflinear systems of equations —lies at the heart of mostcalculations in scientific computing.Dongarra&Eijkhout [32], 2000.考虑线性方程组(2.1)Ar=b,AeRnxn,bERn线性方程组的求解有着非常广泛的应用背景，科学计算中的很多问题最后都可能归结为求解一个或多个线性方程组.从纯数学角度来看，这个问题已经得到了完美的解决，因为它的解可以通过行列式直接表示出来，即Cramer法则.但在实际计算中，由于运算量增长速度太快，当n较大时，用Cramer法则解线性方程组是不可行的.另外，由于实际计算中的舍人误差，可能会导致一系列非常严重的问题一个从纯数学角度看似非常简单的问题，实际计算时可能会非常困难，有时甚至可能是一个无法解决的问题一般来说，求解线性方程组的数值方法可以分为两类：直接法与选代法.本讲介绍直接法，即Gauss消去法.直接法具有良好的稳定性和健壮性，而且在有限步内终止，因此在工程界很受欢迎.但由于运算量是O(n3),对于大规模问题，所需时间会很长(这里n表示未知量的个数).目前Gauss消去法是求解中小规模线性方程组或某些具有特殊结构的大规模稀疏线性方程组的首选方法凸Gauss消去法的思想可以追溯到公元一世纪左右的《九章算术》，Newton,Gauss,Lagrange等数学家都对该方法做出了贡献，相关历史可以参见[63]关于线性方程组直接法的相关参考文献G.H.Golub and C.F.Van Loan, Matrix Computations, 4th, 2013.[57]J.W.Demmel, Applied Numerical Linear Algebra, 1997. [30]L. N. Trefethen and D. Bau, II, Numerical Linear Algebra, 1997. [125]I. S.Duff, A. M.Erisman and J.K.Reid, Direct Methods for Sparse Matrices, 2nd, 2017.[38]T. A.Davis, Direct Methods for Sparse Linear Systems, SIAM, 2006. [29]后面两个文献主要是介绍大规模稀疏线性方程组的直接解法在本讲中，我们总是假定系数矩阵A是非奇异的，即线性方程组（2.1)的解存在且唯一，另外，为了讨论方便，我们只考虑实数情形，对于复系数线性方程组，其求解方法是类似的，41

第二讲线性方程组直接方法 Linear algebra — in particular, the solution of linear systems of equations — lies at the heart of most calculations in scientific computing. — Dongarra & Eijkhout [32], 2000. 考虑线性方程组 Ax = b, A ∈ R n×n , b ∈ R n . (2.1) 线性方程组的求解有着非常广泛的应用背景, 科学计算中的很多问题最后都可能归结为求解一个或多个线性方程组. 从纯数学角度来看, 这个问题已经得到了完美的解决, 因为它的解可以通过行列式直接表示出来, 即 Cramer 法则. 但在实际计算中, 由于运算量增长速度太快, 当 n 较大时, 用 Cramer 法则解线性方程组是不可行的. 另外, 由于实际计算中的舍入误差, 可能会导致一系列非常严重的问题. b 一个从纯数学角度看似非常简单的问题, 实际计算时可能会非常困难, 有时甚至可能是一个无法解决的问题. 一般来说, 求解线性方程组的数值方法可以分为两类: 直接法与迭代法. 本讲介绍直接法, 即 Gauss 消去法. 直接法具有良好的稳定性和健壮性, 而且在有限步内终止, 因此在工程界很受欢迎. 但由于运算量是 O(n 3 ), 对于大规模问题, 所需时间会很长 (这里 n 表示未知量的个数). 目前, Gauss 消去法是求解中小规模线性方程组或某些具有特殊结构的大规模稀疏线性方程组的首选方法. b Gauss 消去法的思想可以追溯到公元一世纪左右的《九章算术》, Newton, Gauss, Lagrange 等数学家都对该方法做出了贡献, 相关历史可以参见 [63]. 关于线性方程组直接法的相关参考文献 ▶ G. H. Golub and C. F. Van Loan, Matrix Computations, 4th, 2013. [57] ▶ J.W. Demmel, Applied Numerical Linear Algebra, 1997. [30] ▶ L. N. Trefethen and D. Bau, III, Numerical Linear Algebra, 1997. [125] ▶ I. S. Duff, A. M. Erisman and J. K. Reid, Direct Methods for Sparse Matrices, 2nd, 2017. [38] ▶ T. A. Davis, Direct Methods for Sparse Linear Systems, SIAM, 2006. [29] 后面两个文献主要是介绍大规模稀疏线性方程组的直接解法. 在本讲中, 我们总是假定系数矩阵 A 是非奇异的, 即线性方程组 (2.1) 的解存在且唯一. 另外, 为了讨论方便, 我们只考虑实数情形, 对于复系数线性方程组, 其求解方法是类似的. 41

2.1 LU 分解与 Gauss 消去法 · 43 · 其中 A11 ∈ R (n−1)×(n−1) 是 A 的 n − 1 阶顺序主子矩阵. 由归纳假设可知, A11 存在 LU 分解, 即存在单位下三角矩阵 L11 和非奇异上三角矩阵 U11 使得 A11 = L11U11. 令 L21 = A21U −1 11 , U12 = L −1 11 A12, U22 = A22 − L21U12, 则 " L11 0 L21 1 # "U11 U12 0 U22# = " L11U11 L11U12 L21U11 U22 + L21U12# = " A11 A12 A21 A22# = A. 因此可得 A 的 LU 分解 A = LU, 其中 L ≜ " L11 0 L21 1 # 为单位下三角矩阵, U ≜ " U11 U12 0 U22# 为非奇异的上三角矩阵 (U 的非奇异性可由 A 的非奇异性可得). 由归纳法可知, 结论成立. 下面证明唯一性. 设 A 存在两个不同的 LU 分解: A = LU = L˜U, ˜ 其中 L 和 L˜ 为单位下三角矩阵, U 和 U˜ 为非奇异上三角矩阵. 则有 L −1L˜ = UU˜ −1 , 该等式左边为下三角矩阵, 右边为上三角矩阵, 所以只能是对角矩阵. 又单位下三角矩阵的逆仍然是单位下三角矩阵, 所以 L −1L˜ 的对角线元素全是 1, 故 L −1L˜ = I, 即 L˜ = L, U˜ = U. 唯一性得证. □ 记 D 为 U 的对角线部分, 则 A = LDU˜, 其中 U˜ = D−1U 是单位上三角矩阵. 因此我们就有下面的 LDU 分解. 推论 2.2 (LDU 分解) 设 A ∈ R n×n 的所有顺序主子矩阵都非奇异, 则 A 存在 LDU 分解, 即存在单位下三角矩阵 L 和单位上三角矩阵 U, 以及非奇异对角矩阵 D, 使得 A = LDU, 其中 L, U, D 都是唯一的. 反之, 若 A 存在 LDU 分解, 则 A 的所有顺序主子矩阵都非奇异. 对角占优情形一般的非奇异矩阵不一定存在 LU 分解, 但如果 A 是对角占优的, 则存在 LU 分解. 我们可以证明, 严格对角占优矩阵在 LU 分解中保持严格对角占优性 (见课后练习), 因此通过数学归纳法可以证明严格对角占优矩阵一定存在 LU 分解. 事实上, 只要矩阵列对角占优且非奇异, 则一定存在 LU 分解 [57]. 定理 2.3 [57] 设 A ∈ R n×n 非奇异且列对角占优, 则 A 存在 LU 分解且 L 中的元素的绝对值都不超过 1. (留作练习, 数学归纳法)

· 46 · 第二讲线性方程组直接方法 11: end for 12: end for b 评价算法的一个主要指标是执行时间, 但这依赖于计算机硬件和编程技巧等, 因此直接给出算法执行时间是不太现实的. 所以我们通常是统计算法中算术运算 (加减乘除) 的次数. 在矩阵计算中, 大多仅仅涉及加减乘除和开方运算. 一般情况下, 加减运算次数与乘法运算次数具有相同的量级, 而除法运算和开方运算次数具有更低的量级. b 为了尽可能地减少运算量, 在实际计算中, 数, 向量和矩阵做乘法运算时的先后执行次序为: 先计算数与向量的乘法, 然后计算矩阵与向量的乘法, 最后才计算矩阵与矩阵的乘法. 比如计算 αABx, 其中 α 是数, A, B 是矩阵, x 是向量, 如果按照从左往右计算的话, 则运算量为 O(n 3 ), 但是如果先计算 αx, 然后计算 B(αx), 最后再计算 A(B(αx)) 的话, 运算量则为 O(n 2 ), 相差一个量级. 矩阵 L 和 U 的存储当 A 的第 i 列 (严格下三角部分) 被用于计算 L 的第 i 列后, 在后面的计算中不再被使用. 而 A 的第 i 行 (上三角部分) 更新后就是 U 的第 i 行. 因此, 为了节省存储空间, 我们可以在计算过程中将 L 的第 i 列存放在 A 的第 i 列 (严格下三角部分, L 的对角线全部为 1, 不需要存储), 将 U 的第 i 行存放在 A 的第 i 行 (上三角部分), 这样就不需要另外分配空间存储 L 和 U. 计算结束后, A 的上三角部分为 U, 其严格下三角部分为 L 的绝对下三角部分. 此时算法可以描述为：算法 2.3. LU 分解 (用 A 存储 L 和 U) 1: for k = 1 to n − 1 do 2: for i = k + 1 to n do 3: aik = aik/akk 4: for j = k + 1 to n do 5: aij = aij − aikakj 6: end for 7: end for 8: end for LU 分解的运算量由算法 2.2 可知, LU 分解的运算量为 • 乘法次数: Tp = nX−1 k=1 Xn i=k+1 Xn j=k+1 1 = nX−1 k=1 (n − k) 2 = 1 6 (2n 3 − 3n 2 + n) = 1 3 n 3 + O(n 2 )

《矩阵计算》课程教学资源（讲义）第二讲 线性方程组直接方法

《矩阵计算》课程教学资源（讲义）第二讲线性方程组直接方法