《并行计算》课程教学资源（讲义）线性方程组的迭代解法

在阶数较大、系数阵为稀疏阵的情况下,可以采用迭代法求解线性方程组。用迭代法 (Iterative Method)求解线性方程组的优点是方法简单,便于编制计算机程序,但必须选取合适的迭代格式及初始向量,以使迭代过程尽快地收敛。迭代法根据迭代格式的不同分成雅可比(Jacobi)迭代、高斯塞德尔(Gauss-Seidel-)迭代和松弛(Relaxation)法等几种。

团购合买资源类别：文库，文档格式：DOC，文档页数：12，文件大小：148KB

1. 8 线性方程组的迭代解法在阶数较大、系数阵为稀疏阵的情况下，可以采用迭代法求解线性方程组。用迭代法 (Iterative Method)求解线性方程组的优点是方法简单，便于编制计算机程序，但必须选取合适的迭代格式及初始向量，以使迭代过程尽快地收敛。迭代法根据迭代格式的不同分成雅可比(Jacobi)迭代、高斯-塞德尔(Gauss-Seidel)迭代和松弛(Relaxation)法等几种。在本节中，我们假设系数矩阵 A 的主对角线元素 aii  0 ，且按行严格对角占优(Diagonal Donimant)，即： ( 1,2,..., ) 1 a a i n n j j i ii   ij = =  1.1 雅可比迭代 1.1.1 雅可比迭代及其串行算法雅可比迭代的原理是：对于求解 n 阶线性方程组 Ax=b，将原方程组的每一个方程 ai1x1+ ai2x2+…+ ainxn= bi 改写为未知向量 x 的分量的形式： ( ) / (1 ) 1, x b a x aii i n n j j i i = i −  ij j   =  然后使用第 k-1 步所计算的变量 xi (k -1)来计算第 k 步的 xi (k)的值： ( ) / (1 , ) 1, ( ) ( 1) x b a x aii i k n n j j i k i ij k i j = −    =  − 这里，xi (k)为第 k 次迭代得到的近似解向量 x (k)= (x1 (k) , x2 (k) , …, xn (k) ) T的第 i 个分量。取适当初始解向量 x (0)代入上述迭代格式中，可得到 x (1)，再由 x (1)得到 x (2)，依次迭代下去得到近似解向量序列{x (k)}。若原方程组的系数矩阵按行严格对角占优，则{x (k )}收敛于原方程组的解 x。实际计算中，一般认为，当相邻两次的迭代值 xi (k +1)与 xi (k) i=(1,2, …,n)很接近时， xi (k +1)与准确解 x 中的分量 xi 也很接近。因此，一般用 (k) i (k ) i x -x 1 1 i n max +   判断迭代是否收敛。如果取一次乘法和加法运算时间或一次比较运算时间为一个单位时间，则下述雅可比迭代算法 20.1 的一轮计算时间为 n 2+n=O(n 2 )。算法 20.1 单处理器上求解线性方程组雅可比迭代算法输入：系数矩阵 An×n，常数向量 b n×1，ε，初始解向量 xn×1 输出：解向量 xn×1 Begin (1)for i=1 to n do xi=bi/aii end for

(1.3)x1[i]=(b[i] - sum)/a[i,my_rank*m+i] end for (2)/*求出本处理器计算的 x 的相应的分量的新值与原值的差的最大值 localmax */ localmax=│x1[0]-x[0]│ (3)for i=1 to m-1 do if (│x1[i]-x[i] │>localmax) then localmax =│x1[i]-x[i] │ end if end for (4)用 Allgather 操作将 x 的所有分量的新值广播到所有处理器中 (5)用 Allreduce 操作求出所有处理器中 localmax 值的最大值 max 并广播到所有处理器中 end while End 若取一次乘法和加法运算时间或一次比较运算时间为一个单位时间，则一轮迭代的计算时间为 mn+m；另外，各处理器在迭代中做一次归约操作，通信量为 1，一次扩展收集操作，通信量为 m，需要的通信时间为 4t ( p −1) + (m +1)tw( p −1) s ，因此算法 20.2 的一轮并行计算时间为 Tp = 4t s ( p −1) + (m +1)tw ( p −1) + mn + m。 MPI 源程序请参见所附光盘。 1.2 高斯-塞德尔迭代 1.2.1 高斯-塞德尔迭代及其串行算法高斯-塞德尔迭代的基本思想与雅可比迭代相似。它们的区别在于，在雅可比迭代中，每次迭代时只用到前一次的迭代值，而在高斯-塞德尔迭代中，每次迭代时充分利用最新的迭代值。一旦一个分量的新值被求出，就立即用于后续分量的迭代计算，而不必等到所有分量的新值被求出以后。设方程组 Ax=b 的第 i 个方程为：  = n j 1 ij a j x = i b (i =1,2,  ,n) 高斯-塞德尔迭代公式为： ( ) 1 1 ( ) 1 1 ( 1) ( 1) = −  −  = + − = + + n j i k ij j i j k i ij j ii k i b a x a x a x (i =1,2,  , n) 取适当的 x (0)作为初始向量，由上述迭代格式可得出近似解向量{x (k)}。若原方程组的系数矩阵是按行严格对角占优的，则{x (k)}收敛于方程组的解 x，若取一次乘法和加法运算时间或一次比较运算时间为一个单位时间，则下述高斯-塞德尔迭代算法 20.3 的一轮计算时间为 n 2+n=O(n 2 )。算法 20.3 单处理器上求解线性方程组的高斯-塞德尔迭代算法输入：系数矩阵 An×n，常数向量 b n×1，ε，初始解向量 xn×1 输出：解向量 xn×1 Begin

d fo (2)p=a 3) while(p≥E)do (1)t=x (i)s= (iiiforj=I to n do if(≠)then end for (v)if(x-t>)then p=x-tend if end for end while 122高斯塞德尔迭代并行算法在并行计算中,高斯-塞德尔迭代采用与雅可比迭代相同的数据划分。对于高斯塞德尔迭代,计算x的新值时,使用x+,…,x-1的旧值和xn…x的新值。计算过程中x与x0,…x:1 及x+1,…,xn1的新值会在不同的处理器中产生,因此可以考虑采用时间偏移的方法,使各个处理器对新值计算的开始和结束时间产生一定的偏差。编号为 my rank的处理器一旦计算出x( my rank×m≤i<( my rank+1)×m)的新值,就立即广播给其余处理器,以供各处理器对x的其它分量计算有关x的乘积项并求和。当它计算完x的所有分量后,它还要接收其它处理器发送的新的x分量,并对这些分量进行求和计算,为计算下一轮的x作准备。计算开始时,所有处理器并行地对主对角元素右边的数据项进行求和,此时编号为0的处理器(简称为Po)计算出x然后广播给其余处理器,其余所有的处理器用x0的新值和其对应项进行求和计算,接着P计算出x,x2…当P完成对xm-1的计算和广播后,P1计算出xm,并广播给其余处理器,其余所有的处理器用xm的新值求其对应项的乘积并作求和计算。然后P1计算出xm+1,xm+2,…,当P1完成对xm1的计算和广播后,P2计算出x·m…,如此重复下去,直至xn在P1中被计算出并广播至其余的处理器之后,P0计算出下一轮的新的x0,这样逐次迭代下去,直至收敛为止。具体算法框架描述如下算法20.4求解线性方程组的高斯塞德尔迭代并行算法输入:系数矩阵Axn,常数向量bn×1,ε,初始解向量x×1 输出:解向量x×1 对所有处理器 my rank( my rank=0,…,p-1)同时执行如下的算法 (I)for i=my-rank m to(my-rank+1)m-I do /*所有处理器并行地对主对角元素右边的数据求和* (1.1)stm{d=0.0 (1.2)forj=i+l to n-l d sumi=sum(i+aixi

(1)for i=1 to n do xi=0 end for (2)p=ε+1 (3)while (p ≥ ε) do for i=1 to n do (i) t = xi (ii) s=0 (iii)for j= 1 to n do if (j ≠ i) then s= s+ aij xj end if end for (iv) xi=(bi-s)/ aii (v) if (│xi-t│>p) then p=│xi-t│end if end for end while End 1.2.2 高斯-塞德尔迭代并行算法在并行计算中，高斯-塞德尔迭代采用与雅可比迭代相同的数据划分。对于高斯-塞德尔迭代，计算xi 的新值时，使用xi+1, …,xn-1 的旧值和x0, …,xi-1 的新值。计算过程中xi 与x0, …,xi-1 及 xi+1, …,xn-1 的新值会在不同的处理器中产生，因此可以考虑采用时间偏移的方法，使各个处理器对新值计算的开始和结束时间产生一定的偏差。编号为 my_rank 的处理器一旦计算出 xi(my_rank×m ≤ i < (my_rank+1)×m)的新值，就立即广播给其余处理器，以供各处理器对 x 的其它分量计算有关 xi 的乘积项并求和。当它计算完 x 的所有分量后，它还要接收其它处理器发送的新的 x 分量，并对这些分量进行求和计算，为计算下一轮的 xi 作准备。计算开始时，所有处理器并行地对主对角元素右边的数据项进行求和，此时编号为 0 的处理器（简称为 P0）计算出 x0,然后广播给其余处理器，其余所有的处理器用 x0 的新值和其对应项进行求和计算,接着 P0 计算出 x1,x2, …,当 P0 完成对 xm-1 的计算和广播后，P1 计算出 xm，并广播给其余处理器，其余所有的处理器用 xm 的新值求其对应项的乘积并作求和计算。然后 P1 计算出 xm+1,xm+2, …,当 P1 完成对 x2*m-1 的计算和广播后，P2 计算出 x2*m …，如此重复下去，直至 xn-1 在 Pp-1 中被计算出并广播至其余的处理器之后，P0 计算出下一轮的新的 x0，这样逐次迭代下去，直至收敛为止。具体算法框架描述如下：算法 20.4 求解线性方程组的高斯-塞德尔迭代并行算法输入：系数矩阵 An×n，常数向量 b n×1，ε，初始解向量 xn×1 输出：解向量 xn×1 Begin 对所有处理器 my_rank(my_rank=0,…, p-1)同时执行如下的算法: (1)for i=my-rank* m to (my-rank+1)*m-1 do /*所有处理器并行地对主对角元素右边的数据求和*/ (1.1)sum[i]=0.0 (1.2)for j=i+1 to n-1 do sum[i]=sum[i]+a[i,j]*x[j]

处理器中 end while 与并行高斯-塞德尔迭代相似,并行松弛迭代法的一轮并行计算时间为 Tp=m+m+m(3+1)gp+2,(VP-1)+1n(p-1) MPI源程序请参见所附光盘 14小结本章主要讨论线性方程组的迭代解法,这种方法是一种逐步求精的近似求解过程,其优点是简单,易于计算机编程,但它存在着迭代是否收敛以及收敛速度快慢的问题。一般迭代过程由预先给定的精度要求来控制,但由于方程组的准确解一般是不知道的,因此判断某次迭代是否满足精度要求也是比较困难的,需要根据具体情况而定。文献给出了稀疏线性方程组迭代解法的详尽描述,还包含了多重网格( Multigrid法、共轭梯度( Conjugate Gradient 法,[2]综述了稀疏线性方程组的并行求解算法,[3]综述了在向量机和并行机上偏微分方程的求解方法,[4]讨论了超立方多处理机上的多重网格算法,[5]讨论了并行共轭梯度算法 6]深入而全面地论述了SMD和MMD模型上的数值代数、离散变换和卷积、微分方程、计算数论和最优化计算的并行算法,对并行排序算法也作了介绍。此外,在[刁中第九章的参考文献注释中还列举了大量有关参考文献,进一步深入研究的读者可在这些文献中获得更多的资料参考文献 [1]陈国良编著.并行计算——结构·算法·编程.高等教育出版社,199910 12. Heath M T, Ng e and Peyton B W. Parallel Algorithm for Space Linear Systems. SIAM Review,1991,33:420-460 [3]. Ortega J M, VoigtRG. Solution of Partial Differential Equations on Vector and Parallel Computers. SIAM Review, 1985, 27(2): 149-240 [4]. Chan T F, Saad Y. Multigrid Algorithms on the Hypercube Multiprocessor IEEE-TC,1986C-35(11):969977 15. Chronopoulos A T, Gear C w On the Efficient Implementation of Pre-condition S-step Conjugate Gradient Methods on Multiprocessors with Memory Hierarchy. Parallel Computing,1989,11:37-53 6].李晓梅,蒋増荣等编著.并行算法(第五章)·湖南科技出版社,1992 [7]. Quinn MJ. Parallel Computing-Theory and Practic(second edition )McGraw-Hill, Inc, 1994 附录高斯-塞德尔迭代并行算法的MP源程序 1.源程序 seidel.c #include"mpi.h #include "math. h

处理器中 end while End 与并行高斯 - 塞德尔迭代相似 , 并行松弛迭代法的一轮并行计算时间为 : T = mn + m + n(t + t )log p + 2t ( p −1) + tw(p −1) p s w s 。 MPI 源程序请参见所附光盘。 1.4 小结本章主要讨论线性方程组的迭代解法，这种方法是一种逐步求精的近似求解过程，其优点是简单，易于计算机编程，但它存在着迭代是否收敛以及收敛速度快慢的问题。一般迭代过程由预先给定的精度要求来控制，但由于方程组的准确解一般是不知道的，因此判断某次迭代是否满足精度要求也是比较困难的，需要根据具体情况而定。文献[1]给出了稀疏线性方程组迭代解法的详尽描述，还包含了多重网格(Multigrid)法、共轭梯度(Conjugate Gradient) 法，[2]综述了稀疏线性方程组的并行求解算法，[3]综述了在向量机和并行机上偏微分方程的求解方法，[4]讨论了超立方多处理机上的多重网格算法，[5]讨论了并行共轭梯度算法， [6]深入而全面地论述了 SIMD 和 MIMD 模型上的数值代数、离散变换和卷积、微分方程、计算数论和最优化计算的并行算法，对并行排序算法也作了介绍。此外，在[7]中第九章的参考文献注释中还列举了大量有关参考文献，进一步深入研究的读者可在这些文献中获得更多的资料。参考文献 [1]. 陈国良编著．并行计算——结构·算法·编程．高等教育出版社,1999.10 [2]. Heath M T, Ng E and Peyton B W. Parallel Algorithm for Space Linear Systems. SIAM Review,1991,33:420-460 [3]. Ortega J M, Voigt R G. Solution of Partial Differential Equations on Vector and Parallel Computers. SIAM Review,1985,27(2):149-240 [4]. Chan T F,Saad Y. Multigrid Algorithms on the Hypercube Multiprocessor. IEEE-TC,1986,C-35(11):969-977 [5]. Chronopoulos A T, Gear C W. On the Efficient Implementation of Pre-condition S-step Conjugate Gradient Methods on Multiprocessors with Memory Hierarchy. Parallel Computing,1989,11:37-53 [6]. 李晓梅，蒋增荣等编著．并行算法(第五章) ．湖南科技出版社, 1992 [7]. Quinn M J. Parallel Computing-Theory and Practic(second edition)McGraw-Hill, Inc., 1994 附录高斯-塞德尔迭代并行算法的 MPI 源程序 1. 源程序 seidel.c #include "stdio.h" #include "stdlib.h" #include "mpi.h" #include "math.h

点击下载完整版文档（DOC格式）

共12页，试读结束，阅读完整版请下载

点击下载（DOC格式）

浏览记录