《并行计算》课程教学资源（讲义）线性方程组的直接解法

在求解线性方程组(System of Linear Equations)的算法中,有两类最基本的算法,一类是直接法,即以消去为基础的解法。如果不考虑误差的影响,从理论上讲,它可以在固定步数内求得方程组的准确解。另一类是迭代解法,它是一个逐步求得近似解的过程,这种方法便于编制解题程序,但存在着迭代是否收敛及收敛速度快慢的问题。

团购合买资源类别：文库，文档格式：DOC，文档页数：16，文件大小：171.5KB

7线性方程组的直接解法在求解线性方程组( System of Linear Equations)的算法中,有两类最基本的算法,一类是直接法,即以消去为基础的解法。如果不考虑误差的影响,从理论上讲,它可以在固定步数内求得方程组的准确解。另一类是迭代解法,它是一个逐步求得近似解的过程,这种方法便于编制解题程序,但存在着迭代是否收敛及收敛速度快慢的问题。在迭代过程中,由于极限过程一般不可能进行到底,因此只能得到满足一定精度要求的近似解。本章我们主要介绍几种直接法,迭代法将在下一章讨论。 1.1高斯消去法解线性方程组在直接方法中最主要的是高斯消去法( Gaussian elimination)。它分为消元与回代两个过程,消元过程将方程组化为一个等价的三角方程组,而回代过程则是解这个三角方程组。 1911高斯消去及其串行算法对于方程组Ax=b,其中A为n阶非奇异阵,其各阶主子行列式不为零,x,b为n维向量。将向量b看成是A的最后一列,此时A就成了一个n×(n+1)的方程组的增广矩阵 ( Augmented matrⅸx),消去过程实质上是对增广矩阵A进行线性变换,使之三角化。高斯消去法按k=1,2…;n的顺序,逐次以第k行作为主行进行消去变换,以消去第k列的主元素以下的元素ak+1k,ak+2k,…,amk。消去过程分为两步,首先计算: k=akak,j=k+1,…,n 这一步称为归一化( Normalization)。它的作用是将主对角线上的元素变成1,同时第k行上的所有元素与常数向量中的bk都要除以ak。由于A的各阶主子式非零,可以保证在消去过程中所有主元素aA皆为非零。然后计算 a= ajj-aik aki,i/=k+1,…,n b=b-akbk,i=k+1,…n 这一步称为消元,它的作用是将主对角线ak以下的元素消成0,其它元素与向量B中的元素也应作相应的变换。在回代过程中,按下式依次解出xm,xm1,…x1: ①直接解出xn,即xn=bn/anm ②进行回代求x=b-∑ 在归-化的过程中,要用ak作除数,当|ak|很小时,会损失精度,并且可能会导致商太大而使计算产生溢出。如果系数A虽为非奇异,但不能满足各阶主子式全不为零的条件,就会出现主元素an为零的情况,导致消去过程无法继续进行。为了避免这种情形,在每次归一化之前,可增加一个选主元( Pivot)的过程,将绝对值较大的元素交换到主对角线的置上。根据选取主元的范围不同,选主元的方法主要有列主元与全主元两种。列主元 Column pivot方法的基本思想是当变换到第k步时,从第k列的aM以下(包括

1. 7 线性方程组的直接解法在求解线性方程组(System of Linear Equations)的算法中，有两类最基本的算法，一类是直接法，即以消去为基础的解法。如果不考虑误差的影响，从理论上讲，它可以在固定步数内求得方程组的准确解。另一类是迭代解法，它是一个逐步求得近似解的过程，这种方法便于编制解题程序，但存在着迭代是否收敛及收敛速度快慢的问题。在迭代过程中，由于极限过程一般不可能进行到底，因此只能得到满足一定精度要求的近似解。本章我们主要介绍几种直接法，迭代法将在下一章讨论。 1.1 高斯消去法解线性方程组在直接方法中最主要的是高斯消去法(Gaussian Elimination)。它分为消元与回代两个过程，消元过程将方程组化为一个等价的三角方程组，而回代过程则是解这个三角方程组。 19.1.1 高斯消去及其串行算法对于方程组 Ax=b，其中 A 为 n 阶非奇异阵，其各阶主子行列式不为零，x，b 为 n 维向量。将向量 b 看成是 A 的最后一列，此时 A 就成了一个 n×(n+1)的方程组的增广矩阵 (Augmented Matrix)，消去过程实质上是对增广矩阵 A 进行线性变换，使之三角化。高斯消去法按 k=1,2,…,n 的顺序，逐次以第 k 行作为主行进行消去变换，以消去第 k 列的主元素以下的元素 ak k ak k ank , , , +1 +2  。消去过程分为两步，首先计算： akj=akj/akk , j=k+1, …,n bk=bk/akk 这一步称为归一化(Normalization)。它的作用是将主对角线上的元素变成 1，同时第 k 行上的所有元素与常数向量中的 bk都要除以 akk 。由于 A 的各阶主子式非零，可以保证在消去过程中所有主元素 akk皆为非零。然后计算： aij=aij-aik akj , i,j=k+1, …,n bi= bi -aik bk , i =k+1, …,n 这一步称为消元，它的作用是将主对角线 akk以下的元素消成 0，其它元素与向量 B 中的元素也应作相应的变换。在回代过程中，按下式依次解出 xn,xn-1, …,x1： ① 直接解出 xn，即 xn=bn/ann； ② 进行回代求 = + = − = − n j i xi bi aij xj i n 1 , 1, , 2,1 在归−化的过程中，要用 akk 作除数，当∣akk∣很小时，会损失精度，并且可能会导致商太大而使计算产生溢出。如果系数 A 虽为非奇异，但不能满足各阶主子式全不为零的条件，就会出现主元素 aii 为零的情况，导致消去过程无法继续进行。为了避免这种情形，在每次归一化之前，可增加一个选主元(Pivot)的过程，将绝对值较大的元素交换到主对角线的位置上。根据选取主元的范围不同，选主元的方法主要有列主元与全主元两种。列主元(Column Pivot)方法的基本思想是当变换到第 k 步时，从第 k 列的 akk以下（包括

(il)a[,1 nd for (3)fori= n downto l do/采用全主元高斯消去法的回代过程 forj=汁+ I to n do l]=a[*x可 end for end for (4)for k-l to n do for F=l to n do if(shjl=k)then输出x{k]的值x{ i end if end fo end for 在全主元高斯消去法中,由于每次选择主元素的数据交换情况无法预计,因此我们不考虑选主元的时间而仅考虑一般高斯消去法的计算时间复杂度。若取一次乘法和加法运算时间或一次除法运算时间为一个单位时间,则消去过程的时间复杂度为22,回代过程的时间复杂度为Σi,算法19.1的时间复杂度为(m3+3m2+2n)3=0m2 1912并行高斯消去算法高斯消去法是利用主行i对其余各行j,>)作初等行变换,各行计算之间没有数据相关关系,因此可以对矩阵A按行划分。考虑到在计算过程中处理器之间的负载均衡,对A 采用行交叉划分。设处理器个数为p矩阵A的阶数为n,m=「m/p,对矩阵A行交叉划分后, 编号为i(=0,1,…,p-1)的处理器含有A的第,计p,…+(m1)p行和向量B的第i, 计+p,…,计+(m-1)一共m个元素消去过程的并行是依次以第0,1,…;n-1行作为主行进行消去计算,由于对行的交叉划分与分布,这实际上是由各处理器轮流选出主行。在每次消去计算前,各处理器并行求其局部存储器中右下角阶子阵的最大元。若以编号为 my rank的处理器的第i行作为主行,则编号在 my rank后面的处理器(包括 my rank本身)求其局部存储器中第i行至第m1行元素的最大元,并记录其行号、列号及所在处理器编号;编号在 my rank前面的处理器求其局部存储器中第计+1行至第m-1行元素的最大元,并记录其行号、列号及所在处理器编号。然后通过扩展收集操作将局部存储器中的最大元按处理器编号连接起来并广播给所有处理器,各处理器以此求得整个矩阵右下角阶子阵的最大元 maxvalue及其所在行号、列号和处理器编号。若 maxvalue的列号不是原主元素ak的列号,则交换第k列与 maxvalue所在列的两列数据:若 maxvalue的处理器编号不是原主元素ak的处理器编号,则在处理器间的进行行交换;若 maxvalue的处理器编号是原主元素ak的处理器编号,但行号不是原主元素ak的行号,则在处理器内部进行行交换。在消去计算中,首先对主行元素作归一化操作ay=a/ak b=bk,然后将主行广播给所有处理器,各处理器利用接收到的主行元素对其部分行向量做行变换。若以编号为 my rank的处理器的第i行作为主行,并将它播送给所有的处理器则编号在 my_ rank前面的处理器(包括 my rank本身)利用主行对其第汁1…,m1行数据和子向量B做行变换。编号在 my rank后面的处理器利用主行对其第i…,m1行数据和子向量B做行变换

(iii)a[i,k]=0 end for end for (3)for i=n downto 1 do /*采用全主元高斯消去法的回代过程*/ forj=i+1 to n do b[i]= a[i,j]* x[i] end for end for (4)for k=1 to n do for i=1 to n do if (shift[i]=k) then 输出 x[k]的值 x[i] end if end for end for End 在全主元高斯消去法中，由于每次选择主元素的数据交换情况无法预计，因此我们不考虑选主元的时间而仅考虑一般高斯消去法的计算时间复杂度。若取一次乘法和加法运算时间或一次除法运算时间为一个单位时间，则消去过程的时间复杂度为  = n i i 1 2 ，回代过程的时间复杂度为  = n i i 1 ，算法 19.1 的时间复杂度为(n 3+3n 2+2n)/3=О(n 3 )。 19.1.2 并行高斯消去算法高斯消去法是利用主行 i 对其余各行 j，(j>i)作初等行变换，各行计算之间没有数据相关关系，因此可以对矩阵 A 按行划分。考虑到在计算过程中处理器之间的负载均衡，对 A 采用行交叉划分。设处理器个数为 p,矩阵 A 的阶数为 n，m = n / p ，对矩阵 A 行交叉划分后，编号为 i(i=0,1,…, p -1)的处理器含有 A 的第 i, i+p,…,i+(m-1)p 行和向量 B 的第 i, i+p,…,i+(m-1)p 一共 m 个元素。消去过程的并行是依次以第 0,1,…,n-1 行作为主行进行消去计算，由于对行的交叉划分与分布，这实际上是由各处理器轮流选出主行。在每次消去计算前，各处理器并行求其局部存储器中右下角阶子阵的最大元。若以编号为 my_rank 的处理器的第 i 行作为主行，则编号在 my_rank 后面的处理器（包括 my_rank 本身）求其局部存储器中第 i 行至第 m-1 行元素的最大元，并记录其行号、列号及所在处理器编号；编号在 my_rank 前面的处理器求其局部存储器中第 i+1 行至第 m-1 行元素的最大元，并记录其行号、列号及所在处理器编号。然后通过扩展收集操作将局部存储器中的最大元按处理器编号连接起来并广播给所有处理器，各处理器以此求得整个矩阵右下角阶子阵的最大元 maxvalue 及其所在行号、列号和处理器编号。若 maxvalue 的列号不是原主元素 akk的列号，则交换第 k 列与 maxvalue 所在列的两列数据；若 maxvalue 的处理器编号不是原主元素 akk的处理器编号，则在处理器间的进行行交换；若 maxvalue 的处理器编号是原主元素 akk的处理器编号，但行号不是原主元素 akk的行号，则在处理器内部进行行交换。在消去计算中，首先对主行元素作归一化操作 akj=akj/akk , bk=bk/akk，然后将主行广播给所有处理器，各处理器利用接收到的主行元素对其部分行向量做行变换。若以编号为 my_rank 的处理器的第 i 行作为主行，并将它播送给所有的处理器。则编号在 my_rank 前面的处理器（包括 my_rank 本身）利用主行对其第 i+1,…, m-1 行数据和子向量 B 做行变换。编号在 my_rank 后面的处理器利用主行对其第 i,…,m-1 行数据和子向量 B 做行变换

点击下载完整版文档（DOC格式）

共16页，试读结束，阅读完整版请下载

点击下载（DOC格式）

浏览记录