
计算机系统结构 (第26讲) 主讲人: 郑纬民 教授 清华大学计算机系
计算机系统结构 (第26讲) 主讲人: 郑纬民 教授 清华大学计算机系

计算机系统结构 第一章基本概念 第六章向量处理机 第二章指令系统 第七章互连网络 第三章存储系统 第八章 并行处理机和 第四章输入输出系统 多处理机 第五章标量处理机
计算机系统结构 第一章 基本概念 第二章 指令系统 第三章 存储系统 第四章 输入输出系统 第五章 标量处理机 第六章 向量处理机 第七章 互连网络 第八章 并行处理机和 多处理机

第八章并行处理机和多处理机 两种并行性概念: 同时性并行Simultaneity:两个或 两个以上事件在同一时刻发生 并发性并行Concurrency:两个或 两个以上事件在同一时间间隔内发生。 三条技术途径: 资源重复:通过重复设置多个处理部 件来提高速度。 时间重叠:流水线 资源共享:分时系统,分布式系统
第八章 并行处理机和多处理机 两种并行性概念: 同时性并行Simultaneity:两个或 两个以上事件在同一时刻发生。 并发性并行Concurrency:两个或 两个以上事件在同一时间间隔内发生。 三条技术途径: 资源重复:通过重复设置多个处理部 件来提高速度。 时间重叠:流水线 资源共享:分时系统,分布式系统

第八章并行处理机和多处理机 并行处理机采用同时性并行,资 源重复技术。 8.1并行处理机模型 8.2并行处理机的基本结构 8.3并行处理机实例 8.4多处理机结构 8.5多处理机性能模型 8.6多处理机实例
第八章 并行处理机和多处理机 8.1 并行处理机模型 8.2 并行处理机的基本结构 8.3 并行处理机实例 8.4 多处理机结构 8.5 多处理机性能模型 8.6 多处理机实例 并行处理机采用同时性并行,资 源重复技术

8.1并行处理机模型 并行处理机定义: 多个PU按照一定方式互连,在同一 个CU控制下,对各自的数据完成同一条 指令规定的操作。 从CU看,指令是串行执行的,从 PU看,数据是并行处理的。 并行处理机也称为阵列处理机。按 照佛林分类法,它属于SIMD计算机。 并行处理机的应用领域 主要用于高速向量或矩阵运算中
8.1 并行处理机模型 并行处理机定义: 多个PU按照一定方式互连,在同一 个CU控制下,对各自的数据完成同一条 指令规定的操作。 从CU看,指令是串行执行的,从 PU看,数据是并行处理的。 并行处理机也称为阵列处理机。按 照佛林分类法,它属于SIMD计算机。 并行处理机的应用领域: 主要用于高速向量或矩阵运算中

并行处理机的操作模型可用五元组来表示: M=N,C,I,M,R). 其中: N为PE个数。如IlliacIV有64个PE。 C为由控制部件CU直接执行的指令 集,包括标量指令和程序控制指令。 I为所有PE并行执行的指令集,包 括算术运算、逻辑运算、数据寻径、屏 蔽以及其它由每个活动的PE对它的数据 所执行的局部操作 M为屏蔽操作集,每种屏蔽将PE划 分为允许操作和禁止操作两个子集
并行处理机的操作模型可用五元组来表示: M=(N,C,I,M,R), 其中: N为PE个数。如IlliacIV有64个PE。 C为由控制部件CU直接执行的指令 集,包括标量指令和程序控制指令。 I为所有PE并行执行的指令集,包 括算术运算、逻辑运算、数据寻径、屏 蔽以及其它由每个活动的PE对它的数据 所执行的局部操作。 M为屏蔽操作集,每种屏蔽将PE划 分为允许操作和禁止操作两个子集

R是数据寻径集,说明互连网络中PE 间通信所需要的各种设置模式。 控制器 PEo PE PE2 Pen-1 Po P2 M M M2 M -1 互连网络 H J Siegelf提出的并行处理机模型
R是数据寻径集,说明互连网络中PE 间通信所需要的各种设置模式。 P0 M0 PE0 P1 M1 PE1 P2 M2 PE2 Pn-1 Mn-1 Pen-1 互连网络 控制器 …… H·J·Siegel提出的并行处理机模型

典型并行处理机 系统型号 SMD计算系统 语這,编译器 结构和性能 和软件支持 1024~16384个PE Fortran77 26 GIPS或1.3 MasPar Fortran MasPar Gflops;每个PE带 MPF)和MasPar 并行应用语言;X MP-1系列 16KB本地存储器, X-Net网格加一个 级交叉并关互 连 网 露 程毫
系统型号 SIMD计算系统 结构和性能 语言、编译器 和软件支持 MasPar MP-1系列 1024~16384个PE, 26 GIPS 或 1 . 3 Gflops; 每个PE带 16KB本地存储器, X-Net网格加一个 多级交叉开关互 连网 Fortran77, MasPar Fortran (MPF) 和 MasPar 并行应用语言; X 窗 口 UNIX/OS, 符号调试程序, 可 视化和动画制作 程序 典型并行处理机

65536个PE排成10 维超立方体,每个 由VAX, Sun Thinking P正可有1M位存储 Symbolics 360 或主支 Machines?公 司CM-2 选墨 机驱动,PARIS 持的isp编译 厚28Gf1ops和持 Fortran90 C* 和 续速度5.6Gf1ops *Lisp 1K位/PE方形网 主 AX/VMS Active 互连成4096PE UNIX Memory 的 细粒、 Technology M库列, 装 plus Hortrar 或DAP APAL供,主 DAP600 - 邻位链接 系列 2 560 Mflops峰值件 0 GIPS Fortran影. Fortran90标准 能 关的Fortran- plus
Active Memory Technology DAP600 系列 1K位/PE方形网 格互连成4096PE 的细粒 、 位 片 SIMD阵列,正交 4 - 邻位链接 , 2 0 GIPS 和 560Mflops峰值性 能 由 主 机 VAX/VMS 或 UNIX Fortranplus 或 DAP 上 APAL提供,主机 的 Fortran77 或 C; 与 Fortran90 标 准 有关的 Fortranplus Thinking Machines公 司CM-2 65536个PE排成10 维超立方体, 每个 PE可有1M位存储 器, 32个PE共享 FPU选件, 峰值速 度28 Gflops和持 续速度5.6 Gflops 由 VAX, Sun 或 Symbolics 360 主 机驱动, PARIS支 持的Lisp编译器、 Fortran90、C* 和 *Lisp

8.2并行处理机的基本结构 并行处理机有两种典型结构: 分布存储器并行处理机 共享存储器并行处理机 台并行处理机由五个部分组成: 多个处理单元PE 多个存储器模块M 一个控制器CU 一个互连网络ICN 一 台输入输出处理机IOP
8.2 并行处理机的基本结构 并行处理机有两种典型结构: 分布存储器并行处理机 共享存储器并行处理机 一台并行处理机由五个部分组成: 多个处理单元PE 多个存储器模块M 一个控制器CU 一个互连网络ICN 一台输入输出处理机IOP