
计算机系统结构 (第20讲) 主讲人:郑纬民教授 清华大学计算机系
计算机系统结构 (第20讲) 主讲人: 郑纬民 教授 清华大学计算机系

计算机系统结构 第一章基本概念 第六章 向量处理机 第二章指令系统 第七章互连网络 第三章存储系统 第八章并行处理机和 第四章输入输出系统 多处理机 第五章标量处理机
计算机系统结构 第一章 基本概念 第二章 指令系统 第三章 存储系统 第四章 输入输出系统 第五章 标量处理机 第六章 向量处理机 第七章 互连网络 第八章 并行处理机和 多处理机

第六章向量处理机 6.1向量数据表示方式 6.2向量处理机的结构 6.3向量处理方式 6.4向量处理机的关键技术 6.5向量处理机实例 6.6向量处理机的性能评价 6.7向量处理机的发展
第六章 向量处理机 6.1 向量数据表示方式 6.2 向量处理机的结构 6.3 向量处理方式 6.4 向量处理机的关键技术 6.5 向量处理机实例 6.6 向量处理机的性能评价 6.7 向量处理机的发展

6.1向量数据表示方式 向量处理机是解决数值计算问题的一种 高性能计算机结构 向量处理机一般都采用流水线结构,有 多条流水线并行工作 向量处理机通常属大型或巨型机,也可 以用微机加一台向量协处理器组成 般向量计算机中包括有一台高性能标 量处理机 必须把要解决的问题转化为向量运算, 向量处理机才能充分发挥作用
6.1 向量数据表示方式 向量处理机是解决数值计算问题的一种 高性能计算机结构 向量处理机一般都采用流水线结构,有 多条流水线并行工作 向量处理机通常属大型或巨型机,也可 以用微机加一台向量协处理器组成 一般向量计算机中包括有一台高性能标 量处理机 必须把要解决的问题转化为向量运算, 向量处理机才能充分发挥作用

6.1向量数据 6.1.1从标量到向量
6.1 向量数据 6.1.1 从标量到向量

6.1.1从标量到向量 例如:一个简单的C语言程序如下: for(i=10;i<=1010;i++) ci订=a[i]+b[i+5]; 在向量处理机上,可以只用一条指令: C(10:1010)=A(10:1010)+B(15:1015) 条向量指令可处理N个或N对操作数 在标量处理机上用10多条指令,其中有8 条指令要循环1000次。 采用多寄存器结构的两地址指令 编写程序
6.1.1 从标量到向量 例如:一个简单的C语言程序如下: for (i = 10; i <= 1010; i++) c[i] = a[i] + b[i+5] ; 在向量处理机上,可以只用一条指令: C(10:1010)=A(10:1010) + B(15 :1015) 一条向量指令可处理N个或N对操作数 在标量处理机上用10多条指令,其中有8 条指令要循环1000次。 采用多寄存器结构的两地址指令 编写程序

存储器采用字节编址方式,字长为32位 在一般标量处理机中需要如下指令序列 来实现(A、B、C分别是向量a、b、c在内存 中的起始地址) START: LOAD RO, ST ;读循环初值,10 LOAD RI. ED ;读循环终值,1010 LOAD R2, ;读内存地址增量, ;常数4 MOVE R3, R2 MUL R3, RO ;向量偏移量, ;初始值为40 LOOP: LOAD R4, A(R3);读A向量的 个元素
存储器采用字节编址方式,字长为32位 在一般标量处理机中需要如下指令序列 来实现(A、B、C分别是向量a、b、c在内存 中的起始地址): START: LOAD R0, ST ;读循环初值,10 LOAD R1, ED ;读循环终值,1010 LOAD R2, L ;读内存地址增量, ;常数4 MOVE R3, R2 MUL R3, R0 ;向量偏移量, ;初始值为40 LOOP: LOAD R4, A(R3) ;读A向量的 ;一个元素

LOAD R5, B(R3);读B向量的一个元素 ADD R4. R5 STORE R4, CR3);写C向量的一个元素 ADD R3, R2 :改变向量偏移量 INC RO ,循环次数增1 CMP RO. R1 ;循环是否结束 BLE LOOP ;循环未结束转LOOP, ;否则继续 HALT ST: 10 ;循环初值 ED: 1010 ;循环终值 L A ;内存地址增量
LOAD R5, B(R3) ;读B向量的一个元素 ADD R4, R5 STORE R4, C(R3) ;写C向量的一个元素 ADD R3, R2 ;改变向量偏移量 INC R0 ;循环次数增1 CMP R0, R1 ;循环是否结束 BLE LOOP ;循环未结束转LOOP, ;否则继续 HALT ST: 10 ;循环初值 ED: 1010 ;循环终值 L: 4 ;内存地址增量

第六章向量处理机 6.1向量数据表示方式 6.2向量处理机的结构 6.3向量处理方式 6.4向量处理机的关键技术 6.5向量处理机实例 6.6向量处理机的性能评价 6.7向量处理机的发展
第六章 向量处理机 6.1 向量数据表示方式 6.2 向量处理机的结构 6.3 向量处理方式 6.4 向量处理机的关键技术 6.5 向量处理机实例 6.6 向量处理机的性能评价 6.7 向量处理机的发展

6.2向量处理机结构 向量处理机的最关键问题是存储器系统 能够满足运算部件带宽的要求。 主要采用两种方法: 1.存储器一存储器结构 多个独立的存储器模块并行工作 处理机结构简单,对存储系统的 访问速度要求很高 2.寄存器一寄存器结构 运算通过向量寄存器进行 需要大量高速寄存器,对存储系 统访问速度的要求降低
6.2 向量处理机结构 向量处理机的最关键问题是存储器系统 能够满足运算部件带宽的要求。 主要采用两种方法: 1. 存储器-存储器结构 多个独立的存储器模块并行工作 处理机结构简单,对存储系统的 访问速度要求很高 2. 寄存器-寄存器结构 运算通过向量寄存器进行 需要大量高速寄存器,对存储系 统访问速度的要求降低