
计算机系统结构 (第15讲) 主讲人:郑纬民教授 清华大学计算机系
计算机系统结构 (第15讲) 主讲人: 郑纬民 教授 清华大学计算机系

计算机系统结构 第一章基本概念 第六章向量处理机 第二章指令系统 第七章互连网络 第三章存储系统 第八章并行处理机和 第四章输入输出系统 多处理机 第五章标量处理机
计算机系统结构 第一章 基本概念 第二章 指令系统 第三章 存储系统 第四章 输入输出系统 第五章 标量处理机 第六章 向量处理机 第七章 互连网络 第八章 并行处理机和 多处理机

第五章 标量处理机 5.1指令的重叠执行方式 5.2流水线技术 5.3超标量处理机 5.4超流水线处理机 5.5超标量超流水线理机
第五章 标量处理机 5.1 指令的重叠执行方式 5.2 流水线技术 5.3 超标量处理机 5.4 超流水线处理机 5.5 超标量超流水线处理机

只有标量数据表示和标量指令系统的处理机称 为标量处理机 提高指令执行速度的主要途径: (1)提高处理机的工作主频 (2)采用更好的算法和设计更好的功能部件 (3)采用指令级并行技术 三种指令级并行处理机: (I)流水线处理机和超流水线(Super- pipelining)处理机 (2)超标量(Superscalar)处理机 (3)超长指令字(VLIW:Very Long Instruction Word)处理机
只有标量数据表示和标量指令系统的处理机称 为标量处理机 提高指令执行速度的主要途径: (1) 提高处理机的工作主频 (2) 采用更好的算法和设计更好的功能部件 (3) 采用指令级并行技术 三种指令级并行处理机: (1) 流水线处理机和超流水线(Superpipelining)处理机 (2) 超标量(Superscalar)处理机 (3) 超长指令字(VLIW: Very Long Instruction Word)处理机

5.1指令的重叠执行方式 1、顺序执行方式 执行n条指令所用的时间为: 7=立(指◆+t分折+t铁行) i=1 如果每段时间都为t,则执行n条指令所用 的时间为:T=3nt 取指令k分析执行k取指令k+1分析k+1执行k+1
5.1 指令的重叠执行方式 1、顺序执行方式 执行n条指令所用的时间为: 如果每段时间都为t,则执行n条指令所用 的时间为: T=3nt = = + + n i T t i t i t i 1 ( 取指令 分析 执行 ) 取指令k 分析k 执行k 取指令k+1 分析k+1 执行k+1

主要优点: 控制简单,节省设备。 主要缺点: 执行指令的速度慢,功能部件的利用率 很低。 2、一次重叠执行方式 种最简单的流水线方式 如果两个过程的时间相等,则执行n条指令 的时间为:T=(1+2nt
主要优点: 控制简单,节省设备。 主要缺点: 执行指令的速度慢,功能部件的利用率 很低。 2、一次重叠执行方式 一种最简单的流水线方式 如果两个过程的时间相等,则执行n条指令 的时间为:T=(1+2n)t

取捐分析执行 取指分析执行 取指分析执行 主要优点: 指令的执行时间缩短 功能部件的利用率明显提高 主要缺点: 需要增加一些硬件 控制过程稍复杂
取指 分析 执行 取指 分析 执行 取指 分析 执行 主要优点: 指令的执行时间缩短 功能部件的利用率明显提高 主要缺点: 需要增加一些硬件 控制过程稍复杂

3、二次重叠执行方式 如果三过程的时间相等,执行n条指令的时 间为:T=(2+nt 理想情况下同时有三条指令在执行 处理机的结构要作比较大的改变,必须采 用先行控制方式 取指散 分析k执行k 取指k+1分析k+1执行k+1 取指歇+2分析k+2执行k+2
3、二次重叠执行方式 如果三过程的时间相等,执行n条指令的时 间为:T=(2+n)t 理想情况下同时有三条指令在执行 处理机的结构要作比较大的改变,必须采 用先行控制方式 取指k+2 分析k+2 执行k+2 取指k+1 分析k+1 执行k+1 取指k 分析k 执行k

先行控制方式的原理 1、采用二次重叠执行方式,必须解决两个问题: (1)有独立的取指令部件、指令分析部件 和指令执行部件 独立的控制器: 存储控制器、指令控制器、运算控制器 (2)要解决访问主存储器的冲突问题 取指令、分析指令、执行指令都可能要访问存储器 2、解决访存冲突的方法: (1)采用低位交叉存取方式: 这种方法不能根本解决冲突问题。 取指令、读操作数、写结果
先行控制方式的原理 1、采用二次重叠执行方式,必须解决两个问题: (1) 有独立的取指令部件、指令分析部件 和指令执行部件 独立的控制器: 存储控制器、指令控制器、运算控制器 (2) 要解决访问主存储器的冲突问题 取指令、分析指令、执行指令都可能要访问存储器 2、解决访存冲突的方法: (1) 采用低位交叉存取方式: 这种方法不能根本解决冲突问题。 取指令、读操作数、写结果

(2)两个独立的存储器:独立的指令存储器和数据存储器。 如果再规定,执行指令所需要的操作数和执行结果只 写到通用寄存器,那么,取指令、分析指令和执行指令就 可以同时进行。 在许多高性能处理机中,有独立的指令Cache和数据 Cache。 这种结构被称为哈佛结构。 (3)采用先行控制技术。 先行控制技术的关键是缓冲技术和预处理技术。 缓冲技术是在工作速度不固定的两个功能部件之间设 置缓冲栈,用以平滑它们的工作。 在采用了缓冲技术和预处理技术之后,运算器能够 专心于数据的运算,从而大幅度提高程序的执行速度
(2) 两个独立的存储器:独立的指令存储器和数据存储器。 如果再规定,执行指令所需要的操作数和执行结果只 写到通用寄存器,那么,取指令、分析指令和执行指令就 可以同时进行。 在许多高性能处理机中,有独立的指令Cache和数据 Cache。 这种结构被称为哈佛结构。 (3) 采用先行控制技术。 先行控制技术的关键是缓冲技术和预处理技术。 缓冲技术是在工作速度不固定的两个功能部件之间设 置缓冲栈,用以平滑它们的工作。 在采用了缓冲技术和预处理技术之后,运算器能够 专心于数据的运算,从而大幅度提高程序的执行速度