
计算机系统结构 (第16讲) 主讲人: 郑纬民教授 清华大学计算机系
计算机系统结构 (第16讲) 主讲人: 郑纬民 教授 清华大学计算机系

第五章 标量处理机 5.1先行控制技术 5.2流水线技术 5.3超标量处理机 5.4超流水线处理机 5.5超标量超流水线处理机
第五章 标量处理机 5.1 先行控制技术 5.2 流水线技术 5.3 超标量处理机 5.4 超流水线处理机 5.5 超标量超流水线处理机

5.2流水线技术 5.2.1流水线工作原理 5.2.2流水线的分类 5.2.3线性流水线的性能分析 5.2.4非线性流水线的调度技术
5.2 流水线技术 5.2.1 流水线工作原理 5.2.2 流水线的分类 5.2.3 线性流水线的性能分析 5.2.4 非线性流水线的调度技术

5.2流水线技术 空间并行性: 设置多个独立的操作部件 多操作部件处理机 超标量处理机 时间并行性: 采用流水线技术。 不增加或只增加少量硬件就能使运算 速度提高几倍 流水线处理机 超流水线处理机
5.2 流水线技术 空间并行性: 设置多个独立的操作部件 多操作部件处理机 超标量处理机 时间并行性: 采用流水线技术。 不增加或只增加少量硬件就能使运算 速度提高几倍 流水线处理机 超流水线处理机

5.2.1流水线工作原理 1、简单流水线 输 折器 流水 执行部件 流水 输 k+ 锁存器 打行k 锁存器 流水线的每一个阶段称为流水步、流水 步骤、流水段、流水线阶段、流水功 能段、功能段、流水级、流水节拍等
5.2.1 流水线工作原理 1、简单流水线 流水线的每一个阶段称为流水步、流水 步骤、流水段、流水线阶段、流水功 能段、功能段、流水级、流水节拍等。 ` 分析器 分析k+1 流水 锁存器 执行部件 执行k 流水 锁存器 输 入 输 出 t1 t2

在每一个流水段的末尾或开头必须设置 个寄存器,称为流水寄存器、流水 锁存器、流水闸门寄存器等。会增加 指令的执行时间。 为了简化,在一般流水线中不画出流水 锁存器。 2、一种指令流水线 取指 译码 形成操 取操 呆存 作数地 执行
在每一个流水段的末尾或开头必须设置 一个寄存器,称为流水寄存器、流水 锁存器、流水闸门寄存器等。会增加 指令的执行时间。 为了简化,在一般流水线中不画出流水 锁存器。 2、一种指令流水线 取指 形成操 译码 作数地址 取操 作数 执行 保存 结果

般4至12个流水段,等于及大于8个流 水段的称为超流水线处理机 3、流水线的时空图 一 条简单流水线的时空图: 空间 执行k执行k+1执行k+2执行k+3 分析k份析k+份析k+2分析k+3 t> ts 时间
一般4至12个流水段,等于及大于8个流 水段的称为超流水线处理机 3、流水线的时空图 一条简单流水线的时空图: 分析k 分析k+1分析k+2分析k+3 执行k 执行k+1执行k+2执行k+3 时间 空间 0 t1 t2 t3 t4 t5

个浮点加法器流水线的时空图(由求阶差、 对阶、尾数加和规格化4个流水段组成): 空间 NL1NL2 NL3NL4NL5 MA1MA2MA3MA4MA5 EA1EA2 EA3 EA4EA5 ED1 ED2 ED3 ED4 ED5 时间 0 t- NL:规格化 MA:尾数加 ED:求阶差 EA:对阶
一个浮点加法器流水线的时空图(由求阶差、 对阶、尾数加和规格化4个流水段组成): ED1 时间 空间 0 t1 t2 t3 t4 t5 ED2 ED3 ED4 ED5 EA1 EA2 EA3 EA4 EA5 MA1MA2MA3MA4MA5 NL1 NL2 NL3 NL4 NL5 t6 t7 t8 NL:规格化 MA:尾数加 ED:求阶差 EA:对阶

4、流水线的主要特点 只有连续提供同类任务才能充分发挥流 水线的效率: 对于指令流水线:要尽量减少因条件 分支造成的“断流” 对于操作部件:主要通过编译技术, 尽量提供连续的同类操作 在流水线的每一个流水线段中都要设置 一个流水锁存器 时间开销:流水线的执行时间加长 是流水线中需要增加的主要硬件之
4、流水线的主要特点 只有连续提供同类任务才能充分发挥流 水线的效率: 对于指令流水线:要尽量减少因条件 分支造成的“断流” 对于操作部件:主要通过编译技术, 尽量提供连续的同类操作 在流水线的每一个流水线段中都要设置 一个流水锁存器 时间开销:流水线的执行时间加长 是流水线中需要增加的主要硬件之一

各流水段的时间应尽量相等 流水线处理机的基本时钟周期等于时 间最长的流水段的时间长度 流水线需要有“装入时间”和“排空时 间
各流水段的时间应尽量相等 流水线处理机的基本时钟周期等于时 间最长的流水段的时间长度 流水线需要有“装入时间”和“排空时 间