钱晓捷,微机原理与接口技术第4版—基于IA-32处理器和32位汇编语言 第9章 处理器性能提髙技术 9.1精简指令集计算机技术 9.2指令流水线技术 9.3浮点数据处理单元 9.4多媒体指令
钱晓捷,微机原理与接口技术·第4版——基于IA-32处理器和32位汇编语言 第 9 章 处理器性能提高技术 9.1 精简指令集计算机技术 9.2 指令流水线技术 9.3 浮点数据处理单元 9.4 多媒体指令
9.1精简指令集计算机技术 >精简指令集计算机技术起源 ·向量巨型机CRAY-I:精简指令、面向寄存器操 作 第·IBM801小型机:单周期固定格式指令、高速缓 冲存储器以及编译技术相结合 机·RISC-I:第一个精简指令集计算机处理器芯片 在高档的工程工作站得到广泛应用 最新开发的处理器普遍釆用精简指令集计算 机设计思想 Simple but elegant
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 9.1 精简指令集计算机技术 ➢精简指令集计算机技术起源 向量巨型机CRAY-I:精简指令、面向寄存器操 作 IBM 801小型机:单周期固定格式指令、高速缓 冲存储器以及编译技术相结合 RISC-I:第一个精简指令集计算机处理器芯片 ➢在高档的工程工作站得到广泛应用 ➢最新开发的处理器普遍采用精简指令集计算 机设计思想 Simple but elegant
9.1.1复杂指令集和精简指令集 骂复杂指令集计算机CISC ·指令系统丰富、程序设计方便、程序短小、执 行性能高 第·处理器硬件复杂,不易使用先进的流水线技术, 导致其执行速度和性能难以进一步提高 相≥精简指令集计算机RISC 指令系统很简单,只有少数简单、常用的指令 出 ●处理器硬件简单,比较方便地实现优化 80%和20%规律
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 9.1.1 复杂指令集和精简指令集 ➢复杂指令集计算机CISC 指令系统丰富、程序设计方便、程序短小、执 行性能高 处理器硬件复杂,不易使用先进的流水线技术, 导致其执行速度和性能难以进一步提高 ➢精简指令集计算机RISC 指令系统很简单,只有少数简单、常用的指令 处理器硬件简单,比较方便地实现优化 80%和20%规律
微机原 处理器性能公式 理>处理器执行时间=Ic×CP×T IC=程序的指令条数 CPI=执行每条指令所需的平均时钟周期数 T=每个时钟周期的时间(时钟频率的倒数) 版处理器执行程序时间越少,计算机性能越高 械·减少时钟周期时间T,即提高时钟频率 ·CISC通过使用复杂指令减少IC 醛·RISC使用简单指令减少CP 相互借鉴、共同提高
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 处理器性能公式 ➢处理器执行时间=IC×CPI×T IC=程序的指令条数 CPI=执行每条指令所需的平均时钟周期数 T=每个时钟周期的时间(时钟频率的倒数) ➢处理器执行程序时间越少,计算机性能越高 减少时钟周期时间T,即提高时钟频率 CISC通过使用复杂指令减少IC RISC使用简单指令减少CPI 相互借鉴、共同提高
微机原 9.1.2RISc技术的主要特点 骂≥指令条数较少 接 寻址方式简单 技 不>面向寄存器操作 4>指令格式规整 版 机>单周期执行 x>先进的流水线技术 >编译器优化 社 ●●●●●● Load- Store结构
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 9.1.2 RISC技术的主要特点 ➢指令条数较少 ➢寻址方式简单 ➢面向寄存器操作 ➢指令格式规整 ➢单周期执行 ➢先进的流水线技术 ➢编译器优化 ➢…… Load-Store结构
概92指令流水线技术 理 6 PM 7 8 接 时间 米在 304040404020 第 4 务顺 A 版序 机 B 械 洗衣房的流水作业 业 17 三个阶段: 出 版 1.水洗(30) 社 片 2.烘干(40) 3.熨烫(20)午
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 9.2 指令流水线技术 洗衣房的流水作业 三个阶段: 1. 水洗(30) 2. 烘干(40) 3. 熨烫(20) A B C D 6 PM 7 8 9 任 务 顺 序 时间 30 40 40 40 40 20
9.21指令流水线 微机原理与接口技术·第4版机械工业出版社 又指 执行 取指 译码 执行 取指」译码}地址」执行」回写 S2 S3 S4 S5 指令读取 指令译码 地址计算 指令执行 结果回写
微机原理与接口技术·第4版机械工业出版社 9.2.1 指令流水线 取指 执行 取指 译码 执行 取指 译码 地址 执行 回写 S1 S2 S3 S4 S5 指令读取 指令译码 地址计算 指令执行 结果回写
薇1.流水线思想 理指令流水线技术:把执行指令这个过程分解成多 接个子过程,执行指令的功能单元也设计成多个相 技应的处理单元,多个子过程在多个处理单元并行 术 操作,同时处理多条指令 第 4>没有减少每个指令的执行时间 版 有助于减少整个程序(多条指令)的执行时间 机 >指令流水线开始需要“填充时间(Fil)”,最 业出版社 后有一个“排空时间( Drain) 要发挥流水线效率需要连续不断地处理指令 不要断流 时空图
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 1. 流水线思想 ➢ 指令流水线技术:把执行指令这个过程分解成多 个子过程,执行指令的功能单元也设计成多个相 应的处理单元,多个子过程在多个处理单元并行 操作,同时处理多条指令 ➢ 没有减少每个指令的执行时间 ➢ 有助于减少整个程序(多条指令)的执行时间 ➢ 指令流水线开始需要“填充时间(Fill)” ,最 后有一个“排空时间(Drain)” 要发挥流水线效率需要连续不断地处理指令 时空图
概2.流水线中的指令相关 理指令相关:指令之间存在相互依赖关系 常使下一条指令无法在设计的单位时间内执行 术 导致流水线的“断流”,性能降低 第有三种类型的指令相关 资源冲突:当指令重叠执行过程中,硬件资源 满足不了指令重叠执行的要求 亚·数据相关:在同时执行的多条指令中,一条指 出 令依赖前一条指令的执行结果(数据)无法得到 控制相关:流水线遇到分支指令或其他改变PC 值的指令 数据旁路预取分支目标分支预测
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 2. 流水线中的指令相关 ➢指令相关:指令之间存在相互依赖关系 常使下一条指令无法在设计的单位时间内执行 导致流水线的“断流” ,性能降低 ➢有三种类型的指令相关 资源冲突:当指令重叠执行过程中,硬件资源 满足不了指令重叠执行的要求 数据相关:在同时执行的多条指令中,一条指 令依赖前一条指令的执行结果(数据)无法得到 控制相关:流水线遇到分支指令或其他改变PC 值的指令 数据旁路 预取分支目标 分支预测
9.2.280486的指令流水线 理>5级指令流水线,每级1个时钟周期 苔①P指令预取( prefetch) 术 ②D1指令译码1( decode stage1) 第对所有操作码和寻址方式信息进行译码 版③D2指令译码2( decode stage2) 机 械 将操作码扩展为ALU控制信号,存储器地址计算 ④EX指令执行( execute) 版完成AL操作和 ICache存取 社 ⑤WB回写( write back) 更新在EX步骤得到的寄存器数据和状态标志
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 9.2.2 80486的指令流水线 ➢5级指令流水线,每级1个时钟周期 PF⎯⎯指令预取(prefetch) D1⎯⎯指令译码1(decode stage 1) 对所有操作码和寻址方式信息进行译码 D2⎯⎯指令译码2(decode stage 2) 将操作码扩展为ALU控制信号,存储器地址计算 EX⎯⎯指令执行(execute) 完成ALU操作和Cache存取 WB⎯⎯回写(write back) 更新在EX步骤得到的寄存器数据和状态标志