北京《计算机系统结构》：第一章基本概念

研究内容：从外部来研究计算机系统使用者所看到的物理计算机的抽象编写出能够在机器上正确运行的程序所必须了解到的计算机的属性软硬件功能分配及分界面的确定。

团购合买资源类别：文库，文档格式：DOC，文档页数：22，文件大小：196.5KB

1 计算机系统结构课程介绍 • Computer Architecture 计算机系统结构计算机体系结构 “建筑学”、“建筑物的设计或式样”，通常是指一个系统的外貌。 • 研究内容：从外部来研究计算机系统使用者所看到的物理计算机的抽象编写出能够在机器上正确运行的程序所必须了解到的计算机的属性软硬件功能分配及分界面的确定 • 学习目的：建立计算机系统的完整概念学习计算机系统的分析方法和设计方法掌握新型计算机系统的基本结构及其工作原理 • 学科方向：是全国重点学科一级学科一个：计算机科学与技术二级学科三个：计算机系统结构、计算机软件、计算机应用技术 • 与其他学科的交叉主要包括：计算机组成原理、计算机操作系统、汇编语言、数据结构、微机原理、高级语言等新内容：超标量处理机、超流水线计算机、向量处理机、并行处理机、多处理机等交叉点：提高、建立完整概念 • 课程安排课内：64 学时, 实验：16 学时, 课外：课内外比例 1：2 除完成作业和实验外，还要多看参考书 • 实验 DLX处理机实验原理、实验内容及实验要求：教材第十二章 • 计算机系统结构正处于变革时期软件、系统结构、组成技术，两头发展快、中间慢非冯计算机正兴起系统结构的发展时期已经到来 • 教材：计算机系统结构，清华大学出版社，第二版主要参考书： 1．Patterson D A, Hennessy J L, Computer Architecture: A Quantitative Approach 2 Ed. San Francisco: Morgan Kaufmann Publishers, 1995. 2．李学干，苏东庄，计算机系统结构，西安电子科技大学出版社，1991 年。 3．李勇，刘恩林，计算机体系结构，国防科技大学出版社，1988 年。 4．Kai Hwang，高等计算机系统结构并行性可扩展性可编程性，清华大学出版社

例3:如果浮点开平方操作 FPSQR的比例为2%,它的CPI为100,其他浮点操作的比例为23%,它的CPI=4.0,其余指令的CPI=1.33,计算该处理机的等效CPI。如果 FPSQR操作的CPI也为4.0,重新计算等效CPI 解:等效CPI1=100×2%+4×23%+1.33×75%=3.92 等效CPI2=4×25%+1.33×75%=2.00 由于改进了仅占2%的 FPSQR操作的CPI,使等效速度提高了近一倍 ●指令执行速度的几种平均方法上述2中的指令执行速度又称为算术平均速度上述3中的等效指令执行速度又称为加权平均速度,或调和平均速度几何平均速度: ETR 其中: ETR (execution time ratio),n指不同的程序几何平均速度与机器无关,与程序的执行时间无关。 4、数据处理速率PDR( processing data rate) PDR=L/R 其中:L=0.85G+0.15H+0.4J+0.15K;R=0.85M+0.09N+0.06P 其中:G是每条定点指令的位数 M是平均定点加法时间 H是每条浮点指令的位数 N是平均浮点加法时间 J是定点操作数的位数 P是平均浮点乘法时间 K是浮点操作数的位数另外还规定:G>20位,H>30位;从主存取一条指令的时间等于取一个字的时间;指令和操作数都存放在同一个主存,无变址或间址操作;允许有先行或并行取指令功能,此时选用平均取指令时间。 PDR主要用来对CPU和主存储器的速度进行度量,它没有涉及到 cache和多功能等。因此,PDR不能度量机器的整体速度。 5、核心程序法把应用程序中用得最多频繁的那部分核心程序作为评价计算机性能的标准程序。称为基准程序 benchmark 整数测试程序: Dhrystone 用C语言编写,100条语句。包括:各种赋值语句,各种数据类型和数据区, 各种控制语句,过程调用和参数传送,整数运算和逻辑操作 VAX-11/780的测试结果为每秒1757个 Dhrystones,即 IVAX MIPS=1757Dhrystones/Second 浮点测试程序: Linpack 用 FORTRAN语言编写,主要是浮点加法和浮点乘法操作。用 MFLOPS( Million Floating Point Operations Per Second)表示 GFLOPS、 TFLOPS Whetstone基准测试程序用 FORTRAN语言编写的综合性测试程序,主要包括:浮点运算、整数算术运算、功能调用、数组变址、条件转移、超越函数。测试结果用 Twips表示

7 例 3：如果浮点开平方操作 FPSQR 的比例为 2%，它的 CPI 为 100，其他浮点操作的比例为 23%，它的 CPI＝4.0，其余指令的 CPI＝1.33，计算该处理机的等效 CPI。如果 FPSQR 操作的 CPI 也为 4.0，重新计算等效 CPI。解：等效 CPI1＝100  2％＋ 4  23％＋ 1.33  75％＝3.92 等效 CPI2＝4  25％＋1.33  75％＝2.00 由于改进了仅占 2％的 FPSQR 操作的 CPI，使等效速度提高了近一倍 • 指令执行速度的几种平均方法上述2中的指令执行速度又称为算术平均速度上述3中的等效指令执行速度又称为加权平均速度，或调和平均速度几何平均速度：其中：ETR(execution time ratio),n指不同的程序几何平均速度与机器无关，与程序的执行时间无关。 4、数据处理速率 PDR（processing data rate） PDR＝L/R 其中：L＝0.85G＋0.15H＋0.4J＋0.15K；R＝0.85M＋0.09N＋0.06P 其中：G 是每条定点指令的位数 M 是平均定点加法时间 H 是每条浮点指令的位数 N 是平均浮点加法时间 J 是定点操作数的位数 P 是平均浮点乘法时间 K 是浮点操作数的位数另外还规定：G > 20 位，H > 30 位；从主存取一条指令的时间等于取一个字的时间；指令和操作数都存放在同一个主存，无变址或间址操作；允许有先行或并行取指令功能，此时选用平均取指令时间。 PDR 主要用来对 CPU 和主存储器的速度进行度量，它没有涉及到 cache 和多功能等。因此，PDR 不能度量机器的整体速度。 5、核心程序法把应用程序中用得最多频繁的那部分核心程序作为评价计算机性能的标准程序。称为基准程序 benchmark • 整数测试程序：Dhrystone 用 C 语言编写，100 条语句。包括：各种赋值语句，各种数据类型和数据区，各种控制语句，过程调用和参数传送，整数运算和逻辑操作。 VAX-11/780 的测试结果为每秒 1757 个 Dhrystones，即： 1VAX MIPS＝1757Dhrystones／Second • 浮点测试程序：Linpack 用 FORTRAN 语言编写，主要是浮点加法和浮点乘法操作。用 MFLOPS（Million Floating Point Operations Per Second）表示 GFLOPS、TFLOPS • Whetstone 基准测试程序用 FORTRAN 语言编写的综合性测试程序，主要包括：浮点运算、整数算术运算、功能调用、数组变址、条件转移、超越函数。测试结果用 Kwips 表示， G ETRi i n = n =  1

8 • SPEC 基准测试程序 System performance evaluation Cooperative 由 30 个左右世界知名计算机大厂商所支持的非盈利的合作组织，包括：IBM、 AT&T、BULL、Compaq、CDC、DG、DEC、Fujitsu、HP、Intel、MIPS、Motolola、 SGI、SUN、Unisys 等； SPEC 能够全面反映机器的性能，具有很高的参考价值；以 AX-11/780 的测试结果作为基数； SPEC1.0 1989 年 10 月宣布，包含 10 个测试程序，程序量超过 15 万行，4 个定点程序，6 个浮点程序；测试结果用 SPECint’89 和 SPECfp’89 表示。 1992 年，又增加 10 个测试程序，共有 6 个定点程序和 14 个浮点程序，测试结果用 SPECint’92 和 SPECfp’92 表示。 1995 年推出 SPECint’95 和 SPECfp’95 处理机 SPECint’95 SPECfp’95 处理机 SPECint’95 SPECfp’95 PentiumII 450 18.5 13.3 Celeron 333 13.1 10.20 PentiumII 450 18.7 13.7 Celeron 366 14.1 10.70 PentiumIII 500 20.6 14.7 Celeron 400 15.1 11.20 PientiumIII 550 22.3 15.6 Celeron 433 16.1 11.60 Celeron 300A 12.0 9.66 Celeron 466 17.0 12.00 • TPC 基准程序 Transaction Processing Council（事务处理委员会）成立于 1988 年，已有 40 多个成员；用于评测计算机的事务处理、数据库处理、企业管理与决策支持等方面的性能。 1989 年 10 月、1990 年 8 月和 1992 年 7 月发表了 TPC-A、TPC-B 和 TPC-C。 6、峰值速度 • 峰值指令速度 MIPS、GIPS、TIPS 例如：PentiumIII 500，有 3 条指令流水线，1500 MIPS，每秒 15 亿次一个由 8 台机器组成的 Cluster，每台机器是 4 个 PentiumIII 500 组成的 SMP；其峰值速度为 48GIPS，每秒 480 亿次。 • 峰值浮点速度 MFLOPS、GFLOPS、TFLOPS 1．2．2 其他性能 1．存储能力 • 寻址空间大小，2 16、2 24、2 32、2 64、... • 存储容量，速度，编址单位，编址方式，寻址方式 • 存储系统，Lookahead  Cache  Main Memory  Online Storage  Off-line Storage 2．字长 1～几百位 • 关键问题：指令字长与数据字长的协调原因：程序与数据共用同一个主存储器 • 早期：由指令字长决定当前：由数据字长决定，8 的倍数，如：32 位、64 位等可变字长：任意组合

点击进入文档下载页（DOC格式）

共22页，试读已结束，阅读完整版请下载

点击下载（DOC格式）

浏览记录

北京《计算机系统结构》：第一章基本概念