第3章性能指标和基准程序 1系统和应用的基准程序 2性能和成本 C3基本性能指标 24并行计算机性能 n25并行程序性能 26可扩展性和加速比分析 哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院 2 第3章 性能指标和基准程序 ◼1 系统和应用的基准程序 ◼ 2 性能和成本 ◼ 3 基本性能指标 ◼ 4 并行计算机性能 ◼ 5 并行程序性能 ◼ 6 可扩展性和加速比分析
1.如何描述应用和系统的性能特征? 2.什么是用户对性能和成本要求? 3.如何测量应用程序的性能?使用何种 类型的性能指标? 4.当在并行计算机上执行并行程序时, 如何描述系统性能的特征? 5.影响性能的参数有哪些?典型的参数 值为多少? 6.如何量化和分析系统可扩展性? 7.如何确定执行给定应用问题的并行机 的可扩展性? 哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院 3 1. 如何描述应用和系统的性能特征? 2. 什么是用户对性能和成本要求? 3. 如何测量应用程序的性能? 使用何种 类型的性能指标? 4. 当在并行计算机上执行并行程序时, 如何描述系统性能的特征? 5. 影响性能的参数有哪些? 典型的参数 值为多少? 6. 如何量化和分析系统可扩展性? 7. 如何确定执行给定应用问题的并行机 的可扩展性?
1系统和应用的基准程序 前言 基准程序是性能测试程序,并假设它 能刻划某一类应用问题的处理和数据 移动的特征。 基准程序用来测量和预测计算机系统 的性能,并能提示它们的体系结构的 弱点和优点。 哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院 4 ◼一、前言 ◼ 基准程序是性能测试程序,并假设它 能刻划某一类应用问题的处理和数据 移动的特征。 ◼ 基准程序用来测量和预测计算机系统 的性能,并能提示它们的体系结构的 弱点和优点。 1 系统和应用的基准程序
基准程序分类 (1)按应用类 (2)按计算机系统来分基准程序 口宏基准程序 宏基准程序测量一个计算机系统的总 体性能。 口微基准程序两类 微基准程序测量一个计算机系统的某 特定方面性能。 哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院 5 ◼基准程序分类: (1)按应用类 (2)按计算机系统来分基准程序 ❑宏基准程序 ◼ 宏基准程序测量一个计算机系统的总 体性能。 ❑微基准程序两类 ◼ 微基准程序测量一个计算机系统的某一 特定方面性能
代表性的微和宏基准程序组 类型 名称 测量 微基准程序 LINPACK数值计算(线性代数) LMBENCH unix中的系统调用和数据移动 STREAM存储器带宽 宏基准程序NAS 并行计算(CPD PARKBENCH并行计算 SPEC 混合基准程序系列 Spl ash并行计算 STAP 信号处理 IPC 商业应用 哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院 6
二、微基准程序 包括:3个微基准程序组。 ■1. LINPACK L| NPACK基准程序由田纳西大学的 Jack Dongarra创作并加以维护。 LINPACK简单实用,它定期公布有关 各种系统的L| NPACK性能数值表 口包括Top500表,它列出了世界上功能最 强的500台计算机。 哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院 7 ◼二、微基准程序 ◼ 包括:3个微基准程序组。 ◼ 1.LINPACK ◼ LINPACK基准程序由田纳西大学的 Jack Dongarra 创作并加以维护。 ◼ LINPACK简单实用,它定期公布有关 各种系统的LINPACK性能数值表。 ❑ 包括Top 500表,它列出了世界上功能最 强的500台计算机
1996年12月 LINPACK报告的样本 计算机 处理器数R(Gnop/s)N。(阶)N,2(阶)Rn(Gop/s) Intel ASCI Option Red 7264 1068 215,00053,400 1453 CP-PACS 2048 368.2 10368030,720 6]4 Intel Paragon XP/S MP 6768 281. 12860025,700 338 Numerical Wind Tunne 167 229.7 66,13218,018 281 Fujitsu VPP500/153 153 200.6 62.73017,000 245 Cray T3D 1024 1024 100.5 8l,92010,224 152 IBM SP2-T2 512 88.4 73,50020,150 136 NEC SX-4/32 32 61.77 15,3601792 64 Return 哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院 8 Return
2 LMBENCH LMBENCH基准程序组由SG的 LarryMcvoy提出,是一个可移植的 基准程序 在各种Uhnx平台上,用来测量操作 系统开销和处理器、高速缓存、存 储器、网络及磁盘。 哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院 9 ◼ 2.LMBENCH ◼ LMBENCH基准程序组由SGI的 LarryMcVoy提出,是一个可移植的 基准程序。 ◼ 在各种Unix平台上,用来测量操作 系统开销和处理器、高速缓存、存 储器、网络及磁盘
由 LMBENCH测得的带宽、时延和系统开销 属性 Intel Sun UltraIBM 990 Alder 带宽(MB存储器复制 52 85 242 读文件 52 85 187 管道 38 61 84 TCP 20 51 10 时延读存储器 0.28 0.27 0.26 (μs)创建文件 23809 18,18113,333 管道 101 62 91 TCP 305 162 332 系统开无系统调用 7 5 16 销 创建进程 4500 3700 1200 L(μs)现场切换 36 14 13
哈尔滨工业大学计算机科学与技术学院 10 属 性 Intel Alder Sun Ultra IBM 990 带宽(MB /s) 存储器复制 读文件 管道 TCP 52 52 38 20 85 85 61 51 242 187 84 10 时延 (μs) 读存储器 创建文件 管道 TCP 0.28 23809 101 305 0.27 18,181 62 162 0.26 13,333 91 332 系统开 销 (μs) 无系统调用 创建进程 现场切换 7 4500 36 5 3700 14 16 1200 13 由LMBENCH测得的带宽、时延和系统开销
3. STREAM 是一个简单的合成基准程序; 由SG的 JohnMcCalpin提出。 口测量持续的存储器带宽(以MB/s为 单位)和相应的计算速率 口下表中的向量a、b和c均是有二百 万个元素的数组,其中每个元素是 一个8字节的字。 哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院 11 ◼ 3.STREAM ◼是一个简单的合成基准程序; ◼由SGl的JohnMcCalpin提出。 ❑测量持续的存储器带宽(以MB/s为 单位)和相应的计算速率。 ❑下表中的向量a、b和c均是有二百 万个元素的数组,其中每个元素是 一个8字节的字