当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第三章 性能指标和基准程序(3.3)基本性能指标

资源类别:文库,文档格式:PPT,文档页数:10,文件大小:87.5KB,团购合买
一、工作负载和速度指标 常用3个指标来测量程序C的计算工作负载:
点击下载完整版文档(PPT)

第3章性能指标和基准程序 1系统和应用的基准程序 2性能和成本 3基本性能指标 24并行计算机性能 5并行程序性能 26可扩展性和加速比分析 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 2 第3章 性能指标和基准程序 ◼ 1 系统和应用的基准程序 ◼ 2 性能和成本 ◼3 基本性能指标 ◼ 4 并行计算机性能 ◼ 5 并行程序性能 ◼ 6 可扩展性和加速比分析

工作负载和速度指标 常用3个指标来测量程序的计 算工作负载: ①执行时间; ②执行的指令数; ③执行的浮点操作数。 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 3 一、工作负载和速度指标 常用3个指标来测量程序C的计 算工作负载: ①执行时间; ②执行的指令数; ③执行的浮点操作数

工作负载和速度指标 工作负载类型 工作负载单位 速度单位 执行时间 秒(s),CPU时钟 应用/每秒 指令数 百万条指令或十亿条指令MPS或BIPS 点操作数 flop flop,百万flop( Mflop) Mf lop 十亿flop( Gflop) Gflop/s 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 4

1.关于指令数的说明 2.关于执行时间的说明 执行时间依赖于许多因素: ④算法 ②数据结构 ③输入数据 ④平台 ⑤语言 ⑥浮点数 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 5 1. 关于指令数的说明 2. 关于执行时间的说明 ◼ 执行时间依赖于许多因素: ① 算法 ② 数据结构 ③ 输入数据 ④ 平台 ⑤ 语言 ⑥ 浮点数

计算浮点操作的规则 操作 fIop数 规则注释 A[2*i=B[j-1]+15*G-2;3加,减或乘每个计为 Flop 下标运算不计值,赋值不分开计值 X=Y 孤立的赋值计为flop if(X>y)Max=2.0*X: 2 比较计为1flop x=(float)i+3.0 类型转换计为 Flop X=Y /3. 0+sgrt(z) 除或开方计为4flop X= in(y)-exp(z) 17正弦,指数等计为8flop 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 6

例题:FFT处理的利用率 假定STAP一个DP(多普勒处理)步由2048个, 每个为8192点的FT所组成。每个N点FFT 处理的工作负载为W=5 nlogN flop 则多普勒处理步的总工作负载是2048x(5x 8192Xog8192)flop,约为1.09 Gf lop 对于在X机上50s的执行时间,其速度约为 22Mflop/so 设X机的峰值速度为266 Mflop/s,则多 勒处理可达到的利用率为 22/266=8.27% 仅为峰值性能的很低比值 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 7 ◼ 例题:FFT处理的利用率 ◼ 假定STAP一个DP(多普勒处理)步由2048个, 每个为8192点的FFT所组成。每个N点FFT 处理的工作负载为W=5NlogN flop。 ◼ 则多普勒处理步的总工作负载是2048x(5x 8192xlog 8192)flop,约为1.09Gflop。 ◼ 对于在X机上50s的执行时间,其速度约为 22Mflop/s。 ◼ 假设X机的峰值速度为266Mflop/s,则多 普勒处理可达到的利用率为 ◼ 22/266=8.27% ◼ 仅为峰值性能的很低比值

在进行理论性能分析时,常假设每条 指令或fop需要相同时间量。 在实际系统中这种均匀速度假设是不 成立的。 口在单BMSP结点上,观察到的速度可 从5变化到250 Mflop/s 口在测量工作负载时,也广泛使用顺序执 行时间以补充统计flop或指令数的方法 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 8 ◼ 在进行理论性能分析时,常假设每条 指令或flop需要相同时间量。 ◼ 在实际系统中这种均匀速度假设是不 成立的。 ❑ 在单IBM SP2结点上,观察到的速度可 从5变化到250Mflop/s。 ❑ 在测量工作负载时,也广泛使用顺序执 行时间以补充统计flop或指令数的方法

二、有关性能指标的总结 1.所有3种指标都是有用的,特别是 flop数和执行时间。 2.在预测和测量应用的性能时,应统 地使用单工作负载,即使是在并 行计算机上也应如此 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 9 二、有关性能指标的总结 1. 所有3种指标都是有用的,特别是 flop数和执行时间。 2. 在预测和测量应用的性能时,应统 一地使用单工作负载,即使是在并 行计算机上也应如此

■例题: SP2的顺序STAP序性能 程序分算法工作负教(Mnoy)执行时间(s)速度(Mnop)利用率(%) APT Total 1447 14.37 i00 3735 DP 4.12 20 Hr 288 004 72 2707 BE 1314 964 i36 51.22 0.57 280 HO-PD total 上2853 l30.61 37.00 DP 220 l162 9 722 BF 12,68 1882 L06 3992 14 0.17 309 哈尔滨工业大学计算机科学与技术学院 10

哈尔滨工业大学计算机科学与技术学院 10 ◼ 例题:

程序分算齿工作负毅执行时间度利用事 〔Mnop)() (Mflop/) (a) Gen Total 532612105 1654 SORT 1183 22.80 52 95 1909 7914 24 9.06 VEC 14.i1 32 【L.B8 LIN 1630 20.23 8231.00 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 11

点击下载完整版文档(PPT)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
已到末页,全文结束
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有