当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

哈尔滨工业大学:《并行处理与体系结构》课程教学资源(PPT课件讲稿)第三章 性能指标和基准程序(3.2)性能和成本

资源类别:文库,文档格式:PPT,文档页数:27,文件大小:142.5KB,团购合买
一、用户经常提到6种性能: 二 、执行时间
点击下载完整版文档(PPT)

第3章性能指标和基准程序 1系统和应用的基准程序 2性能和成本 ξ3基本性能指标 24并行计算机性能 25并行程序性能 26可扩展性和加速比分析 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 2 第3章 性能指标和基准程序 ◼ 1 系统和应用的基准程序 ◼ 2 性能和成本 ◼ 3 基本性能指标 ◼ 4 并行计算机性能 ◼ 5 并行程序性能 ◼ 6 可扩展性和加速比分析

用户经常提到6种性能: ①执行时间 ②速度 ③吞吐率 ④利用率 ⑤成本有效性 性能/成本比 对在相同计算机平台上执行相同的应期程 序,这些需求可能导致很大差别的结论。 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 3 ◼ 用户经常提到6种性能: ① 执行时间 ② 速度 ③ 吞吐率 ④ 利用率 ⑤ 成本有效性 ⑥ 性能/成本比 ◼ 对在相同计算机平台上执行相同的应期程 序,这些需求可能导致很大差别的结论

用到的一些概念 口工作负载(W)是程序中的计算操 作数 aPeak是处理器的峰值速度 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 4 ◼用到的一些概念 ❑工作负载(W)是程序中的计算操 作数 ❑Ppeak是处理器的峰值速度

术语 记号 单位 机器规模 n 无量纲 时钟速率 f MHz 工作负载 W Mflop (兆浮点运算) 顺序执行时间T1 s(秒) 并行执行时间Tn s(秒) 速度 Pn=W/T Mflop/s 加速比 Sn= T1/Tn 无量纲 效率 En=Sn/n 无量纲 利用率 Uh=Pn/( aPeak)无量纲 启动时间 tO u s 渐近带宽 r∞ MB/s 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 5 术语 记号 单位 机器规模 n 无量纲 时钟速率 f MHz 工作负载 W Mflop(兆浮点运算) 顺序执行时间 T1 s(秒) 并行执行时间 Tn s(秒) 速度 Pn=W/T Mflop/s 加速比 Sn= T1/Tn 无量纲 效率 En=Sn/n 无量纲 利用率 Un=Pn/(nPpeak) 无量纲 启动时间 t0 μs 渐近带宽 r∞ MB/s

例题: 用执行时间测量性能的陷阱 在并行计算机x上成功地运行他的代 码测得执行时间为1000s 该代码在另一台机器y上运行需要 500s时间, 推不出:结论x机比y机慢 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 6 ◼例题: ◼ 用执行时间测量性能的陷阱 ◼ 在并行计算机x上成功地运行他的代 码测得执行时间为1000s。 ◼ 该代码在另一台机器y上运行需要 500s时间, ◼推不出:结论x机比y机慢

执行时间和吞吐率 1.处理速度: 口是指单位时间的工作负载(Y)的处理; 口对于许多应用,用户可能对达到某一处理速 度感兴趣。 系统吞吐率 是指单位时间处理的作业数 口提高系统吞吐率的两个方法 ④流水化 ②无相关的分配 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 7 ◼ 一、执行时间和吞吐率 ◼ 1.处理速度: ❑ 是指单位时间的工作负载(W)的处理; ❑ 对于许多应用,用户可能对达到某一处理速 度感兴趣。 ◼ 系统吞吐率 ❑ 是指单位时间处理的作业数 ❑ 提高系统吞吐率的两个方法 ① 流水化 ② 无相关的分配

在256个结点的SP2上所测得的STAP性能 程序执行时间速度加速比利用 (s) (GF lop/s) 率 APT 0.16 90 13% HO-PD 0 56 23 233 34 GEN 40 3.8 86 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 8 在256个结点的SP2上所测得的STAP性能 程序 执行时间 (s) 速度 (GFlop/s) 加速比 利用 率 APT HO-PD GEN 0.16 0.56 1.40 9 23 3.8 90 233 86 13% 34% 6%

例题:在256个结点的sP2上希望STAP 在0.5秒完成 口根据上表,只有APT能完成 例题:在256个结点的SP2上希望STAP 速度为10 GFLOP/S 口根据上表,只有HOPD能完成 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 9 ◼ 例题:在256个结点的SP2上希望STAP 在0.5秒完成 ❑ 根据上表,只有APT能完成 ◼ 例题:在256个结点的SP2上希望STAP 速度为10GFLOP/S ❑ 根据上表,只有HO-PD能完成

2.系统吞吐率 a是指单位时间处理的作业数 口提高系统吞吐率的两个方法 ④流水化 ②无相关的分配 哈尔滨工业大学计算机科学与技术学院 10

哈尔滨工业大学计算机科学与技术学院 10 ◼ 2.系统吞吐率 ❑是指单位时间处理的作业数 ❑提高系统吞吐率的两个方法 ① 流水化 ② 无相关的分配

例题:在256个结点的SP2上 APT程序的吞吐率是单位时间作业数 口0.16S—个APT a或1/0.16=6.25 例题:并行APT中吞吐率和速度改进 上表的工作负载=9*0.16=1.44Gfop 口用两级流水0.148,0.11 口吞吐率=1/0.14=7.14或10.34 哈尔滨工业大学计算机科学与技术学院

哈尔滨工业大学计算机科学与技术学院 11 ◼ 例题:在256个结点的SP2上 ◼ APT程序的吞吐率是单位时间作业数 ❑ 0.16S一个APT ❑或1/0.16=6.25 ◼ 例题:并行APT中吞吐率和速度改进 ◼ 上表的工作负载=9*0.16=1.44Gflop ❑ 用两级流水0.14S,0.11S ❑ 吞吐率=1/0.14S=7.14或10.34

点击下载完整版文档(PPT)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
共27页,试读已结束,阅读完整版请下载
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有