正在加载图片...
所以:加速比=1.37 3.14CRAY-1机器上,按照链接方式执行下述4条向量指令(括号中给出了相应功能部件的时 间),如果向量寄存器和功能部件之间数据传输需要1拍,试求此链接流水线的通过时间 是多少拍?如果向量长度为64,则需要多少拍才能得到全部结果。 Vo←存储器 (从存储器中取数:7拍) V2←Vo+V1 向量加:3拍) V2←V2<A (按(A3)左移:4拍) Vs←V3^V4 (向量逻辑乘:2拍) 解:通过时间就是每条向量指令的第一个操作数执行完毕需要的时间,也就是各功能 流水线由空到满的时间,具体过程如下图所示。要得到全部结果,在流水线充满之后,向 量中后继操作数继续以流水方式执行,直到整组向量执行完毕。 访存 向量加 左移 向量逻 T通过=(7+1)+(1+3+1)+(1+4+1)+(1+2+1)=23(拍) T共=T通过+(64-1)=23+63=86(拍) 3.15向量处理机有16个向量寄存器,其中V0~V5中分别存放有向量A、B、C、D、E、F, 向量长度均为8,向量各元素均为浮点数:处理部件采用两个单功能流水线,加法功能部 件时间为2拍,乘法功能部件时间为3拍。采用类似CRAY-1的链接技术,先计算(A B)*C,在流水线不停留的情况下,接着计算(D+E)*F (1)求此链接流水线的通过时间为多少拍?(设寄存器入、出各需1拍) (2)假如每拍时间为50ns,完成这些计算并把结果存进相应寄存器,此处理部件地实际 吞吐率为多少 MFLOPS? 解:(1)我们在这里假设A+B的中间结果放在V6中,(A+B)*C地最后结果放 在V7中,D+E地中间结果放在V8中,(D+E)的最后结果放在V9中。具体实现参 考下图 第10页共52页第 10 页 共 52页 所以: 加速比 = 1.37 3.14 CRAY-1 机器上,按照链接方式执行下述 4 条向量指令(括号中给出了相应功能部件的时 间),如果向量寄存器和功能部件之间数据传输需要 1 拍,试求此链接流水线的通过时间 是多少拍?如果向量长度为 64,则需要多少拍才能得到全部结果。 V0←存储器 (从存储器中取数:7 拍) V2←V0+V1 (向量加:3 拍) V2←V2 < A3 (按(A3)左移:4 拍) V5←V3∧V4 (向量逻辑乘:2 拍) 解:通过时间就是每条向量指令的第一个操作数执行完毕需要的时间,也就是各功能 流水线由空到满的时间,具体过程如下图所示。要得到全部结果,在流水线充满之后,向 量中后继操作数继续以流水方式执行,直到整组向量执行完毕。 存储器 访存 向量加 左移 向量逻 辑乘 V0 V1 V2 V3 V4 V5 A3 +( -)= + = (拍) =( +)+(+ +)+(+ +)+(+ +)= (拍) 总共 通过 通过 T T 64 1 23 63 86 T 7 1 1 3 1 1 4 1 1 2 1 23 = 3.15 向量处理机有 16 个向量寄存器,其中 V0~V5 中分别存放有向量 A、B、C、D、E、F, 向量长度均为 8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部 件时间为 2 拍,乘法功能部件时间为 3 拍。采用类似 CRAY-1 的链接技术,先计算(A+ B)*C,在流水线不停留的情况下,接着计算(D+E)*F。 (1)求此链接流水线的通过时间为多少拍?(设寄存器入、出各需 1 拍) (2)假如每拍时间为 50ns,完成这些计算并把结果存进相应寄存器,此处理部件地实际 吞吐率为多少 MFLOPS? 解:(1)我们在这里假设 A+B 的中间结果放在 V6 中,(A+B)*C 地最后结果放 在 V7 中,D+E 地中间结果放在 V8 中,(D+E)*F 的最后结果放在 V9 中。具体实现参 考下图:
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有