正在加载图片...
FP循环中的 Stalls 1 Loop LD FO, O(R1) F0=vector element stal 23456789 ADDD F4F0F2 g add scalar in F2 stall stall O(R1), F4 , store result SUBI R1.R1.8 g decrement pointer 8B DW) stall BNEZ R1, Loop branch R1lzero 10 stall g delayed branch slot 产生结果的指令使用结果的指令 所需的延时 FP ALU op Another FP ALU op FP ALU op Store double Load double FP ALU op Load double Store double 32100 Integer op Integer op 10 clocks:是否可以通过调整代码顺序使sall减到最小10 clocks: 是否可以通过调整代码顺序使stalls减到最小 1 Loop: LD F0,0(R1) ;F0=vector element 2 stall 3 ADDD F4,F0,F2 ;add scalar in F2 4 stall 5 stall 6 SD 0(R1),F4 ;store result 7 SUBI R1,R1,8 ;decrement pointer 8B (DW) 8 stall ; 9 BNEZ R1,Loop ;branch R1!=zero 10 stall ;delayed branch slot 产生结果的指令 使用结果的指令 所需的延时 FP ALU op Another FP ALU op 3 FP ALU op Store double 2 Load double FP ALU op 1 Load double Store double 0 Integer op Integer op 0 2021/2/7 计算机体系结构 13 FP 循环中的Stalls
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有