
计算机系统结构 (第22讲) 主讲人:郑纬民教授 清华大学计算机系
计算机系统结构 (第22讲) 主讲人: 郑纬民 教授 清华大学计算机系

6.3.3纵横处理方式 用于寄存器-寄存器结构的向量处理机中 向量寄存器的长度是有限的,例如, 每个向量寄存器有64个寄存器。当向量 长度N大于向量寄存器长度n时,需要分 组处理。 分组方法:N=Kn十r,其中:r为余 数,共分K十1组。 组内采用纵向处理方式,组间采用 横向处理方式。因此,也称为分组处理 方式,纵横向加工方式等
6.3.3 纵横处理方式 用于寄存器-寄存器结构的向量处理机中 向量寄存器的长度是有限的,例如, 每个向量寄存器有64个寄存器。当向量 长度N大于向量寄存器长度n时,需要分 组处理。 分组方法:N=K·n+r,其中:r为余 数,共分K+1组。 组内采用纵向处理方式,组间采用 横向处理方式。因此,也称为分组处理 方式,纵横向加工方式等

运算过程为: 第1组: T(1,n)=B(1,n)+C(1,n) Y(1,n)=A(1,n×T(1,n) 第2组: Tn+1,2n)=B(n+1,2n)+Cn+1,2n) Y(n+1,2n)=A(n+1,2n)×Tn+1,2n) 最后第k+1组: T(kn+1,N)=B(kn+1,N)+C(kn+1,N) Y(kn+1,N)=A(kn+1,N)+T(kn+1,N)
运算过程为: 第1组: T(1,n) = B(1,n) + C(1,n) Y(1,n) = A(1,n)×T(1,n) 第2组: T(n+1,2n) = B(n+1,2n)+C(n+1,2n) Y(n+1,2n) = A(n+1,2n)×T(n+1,2n) …… 最后第k+1组: T(kn+1,N) = B(kn+1,N) + C(kn+1,N) Y(kn+1,N) = A(kn+1,N) + T(kn+1,N)

每组用两条向量指令,每组发生数据相关两 次,其中组内发生数据相关一次,组间切 换时发生数据相关一次。 优点:减少访问主存储器的次数 例如:中间变量T不写入主存储器
每组用两条向量指令,每组发生数据相关两 次,其中组内发生数据相关一次,组间切 换时发生数据相关一次。 优点:减少访问主存储器的次数 例如:中间变量T不写入主存储器

第六章向量处理机 6.1向量数据表示方式 6.2向量处理机的结构 6.3向量处理方式 6.4向量处理机的关键技术 6.5向量处理机实例 6.6向量处理机的性能评价 6.7向量处理机的发展
第六章 向量处理机 6.1 向量数据表示方式 6.2 向量处理机的结构 6.3 向量处理方式 6.4 向量处理机的关键技术 6.5 向量处理机实例 6.6 向量处理机的性能评价 6.7 向量处理机的发展

6.4向量处理机的关键技术 6.4.1向量与标量性能的平衡 6.4.2向量链接技术
6.4 向量处理机的关键技术 6.4.1 向量与标量性能的平衡 6.4.2 向量链接技术

6.4.1向量与标量性能的平衡 实际的应用问题中通常既有向量计算又有 标量计算,而且两类计算有一定的比例 向量平衡点(vector balance point): 为了使向量硬件设备和标量硬件设 备的利用率相等,一个程序中向量代码 所占的百分比。 关键问题是:希望向量硬件和标量硬件都 能够充分利用,不要空闲。 例如:一个系统的向量运算速度为 90 Mfolps,标量运算速度为1 Mfolps
6.4.1 向量与标量性能的平衡 实际的应用问题中通常既有向量计算又有 标量计算,而且两类计算有一定的比例 向量平衡点(vector balance point): 为了使向量硬件设备和标量硬件设 备的利用率相等,一个程序中向量代码 所占的百分比。 关键问题是:希望向量硬件和标量硬件都 能够充分利用,不要空闲。 例如:一个系统的向量运算速度为 90Mfolps,标量运算速度为10Mfolps

如果程序的90%是向量运算,10%是标 量运算。则向量平衡点为0.9。硬件利用 率最高。 向量处理机的向量平衡点必须与用户程序 的向量化程度相匹配。 IBM向量计算机的设计思想与上述方法不 同,它维持较低的向量与标量比例,定 在3~5的范围之间。这种做法能够适应 通用应用问题对标量和向量处理要求
如果程序的90%是向量运算,10%是标 量运算。则向量平衡点为0.9。硬件利用 率最高。 向量处理机的向量平衡点必须与用户程序 的向量化程度相匹配。 IBM向量计算机的设计思想与上述方法不 同,它维持较低的向量与标量比例,定 在3~5的范围之间。这种做法能够适应 通用应用问题对标量和向量处理要求

几种超级计算机的向量性能和标量性能 机器型号 向量性能标量性能 Mflops Mflops 向量平衡点 Cray IS 85.0 9.8 0.90 Cray 2S 151.5 11.2 0.93 Cray X-MP 143.3 13.1 0.92 Cray Y-MP 201.6 17.0 0.92 Hitachi $820 737.3 17.8 0.98 NEC SX2 424.2 9.5 0.98 ujitsu VP400 207.1 6.6 0.97
机器型号 几种超级计算机的向量性能和标量性能 Fujitsu VP400 Cray IS Cray 2S Cray X-MP Cray Y-MP Hitachi S820 NEC SX2 向量性能 Mflops 标量性能 Mflops 向量平衡点 85.0 9.8 0.90 151.5 11.2 0.93 143.3 13.1 0.92 201.6 17.0 0.92 737.3 17.8 0.98 424.2 9.5 0.98 207.1 6.6 0.97

6.4.2向量链接技术 1、向量指令的类型 以CRAY-1向量处理机为例,有四类指令, 两种指令格式 (1)向量与向量操作,Vik-vi OP vk (2)向量与标量操作,Vi←Sj OP Vk (3)向量取, Vik←-存储器 (4)向量存, 存储器←-Vi
6.4.2 向量链接技术 1、向量指令的类型 以CRAY-1向量处理机为例,有四类指令, 两种指令格式 (1) 向量与向量操作,ViVj OP Vk (2) 向量与标量操作,Vi Sj OP Vk (3) 向量取, Vi存储器 (4) 向量存, 存储器 Vi