当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

北京大学:《微机原理 Microcomputer Principle 微机与接口技术》课程学生研究报告——浅谈多核处理器技术

资源类别:文库,文档格式:PDF,文档页数:6,文件大小:149.03KB,团购合买
点击下载完整版文档(PDF)

浅议多核处理器技术 00748712荣振 摘要:多核处理器以其高性能、低功耗优势正逐步取代传统的单处理器成为市场的主流。 随着应用需求的扩大和技术的不断进步,多核必将展示出其强大的性能优势。但目前多核处 理器技术还面临着诸多挑战,本文主要介绍了多核处理器发展的关键技术并对多核处理器技 术的发展趋势进行简要分析。 关键词:多核;同构异构;片上通信;I/0结构;低功耗 1多核处理器介绍 多核处理器也称为片上多处理器( chip multi-processor,CMP),或单芯片多处理器。 自1996年美国斯坦福大学首次提出片上多处理器(CMP)思想和首个多核结构原型,到2001 年I闓M推出第一个商用多核处理器 POWER4,再到2005年 Intel和AM多核处理器的大规模 应用,最后到现在多核成为市场主流,多核处理器经历了十几年的发展。在这个过程中,多 核处理器的应用范围已覆盖了多媒体计算、嵌入式设备、个人计算机、商用服务器和高性能 计算机等众多领域,多核技术及其相关研究也迅速发展。 多核处理器将多个完全功能的核心集成在同一个芯片内,整个芯片作为一个统一的结构 对外提供服务,输出性能。多核处理器首先通过集成多个单线程处理核心或者集成多个同时 多线程处理核心,使得整个处理器可同时执行的线程数或任务数是单处理器的数倍,这极大 地提升了处理器的并行性能。其次,多个核集成在片内,极大地缩短了核间的互连线,核间 通信延迟变低,提高了通信效率,数据传输带宽也得到提高。再者,多核结构有效共享资源, 片上资源的利用率得到了提高,功耗也随着器件的减少得到了降低。最后,多核结构简单, 易于优化设计,扩展性强。这些优势最终推动了多核的发展并逐渐取代单处理器成为主流。 2多核发展的关键技术 多核处理器结构不仅有性能潜力大、集成度高、并行度高、结构简单和设计验证方便等 诸多优势,而且它还能继承传统单处理器研究中的某些成果,例如同时多线程、宽发射指令 降压低功耗技术等。但多核处理器毕竟是一种新的结构,在多核结构设计和应用开发中出现 了以前未曾遇到的新问题,这些问题给多核处理器的未来提出了挑战

浅议多核处理器技术 00748712 荣振 摘要:多核处理器以其高性能、低功耗优势正逐步取代传统的单处理器成为市场的主流。 随着应用需求的扩大和技术的不断进步,多核必将展示出其强大的性能优势。但目前多核处 理器技术还面临着诸多挑战,本文主要介绍了多核处理器发展的关键技术并对多核处理器技 术的发展趋势进行简要分析。 关键词:多核;同构异构;片上通信;I/O 结构;低功耗 1 多核处理器介绍 多核处理器也称为片上多处理器(chip multi-processor,CMP),或单芯片多处理器。 自 1996 年美国斯坦福大学首次提出片上多处理器(CMP)思想和首个多核结构原型,到 2001 年 IBM 推出第一个商用多核处理器 POWER4,再到 2005 年 Intel 和 AMD 多核处理器的大规模 应用,最后到现在多核成为市场主流,多核处理器经历了十几年的发展。在这个过程中,多 核处理器的应用范围已覆盖了多媒体计算、嵌入式设备、个人计算机、商用服务器和高性能 计算机等众多领域,多核技术及其相关研究也迅速发展。 多核处理器将多个完全功能的核心集成在同一个芯片内,整个芯片作为一个统一的结构 对外提供服务,输出性能。多核处理器首先通过集成多个单线程处理核心或者集成多个同时 多线程处理核心,使得整个处理器可同时执行的线程数或任务数是单处理器的数倍,这极大 地提升了处理器的并行性能。其次,多个核集成在片内,极大地缩短了核间的互连线,核间 通信延迟变低,提高了通信效率,数据传输带宽也得到提高。再者,多核结构有效共享资源, 片上资源的利用率得到了提高,功耗也随着器件的减少得到了降低。最后,多核结构简单, 易于优化设计,扩展性强。这些优势最终推动了多核的发展并逐渐取代单处理器成为主流。 2 多核发展的关键技术 多核处理器结构不仅有性能潜力大、集成度高、并行度高、结构简单和设计验证方便等 诸多优势,而且它还能继承传统单处理器研究中的某些成果,例如同时多线程、宽发射指令、 降压低功耗技术等。但多核处理器毕竟是一种新的结构,在多核结构设计和应用开发中出现 了以前未曾遇到的新问题,这些问题给多核处理器的未来提出了挑战

2.1核心结构的选择 目前多核处理器的核心结构主要有同构和异构两种。同构与异构是多核处理器主要的两 种结构形态。顾名思义,同构多核处理器是指处理器芯片内部的所有核心其结构是完全相同 的,各个核心的地位也是等同的。目前的同构多核处理器大多数由通用的处理器核心组成 每个处理器核心可以独立地执行任务,与通用单核处理器结构相近。 同构多用于通用多核处理器结构。在多计算机系统结构的分类方法中,多处理器结构和 多计算机结构因为其互连方式和数据存储与共享方式相异,相应地,同构的多核处理器也可 以依据其互连的层次在结构上予以区分,即,核心之间可以通过共享存储器互连,也可以在 Cache层面(或局部存储器)互连。 异构多核处理器芯片内部采用多种功能不同的核心。如有负责管理调度的主核和负责计 算的从核构成的多核处理器;再有承担定点、浮点、特殊计算等不同计算功能的核心构成的 多核处理器。日前的异构多核处理器通常同时集成通用处理器、DSP、媒体处理器、网络处 理器等多种类型的处理器核心,针对不同需求提高应用的计算性能。其中,通用处理器核常 作为处理器控制与通用计算之用的主核,而其他处理器核则为用于加速特定的应用的从核。 2.2片上通信技术 多核芯片上的多个核心虽然各自执行自己的代码,但是不同核心间可能需要进行数据的 共享和同步,因此片上通信结构的性能将直接影响处理器的性能。当前片上通信主要有3种 方式:总线共享、交叉开关互连和片上网络 network on chip,NOC)。 总线共享结构是指片上核心、输入输出端口以及存储器通过共享二级或三级 Cache,或 者通过连接核心的总线进行通信。总线结构的长处是较为简单,易于设计实现,当前多数双 核和四核处理器基本上都采用了该结构,但缺点是总线结构可扩展性较差,适用于核心数较 少的情况。比较典型的总线共享结构处理器有 Hydra、 Intel的Core、IBM的 Power4/5等。 交叉开关互连结构由交叉开关以及接口逻辑构成。交叉开关与总线结构相比,优势是数据通 道多,访问带宽更大,但不足是交叉开关结构占用的片上面积也较大,而且随着核心数的增 加,性能也会下降,因此它也只适用于核心数较少的情况。例如AMD公司的 Athlon x2双核 处理器用交叉开关来控制核心与外部的通信。 片上网络是把互连网络用于片上系统设计,解决片上组件之间的通信问题,它借鉴了并 行计算机的互联网络。片上网络与并行计算机的互连相比有很多相同点:支持包通信、可扩 展、提供透明的通信服务等;但也有不同之处:片上网络技术支持同时访问,而且有可靠性

2.1 核心结构的选择 目前多核处理器的核心结构主要有同构和异构两种。同构与异构是多核处理器主要的两 种结构形态。顾名思义,同构多核处理器是指处理器芯片内部的所有核心其结构是完全相同 的,各个核心的地位也是等同的。目前的同构多核处理器大多数由通用的处理器核心组成, 每个处理器核心可以独立地执行任务,与通用单核处理器结构相近。 同构多用于通用多核处理器结构。在多计算机系统结构的分类方法中,多处理器结构和 多计算机结构因为其互连方式和数据存储与共享方式相异,相应地,同构的多核处理器也可 以依据其互连的层次在结构上予以区分,即,核心之间可以通过共享存储器互连,也可以在 Cache 层面(或局部存储器)互连。 异构多核处理器芯片内部采用多种功能不同的核心。如有负责管理调度的主核和负责计 算的从核构成的多核处理器;再有承担定点、浮点、特殊计算等不同计算功能的核心构成的 多核处理器。目前的异构多核处理器通常同时集成通用处理器、DSP、媒体处理器、网络处 理器等多种类型的处理器核心,针对不同需求提高应用的计算性能。其中,通用处理器核常 作为处理器控制与通用计算之用的主核,而其他处理器核则为用于加速特定的应用的从核。 2.2 片上通信技术 多核芯片上的多个核心虽然各自执行自己的代码,但是不同核心间可能需要进行数据的 共享和同步,因此片上通信结构的性能将直接影响处理器的性能。当前片上通信主要有3 种 方式:总线共享、交叉开关互连和片上网络(network on chip,NOC)。 总线共享结构是指片上核心、输入输出端口以及存储器通过共享二级或三级Cache,或 者通过连接核心的总线进行通信。总线结构的长处是较为简单,易于设计实现,当前多数双 核和四核处理器基本上都采用了该结构,但缺点是总线结构可扩展性较差,适用于核心数较 少的情况。比较典型的总线共享结构处理器有Hydra、Intel 的Core、IBM 的Power4/5 等。 交叉开关互连结构由交叉开关以及接口逻辑构成。交叉开关与总线结构相比,优势是数据通 道多,访问带宽更大,但不足是交叉开关结构占用的片上面积也较大,而且随着核心数的增 加,性能也会下降,因此它也只适用于核心数较少的情况。例如AMD公司的Athlon x2 双核 处理器用交叉开关来控制核心与外部的通信。 片上网络是把互连网络用于片上系统设计,解决片上组件之间的通信问题,它借鉴了并 行计算机的互联网络。片上网络与并行计算机的互连相比有很多相同点:支持包通信、可扩 展、提供透明的通信服务等;但也有不同之处:片上网络技术支持同时访问,而且有可靠性

高以及可重用性高等特点。它与总线结构、交叉开关结构相比,片上网络可以连接更多IP 组件、可靠性高、可扩展性强以及较低的功耗,因此片上网络被认为是更加理想的大规模CMP 互连技术。当前片上网络主要有二维网格网络、3 K Tours等互连结构。片上网络设计的问 题是寻找网络开销和多核耦合程度最佳的平衡,并同时考虑网络的可扩展性。RAW处理器就 采用了片上二维网络结构,它通过集成高速网络和优化的路由算法,片上核心间的通信延迟 最大不会超过6个周期,而且该结构可扩展性强。这3种结构虽各有优势和不足,但亦可融合, 比如在全局范围采用片上网络而在局部选择总线或者交叉开关结构,以实现性能与复杂性的 2.3多核与I/0结构 多核与I/0结构处理器芯片能力的提高对系统的I/0能力提出了更高的要求。近年来, 标准I/0接口的传输率和带宽等主要性能指标不断提高,并从并行传输向串行传输转变,使 以前普遍存在的I/0瓶颈得到了很大的改善,远程访问的延迟和带宽都有了很大提高。 与单核环境比较,多核环境下系统的I/0变得复杂了,对于同构的多核环境,每一个处 理器核在系统中的地位是平等的,都有独立Ⅰ/0操作的可能,这使得系统特别是操作系统必 须给予相应的调度与管理技术支持;对于异构的多核环境,主核运行完整的操作系统,从核 主要用于计算,I/0操作一般由主核统一完成,系统层面上,这与单核的情形相仿。所以, 研究与计算能力相匹配的新I/0技术势在必行。 I/0能力的提高不仅仅是总线接口一方面的问题,而是应从处理器内外综合考虑的问 题。当前的研究实例包括:下一代总线架构、新 PCI-Express、DDR3内存、全缓冲DIMM和I/0 加速技术等,其中Ⅰ/⑩0加速技术包括借助增强特性优化TCP/IP堆栈、借助I/0加速网卡实现 CPU平衡处理、借助直接内存访问技术增强数据移动处理能力等方面。 2.4存储结构设计 处理器与主存储器之间的速度差距一直是处理器结构设计中必须考虑的问题,因为存储 系统自身的体系结构设计直接关系到系统整体性能,会对整个芯片的尺寸、功耗、布局、性 能以及运行效率等各方面产生很大的影响。以往在单处理器中通过采用缓存结构基本上能较 好地解决这个问题,能保证处理器性能得到发挥。可是,发展到了多核处理器时代,核心和 主存之间因速度差距而带来的问题变得严重了。由于处理器内部核心数目增多,对主存的访 问需求增加,而单处理器时代的缓存层次和访问带宽已经不能跟上多核处理器的访问需求, 必须针对多核处理器进行相应的存储结构设计,并解决好存储系统的效率问题

高以及可重用性高等特点。它与总线结构、交叉开关结构相比,片上网络可以连接更多IP 组件、可靠性高、可扩展性强以及较低的功耗,因此片上网络被认为是更加理想的大规模CMP 互连技术。当前片上网络主要有二维网格网络、3K Tours 等互连结构。片上网络设计的问 题是寻找网络开销和多核耦合程度最佳的平衡,并同时考虑网络的可扩展性。RAW 处理器就 采用了片上二维网络结构,它通过集成高速网络和优化的路由算法,片上核心间的通信延迟 最大不会超过6个周期,而且该结构可扩展性强。这3种结构虽各有优势和不足,但亦可融合, 比如在全局范围采用片上网络而在局部选择总线或者交叉开关结构,以实现性能与复杂性的 平衡。 2.3 多核与I/O结构 多核与I/O 结构处理器芯片能力的提高对系统的I/O 能力提出了更高的要求。近年来, 标准I/O 接口的传输率和带宽等主要性能指标不断提高,并从并行传输向串行传输转变,使 以前普遍存在的I/O 瓶颈得到了很大的改善,远程访问的延迟和带宽都有了很大提高。 与单核环境比较,多核环境下系统的I/O 变得复杂了,对于同构的多核环境,每一个处 理器核在系统中的地位是平等的,都有独立I/O 操作的可能,这使得系统特别是操作系统必 须给予相应的调度与管理技术支持;对于异构的多核环境,主核运行完整的操作系统,从核 主要用于计算,I/O 操作一般由主核统一完成,系统层面上,这与单核的情形相仿。所以, 研究与计算能力相匹配的新I/O 技术势在必行。 I/O 能力的提高不仅仅是总线接口一方面的问题,而是应从处理器内外综合考虑的问 题。当前的研究实例包括:下一代总线架构、新PCI-Express、DDR3内存、全缓冲DIMM 和I/O 加速技术等,其中I/O 加速技术包括借助增强特性优化TCP/IP 堆栈、借助I/O加速网卡实现 CPU 平衡处理、借助直接内存访问技术增强数据移动处理能力等方面。 2.4 存储结构设计 处理器与主存储器之间的速度差距一直是处理器结构设计中必须考虑的问题,因为存储 系统自身的体系结构设计直接关系到系统整体性能,会对整个芯片的尺寸、功耗、布局、性 能以及运行效率等各方面产生很大的影响。以往在单处理器中通过采用缓存结构基本上能较 好地解决这个问题,能保证处理器性能得到发挥。可是,发展到了多核处理器时代,核心和 主存之间因速度差距而带来的问题变得严重了。由于处理器内部核心数目增多,对主存的访 问需求增加,而单处理器时代的缓存层次和访问带宽已经不能跟上多核处理器的访问需求, 必须针对多核处理器进行相应的存储结构设计,并解决好存储系统的效率问题

当前对存储系统设计,绝大多数处理器采用缓存设计,也有些处理器采用了片上存储器 结构。缓存结构设计的优点是硬件设计与实现容易,易于应用开发与编程,缺点是需要保证 缓存数据的一致,而且结构扩展不易。针对缓存数据一致性问题,其解决策略主要有总线侦 听协议和基于目录的目录协议。侦听协议是每块缓存通过缓存侦听器时刻侦听总线,以接受 致性命令,不足的是它只适合核心数目较少的情况。目录协议是通过目录表记录自身存储 块在其他缓存中的状态,以便维持一致性时使用点对点的通信,缺点是实现代价太大,并发 访问目录时存在性能瓶颈。除了上述的硬件一致性算法,还有基于多处理机的软件一致性算 法,但能否作为多核结构的缓存一致性机制,这些需要进一步的探讨研究。目前大多数多核 处理器采用总线的侦听协议 片内存储器是将片外的存储器引到了片内,它与片外存储器一样是统一编址,因此它避 开了缓存不命中和一致性问题,但它由于采用了存储器结构,其访问延迟较缓存大。当前 些研究人员通过采用高速动态随机存储器来组成片内存储器,缩小了与缓存间的性能差距。 除了选择何种存储结构外,存储结构设计的问题还有:存储器多大比较合适;在哪一级实现 数据的共享和通信比较合适;在哪一级解决缓存一致性问题比较合理;存储结构如何支持多 线程的应用等。 2.5多核的功率和热管理 在整个计算机系统中,处理器,特别是高性能的处理器的功耗往往占系统功耗的50%, 甚至更高。而当前,处理器性能提高1%就会使芯片功耗增加3%,对于系统设计而言,功耗 对系统的可靠性、可用性以及系统的规模有着直接的影响。 集成电路芯片的功耗分静态与动态两类,静态功耗主要受与频率相关的漏电流的影响, 频率越高,漏电流越大;动态功耗与工作频率及工作电压的平方成正比,即P=C*f*V2,因 此,适当的频率和较低的电压是降低处理器芯片功耗的基础。多核环境下的低功耗技术也主 要体现在芯片的基础参数和片上功耗管理方面。 频率高低反映出处理器峰值运算性能的强弱,多核处理器芯片的工作频率和工作电压ˉ 般都较单核处理器低,相对较低频率和较低电压,再配合按实际需求动态智能化管理功耗的 方法,减少实际耗散功率,将整个处理器芯片的功耗控制在有效的热管理技术之下 2.6操作系统设计 由于多核内部有多个核心,那么就存在任务分配、调度、仲裁以及平衡负载等问题, 核之间的任务调度是充分利用多处理器性能的关键。现有的操作系统还无法有效地支持多核

当前对存储系统设计,绝大多数处理器采用缓存设计,也有些处理器采用了片上存储器 结构。缓存结构设计的优点是硬件设计与实现容易,易于应用开发与编程,缺点是需要保证 缓存数据的一致,而且结构扩展不易。针对缓存数据一致性问题,其解决策略主要有总线侦 听协议和基于目录的目录协议。侦听协议是每块缓存通过缓存侦听器时刻侦听总线,以接受 一致性命令,不足的是它只适合核心数目较少的情况。目录协议是通过目录表记录自身存储 块在其他缓存中的状态,以便维持一致性时使用点对点的通信,缺点是实现代价太大,并发 访问目录时存在性能瓶颈。除了上述的硬件一致性算法,还有基于多处理机的软件一致性算 法,但能否作为多核结构的缓存一致性机制,这些需要进一步的探讨研究。目前大多数多核 处理器采用总线的侦听协议。 片内存储器是将片外的存储器引到了片内,它与片外存储器一样是统一编址,因此它避 开了缓存不命中和一致性问题,但它由于采用了存储器结构,其访问延迟较缓存大。当前一 些研究人员通过采用高速动态随机存储器来组成片内存储器,缩小了与缓存间的性能差距。 除了选择何种存储结构外,存储结构设计的问题还有:存储器多大比较合适;在哪一级实现 数据的共享和通信比较合适;在哪一级解决缓存一致性问题比较合理;存储结构如何支持多 线程的应用等。 2.5 多核的功率和热管理 在整个计算机系统中,处理器,特别是高性能的处理器的功耗往往占系统功耗的50%, 甚至更高。而当前,处理器性能提高1%就会使芯片功耗增加3%,对于系统设计而言,功耗 对系统的可靠性、可用性以及系统的规模有着直接的影响。 集成电路芯片的功耗分静态与动态两类,静态功耗主要受与频率相关的漏电流的影响, 频率越高,漏电流越大;动态功耗与工作频率及工作电压的平方成正比,即P=C*f*V2 ,因 此,适当的频率和较低的电压是降低处理器芯片功耗的基础。多核环境下的低功耗技术也主 要体现在芯片的基础参数和片上功耗管理方面。 频率高低反映出处理器峰值运算性能的强弱,多核处理器芯片的工作频率和工作电压一 般都较单核处理器低,相对较低频率和较低电压,再配合按实际需求动态智能化管理功耗的 方法,减少实际耗散功率,将整个处理器芯片的功耗控制在有效的热管理技术之下。 2.6 操作系统设计 由于多核内部有多个核心,那么就存在任务分配、调度、仲裁以及平衡负载等问题,多 核之间的任务调度是充分利用多处理器性能的关键。现有的操作系统还无法有效地支持多核

处理器的任务运行。为满足实时处理的要求,均衡各处理器负载,任务调度机制需要研究的 内容有设计和优化分布式实时任务调度算法、动态任务迁移技术等。当前关于多核的任务调 度算法主要有全局队列调度、局部队列调度和共生队列调度算法。全局队列调度是操作系统 维护一个全局的任务等待队列,当系统中有一个CPU核心空闲时,操作系统便从全局任务 等待队列中选取就绪任务并开始在此核心上执行,它的优点是CPU核心利用率较高。局部 队列调度是指操作系统为每个CPU内核维护一个局部的任务等待队列,当系统中有一个 CPU内核空闲时,便从该核心的任务等待队列中选取恰当的任务执行,局部队列调度的优 点是任务基本上无需在多个CPU核心间切换,有利于提高CPU核心局部缓存命中率,缺点是 CPU利用率太低。共生调度方法的基本思想是将访问共享资源较多的任务和访问共享资源 较少的任务调度到同一时刻执行,从而最大程度上减少资源冲突。目前,多数多核的操作系 统采用了基于全局队列的任务调度算法 3多核发展趋势 多核处理器产生的直接原因是替代单处理器,解决微处理器的发展瓶颈,但发展多核的 深层次原因还是为了满足人类社会对计算性能的无止境需求,而且这种压力还会持续下去 即便在当前,设计者已经有效地将多核性能提高到了一个新的水平,可是人们对性能的渴望 并未就此泯灭。 阻碍多核性能向更高水平发展的问题很多,可真正束缚多核发展的是低功耗和应用开发 两个问题。由于现有的多核结构设计方法和技术还不能有效地处理好这两个问题,因此有必 要在原有技术基础上探索新的思路和方法。下面的内容是为了实现高性能、低功耗和高应用 性的目标多核处理器呈现得几种发展趋势: (1)多核上将集成更多结构简单、低功耗的核心。为了满足性能需求,通过集成更多核 心来提高性能是必然选择,但是核心的结构也必须考虑。因为如果核心结构过于复杂,随着 核心数量的增多,不仅不能提升性能,还会带来线延迟增加和功耗变大等问题。例如,2007 年 Tilera公司和 Plurality公司分别推出自己的64核处理器产品,而 Intel公司也将推出 80个核心的低功耗处理器。 (2)异构多核是一个重要的方向。研究表明,将结构、功能、功耗、运算性能各不相同 的多个核心集成在芯片上,并通过任务分工和划分将不同的任务分配给不同的核心,让每个 核心处理自己擅长的任务,这种异构组织方式比同构的多核处理器执行任务更有效率,实现

处理器的任务运行。为满足实时处理的要求,均衡各处理器负载,任务调度机制需要研究的 内容有设计和优化分布式实时任务调度算法、动态任务迁移技术等。当前关于多核的任务调 度算法主要有全局队列调度、局部队列调度和共生队列调度算法。全局队列调度是操作系统 维护一个全局的任务等待队列,当系统中有一个CPU 核心空闲时,操作系统便从全局任务 等待队列中选取就绪任务并开始在此核心上执行,它的优点是CPU 核心利用率较高。局部 队列调度是指操作系统为每个CPU 内核维护一个局部的任务等待队列,当系统中有一个 CPU 内核空闲时,便从该核心的任务等待队列中选取恰当的任务执行,局部队列调度的优 点是任务基本上无需在多个CPU核心间切换,有利于提高CPU核心局部缓存命中率,缺点是 CPU 利用率太低。共生调度方法的基本思想是将访问共享资源较多的任务和访问共享资源 较少的任务调度到同一时刻执行,从而最大程度上减少资源冲突。目前,多数多核的操作系 统采用了基于全局队列的任务调度算法。 3 多核发展趋势 多核处理器产生的直接原因是替代单处理器,解决微处理器的发展瓶颈,但发展多核的 深层次原因还是为了满足人类社会对计算性能的无止境需求,而且这种压力还会持续下去。 即便在当前,设计者已经有效地将多核性能提高到了一个新的水平,可是人们对性能的渴望 并未就此泯灭。 阻碍多核性能向更高水平发展的问题很多,可真正束缚多核发展的是低功耗和应用开发 两个问题。由于现有的多核结构设计方法和技术还不能有效地处理好这两个问题,因此有必 要在原有技术基础上探索新的思路和方法。下面的内容是为了实现高性能、低功耗和高应用 性的目标多核处理器呈现得几种发展趋势: (1) 多核上将集成更多结构简单、低功耗的核心。为了满足性能需求,通过集成更多核 心来提高性能是必然选择,但是核心的结构也必须考虑。因为如果核心结构过于复杂,随着 核心数量的增多,不仅不能提升性能,还会带来线延迟增加和功耗变大等问题。例如,2007 年Tilera公司和Plurality 公司分别推出自己的64 核处理器产品,而Intel 公司也将推出 80个核心的低功耗处理器。 (2) 异构多核是一个重要的方向。研究表明,将结构、功能、功耗、运算性能各不相同 的多个核心集成在芯片上,并通过任务分工和划分将不同的任务分配给不同的核心,让每个 核心处理自己擅长的任务,这种异构组织方式比同构的多核处理器执行任务更有效率,实现

了资源的最佳化配置,而且降低了整体功耗。 (3)多核上应用可重构技术。大规模高性能可编程器件的岀现,推动了现场可编程门阵 列( field programmable gate arrays,FPGA)技术的发展。在芯片上应用FGA技术有高灵 活性、高可靠性、高性能、低能耗和低成本多种优势。微处理器设计人员注意到了这种优势, 并将FPGA等可重构技术应用到多核结构上,让结构具备可重构性和可编程性。这种创新思 路大大提高了多核的通用性和运算性能,使处理器既有了通用微处理器的通用性,又有专用 集成电路的高性能,使之兼具了灵活性、高性能、高可靠、低能耗等众多优良特点。 4结束语 多核处理器的出现,对计算机体系结构的发展来讲有着深远的影响。在未来的一段时间 之内,多核处理器将在处理器市场上占有统治地位。但是如何充分利用多核处理器的性能, 更好的发挥出多核的优势,让每个核能够同时处理任务,提高系统利用率,不仅需要硬件上 的资源重复,多核互联,还需要更好的分配任务,分配能够使多个核同时工作,不互相争夺 共享资源的任务,是当前软件工作者和硬件工作者协同工作的重点所在 参考文献: [1]谢向辉,胡苏太,李宏亮.多核处理器及其对系统结构设计的影响[J].计算机科学与探 索,2008,(06) [2]贺松健.多核处理器技术浅析[J.科技促进发展,2009,(02) [3]刘必慰,陈书明,汪东.先进微处理器体系结构及其发展趋势[J].计算机应用研究, 2007,(03) [4]何军,王飙.多核处理器的结构设计研究[J].计算机工程,2007,(16)

了资源的最佳化配置,而且降低了整体功耗。 (3) 多核上应用可重构技术。大规模高性能可编程器件的出现,推动了现场可编程门阵 列(field programmable gate arrays,FPGA) 技术的发展。在芯片上应用FPGA 技术有高灵 活性、高可靠性、高性能、低能耗和低成本多种优势。微处理器设计人员注意到了这种优势, 并将FPGA 等可重构技术应用到多核结构上,让结构具备可重构性和可编程性。这种创新思 路大大提高了多核的通用性和运算性能,使处理器既有了通用微处理器的通用性,又有专用 集成电路的高性能,使之兼具了灵活性、高性能、高可靠、低能耗等众多优良特点。 4 结束语 多核处理器的出现,对计算机体系结构的发展来讲有着深远的影响。在未来的一段时间 之内,多核处理器将在处理器市场上占有统治地位。但是如何充分利用多核处理器的性能, 更好的发挥出多核的优势,让每个核能够同时处理任务,提高系统利用率,不仅需要硬件上 的资源重复,多核互联,还需要更好的分配任务,分配能够使多个核同时工作,不互相争夺 共享资源的任务,是当前软件工作者和硬件工作者协同工作的重点所在。 参考文献: [1] 谢向辉,胡苏太,李宏亮. 多核处理器及其对系统结构设计的影响[J]. 计算机科学与探 索, 2008,(06) . [2] 贺松健. 多核处理器技术浅析[J]. 科技促进发展, 2009,(02) . [3]刘必慰,陈书明,汪东. 先进微处理器体系结构及其发展趋势[J]. 计算机应用研究, 2007,(03) . [4] 何军,王飙. 多核处理器的结构设计研究[J]. 计算机工程, 2007,(16)

点击下载完整版文档(PDF)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
已到末页,全文结束
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有