深度分析:性能与效能 孰重孰轻?

互联网 | 编辑: 杨雪姣 2008-10-07 15:10:00转载-投稿 一键看全文

第二页

扩展性墙(Scalability Wall):在一个十万亿次量级的高性能计算机系统中当前千兆、万兆以太网、Infiniband、 Myrinet、Quadrics等商业化网络均可为应用开发者提供完整的网络互联。在一个胖树拓扑结构中,用户不必过于关注延时,但当系统规模扩展到2万个以上处理器时,就必须采用低度(Low-degree)互连或网格(Grid)互连,胖树结构不适用于这样的规模,延时将变成一个非常重要的问题。同时,今天基本上没有系统软件和应用软件能扩展到这样一个处理器的规模,我们需要重新设计软件硬件编程模型,以适应系统的大规模扩展和求解问题的大规模扩展,并确保其高效性和高并行度;
 
与此同时,在另一方面,虽然多核处理器是当前乃至未来构建高性能计算机的基础,但多核处理器也对传统的系统结构提出了新的挑战,如:如何对芯片、板极、系统级三级并行结构进行均衡设计?如何将通信延伸到多核内,发挥由上万个处理器核构成的大规模并行系统的计算能力?如何增加应用的可移植性?如何减少多核带来的存储器壁垒加剧?

可以看到,上述内存墙、I/O墙、功耗墙、复杂性墙、编程墙、扩展性墙等诸多问题为高性能计算机的发展及其平民化应用设置了重重障碍。美国国防部于2002年制定的“高效能计算系统”(High Productivity Computing Systems,简称HPCS)研究计划(IBM PERCS、Cray Cascade、SUN Hero成为首批入选计划)首先提出了以高效能作为新一代高性能计算机研制的目标。高效能代表了高性能计算机研究的新方向,其包含了高性能、可编程性、可移植性、稳定性等多个方面的要求:

高性能(Performance):在重要的国家安全应用方面,将由十多个到上千个节点组成的系统可伸缩能力和商用计算效能提高10到40倍;

可编程性(Programmability):减少应用方案的开发时间,降低系统运行和维护成本,提高系统使用效率;

可移植性(Portability):将研究和运行的高效能应用软件与系统平台分离开;

健壮性(Robustness):针对外界攻击、硬件故障及软件错误开发相应的保护技术,为用户提供增强的可靠性,减少恶意行为的风险。

全球高效能计算机技术研究现状

高效能计算机研究领域主要包括高带宽/低延迟分级存储系统;平衡好处理器、存储器、网络带宽、系统软件与开发语言的均衡系统结构;健壮性策略;新的度量准则和基准测试程序;系统自适应性;节能以及简化管理复杂性等诸多内容。当前HPCS项目已从大规模研究阶段转向最后阶段-2010年前基于IBM PERCS系统和Cray的“适应性超级计算”(Adaptive Supercomputing) Cascade 系统完成两台千万亿次高生产率超级计算机系统研制开发。

IBM PERCS系统基于Power7微处理器、AIX操作系统、通用并行文件系统(GPFS)、IBM并行计算环境及互联和存储子系统进行开发。当前 IBM PERCS 项目已经公布的几个研究方向有:片上多处理器(CMP);智能内存:在每个DIMM内存条上增加一个智能Hub芯片,实现预取、Scatter/Gather、重排序、缓存等功能;全局名字空间支持;混合型DSM:通过X10编程语言实现,支持OpenMP程序;异步SMP:简化目前SMP硬件一致性协议,使之更接近软件的应用模式;片上FIFO:将同步和数据传送结合,减少应用中的延迟;基于目录的cache一致性协议等。PERCS的存储系统实现了巨大的UMA结构的SMP系统,同时在该系统中IBM计划开发高效用软件和开发工具以提高开发人员的生产率。

Cray Cascade 系统联合了Stanford、Caltech/JPL和Notre Dame学院的研究人员共同进行开发,具有独特的处理器设计,单节点处理器有机地结合了向量处理器、流处理器、多线程处理器设计;轻量级处理器采用了PIM技术和多线程技术。存储系统采用UMA+NUMA共享内存方式,并提供了灵活的地址变换和分布。Cray Cascade 系统本质上是一个能在单系统中提供包括标量、FPGA和混合矢量/超级多线程(MMT)处理器板卡的机箱内集群(Cluster-in-a-box)。在该系统中Cray将设计一款基于其XD1系统的FPGA加速板卡,采用统一的高带宽光互联网络,节点(Locale)包含向量部件、粗粒度的多线程处理器、与DRAM结合支持细粒度并行的PIM部件等,提供分布式共享内存、多层次多线程执行模型、硬件支持的分析和调试功能。Cascade系统将开发编译器软件Chapel以处理多种涉及标量、矢量或MMT应用的混合UMA/NUMA编程模型。除上述两家获HPCS最终支持的企业外,SUN也在第一、二阶段获得了支持,SUN HERO计划主要采用的技术有Sea of Memory技术、Proximity Interconnect 技术、Guarded Pointer技术和Interval Arithmetic(IA)技术。

当前除了上述IBM、Cray、SUN等企业及学术机构以外,基于可重构计算、专用加速部件、混合异构结构、芯片级、系统级以及基础架构级节能等相关技术,学术界和企业界也已经展开了高效能计算机关联技术研究。当前以FPGA、专用加速部件、通用商品化基于多核处理器(Many-Core)为主体的混合异构结构已成为高效能计算机发展的主流,在这其中,包括节能、PIM、流式计算、光互联、高效编译器、并行计算环境等等诸多方面的创新和整合;在应用加速方面,由于FPGA可以根据不同的应用实现可重构计算,适应高性能计算机面临的不同的计算模型,同时FPGA在内存带宽、并行处理和低功耗方面有突出的优势,因此与主处理器配合,可实现提高特定应用性能和降低系统功耗的双重目标,应用前景广阔,是实现高效能计算的有效途径之一;在提高存储器性能方面,基于多层次Cache、加大处理器和存储器之间的带宽、多线程、预取、PIM等诸多技术以消除内存墙(Memory Wall);

在系统可靠性研究方面,国内外研究主要在硬件可靠性、操作系统可靠性和应用可靠性三个方面。硬件可靠性主要沿用60年代大型机系统发展起来的一系列基础技术框架,如N模冗余、专用组件或模块等,通过冗余硬件达到提高系统硬件可靠性的目的。操作系统可靠性研究主要有操作系统隔离技术(如Nooks)、故障忽略技术等,通过将故障忽略或隔离从而减少对应用的影响。针对科学计算应用,多采用检查点技术对应用运行的阶段性结果进行保存,以备在出错时进行恢复;在解决管理的复杂性方面,包括自动监控全局资源,对监控数据进行深度挖掘、关联分析预测系统行为,根据应用特征动态构造虚拟计算环境,实现应用间性能隔离和安全隔离,对应用软件的可靠性和扩展性提供支持,提供验证、模拟、评价工具,并在保证系统性能的情况下,实施自适应功耗管理及可靠性管理;

提示:试试键盘 “← →” 可以实现快速翻页 

一键看全文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑