挑战高性能计算 曙光5000勇攀高峰

互联网 | 编辑: 杨雪姣 2007-10-10 10:13:00转载 一键看全文

第二页

2、创新的设计主要体现在三款核心芯片上,曙光5000具有(百)千万亿次计算机的实实在在的自主知识产权。

从曙光一号到曙光4000,计算所和曙光公司在高效能超级计算机的研制过程中,曾设计、流片过Wormhole Routing 等关键芯片,但基本上没有量产。目前大量销售的曙光高性能计算机的各种芯片几乎都是进口的,CPU等芯片占到高端计算机成本的80%以上。曙光5000与过去我们研制的高端计算机的重要区别是,(百)千万亿次计算机的三款核心芯片都将由计算所和曙光公司自己设计。这三款核心芯片是:龙芯多核CPU,连接一块板上多个CPU的系统控制器(System Controller),和连接各节点的交换芯片(Switch)。这三款核心芯片难度都很大。如果能按计划如期完成,我们可以十分自信地宣布,中国已完全掌握了高效能超级计算机设计的核心技术。在我们的研制计划中,这些芯片不是仿制国外的芯片,必须要按照HPP体系结构的要求独立设计,包含许多原始创新:例如:我们争取在世界上首次实现CPU内多核之间的寄存器级(RTL)数据传输机制,使得CPU内通信速度有可能超过计算速度,从根本上消除通信瓶颈;系统控制器和交换芯片中内置可直接寻址的Test & Set硬件锁,可显著提高进程间同步的效率,硬件"同步"也会大大提高并行应用同步的效率;利用全局地址空间实现"赋值"式通信,降低CPU中核与核之间的通信延迟;利用多层网络提高了多核与多核之间并发数据交换的聚合带宽和吞吐率,打破通信壁垒等等。


必须指出,研制(百)千万亿次计算机在工程实现上难度很大,不同于一般的科研课题。曙光5000必须解决一系列世界性难题:如千万亿次计算机的全系统模拟器;高频数字模拟混合、光电混合信号;多核心(Kernel) 操作系统容忍单个处理器故障,能够支持节点之间的隔离性;对消息传递机制和全局地址空间两种并行计算模式同时提供有效支持;上千个客户端在多用户并发访问模式下保持稳定的I/O性能;改造现有算法并利用并行编译技术使应用与千万亿次计算机的体系结构相适应,以达到数万个处理器的可扩展性等等。这些都是国际学术界和企业共同面对的难点。我国在工程技术上与国外还有较大的差距,掌握这些技术还需要我们付出艰苦的努力。

3、曙光5000创新技术还体现在低成本、低功耗和低占地面积方面,曙光5000在单位性能的成本、功耗和占地面积上的目标是瞄准世界领先水平。

龙芯多核CPU在可扩展多核结构、多指令集支持以及在低成本和低功耗的基础上获得高效能等方面有独特的优势。如果全部采用龙芯多核CPU,曙光 5000在成本上将有极大的优势。即使只采用一半龙芯多核CPU,另一半用国外CPU芯片(曙光5000的体系结构具有很大的灵活性,也可以支持其他主流 CPU,不限于龙芯CPU),成本上也有较大优势,比国外正在研制的千万亿次计算机成本要低得多。

曙光5000计划分两期进行,在2008年通过一台百万亿次曙光5000A系统、一台数万亿次原型机、一个模拟器分别验证曙光5000在软件、硬件、体系结构上的创新,在2010年推出千万亿次曙光5000L系统。

曙光5000在满足国家千万亿次高效能计算机的战略需求的同时,还要将关键技术辐射到企业服务器、个人高效能计算机(万亿次)、箱式高效能计算机(十万亿次)、可扩展高效能计算机(百万亿次)等多种产品形态,到"十一五"末高效能计算机平均每万亿次的硬件成本要比曙光4000A时降低30倍,使得国产品牌高效能计算机的销售量增加8-10倍,达到每年4000台以上,大大提高国内品牌高效能计算机的市场竞争力,有力地促进高效能计算机在中国的普及。

提示:试试键盘 “← →” 可以实现快速翻页 

总共 2 页< 上一页12
一键看全文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑