2008,这一路走来,我们经历了太多太多难忘的事情,南方地区的风雪灾害,5.12的汶川大地震,但我们更多的记住了勇敢,坚强,因为我们最终战胜了困难,看到了希望,迎来了曙光。
是的,曙光百万亿次超级计算机曙光5000A的发布,让我们站在了世界水平的前列,,为我们带来了一个民族高性能计算产业的希望。
从发射神舟飞船的基地到东方石油公司设在国内外包括非洲、中东和南美洲的勘探计算机房,从中国最大的超级计算中心(上海超算中心)到许多大学的网络中心,从涉及国家长治久安的信息安全部门到全国最大的证券交易所都能看到曙光高性能服务器的身影,而如今运算能力超百万亿次的曙光5000的推出,将再次让世界体验到名副其实的中国速度。
曙光公司是我国高技术领域依靠自主创新发展壮大的一个范例,从最初的曙光1号到如今的曙光5000,都值得我们认真分析总结,因为这也同时代表的中国高性能计算机的发展史。
PCHOME非常高兴请来了曙光行业总监 曾超和刀片技术部总经理 沙超群,在7月8日三点半,与我们一起解开背后的更多故事,以下为现场文字直播:
主持人:各位网友,大家好!欢迎大家来到PCHOME访谈室。2008年,这一路走来,让我们经历了很多很多难忘的事情。但我们更多的学会了勇敢、坚强。因为我们最终战胜了困难,看到了希望,也迎来了曙光。是的,曙光百万亿次超级计算机曙光5000A的发布,已经让我们站在了世界水平的前列,这是一件非常让我们十分自豪和骄傲的事情,为我们带来一个民族高性能计算产业的希望。
我们这次也很高兴的请来曙光行业总监曾超、刀片技术部总经理沙超群,由两位跟大家打一个招呼。
曾超:网友朋友们,大家好!
沙超群:大家好!
主持人:先跟两位求证一个事情,曙光5000A在这次TOP 500的排名相比,大概在一个什么样的水平?
沙超群:对曙光5000A来说,看了6月份最新发布的TOP 500,曙光会在第六或第七名的样子。在第六名以前都是美国公司研制的。曙光5000A推出,意味着中国继美国之后第一个能够研制商用超过两百万亿次的超级计算机的国家。
主持人:错过这次排名,会不会觉得很可惜?
曾超:作为曙光来说,能够进入前十名,这不是曙光生产超级计算机唯一目的。通过技术的排名和先后顺序的排名,能够表现出生产超级计算机的水平。但是不是能真实反应应用。曙光不会为了追求排名而追求排名。
沙超群:如果为了排TOP500,我们需要4月就得生产出曙光5000A,而用户12月份才要,中间这段时间这台机器干什么呢?"
主持人:会参加下半年的排名吗?
曾超:如果时间允许,我们会参加的。
主持人:HPC发展速度很快,会不会担心下次无缘前十?
沙超群:这一个机器在下半年排名当中会不会保持现在的位置,我们不敢保证。因为高性能计算发展非常快。几年前,日本30万亿次一直排在前面,现在已经落到十几名开外。高性能计算发展非常快。我们会尽力的去排,在机器的效率方面想办法调高,尽可能排到前十名。这是我们的目标。
主持人:据说5000A申请了50多个专利,主要都有哪些方面的创新?
沙超群:也不只是50多个。曙光5000A专利集中在很多方面。
首先,我们说建设节约型社会,在节能方面我们有大量研究,付出了很多精力。在节能方面,申请了很多专利。在互联方面,我们有接近2000个节点,如何保持高效,我们做了很多工作。在系统散热方面,因为曙光5000A做的密度基本上能够达到业界最高,这一种密度下,散热是巨大的问题。我们在散热方面,做了很多创新的东西。
曙光5000A应用的是曙光刀片式服务器。国内服务器厂商,曙光是国内服务器厂商第一家自主开发刀片式服务器的厂商。刀片式服务器上,我们有大量的创新,包括风道的设计,刀片式服务器节能的设计,还有很多高密度刀片设计等。整体来说,我们专利散布在架构、节能、散热、节点等很多方面。
主持人:大部分的人知道和听过HPC,但并不是很了解HPC,请问商业应用主要是什么?在哪些行业,为人们的日常生活带来了哪些好处和便利?
曾超:HPC给我们日常生活带来的影响是非常全面的。普通老百姓对超级计算机感觉不深。比如说从早上离开我们的家之前,我们要看天气情况,要看天气预报,天气预报播报跟超级计算机息息相关,如果用普通的PC机需要不停的运转,要一年的时间,用曙光的机器用几个小时时间可以很快分析出气象情况。看了气象之后上路要开车,汽车的研发、汽车的碰撞等都是跟超级计算机息息相关。开车使用的石油,也是用超级计算机进行石油勘探。像头疼感冒需要吃药,生物制药跟超级计算机也是有关。
主持人:曙光5000A用的是AMD的巴塞罗那,因为英特尔是很大的芯片制造厂商,我们会不会推出基于英特尔平台?
沙超群:大家承认英特尔和AMD是非常优秀的芯片供应商。大家有一些误解,认为是曙光4000A和曙光5000A,其实是一个系列的。曙光4000A过去卖了一两千套。曙光5000A系列产品里面,大家看到的是最大的超级计算机。这一个系列的产品不排除采用AMD芯片。刀片式服务器我们有基于AMD四路巴塞罗那的芯片。后期产品规划,我们也会有基于英特尔的产品。
主持人:曙光4000也是部署在上海超算,曙光5000A也是,他们俩的工作会有所不同吗?会有所替代吗?
曾超:曙光5000研发到位,曙光4000A会移出机房。现在曙光4000A整体的机器跟现有的曙光5000一个机柜能量差不多。从另外一个角度说明,机器更新非常快。之前那么大面积的机器只剩下机柜这么大。所以,一定会有更新。操作系统和研发架构不太相容,会替代的。
主持人:曙光5000A完全替代曙光4000A?
曾超:对。
主持人:会承担哪一些方面的工作?
曾超:方方面面的。刚才提及的应用领域都有,汽车碰撞、汽油勘探、飞机机型设计、桥梁的抗压等都要用到曙光5000。
主持人:龙芯是我们国家自主研制的芯片。曙光5000这次用到龙芯吗?
沙超群:我们一直说高性能计算的自主研发,曙光5000目前来看,除了芯片和CPU采用外国的,其他的板卡和机箱的设计、系统散热的设计都是自己研发的。核心部件还是芯片,这一次我们采用AMD的巴塞罗那为主。我们近期会出另外一个系列的产品。
主持人:方便透露吗?
沙超群:在曙光5000验收鉴定的时候,有可能会发布。
主持人:超级计算机向千万亿次速度发展。下面这一代超级计算机会采用龙芯吗?
沙超群:这是一个比较复杂的问题。我们会看当时芯片的发展情况和龙芯自身发展情况。目前的规划一定是要用龙芯的,不排除这是一个混合的结构,以完成千万亿次协同计算。如果纯粹采用龙芯,目前也不排除这一种可能。
主持人:也有可能完全采用龙芯。如果采用龙芯,因为是我们自己研制的,在成本方面会不会有一些节省?
沙超群:采用龙芯,在成本上有更大优势。更大优势是节能方面。如果我们能够达到别的芯片一半的计算能力,功耗可能是其他处理器的八分之一、十分之一,甚至更低。我们采用龙芯,在功耗方面会得到很大幅度的节约。
主持人:速度和性能会受到影响?
沙超群:主要是怎么样把CPU协同起来。通过很好的方式协同起来,我可能用更多的芯片,但是使性能更高。IBM几年前用的处理器,单颗CPU性能不是很高,但是组成了非常庞大的性能。
主持人:曙光5000A占地面积非常大,它的造价和占地面积是多少,如果人来算,它的运算速度是多少?
沙超群:第一个,造价。我们的造价非常低。但是,也达到了两亿元人民币。另外,占地面积是300平方米左右。计算能力目前设计峰值是230万亿次。
国际上同等计算能力的超级计算机,造价和占地面积都高于我们。曙光4000A用40多个机柜,达到的计算能力是十万亿次。
主持人:奥运离我们已经非常接近了,曙光的产品在奥运这块有没有一些应用?
曾超:提到曙光5000A,曙光5000A是一个大的体系架构、一个大的架构。曙光5000A在交互上,在水晶石公司里面,曙光公司把自己的产品用到了水晶石公司的产品。奥运会开幕式8点8分的时候,打开电视机会看到有一个非常精美的图画,制作非常精美,所有图画制作是曙光5000A一小部分机器来完成的。北京气象局用的是曙光超级计算机,它保护了北京地区的天气预报形成,为奥运会间接的做了一些贡献。
主持人:曙光5000A用到了奥运会的产品上?
曾超:对。
主持人:以前有产品用在奥运会上吗?
曾超:非常多。包括安保、新闻转播等都用到了曙光产品。
主持人:人们一直有这样的观点,那就是高性能势必高功耗,而如何在高性能的情况下保持功耗不变或降低,这是大家关心的。曙光5000A在节能环保这块做了哪些功课?
沙超群:刚才也谈到了这一个话题。对于曙光5000A来说,我们在整体研发过程当中,我们投入精力非常大的一部分是节能。在节能方面体现了多个层次的节能:
第一,节能部件,这一次采用的是巴塞罗那低功耗的CPU。一颗CPU比别的降低很多。
第二,内存。我们选用业界主流的内存。我们内存的节能也很大。
还有,节点。曙光5000A用的是刀片式服务器。刀片式服务器在节能方面,我们做了非常多的工作,做散热模拟和风道的设计,保证很好的散热。每一个刀片机箱里有很多电源,电源是有自己的效率曲线,电源工作在10%输出的时候,电源是1000瓦,90%负载情况下,可以让效率达到90%以上,我们会计算当前输出多大功率,然后计算出几个电源工作合适,我们会自动的打开或关掉一些电源。我们还有曙光的节能软件,我们根据CPU工作情况来调节。我们有很多节点,有一些节点没有工作,我们可以把它休眠。仅此一项节能就可以达到30%以上。有一部分CPU一直在工作,但是负载很低,这一个时候我们把CPU降频。在负债比较轻的情况下,能够做到比较节能的工作。比如说有100个刀片的计算,有30个刀片很忙,有70个刀片很闲,我把70个刀片工作任务迁到30个刀片上,让这70个刀片休闲。我们根据工作情况来调整刀片的构成状态。我们的节能软件还有一点,你用我这一个东西,比如说一周、一个月、某日到某日你耗了多少电,我们都可以计算出来耗了多少电,会计算出花了多少钱。采用我们节能技术,一年至少给客户节约1000万吨电,客户的维护费用减少几百万。
主持人:都是用软件调节的?
沙超群:一部分是用软件调节。还有一部分我们提供硬件接口。我们还提供了一个技术,可以让用户机房供电降低。
主持人:是曙光自己研发的吗?
沙超群:对。我们有一个团队,节能是他们的一方面工作。
主持人:高性能计算机未来的发展趋势是什么?
沙超群:高性能计算机发展趋势,几年前都在谈,包括曙光提出来的HPP架构等等,目前还在探讨当中。曙光下一代是千万亿次。我们在架构上会采用加速部件等提高整体性能。
主持人:纵观全局,请分析一下整个的发展。
沙超群:
几年前我们探讨架构方向变化。目前也有一些出来了。有一些通用架构CPU和加速CPU。目前,混合CPU会出现在高性能计算机。
主持人:客户应用会呈现出哪些趋势和特点?
曾超:大家对曙光的了解,包括对高性能计算机的了解,还是停留在运算这一块,是阳春白雪,离我们非常远。很多人感受不到高性能计算机对我们的好处。未来发展趋势,高性能计算机由阳春白雪走到寻常百姓家里面。随着高性能计算机的发展,我们的应用会越来越广泛。举一个跟大家息息相关的例子,微软在它软件使用上有一个新的变化。微软操作系统不会卖你单机版的,把微软的操作系统装在一个大的集成机里面。用户在网上打开。每一次打开收取使用费,而不是下载下来。这样,集群应用需求量非常大,这是一个很大应用方向。满足世界上大量用户的应用,需要高性能大机器做充分的应用。微软正在做这样的测试,如果未来软件支持这样的模式,高性能计算机的应用跟大家息息相关了。从软件的的应用,包括个人的PC等,我们更多人感受到高性能计算机给大家带来的好处和实惠。
主持人:是网上流行的云计算?
曾超:是实现云计算的一部分。
主持人:曙光5000A研制非常不容易,在研制过程中,遇到的最大困难是什么?有没有很难忘的事情?
沙超群:对于曙光5000A项目来说,确实有很多的困难。
首先,曙光4000A占地面积是曙光5000A的一半,但是曙光5000A是曙光4000A计算能力的很多倍。我们如何把计算密度提上去?如何保证效率更高?这是我们面临的非常大的难题。2005年开始,我们开始研究曙光5000A的节点。用在曙光5000A的刀片式服务器,是全球密度最高的四路,相当于我们普通的电视机里面,放了40颗高性能的芯片,如何保持散热、高性能计算?这是我们面临比较大的问题。
另外,规模扩大了20倍,如何保证效率?采用什么样的互联使系统的实测效率更高?这是我们遇到的实实在在的问题。
刚才谈到了节能,如果用户每天耗电几十万,也是受不了的。
主持人:曙光是在中科院的依托下成长的,对我们都有哪些方面的帮助,让我们更快的成长?
沙超群:曙光跟中科院有非常紧密的联系,包括曙光5000A的项目是跟计算所合作开发的。有很多技术也是跟计算所合作。有很多架构的提出,很多的实现,都是一起来完成的。而且,计算所是曙光的大股东。在这一种情况下,我们跟计算所有很好的合作来开发产品。
主持人:对你们帮助很大?
沙超群:对。
主持人:资金方面呢?
曾超:没有太多的帮助。计算所是国立的机构,代表了国家计算机研发最高水平。国家在这一方面每年有大量的投入,投入是给计算所做科研课题。有一些科研课题可以转变为产品,有的转变不了,是学术性的东西。转变为产品的工作由曙光公司来实现。
主持人:曙光前一段也刚刚发布了个人HPC,也是飞入了寻常百姓家,一般HPC都是高端的应用,为什么会发布个人HPC?
曾超:因需而生。一个大的集群系统,不会单单需要两个亿。有多少人觉得两个亿不贵?大的集群动则几千万、几亿,从资金面来说,这是很核心的问题。
现实当中又有很多应用,像高校、科学院所有高性能的需求,但是花不起这么多钱。买超级计算机一般是干一两件事,这一两件事干完之后,这一个机器就闲置了。我们在市场调研当中发现,个人HPC的市场前途非常广。在这样的前提下,我们发布了个人HPC。一推出,得到了很好的效果。
主持人:目前销售情况怎么样?
曾超:销售情况非常好。将近十几个分区采用了。有很多专家有浓厚的兴趣。我们对个人HPC非常有兴趣。
主持人:什么样的用户买个人HPC?
曾超:大的动漫渲染的机构有实实在在的需求,包括科学院所,包括高校,包括大的工程设计、工程计算,包括石油研究所等都有需求。
主持人:个人HPC与传统的HPC有什么区别?
沙超群:它的区别是比较明显的。
首先,价格。普通的HPC价格高高在上。个人HPC的价格低,要让人用得起。
第二,普通的HPC,如果用户要用,首先得有专门的机房放,同时要有专门的空调和供电设施等。而个人HPC放在桌子上就可以了,但这得解决一个供电的问题。个人HPC的目标,是用墙上的插头来供电。
第三,放在桌子上,最简单的一个问题,噪音得低。在普通HPC机房里面,噪音非常高,一般人不能接受。一堆人在办公室里面,弄噪音70、80分贝的东西,别人没法儿工作。
第四,个人HPC得有一个起点,要超过一万亿次。超过一万亿次以上的具备以上条件的,就可以算个人HPC。
主持人:放在桌面上,散热怎么样解决?
沙超群:用墙电,保证了墙上的电够我使。摆在桌子上,噪音要非常低。个人HPC实测是零噪,低于35分贝算零噪。个人HPC的噪音比个人PC还小。
主持人:几乎感觉不到?跟普通的电脑噪音差不多?
沙超群:对。它的计算能力是普通笔记本的10个至20个之间。买一个个人HPC,自己就可以做天气预报了。
主持人:很多超级发烧友会非常喜欢这样的东西,放在桌面上,速度这么快,噪音又低,又很节能环保,请问价钱是多少?
曾超:个人HPC相当一部分用在并行上,普通的老百姓还用不到这一些东西。从整个价格来说,便宜的有十万、几十万。随着时间的推移,并行程序会更广泛的应用,我们老百姓应用不多,主要是专业人士用。
主持人:会不会推出价格相对便宜,能够用在普通人生活当中的产品?
曾超:这是曙光的目标和追求。
主持人:希望早日实现。
主持人:个人HPC适合应用于哪些行业?
曾超:可以用在曙光4000A、曙光5000A这一些领域的,个人HPC都可以用。它们应用领域是重叠的。目前还是应用在专业的领域,像石油、气象、科研等。随着电脑技术不断的发展,个人不断的挑战自我,有很多的用户也在接触并行。像微软新模式的使用,会有更多的人感受得到和使用,随着时间的推移,应用会越来越广泛。
沙超群:刚开始我们讨论个人HPC,过于强调“个人”。其实个人HPC的“个人”是科研院所、大学教师、高级研究员等,我们初期没有把它计划推入寻常老百姓家看电影等。个人HPC并行处理,个人玩游戏等目前还没有并行的需求,是基于一颗CPU上跑的。老百姓应用的程序没有很多CPU来支持。比如说做发动机的设计、做流动力学的仿真、搞制药的人看药品的分子结构等,用高端下移的办法来实现。曙光的目的是把个人HPC卖给家庭用户,每一个家庭用户都来用,这是我们的梦想。
主持人:个人HPC不是日常的应用,是SOHO、小企业的应用?
曾超:对。
主持人:当初研发个人HPC,是客户有这样的需求给我们提?还是我们觉得客户有这样的需求去做的?
曾超:我们充分进行了市场调研。我们接触了大量的客户,客户有这样的需求,再加上我们对市场的分析,我们发现个人HPC是非常好的趋势。很多人对个人HPC关注不大,但是个人HPC对高性能计算机应用是标志性的事件。随着时间的推移,大家会越来越感觉到个人HPC对生活的影响和对科技的推动。
主持人:我看到个人HPC这一个名词的时候,觉得很新鲜。把个人HPC体积这么大的产品做成桌面化,这里面有什么新的技术吗?
沙超群:把40个核放在桌面上让大家用,刚才也比较了个人HPC跟普通PC的区别,我们要克服一些困难:
1、我们要做到一万亿次以上。
2、要保证功耗低,因为要用墙电,得用220伏的电。
3、要用在桌子上,噪音得小。
HPC技术我们已经做完了,关键是解决个人HPC节能、降耗的技术。刚开始我们尝试了水冷等,利用了风道设计,我们分析我们内部的风组,来挑选最合适的曲线,挑选最适合的风扇的风速,结合水冷的技术。看起来很漂亮,用起来也很舒服。
主持人:经过很多次实验,找出最好的办法?
沙超群:对。小规模系统怎么样互联等,经过了大量的调研,和用户进行了大量的探讨。我们内部做了非常多的实验。我们做出来的产品就是目前的个人HPC。
主持人:我没有见过个人HPC?请二位给我们说一说。面积和体积是多大?
沙超群:个人HPC宽度大概是普通PC的二倍,深度比普通PC长一点,高度和目前的PC差不多。
主持人:访谈时间差不多了,请二位给我们总结一下。说一说感受。
曾超:曙光公司为高性能计算和个人HPC一直付出努力。我们有一个梦想,希望在国内,普通老百姓能够用上国产的高性能计算机。在各行各业,实现高性能计算机的梦想。我们国家在计算机领域一直承受着痛苦,龙芯研制成功之后,我们高性能计算机用自己的“芯”生产出自己的高性能计算机,这个时候,我们可以真正地说我们是国产的,我们是世界的。
主持人:个人HPC用龙芯了吗?
曾超:下一个目标是把龙芯运用到个人HPC,这是我们下一个研发的目标。目前还没有应用。
沙超群:从毕业到现在,我一直做研发的工作。我们的想法很简单,我们一代一代人要做下去,把中国的高性能计算机真正做起来。中国人依靠民族高性能的产品,在国防、关乎民生的各项工作当中,包括在IT机房,包括在国家的安全部门,包括在气象、石油勘探,包括在所有的各行各业上,都用上我们自己的民族的高性能产品。这是我们的梦想,也是我们的责任。大家对自主设计有很多质疑的声音。曙光5000A里面,曙光投入了非常大,从机箱到主板所有的部件基本上是靠我们自主研发设计的。下一个目标,如何把国产芯片用到各行各业的高性能计算当中,这也是我们的一个梦想。
主持人:感谢大家的关注,期待个人HPC飞入寻常百姓家,期待着千万亿次高性能计算机的发布,谢谢,再见。
嘉宾简介
曾超 行业总监
曾超,黑龙江省集贤县人
1972年4月出生
1994年哈尔滨工程大学计算机系毕业
1994年—1998年 重庆华渝电器仪表厂
1999年—2001年 重庆人报记者
2002—目前 曙光公司 先后任职 平台经理 大区经理 群组总经理 行业总监
沙超群 刀片技术部副总经理
沙超群,男,硕士,毕业于北京理工大学。
02年进入曙光公司,一直从事研发工作。
历任硬件开发工程师,硬件开发经理,刀片技术部经理。
先后主持研发过曙光4000A节点机,曙光4000A管理系统,曙光TC2600刀片服务器(曙光5000A节点)等工作。
网友评论