基因数据库容量以每6-8月翻一番的速度增长,这一增长速度甚至超过了计算机运算能力的增长,而一个完整的测试流程产生的数据量从以往的几十兆到现在的数十G,数据量增长了成百上千倍……。
很显然,强大的高性能计算系统已经成为生命科学研究不可或缺的利器。但是对于项目启动初期的”生物芯片上海国家工程研究中心”而言,一方面是对海量的计算的无止境的需求,一方面是对总体拥有成本的控制,如何解决这一矛盾成为摆在他们面前的一道难题。
海量计算 难以承受之重
“生物芯片上海国家工程研究中心”由上海生物芯片有限公司负责建设和运行,中心汇聚了中科院上海生命科学研究院等十一家在上海的国内知名大学、研究院、医院和企业的优势资源。作为中心的承担者,上海生物芯片有限公司,经过几年的发展,建成了基因芯片、蛋白芯片、组织芯片以及微流体芯片实验室等一系列生物芯片技术平台,推出了科研型基因芯片系列民用产品,并且承担了国家863项目“基因、蛋白和组织芯片的研究和开发”中生物信息学的研发工作。
随着“生物芯片上海国家工程研究中心”的正式启用,公司进入全面高速发展的另一个时期,就在公司全力以赴进行科学研究时,一个难以逾越的问题出现了。基因芯片研究涉及庞大的数据量和计算量,海量的计算任务让公司现有的平台一直处于超负荷运转状态,计算效率逐步下降,项目研究进度一拖再拖。上海生物芯片有限公司的项目负责人为此十分焦急,引进一套更高性能的计算平台迫在眉睫,但是有限的预算又是一个难以回避的难题——一套成本合理,并具有高性能、高扩展、低功耗的计算平台成为上海生物芯片有限公司的当务之急。
应用复杂 赶超登月工程
作为国内高性能计算领域的领导厂商,在了解到客户的困惑之后,浪潮立即着手前期调研和项目规划工作。上海生物芯片有限公司目前运行的软件包括生物信息学相关软件、分子动力学相关软件、蛋白质结构预测相关软件等数十种应用。考虑到不同软件应用之间特点千差万别,需要根据不同的计算任务特点选择不同的计算软件、计算方法和硬件资源。另一方面,生命科学平台对于计算系统性能和存储系统性能的需求是没有止境的,如果只是单纯的为了搭建此次系统而进行设计,可能会造成后期升级乏力,影响平台使用寿命,造成资源浪费。除此之外,系统功耗也是不得不考虑的因素,因为生命科学平台一个任务可能需要跑数天到数十天,直接带来电费的高投入、机房空调的高投入和机房UPS系统的高投入等等问题。
“两高一低” 化解应用难题
通过与多个院所生命科学领域专家的沟通与实际测试结果来看,浪潮为上海生物新品公司量身定制了天梭TS10000高性能集群,该集群在设计上专注于提高HPC应用的运行效率,增强系统的可扩展性,致力于提升系统的总体计算能力、加速节点间的数据交换和系统的I/O带宽。同时,浪潮针对客户的实际运算需求,开发了不同级别的软件应用,促进系统内部服务器、存储、应用之间最大限度趋近协同运算。
在此设计原则技术上,浪潮特别提供了“高性能计算节点+高速网络+高效能存储”的整套定制方案。计算节点采用的是基于Intel®至强®5500处理器的浪潮NF5220和四路六核服务器NF520D2。该集群不仅计算性能高,还具有高扩展、低功耗的特点,由于采用了智能功耗控制技术,该集群整体功耗比同类产品至少降低10%,在任务较少时,还可以通过浪潮天梭监管软件远程关闭没有工作的节点,进一步降低开支。
兼顾当前 着眼未来
新平台上马之后,许多极具挑战性的计算课题,从耗时几个月的“持久战”变成了几天之内解决战斗的高效“闪电战”。作为一个应用型单位,上海生物芯片公司虽然在业务领域非常精通,但并不是高性能计算方面的专家,所以非常渴望系统厂商能够基于实际应用,提供精准的全方位的技术支持。在这一点上,浪潮的高性能工程师在系统规划之初就积极的参与进来,并以满足客户需求为目标,真实有效的解决了实际问题。天梭TS10000高性能集群解决方案,不但性能卓越,又具备很好的功耗控制和可扩展性,充分保护了客户的投资,并为未来业务拓展预留了足够的空间。
网友评论