AMD预计将会于今年第二季度发布皓龙处理器
AMD预计将会于今年第二季度发布四核和六核“Lisbon”皓龙处理器,该芯片代表了低端4000系列(C32插槽)平台,支持单路和双路服务器。后者更倾向于注重能效而无需太过密集型计算集群节点的Web应用层企业应用以及云架构,尽管如此Fruehe还是表示4000系列适合于所谓的“corporate HPC”,比如银行,汽车公司等32-128节点集群所占据的市场,能效更高,性能相对较低的处理器才是最终选择。
AMD预计将会于明年转移至“Bulldozer”架构,首个服务器产品将会是16核“Interlagos”以及8核“Valencia”,这两款处理器芯片分别向下兼容G34和C32插槽,非常适合于那些只升级处理器的HPC客户。“Bulldozer”变化最大的变化就是整点(Integer Point Unit)和浮点单元(Floating Point Unit,FPU)之间的关系,直到现在皓龙处理器上的每个整点核心都是映射到单128-bit FPU。但是在实现“Bulldozer”的过程中,两个整点核心搭配有一个256-bit的FPU,以此是的浮点处理更为灵活。此外Fruehe还表示计划通过其他增强型FPU设计来提升芯片整体性能。
“Bulldozer”另外一个闪光之处就在于模块化设计,允许不同核心数量的芯片构建在同一个硅片设计图中。其实英特尔早就在Nehalem架构中就引入了模块化,但是对于AMD而言则具有特殊的意义,可以考虑将ATI GPU模块加入到芯片中。Fruehe暗示AMD在重新考虑FPU和GPU在通用计算中的角色,而这将致使旨在加强浮点能力甚至是彻底用GPU模块代替FPU的芯片设计。随着时间的推移,越来越多的用户都会利用GPU来提升浮点性能。
或许现在谈及在服务器领域GPU模块化对于AMD而言还为时尚早,目前也没有将ATI GPU融合至皓龙处理器的计划。AMD产品路线图中CPU-GPU融合一体的“Fusion”芯片也只是用于客户端计算,采用了名为加速处理单元(APU)的架构。将高端GPU和CPU整合的最大障碍在于缺少裸片基板(die real estate)以及能耗限制,除非AMD引入22纳米工艺技术,否则很难在服务器芯片上融合Teraflop级的GPU。
短期内,AMD的目标在于寻找旨在提升性能的GPU逐步接近CPU的方案。尽管Fruehe未能阐述如何实现,但就目前来看不外乎如下两个方案:HyperTransport传输总线以及PCIe总线技术。考虑到目前显卡已经兼容PCIe接口,因此从GPU角度来看,后者更易于实现。想让CPU与PCIe更为适应,就必须改变插槽以及芯片结构。简而言之,在主板上添加HyperTransport—PCIe桥接通道。HyperTransport的方案则需要设计兼容皓龙处理器接口的GPU。
鉴于AMD是唯一一家在CPU和GPU架构上都有着很深的产品组合的芯片商,因此最大化利用CPU和GPU协同性是有相当意义的。在这一点上,英特尔重新激活Larrabee产品线抑或英伟达没有CPU的困扰都使得AMD保持了一种独特地位,和任何一家芯片商相比,无疑都是很大的优势。虽然特尔要在芯片制作工艺上比较领先,但是其缺陷却在于缺乏高端显示芯片产品。Frueh指出,正如英特尔在芯片制作工艺上领先AMD,我们在GPU技术上要远远超出对手,毕竟构建高端显示芯片引擎要比晶体管微缩要难很多。
网友评论