Cell的8个SPE工作方式与普通的多核心处理器不同,各SPE分别在独立的地址空间中运行。因此,每个SPE备有256kB的名为“Local Store”的内存。由于Local Store算作SPE的内存,所以不需进行类似SMP的缓存一致性(Cache Coherency)控制。连接各内核的片上总线(OnChip Bus)采用环形,各个SPE之间的最大数据传输带宽高达192GB/s。
Cell的多核心技术使得线程分配、资源管理等方面的程序模式具有了多种多样的发展可能性。Cell的主性能处理内核可处理双线程,其余每个协处理器可处理一个线程,这样Cell处理器总共可同时处理10个线程,怎样最佳应用处理器资源是今后软件工程师的一个重要研究课题。
Cell结构根本上依赖两大概念:“Apulet” ,由数据对象及必需的执行代码组成的包(Bundle);“处理元素(Processing Element)”,能在任何时间执行Apulet的控制及流处理资源分层包(Bundle)。
Apulet在系统的处理元素中完全便携,因此任务能通过将一个等待Apulet赋给一个可用的处理元素来动态执行,通过添加处理元素可实现扩展。而在最高层级,这种架构看上去像一个单元池(Pool of Cells)。系统中的所有单元都是一个明显的同位体(Peer)。根据谈及Cell设计的其中一篇论文透露,单一芯片执行单一的处理元素。
2.Cell与网格运算
《福布斯》杂志预测,信息技术的下一波大浪潮将在2004~2005年度出现,并造就2005~2020年共15年的黄金时代。到2020年,由此产生的互联网将成长为一个20万亿美元产值的大工业。这一波的本质特征,就是万维网WWW(World Wide Web)升华为网格GGG(Great Global Grid)。
网格运算是伴随着互联网迅速发展起来的专门针对复杂科学计算的新型计算模式。它把分散在不同地理位置的计算机组织成一个“虚拟超级计算机”,其中每台参与运算的计算机就是一个“节点”,整个运算网络就是网格。
(图03)
其实Cell在最初的内核设计时就预料到了网格运算,并及时地在Cell中加入了网格零件。IBM公司的员工吉姆说,这种多内核设计给予了软件设计人员巨大的灵活性,使他们能在Cell处理器上运行多个操作系统,并体验网格计算。他表示,Cell处理器在设计之初就考虑到了联网的需求。
Cell处理器支持网格运算,它还可在网络中漫游,可执行类似于网格计算的功能。一个以Cell为核心的计算机可借用网络中闲置的其他平台的计算资源。独具匠心的架构可使网格计算无所不在。如果在网络中连入几台这样的平台,整个网络都可执行同一项任务。当年的万维网改变了我们的生活,在它的标准上升华的网格,又将成为下一波浪潮的主线。支持网格运算是一个明智的选择,现在Cell正抓住这一时机,大力发展自己。
3.Cell的运算速度
先说说Cell的频率。首款Cell处理器的运行速度将超过4GHz,在2005年2月8日于美国旧金山举行的ISSCC 2005上,发布Cell的4公司提前在会场的宾馆内举行了一次记者招待会,并进行了4GHz运行演示。来自设计合作伙伴的报告称,未来产品的频率将定为4.6GHz。目前采用90nm工艺的Pentium 4处理器的最高速度才为3.8GHz。
运算速度是一款处理器最有价值的技术数据,Cell的额定运算速度为每秒2500亿次浮点数运算(256G FLOPS),PS2游戏主机采用了EE(Emotion Engine)处理器(速度为6.2G FLOPS),Cell的速度是EE的40倍以上。甚至单颗Cell处理器的运算速度,就足与跟90年代中期最强悍的超级电脑相比,或说是目前NVIDIA最强的3D显示芯片的6倍。
(图04,EE处理器)
用Cell搭建的电脑工作站试作机已进入实际运转阶段,这也是Cell处理器首次实际应用。根据测试,该工作站可在1个机柜(所使用的Cell处理器芯片数目为64个)规模下,达成每秒16兆次(16T FLOPS)的浮点数运算能力,相当于单颗PS2微处理器EE(Emotion Engine,每秒62亿次浮点数运算)的2580倍之多。
网友评论