NVIDIA不骄不躁 新技术需开发新架构
● 新技术需要新架构支持,NVIDIA为曲面细分重新设计芯片
从Geforce FX5000系列开始直到现在的GTX285,GPU的图形渲染性能提升了150倍,可是几何性能提升连3倍都不到。而未来DX11游戏将显著加大对图形几何逼真度的计算,NVIDIA意识到继续原有的设计思路势必会形成瓶颈。
NVIDIA耗费了较长的时间研发支持DX11的新GPU—GF100,它的核心架构与之前的GT200大相径庭是在意料之中的。GF100将内核中的处理器分为四个模块,称为GPC,每个GPC中包含四组SM,每个SM拥有32个流处理器和4个纹理单元,总规格便有512个流处理器和64个纹理单元。
GF100实现DX11的功能与ATI截然不同,它是将顶点获取、曲面细分、观察口转换、属性设置、流式输出这五种功能打包成一个专用于几何计算Polymorph引擎,配属到每一个SM当中,共有16个Polymorph。这样GF100芯片的顶点获取和曲面细分单元数量便是RV870的16倍,在遇到繁重的曲面细分任务时它们可以并行工作,极大地提高了GPU的几何性能。
拥有四个Raster是GF100芯片整体性能提升的另一大法宝,它有三个流水阶段组成。在接收到由Polymorph曲面细分后的框架数据时,提取顶点位置,计算三角形的边缘方程,接着光栅器为每一个基元运行边缘方程并计算像素覆盖。最后光栅器所产生的像素将被发送至Z坐标压缩单元,它会用获取像素的深度与显存中现有的像素进行比较,完全处于显存像素后的像素图块将被从流水线中剔除,这部分数据就不再被发送至SM中做进一步像素着色工作,避免了计算资源的浪费。
正因为有这一套智能而又极具针对性的架构使GF100芯片的曲面细分性能强悍而稳定,通过一些曲面细分Benchmark软件的测试显示它具有ATI不可企及的DX11性能。
然而NVIDIA似乎太未雨绸缪了,现阶段DX11游戏才刚刚起步,其中曲面细分特效所占比例十分有限,大多只是在旗帜、布料飘动,水面波浪等处应用,GF100的性能还未得到真正体现。不过在可以预见的将来,随着游戏中曲面细分成分增多,NVIDIA新架构的优势会愈发明显,其价值也必然得到更高认可。
在以往每一代核心的生产制程上,NVIDIA总是落后ATI一步,例如G80的90nm对R600的80nm,G92和GT200的65nm对RV670、RV770的55nm。这一次可能是由于发布时间比ATI晚六个月的缘故,GF100和同属一代RV870用上了相同的40nm制程。
有了最新制造工艺的支持,NVIDIA信心爆棚,它疯狂地将晶体管数目增加到30亿,使GTX480的性能在大多数测试项目中击败了HD5870,成功复辟了单核性能王位。但是台积电的40nm工艺还不够成熟,GF100的核心面积与GT200几乎一样,为570mm²,生产如此巨硕的核心良率甚低。漏电现象加剧了功耗和发热,高成本促成望而却步的售价,以至于NVIDIA不得不让GF100关闭一组SM,使旗舰型号GTX480使用功能不完整的核心。
网友评论