颠覆显卡传统 G80整体及核心架构详解

互联网 | 编辑: 2006-11-09 03:00:00 一键看全文

任何一个人想完整描述Nvidia G80的架构,都是一件不可能的事情。在完成这篇通过Nvidia最新GeForce 8800GTX显卡,对G80进行架构分析,特性介绍的文章之后,我不得不得出这个结论。似乎已经很久,没有一款显卡能够同时拥有那么多“新鲜”的地方,一时间那么多新概念充斥而来让

NV 8800GTX官方样卡,Gigathread技术以及更多

[NV 8800GTX官方样卡,Gigathread技术以及更多]

在这128个统一着色单元(也是一种向量处理单元,被NV称之为Stream Processor)中,Nvidia引入了Gigathread技术,它的能力或者说作用正如其名:超级多线程。这种技术使得成千个独立而同步的进程可以同时在相关着色器中运行!并在今后全新一代的着色/渲染处理状态下,提供更为出色的输出效果。不过,似乎我们并没有能获得更多关于这项技术的资料。但事实上,Gigathread却是G80面向未来高端3D游戏非常重要的一项技术。

更真实的临场感-同时对更多角色进行高质量渲染

前面我们提到了DirectX 10中引入了Geomerty Shader,而它本身则是一个非常复杂的Vertex函数处理器。从总体来看,它能通过简化而有效的方式进行整个模型的物理形状的确定,减少其它Shader工作量,以此来大幅提升GPU处理速度。而在上一页的DirectX 10核心处理示意图中,我们发现Geomerty Shader通过一种称为Stream Output的技术与显存交换数据。它使得GPU可以反复利用已知的计算结果,并允许Vertex着色引擎继续调用这些数据,减少不必要的重复计算。正因为此,使得G80核心内的Vertex Shader能更好地对纹理拾取提供支持。

统一着色单元,材质单元与片内缓存示意图

管线时代我们面临的另外一个比较重要的规格则是纹理处理单元(Texture Model Unit,简称TMU)。而在8800GTX中,提供了多达64个纹理单元,从而使得其纹理填充率在理论上可达到575MHz x 64=36.8GTexel/s!虽然在ATI X1000时代中,我们发现其通过减少部分TMU来达到减少成本等方面的效果。但似乎这对于不少原有的游戏来说更为重要,或许这也是中低端平台ATI相对弱于Nvidia的地方。虽然今后的游戏可能更偏重于Shader方面的需求,但我们认为Nvidia也并没有接纳少TMU的投入。

而相对于以往,似乎两大厂商对于ROP(Rasterizing OPeration,光栅化引擎,即像素输出处理单元)方面的投入均相对减少,而对于G80来说,看似在数量上也并未增加但在质量上则大大提高了。因为采用384bit位宽的显存模式,对应其规格G80种具备了24个ROPs,每四个为一组。而每个ROP单元在每一个时钟周期可以进行8次Z缓冲(减少不需要的Z轴消隐)操作(总用192次Z Op/Cycle),比以往的各类显卡都有较高的处理能力提升。

提示:试试键盘 “← →” 可以实现快速翻页 

一键看全文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑