显卡世界性能王座争夺战

互联网 | 编辑: 2002-01-18 00:00:00

CPU世界的争夺战集中于最高频率,而显卡世界的争夺战显然定位于最高端。nVIDIA和ATi各自推出了自己的杀手锏产品Geforce3 Ti500和Radeon 8500,伴随着无数新技术新规格,一场新的高端王座争霸战又将轰轰烈烈展开了。

 

 

nVIDIA和ATi之间的竞争现在真的可以用如火如荼来形容了。nVIDIA进军原本属于ATi的移动图形和多媒体视频领域,而ATi则采用了和nVIDIA一样的销售战略,全面放开其显示芯片,这样就会有第三方厂商来生产基于Radeon系列的显卡,不仅市场占有率的到了很好的保证,而且可以用频率来拉开ATi原厂与OEM厂商之间的区别,市场也可以得到进一步的细分。当然,这些并不是我们消费者所关心的,关键还是到底ATi显卡的性能如何,它同Geforce3 Ti相比到底处在一个什么样的位置,今天我们就来作一个分析。

Geforce3 Ti200
Geforce3 Ti500
Radeon 8500
制造工艺
0.15µm
0.15µm
0.15µm
芯片频率
175MHz
240MHz
275MHz
显存频率
400MHz
500MHz
275MHz
显存带宽
6.4GB/s
8GB/s
8.8GB/s
渲染流水线
4
4
4
贴图单元
2
2
2
像素填充率
700MB/s
960MB/s
1.1GB/s
纹理填充率
1.4GB/s
1.92GB/s
2.2GB/s

Radeon 8500是ATi推出的新一代图形芯片,也别称作镭III,ATi的硬件工程师在这款新的芯片中为其注入了许多新的概念,而且在芯片频率和显存频率方面也达到了一个新的高度,分别为275/550MHz,全面超过了Geforce3系列。而且ATi提供的一款版本号为A12的测试样板的得分远远高出当时采用Detonator3驱动程序的Geforce3,当然nVIDIA也不是好惹的,除了推出一款可以大幅提升Geforce3性能的Detonator XP驱动之外,也推出了全新的Geforce3 Ti系列,其中包括Geforce3 Ti200和Geforce3 Ti500,它们和Geforce3最大的不同就是芯片频率了,Ti200从原来的200MHz下调到175MHz,显存频率也从460MHz下调到了400MHz,Ti500则将芯片频率和显存频率上升至240MHz和500MHz,对市场做了进一步的细分,接下来我们再来对比一下两者所采用的技术。

首先来看一下Radeon 8500,在其中引入了许多新的技术,当然其中不少是对Radeon改进的结果。

TRUFORM技术

虽然现在显卡上普遍都有T&L单元,变形和光照这样的转换数据都无需交由CPU处理,而可以在显卡内部独立完成,这使得CPU与显卡之间的数据交换数量得以减少,而减轻CPU沉重的负担,但是随着现在游戏设计者追求越来越高的精细程度随着3D画面的精细程度不断提高,CPU和显卡通过AGP总线传送的数据量反而日益增长,AGP总线也显得日益拥挤。虽然AGP快些可以寻找到一条更高带宽的途径来传送数据,但这毕竟是治标不治本。TRUFORM则允许通过AGP总线传送更少的数据,而高精细度所需要的那些三角形顶点则可以在GPU内部产生。TRUFORM通过在三角形的边上额外生成6个控制点,在三角形内部生成一个中心控制点,再加上三角形原先的三个顶点,一共10个控制点将三角形分成了6部分,这样就可以在节省带宽的前提下,提供更加平滑、真实的画面。TRUFORM技术用来实现相对复杂的光阴效果非常有效,这种方法虽然在复杂的效果上有一点损失,但是对于消除瓶颈却是相当的有效,而且这种技术只要安装一个补丁,就可以将其应用于旧的3D游戏中了。

Chrisma Engine II(重新设计的魅力引擎)

ATi这次在推出Radeon 8500的时候,重新设计了它的魅力引擎,并取名为Chrisma Engine II,弥补了上一代Radeon的Chrisma Engine三角形处理能力不足的缺陷,一下子达到了75M tri/s的惊人地步,这样就保证了TRUFORM所传送过来的大量的顶点转换运算能够得以顺利运行。Radeon8500的T&L拥有两条的处理流水线,比Radeon多出一条,两条并行的流水线在处理计算量并不太大的顶点数据时拥有比单流水线更强劲的优势。在光源方面Radeon8500兼容于RADEON,可以对单个顶点最多使用8束来自不同空间位置或局部光源。

SmoothVision

FSAA已经成为主流显卡必须支持的一大特性,Radeon 8500提供了一套动态的FSAA解决方案——SmoothVision。这是一种MSFSAA技术,也就是多取样全屏反锯齿功能。其实,它也是一种多采样Multi-Sampling技术,通过将同一帧的画面使用jitter分别渲染2/4次(依据驱动设定)之后对像素块Pixel Block进行采样,之后将每一个子像素的第一个取样点的数据保存至一个Buffer缓冲区中(每个子像素相同位置取样的实际上是同一个位置的像素元素),再将4个缓存区内的数据进行混合以取得最终的一个像素值,最后SmoothVision再动态分配经过采样的像素于一个预设的安放位置,共有8个预设位置可以选择。相比较Geforce3的HRAA,我们认为SmoothVision应该可以达到更好的画面效果,HRAA虽然是一套节省带宽的好方法,但它水平、横向都对于同一个Sample取样点进行重复的采样混合,模糊的问题始终得不到解决,再者HRAA只能实现2次multisampling,4个取样点有效操作,而SmoothVision则可以最高实现4次multisampling,16个取样点的有效操作。

Pixel Tapestry II像素编织单元

Radeon8500全新的像素编织单元包括4条的像素渲染流水线,而每条流水线则包含了2个TMU单元,它包括一个目前唯一支持DirectX 8.1的可编程像素着色器,我们将其简称为PPS(Programmable Pixel Shader)。Radeon8500的PPS能做到在单周期内最多以6种不同纹理的取样与混合操作定义一个像素的纹理色质。一个像素着色编程单元拥有最多达22条的指令,8固定个常数的调用指令,以及6个临时寄存器,这个规格足以向编程人员提供可调用的足够指令。Radeon 8500支持单周期高达6次的纹理贴图,而且Radeon 8500在每条的流水线下也只有2个贴图单元,它能够完成单周期最高达6次的纹理贴图全数依赖于它的全新PPS单元,假设碰到超过本身每条流水线的2个贴图单元,那么它的PPS单元就会采用返回式纹理寻址/采样/混合等操作,先前首批进行混合一半的数据存放于临时寄存器中,第二次读取纹理Cache中提供的数据,而后再混合。Radeon 8500的纹理寄存器与临时寄存器数量均为6,只有这样才能悉数配合多达6纹理的贴图。而且Radeon 8500不需要合并调整它的流水线。这至少可以为Radeon 8500带来将近20%的领先优势。

Hyper Z II

可以说这是旧版本Radeon所采用的Hyper Z的升级版本,是新一代的显存带宽存储技术,用以节省显存带宽来满足应用软件提升性能。它依然包含了Radeon所采用的Hyper Z中原有的Hierarchical Z、Z-Compression、Fast Z Clear这三大功能,不过都做了相应的改进,Hierarchical Z的功能是像PowerVR体系一样将整个屏幕分成若干个像素块(Pixel Block),然后利用显卡内部的判断器预先对各像素块的Z-Buffer位置进行判断和剔除,之后才向显存中的Z-Buffer进行读取操作,这样的好处是可以大大节省带宽,不过我们注意到Radeon 8500将像素块的大小从8×8改为4×4,这样在Z-Buffer的精度方面可以有更好的表现,不过同时Mini Z-Buffer的操作自然要加快了。而且,Radeon 8500中的Fast Z Clear单周期清空的数据也从Radeon的16像素提升至64像素,这点刚好Radeon8500与Radeon在Hierarchical Z上的像素容量乘积的变化是相反的,不过这个Fast Z clear只是基于Radeon8500芯片级中的Mini Z-Buffer的,而不是显卡上的本地显存。而至于Z-Compression,就目前而言,至少也可以比Radeon有大约20%的性能提升,而且场景越复杂,压缩比也就越明显。

Radeon 8500提供了那么多全新的性能,其研发实力果然非常厉害,那么nVIDIA自然不甘示弱,虽然Geforce3 Ti采用了和Geforce3相同的核心,但是其中也不乏一些新的技术。这些技术虽然早先就出现在了Geforce3的技术清单中,不过,是nVIDIA新的雷管驱动才提供了这些技术的支持。

nVIDIA 3D Texture

nVIDIA首次实现了3D材质的4线性纹理过滤。因为3D材质较以往普遍使用的2D材质多出一个“深度”信息,所以使用传统的3线性纹理过滤是不够的。4线性纹理过滤实际上就是对两块3D纹理进行三线性过滤,能够提供更加真实的深度感和连贯感。而且Geforce3 Ti支持3D纹理压缩技术,若不采用这样的技术,一块普通的256×256×256×32bit的3D纹理所占用的空间将是64MB,但是Geforce3 Ti的nfiniteFX引擎可以支持8:1的3D纹理压缩,这样只需要8MB就可以了,虽然较之2D纹理仍显得有些庞大,但是却使处理3D纹理成为可能。nfiniteFX引擎还支持3D MIP-mapping贴图,通常,我们在进行渲染时,要找到一张和最终贴图大小吻合的纹理是非常困难的一件事情,因此,很多的应用程序都会包含纹理在不同分辨率下的不同版本。例如,2D渲染时,应用程序除了包含256×256的纹理外,还可能包含诸如128×128和64×64这样的地分辨率版本,这些就是所谓的mip map了,如果在贴图时采用了mip map就称其为mip mapping。如果选择可两张分辨率不同但是内容相同的纹理在相应位置的取样后,为了消除纹理之间的接缝以及低分辨率mip map所造成的模糊感,3D引擎就会对两张纹理进行过滤。nfiniteFX引擎可以实现对3D纹理的3D mip mapping,这样不仅能够提高贴图速度,而且结合4线性纹理过滤,提供最佳的3D纹理贴图效果。

nVIDIA Shadow Buffer

nVIDIA Shadow Buffer采用创新的技术来生成光对复杂对象在场景中形成平滑阴影效果,除了要与传统的纹理贴图技术配合之外,这项技术还需要一些新的硬件单元的参与,它可以指定一块图形内存作为阴影缓冲,也就是shadow buffer,还可以生成shadow map到这块shadow buffer中,接着就可以从shadow buffer中读取shadow map来进行一系列复杂的数学运算,依次来判断所指定的像素是否需要进行完全的、部分的或者是完全不需要进行阴影的运算。早先,nVIDIA从TNT系列显卡就开始使用stencil buffer,它是将简单的对象直接较精确的buffer中去,与之对比,阴影缓冲可以实现更加复杂、平滑的效果,而且在使用多重贴图的情况下,阴影缓冲的性能会更加快。

介绍完两者的性能之后,自然就要对两者在测试中的表现作一番对比。我们这次总共收到了厂商送测的5款Radeon 8500、8款Geforce3 Ti200和5款Geforce3 Ti500的产品,我们仍对各款产品的性能取平均值,并一次作为Radeon 8500和Geforce3 Ti之间的性能对照。

测试平台
CPU
Athlon 1.4G
主板
DFI KT266A
内存
384M Kingmax PC-2700 DDR
硬盘
希捷酷鱼3 20G
显示器
SONY CPD-G400
声卡
软件平台
操作系统
Windows 2000简体中文正式版
操作系统补丁版本
Service Pack 2
DirectX版本
8.1
主板驱动
4.37a官方版
显卡驱动
Geforce2 Ti:雷管XP 23.11
 
Radeon 7500:4.13.9008
测试软件

3DMark 2001
 
3DMark 2000
 
Quake3 Arena V1.31
 
VillageMark V1.17

3DMark 2001

虽然Geforce3 Ti500提高了芯片频率和显存频率来迎战ATi Radeon 8500的挑战,但是就在这次送测Radeon 8500普遍使用250/500MHz而未达到ATi原厂275/550MHz的情况下,还是输了,看来驱动程序带来的性能提升毕竟有限,而降低了频率之后的Geforce3 Ti200就更加不用提了,以1000多分的差距远远地落在后面。

3DMark 2000

在作Radeon 7500和Geforce2 Ti的对比测试时,我们就发现虽然ATi在3DMark 2001中以较大优势领先,但是在3DMark 2000中却败给了nVIDIA,同样的情况又再次发生,Radeon 8500在DX7的性能测试中又跌落下来,看来nVIDIA长期以来一直完善的驱动却是厉害,而ATi目前的当务之急也就是完善它们的驱动了。

Quake3 Arena V1.31

这次Radeon 8500一改以往的渲染架构,采用了4条渲染流水线,每个流水线可以一次渲染两个纹理,这正好符合Quake3这类双纹理游戏的要求,这也是nVIDIA一贯采用的架构。因此这次的OpenGL游戏性能测试可以称其为一次公平对决。Radeon 8500有一次给我们带来了惊喜,在1600×1200×32bit的高精细度情况下,刷新率居然达到了将近110fps左右,只能用一个字来形容——强!

VillageMark V1.17

这是一项考研显存带宽的测试,从测试的结果来看,Radeon 8500的Hyper Z II较之Geforce3 Ti的光速内存架构更加优秀,很好地节省了内存带宽,而Geforce3则没有像3DMark 2000中那么幸运了,虽然驱动更加完善,但是毕竟Ti系列是旧的Geforce3的提高频率以后的产品,不像Radeon 8500那样是全新设计的产品,因此还是输在了旧有的体系上面,看来nVIDIA若不是重新设计,光靠提升速度和改进驱动,是很难在性能上超出ATi的了。

FSAA测试

在FSAA测试中,nVIDIA终于报了一剑之仇,而且这次Radeon 8500的得分居然落在了Geforce3 Ti200的后面,3DMark 2001的FSAA测试时,第四场景还出现了难以忍受的贴图错误,虽然Radeon 8500的SmoothVision理论上要比nVIDIA的技术更加有效,但是ATi的最大难题还是他们的驱动,这次的测试再次给他们敲了一次警钟。

测试总结:

虽然,ATi的Radeon 8500在整个测试中仍然有一些环节做的不是那么让人满意,但是它所带来的惊喜却远远多出不足,不仅在D3D和OpenGL测试中凭借优良的性能领先于一向以王者自居的nVIDIA。而且nVIDIA的画质以及视频回放等等方面不及ATi,而且价格居然还不到Geforce3 Ti200的水平。因此,Radeon 8500一定会得到市场的强烈反映,不过希望产品大量上市的时候,它们的驱动也能够得以完善。至于nVIDIA,驱动的力量倒是给了我们一个很深的印象,但是如果不加快产品研发的力度,很快就会被ATi赶上,希望能够看到一个你追我赶的场面。

附:一下是这三款产品的市场平均价格,以供参考

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑