nVIDIA在12月16日正式发布了基于NV44图形芯片的GeForce6200 TC显卡,与先前已经发售的基于NV43-V核心的GF6200有所区别,nVIDIA在显卡名称加上了Turbo Cache这一名称,代表了引入的一项非常有意义的技术
TurboCache——开启显卡技术新篇章
nVIDIA在12月16日正式发布了基于NV44图形芯片的GeForce6200 TC显卡,与先前已经发售的基于NV43-V核心的GF6200有所区别,nVIDIA在显卡名称加上了Turbo Cache这一名称,代表了引入的一项非常有意义的技术。正如nVIDIA说的:此款显卡重新定义了入门级PC的性价比。它主要面向的消费群体为入门级用户以及OEM市场。
说到性价比,那么就让我们来简单分析一下目前显卡市场的情况。目前显卡市场上的两大领军人物nVIDIA和ATi公司在显示芯片领域的竞争如火如荼,不断推出6800Ultra和X850这样顶尖级的显卡,各种宣传和相关文章也是铺天盖地。然而,人们在了解这些面向最高端的顶尖产品的同时,并不会有太多的人去真正购买这些产品,最大的原因就是——价格!因为大部分用户都接受不了那样高的价格。
我们知道,能够给显卡厂商带来最大利润的市场空间是低价的中低端产品市场。显卡厂商也在不断的关注这一市场,正如高端产品打得是品牌形象,中低端产品才是收入的主要来源。然而,低端显卡也给了人们一个不小的问题,就是低价但不高效。这也是厂商们比较郁闷的一个问题,单单靠降低显卡成本,而忽略了诸如支持SM3.0等高阶技术的做法并不吃香。在这一点上人们是很挑剔的,即想拥有一块性能不错的显卡,又想在价格上让自己接受,那么在现有的集成显卡与独立的低端显卡之间,如何寻找到一种更为折中更具性价比的解决方案就成了所有人都非常关心的问题,也正是这种需求使得TurboCache技术得以诞生。
那么,TurboCache的概念到底是什么呢?简单来说,搭载了TurboCache技术的GF 6200只需要板载很少的显存(影响显卡成本的因素主要有核心管线的数量、显存的容量位宽以及PCB板原件的材料),而大部分数据通过高速的PCI Express总线与系统内存进行交换(直接渲染到内存),以此大幅度降低显卡的成本。它可以利用硬件和软件的一体化的解决方案,直接利用系统内存进行渲染。同时也支持DX9.0、Shader Model3.0以及NVIDIA的PureVideo等技术。
TurboCache被解释为智能加速引擎,它最大的特点就是支持将图像和数据直接渲染到内存,而且它的这种特性是通过高带宽的PCI Express通道实现的。首先PCI Express总线实现了远比AGP总线高的带宽,可以有效降低系统延迟,保证数据交换的高速进行;其次,TurboCache可以智能有效的利用内存,当图形核心进行数据的读取和写入操作时可以实时访问内存,而且无需划分固定的容量(这一点在集成图形核心的主板上必须要先在BIOS中固定划分出一定的内存容量为显示核心使用,进入系统后你会发现总内存的容量减少了),系统能够根据图形处理工作的需要决定划分或释放内存。
上面的图是没有采用TurboCache技术的传统架构图和采用了新技术的架构图,从中我们可以看出采用了TurboCache技术的架构中NVIDIA为GPU搭配了一个名位的MMU的单元。这个单元被称作“内存管理单元”(允许GPU无缝的分配和不分配系统内存,并且高效的读写内存),这里的MMU内存管理单元其实就是在系统内存与核心内部的相应流水管线建立了连接通道,它能够同时调用和动态的分配本地及系统内存容量,使得GPU能够高效的利用系统内存进行渲染和纹理处理。此外,通过更改多种管线要素,新的架构除了能够有效的利用PCIE的高速传输带宽,还能够处理由于通过PCI Express接口接入系统而增加的时延。除了MMU,驱动程序中也针对TurboCache技术进行了相应的修改,实现了以智能化的方式确定色彩、纹理和Z轴缓冲数据的位置。这种处理能力也能够最大限度的提高各种应用的性能。
充分利用PCIE带宽优势
上面我们还多次提到了PCIE通道,下面让我们简单的来看看PCIE通道以及带宽的问题。AGP的有效传输带宽已经远远不能满足现在的需要(例如游戏中大量的阴影、光照效果等都需要很多的数据交换)。大家知道,AGP8X的最大带宽只有2.1GB/s,而PCIE16X的有效带宽提升到了4GB/s,而且,如果PCIE接口工作在全双工模式下,那么这时的有效带宽将达到8GB/s。但是,目前全双工模式并没有得到Intel最新一代芯片组915/925的支持,这主要是由于全双工模式还有一些技术问题尚待解决。nNVIDIA最新推出的nForce4芯片组则很好的解决了这一技术问题,也因此能够实现上下行各4GB/s的传输速率。
据报道nVIDIA表示4GB/s上行和4GB/s下行的带宽显卡的性能会比3GB/s上行和1GB/s的下行的速度快20%。而且出了GeForce 6200 TurboCache显示核心能够与系统内存进行上下行各4GB的数据交换,并且还能与本地显存通过2.8GB/s的带宽交换数据,使得有效带宽达到10.8GB/s或更大。
nVIDIA目前已经发布了三个版本的GeForce 6200 TC产品。GeForce 6200 TC所采用的NV44图形核心包含3个顶点单元(vertex)、4条渲染管线(pixel)、2个光栅操作处理器(Raster Operation)。这三个版本分别是GeForce 6200 TurboCache 具备128MB显示缓存,其中板载16MB本地显存
GeForce 6200 TurboCache 具备128MB显示缓存,其中板载32MB本地显存
GeForce 6200 TurboCache 具备256MB显示缓存,其中板载64MB本地显存
公版GF6200TC显卡赏析
现在我们一起来看看其中的一款迟迟才来到评测室的显卡,GF6200TC—板载16MB本地显存的版本。
这是搭配一颗16M/32Bit,mBGA显存颗粒的P282公版显卡
NV44核心,核心与显存频率为350MHz/700MHz。
板上只有一颗三星显存颗粒,mBGA封装
“老三样”
测试平台与说明
测试平台:
在测试中,由于设备上不是很齐全,我们没有采用可以达到最佳带宽的NF4主板进行测试,而是采用了一款915P的主板,在测试中结果可能会稍有细微差别,这一点请大家注意。
硬件平台 | |
主板 | 精英PF4 (915P) |
内存 | Kingmax DDR400 256M×2 |
硬盘 | 希捷SATA 120G |
显卡 | NVIDIA GF6200 with TurboCache(16M/32Bit) |
CPU | Intel P4 3.2GHz(LGA775) |
软件平台 | |
操作系统 | WindowsXP+SP1 |
显卡驱动 | ForceWare 71.24 |
测试说明:
在测试中我们除了测试显卡的基本性能,还测试了显卡超频后的表现,分别将核心与显存频率提升了50MHz和100MHz,达到400/800的水平。另外,也选择了几款主流的游戏进行了测试,在最后我们还将系统内存设置为单通道模式,对单通道和双通道两种情况下的性能进行了对比测试。
显卡综合3D性能测试——3DMark系列、AQUAMark3
显卡游戏性能测试——Quake3、UT2004、Farcry1.3、DOOM3、Half-Life2。
综合测试——3DMark2001SE
虽然3DMark03和3DMark05的推出已经逐渐使3DMark2001失去了其在测试中的地位,但对于低端显卡来说,它依然有足够的能力去检验显卡的真实性能。3Damrk2001SE是从DirectX8到今天的DirectX9还在运用,它风行近两年多的时间,这在测试软件领域是罕见的,不愧为一款经典的权威测试软件,今天我们用它来开场。
3DMARK 2001SE | ||
GF6200TC (350/700MHz) | GF6200TC (OC 400/800MHz) | |
Score | 7410 | 8306 |
Game1-LowDetail | 112.3 | 126.0 |
Game1-HighDetail | 67.8 | 74.3 |
Game2-LowDetail | 103.0 | 118.4 |
Game2-HighDetail | 70.5 | 77.7 |
Game3-LowDetail | 91.3 | 103.9 |
Game3-HighDetail | 52.8 | 60.4 |
Game4 | 26.3 | 28.7 |
综合测试——3DMark03
3DMark03测试主要分为游戏性能测试和处理器性能测试。游戏性能测试分为四个场景,这4个场景都分别基于了不同版本的DirectX进行开发,其中第四个场景基于全新的DirectX 9.0开发。整个测试过程能真实地考验系统处理器和显卡在处理大量顶点着色器程序时的运行能力。
3DMARK 2003 Build350 | ||
GF6200TC (350/700MHz) | GF6200TC (OC 400/800MHz) | |
Score | 2122 | 2379 |
GT1 | 76.9 | 86.3 |
GT2 | 10.1 | 11.5 |
GT3 | 9.8 | 11.1 |
GT4 | 18.8 | 20.7 |
综合测试——3DMark05
由于3DMark05提供了对微软DirectX 9.0C的支持,所以完全支持Shader Model 2a、2b、3.同时加入的更加详细显示控制面板,可以使用户对测试进行更为详细的画面控制。3DMark05还使用了全新的更为类似游戏的3D引擎,使测试更接近于正常的游戏运行。它包含了三个全新的测试场景,分别为:Return to Proxycon、Firefly Forest、Canyon Flight,通过这三个场景的测试便可以得出分数。另外,3DMark05还包含了CPU Testill Rate Test、Single Texturing、Multi Texturing、Pixel Shader Test、Vertex Shader Test和创新的Batch Size Tests。
3DMARK05 Build110 | ||
GF6200TC (350/700MHz) | GF6200TC (OC 400/800MHz) | |
Score | 950 | 1007 |
GT1 | 4.4 | 4.8 |
GT2 | 2.9 | 3.1 |
GT3 | 4.3 | 4.5 |
综合测试——AQUAMARK3及游戏测试
AquaMark3(AM3)使用的就是最新版本的Krass引擎,与其它如3Dmark等测试软件相比,AM3来自于上市游戏Aquanox 2,这表示它并非一套理论式的测试软件,而是被自己的开发人员称为Reality Benchmark的测试,是一个基于真实游戏的测试,更加接近用户使用3D显卡的最终目的。
AQUAMark3 | ||
GF6200TC (350/700MHz) | GF6200TC (OC 400/800MHz) | |
GFX | 2580 | 2895 |
FPS | 22.8 | 25.2 |
通过以上对显卡的3D基本性能的测试,我们发现6200TC的性能基本上可以让人满意。在超频测试中应用程序以及游戏对显示核心的多边形生成速度、顶点及象素处理能力都提出了更高的要求,由于核心频率较低也因此成为了整体性能的瓶颈,而提升频率的作用自然就非常明显了,我们可以看到超频后分数大约有了10%的提升。在系统带宽方面,由于我们采用的是915的系统,相信在选用了像NF4这样的平台后,成绩还会有所提升,毕竟Intel在芯片组上限制了PCIE的传输带宽。
GF6200TC(350/700MHz) | GF6200TC(400/800MHz) | |
QUAKE3 | ||
800x600x85Hz | 191.6 | 216.9 |
1024x768x85Hz | 124.5 | 142.7 |
1280x1024x85Hz | 78.6 | 90.7 |
UT2004 | ||
640x480x85Hz | 71.8 | 74.7 |
800x600x85Hz | 49.8 | 56.9 |
1024x768x85Hz | 34.3 | 37.8 |
FarCry1.3 | ||
640x480x85Hz | 54.5 | 61.0 |
800x600x85Hz | 38.2 | 43.1 |
1024x768x85Hz | 19.5 | 21.3 |
DOOM3 | ||
640x480x85Hz | 28.9 | 31.6 |
800x600x85Hz | 20.9 | 23.0 |
Half-Life 2 | ||
640x480x85Hz | 65.2 | 68.2 |
800x600x85Hz | 44.7 | 46.3 |
1024x768x85Hz | 30.7 | 31.1 |
单通道与双通道内存模式比较
TurboCache这项技术是将以往需要在显存中处理的各种渲染和贴图纹理数据,改为由系统内存进行处理,这部分数据在处理的过程中并不需要较高的运算能力,但由于数据量相对较大,因此对显存的传输带宽以及显存容量都提出了较高的要求。而双通道DDR400内存能够提供足够的内存容量和高达6.4GB/sec的最高传输带宽,因此有足够的能力满足显卡对纹理渲染等工作的需要。但是如果系统被设置为单通道模式呢?Gf6200TC使用动态内存分配技术,通过共享系统内存来完成渲染、纹理处理等工作。当使用双通道DDR400内存时,内存带宽达到6.4GB/s,而如果使用单通道DDR400内存,带宽就只有3.2GB/s了,那么在使用单通道的内存时,显卡的性能会不会受到影响呢?
3DMARK 2001SE | ||
GF6200TC Double | GF6200TC Single | |
Score | 7410 | 7191 |
Game1-LowDetail | 112.3 | 109.0 |
Game1-HighDetail | 67.8 | 66.1 |
Game2-LowDetail | 103.0 | 100.4 |
Game2-HighDetail | 70.5 | 66.4 |
Game3-LowDetail | 91.3 | 89.1 |
Game3-HighDetail | 52.8 | 52.0 |
Game4 | 26.3 | 25.6 |
3DMARK 2003 Build350 | ||
GF6200TC Double | GF6200TC Single | |
Score | 2122 | 2046 |
GT1 | 76.9 | 76.2 |
GT2 | 10.1 | 10.1 |
GT3 | 9.8 | 9.6 |
GT4 | 18.8 | 16.9 |
AQUAMark3 | ||
GF6200TC Double | GF6200TC Single | |
GFX | 2580 | 2466 |
FPS | 22.8 | 21.7 |
通过测试我们看出,在内存换为单通道模式后,成绩上的差距并不是很大,单通道的内存带宽只有3.2GB/s,同时915的PCIE上下行带宽加起来只有4GB/s,因此单通道的带宽被充分利用。但是双通道内存的最大带宽在915芯片组上由于PCIE带宽的原因,并不是6.4GB/s,而只有4GB/s能被显卡使用,所以自然测试差距就不会太大了。
最后总结
通过今天的测试与分析,GF6200TC作为一款入门级的显卡,在性能上基本可以令人满意,毕竟作为入门级的显卡人们也不必为它的性能要求太过苛刻,相比集成显卡和其他入门级的显卡62TC的性能还是具有一定优势的。而且它还支持最新的DX9.0以及SM3.0等技术。同时,作为PCIE平台入门级的显卡,62TC的价格也会平易近人,它只使用了很少的显存,大部分数据处理通过系统内存处理,在这一点上无疑大量节省了显卡的成本,性价比更加突出。
同时,搭载TurboCache技术的GF6200显卡,由于售价便宜并充分利用了PCIE的带宽优势,相信也会加快PCIE平台的普及,在未来随着PCIE技术与TurboCache技术的更进一步的紧密结合,这款显卡的前景将更加光明。
网友评论