有没有想过显示卡竟然要分享系统内存呢!?nVidia为了抢夺低阶市场,推出了TurboCache技术,透过强大的PCI-Express x16频宽,进一步减低显示卡内存的容量,而我们独家找来Inno3D及Galaxy的Geforce 6200TC工程样本,究竟Turbo Cache能否力挽狂栏呢!?
Turbo Cache对抗内建显示核心本文作者:天晴 电脑领域
Turbo Cache对抗内建显示核心
各显示卡厂商都说低阶显示卡越来越难做了,全因现时主机板芯片组内建的显示核心越来越强,以往这些内建显示核心只以 2D为主并拥有有限的3D效能,可是现时内建显示核心的都不再只提供2D而是完整的3D,就以Intel的i915G为例,它支持DirectX 9.0并拥有不错的效能,侵蚀了不少低阶市场,在OEM市场上问题更见严重。
我们不难看到新一代 nVidia Geforce 6系并没有包括低阶市场,而6200定价美金109美金,根本不是低阶显示卡的定位,因为低阶市场必需用上架构成本更低的产品,才能和内建显示核心一决高下。
Turbo Cache = UMA + Cache!?
如果大家有留意我们先前做的 ATi RS480内建显示核心的评测,你可能会对Turbo Cache有一点概念,RS480的内建显示核心拥有HyperMemory架构,需要借用系统内存,但为了加快传取的速度,内建显示核心可以加入SidePort内存,作数据缓冲之用减少读取系统内存的延迟值,增强内存读写的效率。
而 Turbo Cache和HyperMemory理原相同,但NV44则是单一芯片用于显示卡上,但却和内建显示核一样是依赖系统内存来运作,全因新一代PCI-Express x16拥有高达4GB/s的频宽,而双工时更高达8GB/s,有足够的频宽供显示核心与系统记亿体作存取。同样地,为了提高效率,NV44同样会在显示卡上内建内存核心作缓冲,以增加存取内存的工作效率。
图为 NV44 核心没有安装上 PCB 上的图片,我们可以看到其正名为 Geforce 6200TC
NV44 支援SM 3.0NV44 支援SM 3.0
NV44的规格和NV43-V的规格大致相同,其产品型号命名为Geforce 6200TC,核心由TSMC台积电代工,采用0.11微米Low-K制程,原生PCI-Express接口,规格上同样支持Direct X9.0c、Shader Model 3.0、UltraShadow II及Intellisample 3.0,和NV43-V一样拥有4条流水线及3个Vertex引擎,但有别于NV43-V核心原来拥有8条流水线,只是于其中一组流水线的出现问题而被屏敝,NV44则是真真正正只拥有4条流水线的核心,我们不难从上图看到NV44的核心比NV43-V细小,意味着在同一个晶圆下可产出更多芯片,成本就得以降价。
时脉方面, NV44的核心时脉为350MHz,每秒可产生1.4 Billion Fill Rate Pixel及每秒263 Million Vertices,比NV43-V的300MHz略高,看来是希望以时脉弥补,因TurboCache而出现的效能下降。此外,NV44和NV43一样,虽然是支持nVidia Intellisample 3.0技术,取消了其中一个功能,在内存控制器上屏敝了Color and Z-Compression。Color and Z-Compression能有效减少内存频宽的损耗,忽略了一些后景或相迭的部份,而且Color and Z-Compression的影响很大,故此我们可以预见Geforce 6200TC于在开启高解像度、AA及Anisotropic Filtering,效能上会出现极大的差异,但由于6200TC属于低阶的显示卡,故此买家并不会太着重于高解像度及AA等效能吧。
NV44内存配置NV44 内存配置
NV44 的内存定义十分奇怪,如果显示卡上使用的是 8x32 的 32MB 颗粒,预设时脉将会为 550MHz DDR 。如果是 4x32 的 16MB 颗粒,则预设时脉将会被定为较高的 700MHz DDR 。计算内存频宽的方法可以说是十分特别,其内建建有最高 128Bit 的内存控制器,最高支持 256MB 内存。当如果 NV44 只放置一颗 BGA 内存时,虽然显示卡上的内存频宽只有 32Bit ,但其有效宽频将会为 64Bit ,这包括核心读取系统内存的部份,而最高可使用 128MB 内存。如果 NV44 建有两颗内存,显示卡上的内存频宽则会为 64Bit ,而有效宽频将达最高的 128Bit ,这是 NV44 效能最佳的模式,当然多了一颗内存成本亦较贵。而只有在 64MB ,即两颗 32MB(8x32)BGA 内存颗粒,有效内存才能达 256MB ,但由于内存的时脉较低,故此两颗 16MB BGA 内存将会是效能最佳的 NV44 配置。
不占用系统内存 !?不占用系统内存!?
TurboCache的原理虽然和内建核心一样需要借用系统内存,但NV44并非完全占用,而是因应需要而占用,当有需要时才会把数据加载内存,而不会浪费被固定的UMA寻址,因此我们可以看到虽然在Driver上注明机载内存为128MB,但我们系统的1GB内存却没有被显示核心占据,内存的运用更具弹性。
但 NV44 Turbo Cache亦有最低内存要求,nVidia向制作Geforce 6200TC的厂商发出指令,需要在显示卡的盒上注明内存最低要求,如果是16MB及32MB内存的6200TC上用家,要完全取得128MB Effective Memory,就必须需有512MB系统内存,而64MB内存的6200TC的用家,要完全取得256MB Effective Memory,同样亦需要512MB系统内存。
Inno3D Geforce 6200TC工程样本Inno3D Geforce 6200TC工程样本
收到由 Inno3D Geforce 6200TC 工程样本,采用 P282 PCB 公版设计, 我们可以看到此板上还留有一些电压的记号,由于 Inno3D 还未决定采用什么散热器,因此送测时并没有连同散热器。从核心中我们可以看到核心代号为 NV44 及 ENG Sample 字样,但正式出货将没有以上字样,芯片出厂周期为 04 年第 45 周,芯片已经是 A02 版本,属于完成的版本。
只建有一颗内存只建有一颗内存
Inno3D Geforce 6200TC 工程样本采用 Samsung -2.8ns 4Mx32Bit 16MB GDDR 内存,而片背的内存是焊空了,因此这一片是 Geforce 6200TC 16MB/32Bit 版本。
Galaxy Geforce 6200TC工程样本Galaxy Geforce 6200TC 工程样本
这片 Galaxy Geforce 6200TC 要鸣谢厂方的支持,和 Inno3D Geforce 6200TC 一样采用 P282 公版设计,只是 PCB 颜色有所不同而已,据厂方表示正式版本将会改用蓝色,散热器则采用公版设计,但正式版本则会和现在我们看到版本有所不同。核心一样为工程样本,出厂周期为 04 年第 45 周,芯片亦是 A02 完成版本。
完整64Bit架构完整 64Bit架构
Galaxy Geforce 6200TC工程样本采用Hynix -2.2ns 4Mx32Bit 16MB GDDR内存,而片背的亦拥有多一颗相同的内存,因此这一片是Geforce 6200TC 32MB/64Bit版本。
不足够512MB系统内存测试平台︰
Intel Pentum 4 570 (3.6GHz)
Intel DesktopBoard 925XECVZ
Corsair DDR2 533Mhz 512MB x 2(4-4-412)
Inno3D Geforce 6200TC 16MB 32Bit
Galaxy Geforce 6200TC 32MB 64Bit
Inno3D Geforce 6200 128MB 128Bit
Grandmars Radeon X300SE 128MB 64Bit
Maxtor DM9 7,200rpm 80GB
2themax HE-470Pro II
不足够 512MB 系统内存
在不足 512MB的系统内存下,显示卡只会被强制为64MB,因此有部份游戏会拒绝执行,而我们运行3DMark 03时更出现Reboot的情况,看来没有512MB系统内存的用家还是不用使用Geforce 6200TC好了。
32Bit VS 64Bit32Bit VS 64Bit
32Bit |
64Bit | |
3DMark 2001 | ||
800 x 600 |
10502 |
13576 |
1024 x 768 |
7361 |
10983 |
1280 x 1024 |
4660 |
7657 |
1280 x 1024 @4xAA |
221 |
1112 |
3DMark 03 | ||
800 x 600 |
3031 |
4107 |
1024 x 768 |
2167 |
3015 |
1280 x 1024 |
1357 |
2090 |
1280 x 1024 @4xAA |
136 |
349 |
3DMark 05 | ||
800 x 600 |
1167 |
1530 |
1024 x 768 |
934 |
1096 |
1280 x 1024 |
631 |
727 |
1280 x 1024 @4xAA |
163 |
170 |
Doom3 | ||
800 x 600 |
19.5 |
33.0 |
1024 x 768 |
14.1 |
23.1 |
1280 x 1024 |
7.4 |
14.7 |
1280 x 1024 @4xAA |
0.8 |
3.1 |
Half Life 2 | ||
800 x 600 |
32.12 |
50.19 |
1024 x 768 |
19.35 |
37.64 |
1280 x 1024 |
13.23 |
26.20 |
1280 x 1024 @4xAA 8xAF |
4.82 |
9.93 |
从测试中我们可以看到 Onboard 多一颗内存的情况下,由于有效频宽由 64Bit 提升至 128Bit ,在各个测试中效能都有 10% -50% 的效能增长,可以看到 Onboard Cache 对 Turbo Cache 多说是多多益善。
6200 VS 6200TC
6200 128Bit |
6200TC 64Bit | |
3DMark 2001 | ||
800 x 600 |
15805 |
13576 |
1024 x 768 |
13240 |
10983 |
1280 x 1024 |
9717 |
7657 |
1280 x 1024 @4xAA |
5635 |
1112 |
3DMark 03 | ||
800 x 600 |
5088 |
4107 |
1024 x 768 |
3801 |
3015 |
1280 x 1024 |
2697 |
2090 |
1280 x 1024 @4xAA |
1286 |
349 |
3DMark 05 | ||
800 x 600 |
1733 |
1530 |
1024 x 768 |
1414 |
1096 |
1280 x 1024 |
1088 |
727 |
1280 x 1024 @4xAA |
572 |
170 |
Doom3 | ||
800 x 600 |
54.4 |
33.0 |
1024 x 768 |
40.6 |
23.1 |
1280 x 1024 |
26.9 |
14.7 |
1280 x 1024 @4xAA |
11.6 |
3.1 |
Half Life 2 | ||
800 x 600 |
54.53 |
50.19 |
1024 x 768 |
41.41 |
37.64 |
1280 x 1024 |
32.54 |
26.20 |
1280 x 1024 @4xAA 8xAF |
16.64 |
9.93 |
虽然大家也估到 Geforce 6200效能会比Geforce 6200TC 64Bit为高,但大家测试中可以发现两者在低解像度上效能相差没有太远,但随着解像度提高,相者的效能相差越远,在4xAA下两者差距更大,全因6200系列并不支持Z-Color Compress,在高解度上当所占的内存频宽越多下,采用TurboCache的6200TC便会因要大量借用系统内存,效能因而被拖垮。
X300SE 64Bit VS 6200TC 64Bit
X300SE 64Bit |
6200TC 64Bit | |
3DMark 2001 | ||
800 x 600 |
8870 |
13576 |
1024 x 768 |
6283 |
10983 |
1280 x 1024 |
4260 |
7657 |
1280 x 1024 @4xAA |
2425 |
1112 |
3DMark 03 | ||
800 x 600 |
2424 |
4107 |
1024 x 768 |
1711 |
3015 |
1280 x 1024 |
1172 |
2090 |
1280 x 1024 @4xAA |
593 |
349 |
3DMark 05 | ||
800 x 600 |
914 |
1530 |
1024 x 768 |
752 |
1096 |
1280 x 1024 |
587 |
727 |
1280 x 1024 @4xAA |
455 |
170 |
Doom3 | ||
800 x 600 |
19.4 |
33.0 |
1024 x 768 |
12.9 |
23.1 |
1280 x 1024 |
8.3 |
14.7 |
1280 x 1024 @4xAA |
4.3 |
3.1 |
Half Life 2 | ||
800 x 600 |
49.57 |
50.19 |
1024 x 768 |
32.42 |
37.64 |
1280 x 1024 |
22.35 |
26.20 |
1280 x 1024 @4xAA |
13.30 |
9.93 |
在测试中我们可以看到 Geforce 6200TC在各分面都比X300SE优胜,虽然两者都是64Bit,而且6200TC卡上只有32MB,但其有效频宽是高达128Bit,加上可借用系统内存,故此效能上完全压倒对手,不过当处于高解度下,效能出现大幅下降,大家可以看到在1280 x 1024@4xAA被对手反胜。
后记
我们可以看到 6200TC架构十分优秀,借助PCI-Express的特大频宽,采用Turbo Cache技术分享系统内存,这可省下显示卡上内存颗粒的价钱,令成本更多便宜,有力对抗对手ATi的低阶显示卡及内建显示核心的挑战。但是否热卖还是要看看6200TC的定价,不过据显示卡厂商Galaxy表示,现时我们眼看到的6200TC只是工程样本,而出售版本将会以非公版设计,Low Profile令成本更低,看来还是值得令人期待呢。
网友评论