3.nVIDIA
GeForce2 MX是nVIDIA在2000年6月发布的GeForce家族最新产品,GeForce2 MX的开发代号是NV11图形芯片,现在nVIDIA将其正式命名为GeForce2 MX,其实它也是GeForce2 GTS的精简版本,下面就向大家介绍GeForce2 MX。
GeForce2 MX技术规格:
- 基于GeForce2 GTS图形核心;
- 0.18微米工艺制造;
- 双像素处理流水线;
- 每条像素流水线可在单时钟周期内完成两个纹理像素贴图处理;
- 2000万/秒三角形顶点生成率(实际为667万个/秒三角形生成率);
- 175MHz核心运行频率;
- 350M/s像素填充率;
- 700M/s纹理象素填充率;
- 4W耗电量,GeForce 256为16W,GeForce2 GTS为9W;
- 166MHz显存运行频率;
- 支持AGP 1x/2x/4x接口;
性能方面,nVIDIA把GeForce2 MX设计成GeForce2 GTS的精简版本,它的各方面性能指标都几乎是GeForce2
GTS
的一半。
像素/纹理像素处理能力:
GeForce2 MX拥有双像素流水线,可以在单个时钟周期内的两条像素流水线分别处理一个像素,而GeForce2 GTS则是四像素流水线,在同样的时间内,GeForce2 GTS的像素处理能力是GeForce2 MX的一倍,而且GeForce2 MX的核心工作频率也只有175MHz,只是GeForce2 GTS的87%。所以,GeForce2 GTS的像素生成能力为800M/s,而GeForce2 MX就只有350M/s。
单看像素生成能力,GeForce2 MX还要比GeForce 256低,但是GeForce2 MX优胜于GeForce 256之处就是双像素流水线,它可以实现为单个像素完成两次纹理贴图工作,纹理像素生成能力(纹理像素也称为T像素)为700M/s。GeForce 256虽然能在单个时钟周期内处理4个像素,但是它只有一条像素处理流水线,每个像素每次只能完成4个纹理像素贴图工作,纹理像素生成能力只有480M/s。在多重纹理贴图的3D游戏中,当需要多次流水线传递完成多重纹理贴图工作的情况下,GeForce2 MX的效率要比GeForce 256高。
显存带宽:
GeForce2 MX仍旧采用的是128bit SDR显存接口,在采用默认166MHz(6ns)工作频率的SDRAM显存时候,能提供2.7GB/s的图形数据传输带宽,这与GeForce 256 SDR一样。在低分辨率和16bit色下,像素填充速度是决定运行速度的主要原因,但是在高分辨率以及采用32bit色深的时候就是图形带宽决定速度,CPU通常都会在等待显示卡传递图形数据,会由于图形带宽的不足引起性能下降,这会使GeForce2 MX的性能因此大打折扣。
NSR光暗描影处理引擎:
NSR处理引擎可以同时完成7种特殊的光源操作,能实时生成光影效果,可以使3D游戏运行的画面效果得以提升。NSR能从硬件上支持基于每像素的操作功能,它通过基于单个像素的动态计算,实现散射、镜面反光、斑点光源、点光源效果。在DirectX 8中已经加入了对光影特性的支持,也可以通过nVIDIA联合扩展功能(NV_Register_Combiners extension)来实现在OpenGL里的实时动态光影效果,目前已经有一个3D游戏Isle of Morg的demo版,能体现出光影互动的效果,相信我们很快就能看到这类游戏的出现。
不支持FSAA全景抗锯齿功能:
虽然是基于GeForce 2 GTS的图形核心,要增加对FSAA全景抗锯齿功能并非难事,但是考虑到GeForce2 MX的像素填充率不高,图形带宽也低,所以GeForce2 MX未使用FSAA功能。
除了上面提到的功能外,GeForce2 MX还提供新的功能包括DVC控制系统和双显示输出。
数字振动控制系统(Digital Vibrance Control):数字振动控制系统是nVIDIA在GeForce2 MX中增加的一种新功能,它允许用户通过DVC来控制图形处理和图形子系统,采用一简单的用户界面来控制色彩分离和亮度、锐利的动态视觉效果、平衡色彩质量等功能。DVC其实是一种类似Gamma控制的功能,nVIDIA确认DVC功能并没有通过特别的硬件来实现,当然,这样的功能也可以在GeForce 256和GeForce2 GTS上实现。下面图中左半部分与右半部分相比,显然右半部分经过DVC调节后的画面要比左半部分要明亮清晰得多。
双输出显示(TwinView):这种功能就类似Matorx应用在G400图形卡中的DualHead双头显示功能,可以在单块芯片上实现双显示输出,在GeForce2 MX芯片内部整合两条TMDS通道,可以支持两个数字平板显示屏输出。
GeForce2 GTS
nVIDIA的声势越来越大,市场充斥着TNT家族的产品,nVIDIA以6个月左右的时间推出新产品,其研发能力正不断提升和完善,最近在4月底又宣布推出第二代GeForce 256产品——GeForce2 GTS。GeForce2 GTS是芯片的名称,GTS是Giga Textel Sharder的缩写,这意味着nVIDIA也进入10亿像素填充的世界。我们先来看看GeForce2 GTS的技术规格:
- 像素填充率:1.6G/s;
- 多边形:3000万/s;
- 显存带宽:5GB/s;
- 最高分辨率 2048×1536;
- 支持OpenGL 1.2/DX7;
- 整合720线,1080i高清晰度电视HDTV回放;
- 第二代T&L引擎;
- 256bit图形接口;
- 支持DDR SDRAM;
- 支持AGP 4x及快写工作模式;
- 32bit Z和模板缓冲;
- 立方环境映射;
- 支持纹理压缩;
- 支持多采样全景抗锯齿;
- 多通道多纹理贴图;
- 各向异性过滤;
- 单像素透视校正贴图;
- 纹理调节;
- 程序贴图;
我们来看看GeForce2 GTS有什么改变:像素填充率、多边形生成率、核心频率/显存等的提升是必然的。GeForce2 GTS拥有新的第二代T&L处理引擎和经过改进的第二代QuadPipe四通道渲染引擎。
T&L2
即使我们拥有1GHz或更快的CPU,我们也并不拒绝T&L的帮助,将CPU释放出来由显示卡上的硬件T&L引擎来完成几何转换与光源处理,第二代T&L引擎可以完成几何转换,剪裁"Clipping":能除去屏幕边缘多余的画面部分,光源处理,每秒能处理2千5百万个多边形,NVIDIA称之为TCL。第二代T&L引擎加以改良,性能要比第一代T&L快30%左右。TCL与ATI Charisma引擎差不多。更多的多边形生成能力有什么好处呢?我们可以在同一个场景中看见更加细腻的物体表面和复杂的场景,T&L技术已经成为3D业界标准,除了Quake3(支持硬件几何转换),还有几个游戏包括Messiah,越来越多的游戏将支持T&L,未来3D加速卡也会支持T&L。值得注意的是,T&L最大帮助是在于只使用一个点光源的静态场景(我们知道这是不可能的事情),如果使用大量的光源,运行速度始终会下降得很厉害,这一情况在著名的TreeMark测试软件中出现。无论如何,目前真正支持T&L的显示卡只有NVIDIA,虽然最近新的Savage2000驱动程序可以打开T&L,但是无论是速度还是画面质量上都不能令人满意。
十亿象素填充率Giga Textel Sharder
NVIDIA把NV15命名为Gefroce 2 GTS,这是要向世人宣布其拥有10亿以上的象素填充率。我们知道Geforce256可以在单一时钟周期里处理四个象素,由于默认工作频率为120MHz,所以能提供4.8亿/秒的象素填充率。
而Geforce 2 GTS虽然同样在单一时钟周期内处理四个象素,采用200MHz默认工作频率,提供8亿/秒的象素填充率。但是由于单个时钟内每个象素能处理两个纹理贴图(NVIDIA将该渲染流水线称为"Hyper Texel Pipeline"),所以总共可以处理8个T象素(Texel Pixel),Geforce 2 GTS总共能提供16亿/秒的T象素填充速度。最先提出10亿象素填充率的是3dfx,采用4颗VSA-100图形芯片的V5 6000,填充率达到13亿/秒。ATI RadeOn256也宣称能达到12亿/秒(最高达15亿/秒),由于它们暂时都没能出现在市场,无疑让NVIDIA实在的抢到先机力推(无论是在256位内部渲染引擎,T&L,还是十亿象素填充率)。
Geforce 2 GTS中,GTS的含义是十亿象素填充率。Geforce 2拥有两条渲染流水线,每条流水线可以在单个时钟周期内完成4个象素贴图,这样在200MHz的核心工作频率下能实现1600MTexel/秒也就是16亿的T象素填充率。我们再来回顾一下关于T象素的定义,最早提出T象素(Texture+Pixel)的是3dfx,Texel(T像素)它与普通像素不同,仅表示一定纹理上的像素,比如一个512*512纹理就有512*512个T像素。由于子像素和多层纹理技术的出现,显示在屏幕上的像素往往比真实的像素要多,打个比方,在1024x768分辨率下,当一堵全屏显示的墙前面有一块占领屏幕50%的大石头,那么,基本上显示卡要渲染的象素总量为1024x768x1.5个。由于石头背后有50%的画面部分是看不见的,所以这一部分的渲染工作就浪费了。
NVIDIA Shading Rasterizer
我们知道自Geforce256以来采用的QuadPipe四通道渲染引擎,能在单个时钟周期内完成几何转换,光源处理,三角形建立和渲染处理,NVIDIA在渲染处理过程中提出了NSR渲染引擎:NVIDIA Shading Rasterizer,NSR渲染引擎可以在单个时钟周期内四个象素渲染处理内完成7种特殊的象素操作,这7种操作包括了基础纹理操作(based texture),每象素凹凸影射(Bump Mapping),每象素光源扩射(Diffuse lighting),每象素镜面反光(Specular Lighting),彩色雾化(Color Fog),环境光源处理(Ambient Lighting),Alpha透明效果(Alpha Transparency)。
NSR渲染引擎的基础就是每象素光照贴图,如果大家有玩过Quake3就知道,Quake3采用自己的光源处理引擎,选择光照效果有光照贴图Lighting Map和顶点光照Vertex Lighting。光照贴图方式是由设计人员在设计游戏场景时将预先设计好的纹理+光源生成光照贴图,这样我们在预定的场景或即将发生的时间就能看见预先设计好的那幅光照贴图。这样的好处是能看到由设计人员精心设计的游戏画面,缺点是非实时性,而且要花费大量时间去设计画面,这对于游戏开发来说无疑是浪费时间。而顶点光照则是对于多边形的顶点进行计算顶点与光源的远近距离,最后可以在运行3D程序时实时显示动态光源效果。如果场景复杂而且使用大量多边形组成的话,顶点光照的效果会更加明显,如果你在Quake3中选择顶点光照方式,你会发现游戏运行速度明显下降许多,这就是因为Quake3使用大量多边形,而且使用的自己的软件光源引擎,当显示卡处理大量多边形时使用顶点光照,性能会严重下降。
NSR其中的许多3D特效包括凹凸影射,彩色雾化,镜面反光等效果已经包含在OpenGL和DirectX中,未来将会有新版本的DirectX8支持NSR其他3D特效。
数据带宽提升
0.22微米技术已经不能阻挡发热量(Geforce256的耗电量是18w),Geforce 2采用的新的0.18微米技术,这样可减少芯片体积,降低成本,发热量也减少为不到10w,核心工作频率也提升到200MHz。由于Geforce 2能提供16亿象素填充速度,但是没有巨大的数据带宽支持也发挥不了作用,Geforce 2支持32-128MB SDRAM/DDR SDRAM,这也是第一款显示芯片直接使用32MB内存,但是Geforce 2与Geforce 256一样都采用128位显存接口(256bit内核)。许多首先推出Geforce 2的厂家都是采用DDR SDRAM,我们来看看如果一款Geforce 2产品使用166MHz DDR内存,显存工作频率运行在333MHz,可以提供333x128/8=5.3GB/秒的数据带宽,这要比Geforce DDR 4.8G/秒的带宽较高,但是当分辨率逐渐提升而且采用32位色渲染场景时,Geforce 2一样会出现性能下降的问题,这就是数据带宽不足所引起的。在1024x768@32位色下,虽然有纹理压缩帮忙,但是再加上Z-buffer等要求,这样32MB的Geforce 2是不可能在高分辨率下提供高于60fps的游戏速度。这时只能用AGP 4X来存储纹理材质,但是要知道AGP 4X只有1G/秒的数据传输率。Quake3有一个专门设计的大纹理+数量非常多的多边形的场景nv15level,在配备Geforce 2+1GHz PIII系统运行时也只有不到35fps的运行速度。我们肯定在未来的低端市场上会出现32MB SDRAM的Gefroce 2 GTS,但是它的性能不会理想。
NVIDIA每六个月推出新产品,Gefroce 2 GTS对于Gefroce256来说严格上来说并不能称得上是换代产品,NVIDIA在当初推出TNT时扬言比两张Voodoo2快,但是直到TNT2 Ultra的出现我们才认为这是个完善的TNT产品。Gefroce 2 GTS还有一些细节方面我们还没有详细进行分析,以后将会继续向大家报道。同样我们觉得Gefroce 2 GTS也是Gefroce256的改良版本,它拥有10亿/秒的象素填充率,5.3GB/秒的数据带宽,7种特效NSR渲染引擎,FSAA全景抗锯齿功能,第二代T&L引擎等,属于第一款能在1024x768@32位色下提供流畅的Quake3游戏运行速度的产品。
网友评论