漫谈显卡(二)

互联网 | 编辑: 2000-10-05 20:59:01

二、2000年主要显示卡回顾

1.3dfx

在2000年中,3dfx终于推出新一代Voodoo系列产品Voodoo4和Voodoo5,我们来看看新的Voodoo产品带来了什么新的改进。

Voodoo4和Voodoo5采用VSA-100图形芯片作为核心,VSA的全称为Voodoo Scale Archeriture,即Voodoo比例伸展结构。

VSA-100图形芯片特点如下:

  • 采用0.25微米工艺,6层金属半导体加工,芯片内集成1400万个晶体管数目;
  • 32bit色渲染,24bit浮点精度,Z/W-Buffer,8bit阴影模板缓冲;
  • 支持DirectX 7.0 DXTC和3dfx自己开发的FXT1纹理压缩技术;
  • 支持最大2048×2048,32bit纹理;
  • 提供AGP 4x和PCI接口支持;
  • DVD硬件解压,可播放每秒30帧流畅的DVD影片;
  • 128bit 2D引擎,3dfx设计的Voodoo Banshee的2D核心将要继续使用下去;
  • 支持目前流行的DirectX、OpenGL、Glide API,为Intel和AMD CPU优化;
  • 核心工作频率大约是166~183MHz,由于VSA-100在单个时钟周期内处理两个像素单位,所以可以实现166×2=3.33亿/秒的像素填充率。

VSA-100 3D特性:

  • Single-Pass,Single-Cycle Multi-Texturing:单周期单通道多重纹理传递;
  • Single-Pass,Single-Cycle Bump-Mapping:单周期单通道凹凸纹理贴图;
  • Single-Pass,Single-Cycle Tri-Linear Mip-Mapping:单周期单通道三线性过滤;
  • Per-Pixel MIP Mapping and Alpha Blending:单像素Mip贴图和Alpha混合;
  • 8-bit Palletized Texture:8位Palletized纹理;
  • Exponential Fog-Table:雾化;
  • Floating Point Z-Buffer to Eliminate Z-Aliasing also Floating Point W-Buffer:浮点精度Z轴缓冲除去Z轴图形失真,W-Buffer多在图像透视校正方面使用,暂时W-Buffer只在DirectX上使用,未来将应用在OpenGL上;
  • Dynamie Environment Mapping:动态环境贴图。

改进的SLI技术

VSA-100芯片采用原来在Voodoo2时代就出现的SLI(Scan-line Interleaving)技术,可以获得非常强劲的像素填充率和优质游戏画面,我们回顾一下SLI技术的含义:SLI技术把画面分为一条条线(Scanline),两块图形芯片分别负责渲染画面的奇数部分和偶数部分,合并后写入帧缓冲,接着在画面上重新显示,这样能比使用单块芯片时渲染速度提升许多。新的VSA-100芯片可以在单块板卡上集成1到4块图形芯片,可以使用在PCI或者AGP接口上,分辨率达到1600×1200以上。另外,采用经过改进的SLI技术,单块芯片处理一部分的Scanline。举个例子,Voodoo5-6000集成四块VSA-100芯片,总共处理128条Scanline,第1块VSA-100芯片处理第1~32条Scanline,第4块处理最后的32条Scanline。这样实际上每块芯片的工作量都比只有一块芯片工作量大大减少,不会出现数据处理负荷过重的时候性能下降的情况,使像素填充率达到14.7亿个/s水平!更高的像素填充率最直接的作用就是带给我们更流畅的游戏画面,简单计算一下,在1024×768分辨率下,要获得60帧/秒的速度,起码需要处理近5000万个像素,还不包括像素混合处理的工作。

2048×2048分辨率和纹理压缩技术

VSA-100芯片硬件支持5种标准的DirectX 6 DXTC纹理压缩技术,当然还包括3dfx自己开发的FXT1技术。在游戏中采用分辨率更大的纹理进行贴图,可以得到更复杂而且更漂亮自然的游戏画面,但是高分辨率的纹理如果不经过压缩存放在显示卡内存中的容量非常大。过去Voodoo也只是采用256×256大小的纹理,而VSA-100则可使用2048×2048的大型纹理。

32bit纹理

如今的许多游戏都采用32bit纹理,32bit的纹理使色彩精确度提升了一倍。

新一代Voodoo显卡规格比较表

V5系列产品 Voodoo4-4500 PCI Voodoo4-4500 AGP Voodoo5-5500 PCI Voodoo5-5000 AGP Voodoo5-6000 AGP
显存 32MB 32MB 64MB 64MB 128MB
像素填充率 3.33~3.67亿/秒 3.33~3.67亿/秒 6.67~7.33亿/秒 6.67~7.33亿/秒 13.2~14.7亿/秒
接口 PCI AGP PCI AGP AGP
RAMDAC 350MHz 350MHz 350MHz 350MHz 350MHz
最大分辨率 2048×1536 2048×1536 2048×1536 2048×1536 2048×1536
VSA数目 1 1 2 2 4

2.PowerVR

ST微电子公司向世界宣布推出PowerVR系列第三代产品“KYRO”。这次,无论是PowerVR还是ST微电子,都希望借着这块KYRO作为2000年首推重点图形产品,重新进入PC图形市场。

Imagination技术公司设计出基于PowerVR 3技术的KYRO图形芯片,芯片型号为STG4000,我们来看看KYRO。

KYRO图形芯片技术规范:

  • 采用0.25微米工艺制造;
  • 核心工作频率和显存工作频率为150MHz;
  • 1200万个晶体管;
  • 1000万个/秒三角形生成率;
  • 两条渲染流水线,像素填充率为3亿/秒。

KYRO图形芯片特点:

  • 支持DirectX 7顶点格式;
  • 8层多重贴图;
  • 支持RGB高洛德(Gouraud)阴影和镜面反光;
  • 双线性过滤,三线性过滤和各向异性纹理过滤;
  • 三角形生成引擎(可去掉隐藏表面,处理阴影和纹理贴图);
  • Alpha纹理混合和色彩键值;
  • 顶点和表格雾化;
  • 纹理压缩;
  • 全景抗锯齿,支持2x和4x超级采样;
  • 支持Direct3D和OpenGL 1.1 API;
  • 128bit 2D接口;
  • 支持128bit SGRAM/SDRAM,最高可达64MB;
  • 硬件视频播放和DVD解压;
  • AGP 2.1总线接口,支持AGP 1x/2x/4x;
  • 带数字视频输出端口。

作为一块中档图形产品,KYRO的特点包括了平铺式基础渲染、32bit高精度内部渲染色彩、8层多重纹理贴
图、D3D环境凹凸贴图和全景抗锯齿。

平铺式基础渲染(Tile Based Rendering)

在传统的3D图像渲染过程中,所有多边形都必须进行渲染处理。举个例子:在屏幕中,当一物体A显示在另一物体B的前面,由于它不是透明的,所以物体A的一部分相应的遮挡住物体B一部分,物体B被物体A遮挡住的这部分我们是看不见的,但照样需要进行渲染处理。显而易见,这部分工作可以说浪费了,不但影响到处理的效率和性能,而且还要占用图形带宽。我们可能从头到尾都没机会看到这部分。

PowerVR采用延缓贴图技术(Deferred Texturing),在处理纹理贴图、光源和阴影处理步骤之前将被隐藏的表面去掉,这部分表面的处理工作就不需要继续了,这个处理过程就像每一个像素经过Z-Buffer测试后去掉多余的像素。而且只有可见像素才被最终处理和存储到显示内存中,如同在芯片内部就有本地帧缓存,无须频繁为了多余的处理去访问Z-Buffer,也不必占用这部分数据所需的图形带宽。

PowerVR技术在3D渲染处理过程前把多边形组成一批准备处理,这与传统的处理方法不同,它把一场景分割成为由一个个区域称为“Tiles”或“Regions”。每一个区域都是整个区域的子集,这样PowerVR就可以把隐藏的表面去掉。

“Tiles”基层渲染技术还能使一块KYRO上增加一块或多块芯片,多块芯片分别渲染不同的区域,如同3dfx SLI技术和ATI ASIC技术。

内置真彩色技术(Internal True Color)

在传统3D渲染像素处理中,当每个像素渲染都是32bit,而最终输出多边形中的像素要写入16bit的帧缓存中,这些32bit像素就必须从32bit转换到16bit,当然这样会影响色彩精度。在KYRO中,由于像素的深度值测试以及混合等是在芯片内部完成,所有的像素混合操作的执行都是32bit真彩色,无需依靠在帧缓存中Z-Buffer的执行下就能完成。这项技术带来的好处是当使用32bit色渲染的时候,性能不会下降很多,由于像素无需访问Z-Buffer区,减少了图形数据带宽的占用。而且在切换到16bit色的时候,由于内置真彩色技术的缘故,每次混合后的像素仍然是32bit精度,确保最终混合输出的图像精度要比传统像素混合方法要高。

8层多重纹理贴图(8-Layer Multitexturing)

在“Tiles”式基层渲染的执行下,KYRO不但支持D3D环境凹凸贴图技术,更可在硬件上实现多达8层的纹理贴图(DirectX支持最多8层的纹理贴图),多重贴图在目前得以广泛流行,其中一个原因就是大部分的显示芯片都可以在单个时钟周期内完成两次纹理贴图处理,比如可以在实现基础贴图的同时还可以完成光照贴图。如果在一次多重纹理贴图中必须完成透明纹理的混合,在传统的多重纹理渲染中不能实现。除非在32bit帧缓存格式包含了4个8bit的Alpha通道,传统的3D渲染必须使用32bit帧缓存来达到某些混合效果,比如使用Alpha半透明,这是因为在32bit切换到16bit色时Alpha半透明的部分会丢失。而KYRO的硬件多重纹理渲染在内部完成,可以在任何深度值的帧缓存中实现。这样不但减少占用图形带宽,而且还减少了CPU占用。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑