利用相对更便宜且容量较大的内存来取代昂贵的显存,一直是显卡设计者们的一个期待,但是由于总线速度的限制,瓶颈早已在显存和总线之间钳制住了GPU(图形处理核心)处理完数据,而导致这样的期待远远没发展到实用阶段。然而在PCI-E X16总线出现以后,“Turbo Cache”技术只用16
从AGP总线中得到的经验本文作者:龚师傅 中国计算机报·i周刊
利用相对更便宜且容量较大的内存来取代昂贵的显存,一直是显卡设计者们的一个期待,但是由于总线速度的限制,瓶颈早已在显存和总线之间钳制住了GPU(图形处理核心)处理完数据,而导致这样的期待远远没发展到实用阶段。然而在PCI-E X16总线出现以后,“Turbo Cache”技术只用16MB的板载显存就可以保证主流显卡有较高的性能,将期待和现实的距离又拉近了一步。
从AGP总线中得到的经验
所谓“Turbo Cache”其实并非是全新的技术,与AGP接口显卡的基本使用模式有很多类似之处,当年显卡从PCI接口发展到AGP接口后,传输速率得到了很大的提升,因此就提出了DMA和DIME(直接内存执行,Direct Memory Execute)这两个概念,都是利用AGP接口的高传输率,对系统内存加以应用。DMA的具体工作方式是:对使用频率很高的纹理材质数据及显示缓冲区数据放在板载显存中由显示芯片处理,而对使用频率较低的材质与纹理数据先放入一块专门划分出来的主内存区域中,通常通过在BIOS里面设定AGP Aperture Size来确定这一部分内存的大小。DIME和DMA略有不同,它主要是允许把主内存划分出来一部分,作为板载显存的补充用来存取大型的纹理数据,存取数据时不必先将这些数据拷贝入显存而直接由图形芯片在主内存中的AGP内存里面运算,其实也就是将这一部分主内存当作显存来处理。
从i810开始,整合显示系统逐步得到了市场的承认,其中一个关键之处在于其中运用了高速缓存技术,Intel的“多分辨率织网”技术也节省了显示存储空间和I/O流量。
摆脱带宽不足的束缚
尽管目前AGP 8X 接口2.1Gb/s的传输速度已经非常快速,但无法满足填充率已经高达6.4Gb/s的显卡的要求。AGP接口还存在一个大问题就在于其双向通讯使用的是同一个传输通道,所以当进行反向传送的时候,正向数据流的传送必须先停止,直到反向传送数据完成才可进行。这个过程不仅要消耗很多系统资源,还容易造成数据发送冲突甚至出现数据流变向的恶果。因此必须给高档显卡配置大容量的高速显存,否则一旦出现显存不足的情况,对于AGP接口的显卡来说,无论工作在DMA还是DIME模式,都不可避免会遇到AGP接口的数据传输瓶颈,造成性能急剧下降。这就使得目前高档显卡至少都配置了128MB,甚至256MB的大容量高速显存,不仅大大提高了显卡成本,还造成显卡发热耗电增大,稳定性下降等问题。而且大容量显存在不玩3D游戏的大多数时候是完全闲置的,无疑也造成了浪费。
随着新一代显卡高速接口PCI Express x16的推出,显卡接口的数据传输瓶颈得到了改善。PCI Express x16的传输速率有较大幅度的提升,单向为4Gb/s,双向传输时达到8Gb/s。PCI Express采用了一种类似“Switch(开关)”的结构,数据传输通过桥接芯片进行,而无须通过内存;各通道彼此独立,能实现多设备并发传输;这一点对于显卡等对带宽需求非常大的设备来说意义非常重大。PCI-E接口拥有了这么高的数据传输率,加上高端显卡芯片的强大处理能力和日益提升的系统内存性能及容量,如果通过配套的新技术我们就可以充分利用主内存,那么显卡上就不必再配置大容量的显存了,从而降低显卡成本,提升市场竞争力。在这样的背景下,nVIDIA 的“Turbo Cache”技术就应运而生了。
内存共享是大势所趋内存共享是大势所趋
“Turbo Cache”技术最主要的特点就是显卡本身只配置16MB左右的显存,而在需要时可以利用系统内存作为显示卡内存,借助PCI-E的频宽优势,其性能损失将不会很明显。Turbo Cache通过PCI-E双向总线将系统内存作为显示内存使用,充分发挥了PCI Express总线的双向传输优势,能够很自然地将系统内存当成显示内存使用。首款应用Turbo Cache的将是NV44,它基于精简型NV43架构,是一款原生型PCI Express GPU,支持DirectX 9 Shader Model 3.0,仅板载16 MB显示内存,主要作为高速缓存用,在Turbo Cache技术的支持下,能够分享最高128 MB的系统内存作为显示内存。由于双通道内存技术的出现,使共享显存的显卡也可以达到128bit的位宽,再加上大容量、高频率DDR2内存的普及,以及Turbo Cache技术的先进内存调度算法,用主内存作显存性能损失将很小,传言这款产品在3DMark03测试中获得超过2000分的成绩,完全能满足大多数应用需求。
PCI-EX16总线给了显卡共享内存方式发展的最好契机
链接:“HyperMemory”技术
类似的 HyperMemory技术同样基于PCI Express所提供的高速带宽之上,采用了智能优化算法来处理共享显存中的数据,系统和显卡所共享的部分显存数量将由系统控制,并在必须的时候将显存还给系统。无论Hypermemory技术还是Turbo Cache技术,共享系统内存的方式都将减少显卡本身的成本,尽管性能会略有下降,但是可以有效控制成本,而在低端市场上价格是一个很重要的因素。
综合来看,没有显存的集成显卡性能较差,而大容量显存的独立显卡成本较高,采用Turbo Cache及HyperMemory技术的产品可以说这是一个折中产物,但是否能被市场接受,尚是一个未知数。
网友评论