3D性能提升的秘密GDDR4显存速度爆发
显卡技术的发展是令人匪夷所思,日新月异的GPU对于显存总是如饥似渴,作为显卡厂商,一方面在不断地提高显存频率与显存位宽,但是这毕竟受到制作工艺的限制,不可能无穷尽的拓展。随着RV670和G92袭来,均回归到256bit的显存位宽,但性能较之前的G80和R600并无损失,很大程度是因为频率更高,保持了接近的显存带宽,因此可以看到,在未来高频率的显存会应用更为广泛!
高显存频率时代,GDDR3显存软肋凸显
首先,GDDR3的显存延时表现也令人无法完全满意,GDDR3采用了改进型的背靠背式读取,但是此时反而让写入延迟增加了,仅仅提高读取延时并不是理想的做法。现在,当GDDR3频率逐步提高时,厂商为了提高稳定性又进一步提高了延时,这对其性能表现也非常不利。
GDDR3的缺点在于爆发限制(Burst Limitation),爆发动作是指从内存中连续的地址读取有限的数据,在一个DDR设备的频率周期中,可以读取两个各长n-bit的词元。这两个数据信号必须位在内存中的相同位置(由逻辑电路寻址),稍后才能移往下一位置,尽管它相对于GDDR2已经有了很大的改善,但是GDDR4依然大有提升空间。
最后,在显卡已经向超高频率发展的前提下,GDDR3提供的是1.0-2.0的显存速度,最大只能达到2000MHz的频率,因此出现HD3870和无极HD3850玩家战斗版这种显存频率超过2000MHz的显卡时,GDDR3略显无能为力,很典型的就是采用1.1ns GDDR3显存的公版HD3850默认显存频率1660MHz,采用GDDR4显存的HD3870显存频率2250MHz。
速率更快、功耗更低的GDDR4已备受推崇
GDDR4显存颗粒采用了一系列尖端技术,如三星GDDR4采用数据总线转位(DBI,Data Bus Inversion)以及多重前同步码(MP,Multi-Preamble),能有效消除所有数据的传输延迟,GDDR4的数据带宽比GDDR3大幅度提升,而耗电却只有70%左右,GDDR4最终将肯定成为高端显卡甚至主流显卡产品的必备显存。
另外,GDDR4显存颗粒很轻松地就达到了64Mx64颗粒,也就是说只需4颗显存芯片就能够实现256Bit位宽和256MB容量,这对于节省成本并降低对供电模块的依赖性是很有帮助的,同时发热量也进一步降低,这也符合当前主流3D游戏的应用需求。
另外工作在更高的工作频率下,使显卡可以得到更大的显存带宽,如GDDR4的无极HD3850玩家战斗版的显存带宽高达70.4GB/s,可以提供比GDDR3高50%-100%的数据传输率,因此未来将会被广泛使用。
随着三星和HY都推出GDDR4的显存芯片,产能已经完全作好准备,GDDR4显存具备目前业界最高的显存工作频率,而耗能却很低。同时,配备GDDR4需要的配件更少,约束条件也更低,启用GDDR4显存技术能彻底解决当前显卡功耗过大、成本过高、显存发热量巨大等棘手的问题。
GDDR4的高显存带宽提升3D性能更明显
其实显存就是GPU内核与像素渲染管线之间的桥梁或仓库,显存的容量决定“仓库”的大小,显存的带宽决定“桥梁”的宽窄,两者缺一不可,这也就是我们常常说道的“显存容量”与“显存速度”。更快速的显存技术对整体3D性能表现有重大的贡献,数据传送所花的时间通常比GPU执行功能所花的时间更长,因此提高显存带宽往往能够比提高GPU核心频率取得更为明显的效果。
显存位宽并不是由芯片技术决定,而取决于板卡设计,与显存的位宽和频率息息相关,目前老迈的GDDR1和GDDR2完全显出疲态,GDDR3则早已成为主流,未来则是GDDR4的天下,原因很简单,GDDR4并不能决定显存位宽,但是它却决定了显存频率,GDDR4通过实现更高的显存频率来达到极高的带宽。
频率所带来的显存位宽是最为直接的,其执行效率将不会带来任何折扣,也就是说1000MHz的512bit GDDR3显存在性能方面与超越2000MHz的256bit GDDR4显存的带宽是持平的。目前来看,GDDR4显存颗粒的速度集中在0.7-0.9之间,如一颗0.8ns GDDR4的显存,理论运行频率通常为2500MHz,毫无疑问,如果一款显卡的显存频率只有1250MHz,即便其显存位宽达到512bit,其等效显存带宽也仅仅与256bit的2500MHz GDDR4显存持平。
PCIE 2.0+GDDR4无法抵挡的传输速度
显存的传输速度加快,如果配合接口的速度可以提升整体的数据交换速度,因此当GDDR4显存和核心数据交换加快时,必须有更快速的接口支持才不会造成瓶颈,而PCIE 2.0高达5.0Gbps的传输速度,虽然对几乎任何显卡都足够了,未来随着大屏幕显示器和高分辨率下的数据交换加大,也不会给GDDR4显存带来瓶颈。
新一代的G92和RV670都支持PCI-E2.0规格的显卡,它将显卡的总线数据传输率提高了一倍,即从原来PCI-E 16X的2.5Gbps提升至5.0Gbps,2个PCI-E2.0 16X接口能够将传输速度提高到16GB/S。由现在的新游戏可以看出,游戏对帧缓存有着更高的要求,更高带宽的PCI-Express 2.0给这些数据提供了更为广阔的数据接口。
或许有人会说,目前的HD3870虽然频率在2000MHz以上,也就2250MHz的频率,而目前顶级的1.0ns GDDR3显存频率也可以接近2000MHz,不过如果同样是看额定频率来看,如采用0.8ns GDDR4的无极HD3850玩家战斗版最高能达到2500MHz左右,因此对用户来说其实2200MHz的仅仅是保守的频率,还有很大的提升空间!因此也可以看出在GDDR4产生的高带宽下,HD3850将能更好的发挥出其核心应有的性能,从而媲美HD3870!
网友评论