对于显卡来说,PCI Express接口替代AGP接口是大势所趋。 但如何让产品在市场中平稳过渡完成新老交替,却是厂商们需要考虑的问题,今天我们请来骏兆的工程师,为大家说说NVIDIA的解决方案。
NVIDIA另开辟径支持PCIE
对于显卡来说,PCI Express接口替代AGP接口是大势所趋。
但如何让产品在市场中平稳过渡完成新老交替,却是厂商们需要考虑的问题,今天我们请来骏兆的工程师,为大家说说NVIDIA的解决方案。
NVIDIA GeForce PCX家族
NVIDIA在今年Intel春季开发者论坛IDF Spring上发表了涵盖入门、主流、玩家等各种等级的PCI Express全系列GPU产品,所有新产品均具有PCI Express标准在带宽与功能上的优势,运用专有的高速互连High-Speed Interconnect HSI 技术,能高速执行双向互连协议转换,将NVIDIA的GeForce FX系列延伸发展为全系列PCI Express GPU。
新系列产品包括:
GeForce PCX 5950—基于DX9架构设计,向发烧玩家提供最为强大的性能。
GeForce PCX 5750—面向高端用户,能够提供全部的特效。
GeForce PCX 5300—面向主流用户,价格易承受。
GeForce PCX 4300—入门级别的PCI Express显示产品。
代替原生方案的hsi架构体系
提示:NVIDIA这次发布的NVIDIA GeForce PCX系列产品并没有采用原生的PCI Express GPU,而是通过hsi技术,采用桥接芯片,将支持AGP接口的产品转化为支持 PCI Express接口。
到底HSI芯片有何厉害之处,把只有2.1GB/s带宽的AGP 8X总线转为有4GB/s带宽的PCI Express X16总线。下面将会详细分析HSI的内部结构,把这个看似“不可能的任务”的面纱逐步揭开。
HSI介绍
NVIDIA的HSI是一种能够使NVIDIA的AGP GPU连接到PCI Express接口上的互联技术(关于PCI Express的深入技术分析,可以详见我们之前的一篇《突破带宽瓶颈,迈向极速巅峰》)。它支持一条主PCI Express总线及一条从AGP总线。所有必要的协议及地址的翻译都可以在HSI内部快速完成。对于PCI Express的接口方面,它兼容1.0a版本的PCI Express规格,包括全双向和全带宽的支持。
HSI的AGP端口不但支持AGP 8X(2.1GB/s的数据带宽,更加可以支持AGP 16X的完全4.2GB/s带宽(即NVIDIA在GPU和HSI芯片之间的带宽可采用AGP 16X模式)。上面显示了简化的HSI芯片模块图。不过有读者会问,桥接芯片(hsi)的加入,那会不会造成显卡性能上的损失呢?我们下面就来分析一下这个问题。
问题之一:hsi所能达到的带宽问题
PCI Express和AGP比较,有个重要的优势是在于更大的数据传输带宽。我们先来看看它们的最大带宽是多少。AGP总线是一种专门的并行数据线接口,实际上的数据带宽与理论上的总线带宽相同。举例来说:
AGP 8X = 2.1GB/s
AGP 12X = 3.1GB/s
AGP 16X = 4.2GB/s
PCI Express X16的单向理论带宽为4GB/s示。
需注意,4GB/s仅仅是理论上的数据,那实际情况如何呢?由于PCI Express是一种采用共享数据、地址及流动控制线的串行接口,因此它的有效数据带宽低于理论上的数据带宽。PCI Express数据是以封包Packet的形式作传输的。
是一个基本的PCI Express数据包Translation Layer Packet TLP。它主要包括三部分:TLP Header、Data Payload及TLP Digest。
TLP Header包括地址address及流动控制flow control等资料,共16Byte。Data Payload为真正传输的数据。TLP Digest为ECRC侦错码,共4Byte。封包的额外数据Packet Overhead总数为20Byte。
因此我们可以利用图中的公式计算出PCI ExpressX16 lane的有效数据带宽。bw指带宽结果为3GB/s,而非理论上的4GB/s。显示有效PCI Express X16单向带宽的峰值为3GB/s。
拿入门级的GeForce PCX和 VIDIA Quadro FX GPU来说,它们最小都能达到AGP 12X3.1GB/s的数据带宽,其AGP接口超越了PCI Express接口在全速下任何传输方向所提供的有效带宽峰值。实际上,更高端的PCX卡可以提供相当于AGP 16X接口(4.2GB/s)的带宽。
此外,业内还有种认识,认为AGP的上行数据限制在266MB/s内。
但事实并非如此。266MB/s只是在使用PCI写入上行数据时的限制。而当使用AGP写入时,上行带宽只受AGP接口传输率的限制。比如对于AGP 16X来说其接口限制为4.2GB/s。因为HSI支持AGP写入,NVIDIA GPU能够以完全带宽支持与AGP通讯。然后HSI再处理向PCI-E主机的通讯。
图显示了PCI Express带宽的典型使用模式
需要注意的一点是绝大多数图形应用几乎只使用下行数据(从CPU到GPU)。HSI能够传递完全的4.2GB/s带宽并能以任何可能的方式对它进行分配。换句话说,HSI能够根据需要以4.2GB/s速度传递下行或上行数据的任何部分。
问题之二:hsi的寻址延迟问题
NVIDIA将GeForce PCX 家族的GPU与HSI设备紧密地结合起来,以解决由PCI Express和互联产品的总延迟。HSI的设计方式使得GPU等产品的延迟容忍度大于芯片组加上互联所产生的延迟,因此GPU将不会被总线的性能所限制。
增加GPU延迟或减小互联延迟的因素如下图所示:
1、# of in-flight请求。HSI的设计将# of in-flight请求最大化。
2、请求数据的大小。NVIDIA GPU使用最优化的64Byte请求数据。
3、互联所产生的延迟。
HSI支持更高速的AGP传输, 如AGP 12X或AGP 16X。因此,减小了由于互连所产生的延迟。通过设计,使GeForce PCX强大的内部构架有充分的余地消除由全部总线产生的延迟所造成的影响。
提示:由于AGP和PCI Express二者间的寻址延迟是不同的,HSI作为连接二者的桥梁,解决因延迟带来数据传输问题,避免了影响GPU的性能。举一个简单的例子,在一条生产线上,产品不断送过来(数据从PCI Express总线传过来),通过生产线的加工处理后(通过hsi芯片),从另外一头再进入下一道工序(进入GPU),那么产品上生产线和下生产线的速度应该保持某种一致性,不能出现产品送得不及时,让生产线空闲;或者产品无法及时下线,造成生产流程堵塞。
可逆支持
HSI接口的设计完全支持AGP和PCI Express。这样的好处在于AGP GPU能够转换成PCI Express。另外,原生PCI Express GPU也可转换为AGP。HSI的这种灵活优势使NVIDIA能为所有用户群体提供最先进的图形解决方案,而不以牺牲特性和性能为代价。
结 论
PC工业正在进入历史上最令人振奋的总线变革时代,如何为用户提供高性能、高质量、多样化的产品以确保平滑过渡将是至关重要的。HSI使NVIDIA能够迅速将现有或未来的革新性图形处理产品以最短的时间配置到PCI Express或者AGP平台上。
网友评论