为战而生 NVIDIA移动版显卡架构解析

PChome | 编辑: 陶祥明 2013-10-02 06:30:00原创 返回原文

为战而生 NV显卡架构解析

编者按:显卡这一计算机中的硬件名称曾一度成为最热门的词组之一,消费者在选购电脑产品的时候通常都会询问显卡的各种参数来了解性能,而架构作为显卡核心的一项属性,却很少有人提及,本文将从费米和开普勒架构谈起,联系到目前市售的NVIDIA系列移动端显卡,详细解读显卡架构。

显卡的工作是完成把数据转换成信号供输出设备显示的任务,具体来讲就是处理器将数据传输到显卡中,显卡在显存中对于数据进行处理,最后经过数模转换生成输出的信号,显卡的性能主要决定于其显示芯片的运行速度,而我们这里要提到的架构,就是其核心内部的构造,更新更合理的架构可以获得更快的运算效率。

显卡原理效果图(图片来自网络)

NVIDIA作为民用显卡芯片的生产厂家之一,显卡架构也经过了几次较大的改变,目前市售的700M系列移动端显卡主要分为上一代的费米架构产品和最新的开普勒架构。每个架构拥有众多的产品规格,以满足各种档次消费者的需求,当显卡厂商发布新一代的产品线的时候,通常也会采用上一代架构的产品和规格作为中低端显卡的选择。

昔日王者 费米延续经典

NVIDIA在2010年发布了GF100架构的产品,并继续延用了利用物理学家为其命名的惯例,称为费米架构。第一款发布的基于费米架构的产品是GF100芯片,其一大创新之处就是确定了GPU面向通用计算的考虑,通俗一点来讲,之前的GPU仅仅是基于图形进行考虑,但随着GPU性能的大幅提升,GPU已经可以帮助CPU进行运算以提高计算机的整体性能,这就使其的市场选择更加广阔而不再仅仅局限于游戏和图形性能。

GF100核心(图片来自网络)

费米架构(图片来自网络)

费米的架构在内存控制器方面也进行了不小的改变,NVIDIA工程师发现一些应用程序天然需要shared memory,有些应用程序则需要缓存cache,有的既需要shared memory也需要cache。优化的内存设计可以既提供shared memory也提供cache,可以让程序员根据自己的需求来做选择。

费米内存控制(图片来自网络)

费米的架构首先将GPU引入了ECC的概念,可以检查内存错误和修复,在进行大数据处理和大图像运算的时候,内存位的存储错误会线性增加,这种情况下ECC就显得十分必要。在费米架构中,有许多的指令可以实现多线程发射,其多线程的调度能力,使得费米架构可以让硬件的能力发挥到极致。

在我们看到的700M系列移动端显卡中,GT710M和GT720M均延用了费米架构的设计,相较刚发布的费米,在工艺水平提升到了28NM,让其拥有更低的功耗和更优异的性能表现。

如日中天 开普勒王朝来临

NVIDIA在2012年发布了新一代架构的显卡,使用物理学家为其命名为开普勒架构,在运算能力上比上一代费米架构有不小的提升,尽管上一代费米的性能水平得到了肯定,但功耗和发热的问题也使其有了进步的空间。

GK110核心(图片来自网络)

这一代开普勒架构在保持高性能的同时,还十分节能,显著减少了电力消耗,同时产生的发热也更少,无需依靠强力的散热系统也可以达到同样安静和低温的效果。开普勒架构在设置之初就考虑提高电源的效率,创造出惊人的功耗比,开普勒引入的新流式多处理器架构,把功耗比放到了第一位,以增加面积成本为代价,使大量处理器核心运行在较低的频率上,以达到优秀的功耗比。

新架构三大特点(图片来自网络)

开普勒架构还加入了一项新的功能,在CPU和GPU共同协作工作的时候,可以在CPU无需参与的情况下,通过专用硬件路径为自己创造新的工作并控制这项工作的调度。相较上一代费米架构所有工作都是从CPU启动再回到CPU的原理,新架构无需CPU介入,使得很多程序直接可以通过GPU运行,为其他任务释放CPU的空间,以达到降低处理器负载的效果。

GPU独自分配任务(图片来自网络)

在这一代的700M系列移动端显卡中,730M、740M、750M、760M和780M等都采用了开普勒的架构,在提高性能的同时,功耗比十分出众,这对于笔记本和移动设备来讲,相当关键,全新架构的采用让笔记本降低了发热水平并增加了续航能力。

架构的更替 助显卡性能飞升

显卡架构的改变相较工艺上的提升让其性能和效率方面的变化更加明显,就NVIDIA的架构升级来讲,开普勒架构在功耗比上提升的优势完全是改进工艺后的费米架构所不能想象的,可以看到在费米架构推出之前,NVIDIA在架构升级的步伐比较缓慢,随着时间的发展,这种进步在逐步加快。

NVIDIA架构更新规划(图片来自网络)

费米架构延用了两年后推出了开普勒的架构,随着对于架构创新的加速,NVIDIA计划在明年推出全新的GPU架构“麦克斯韦”(Maxwell),首次整合64-bit ARMv8兼容架构的CPU核心“丹佛”(Denver),可以和Intel、AMD处理器合作支持统一虚拟寻址。

回到我们熟悉的笔记本显卡上来讲,每一代显卡的更新一般都会延用上一代的架构作为中低端的选择,并不是因为性能上老一代的架构产品就都一定比新一代架构产品性能落后,由于成本原因这样的解决方案是最合适。

以最新的700M系列移动端显卡来举例,710M和720M为费米架构提升为28nm工艺并加入了显卡加速技术的产品,而730M以上的产品则为基于最新的开普勒架构的产品。对于一般消费者来讲,在选购笔记本显卡的时候可以更关注一些架构核心的区别,而不仅仅只是看显卡的显存有多大,毕竟前者直接关系着显卡的性能水平。 

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑