真省电 NVIDIA Maxwell架构节能技术

PChome | 编辑: 孙伟 2014-03-13 05:00:00原创

NVIDIA的第一代“Maxwell”架构在架构方面实现了多项增强,这些增强之处旨在发挥出更高的性能和功率效率。首款基于 Maxwell 架构的 GPU 代号为 “GM107”,专为笔记本和小型 (SFF) PC 等功率受限的使用场合而设计。这些小型系统通常用于游戏和家庭娱乐,最近的例子是 Valve Software 新近发布的 Steam Machines 运动。 首款基于 GM107 GPU 的显卡是 GeForce GTX 750 Ti。 因为 GM107 惊人的架构效率,在 1080p 分辨率下,GeForce GTX 750 Ti 的性能通常可与我们四年前的旗舰 GPU —— GeForce GTX 480 比肩,然而热设计功耗仅为区区 60W,是后者的四分之一。GM107是首款利用第一代 Maxwell 架构打造出来的 GPU。 这些第一代 Maxwell 产品专注于低功耗工作场合。 NVIDIA晚些时候还将推出性能更高的第二代 Maxwell GPU,以满足高性能与发烧友市场的需求。

NVIDIA Maxwell架构节能技术法宝:流处理器管理

Maxwell 针对流式多处理器 (SM) 而采用一种全新设计,可大幅提高每瓦特性能和每单位面积的性能。 虽然 Kepler SMX 设计在这一代产品中已经相当高效,但是随着它的发展,NVIDIA 的 GPU 架构师看到了架构效率再一次重大飞跃的机遇。Maxwell SM 设计实现了这一愿景。

控制逻辑分区、负载平衡、时钟门控粒度、调度、每时钟周期发出指令条数等方面的改进以及其它诸多增强之处让 Maxwell SM (亦称 “SMM”) 能够在效率上远超 Kepler SMX。全新的 Maxwell SM 架构让我们能够在 GM107 中将 SM 的数量增加至五个 (相比之下 GK107 中只有两个),而芯片面积却仅增加 25%。

NVIDIA Maxwell架构节能技术法宝:负载平衡

Maxwell 效率上的提升主要归功于全新的 Maxwell SM 架构,即 SMM。这种全新的 SM 架构可大幅提升节能性,而且在着色器有限的工作场合中可令每个 CUDA核心的性能提升 35%。实现这些进步需要对架构进行大量重大更改。 NVIDIA 重新编写了 SM 调度器架构和算法,使其更加智能,避免了不必要的停顿,同时进一步降低了调度每条指令所需的能耗。

NVIDIA在 Maxwell更改了 SM 的组织方式。 每个 SM 分为四个独立的处理块,每个处理块具备自己的指令缓冲区、调度器以及 32 个 CUDA 核心。 Kepler 的方法是划分为非2幂 (non-power-of-two) 数量的 CUDA 核心,其中一些是共享核心,这种方法现已弃用。新的划分方法简化了设计与调度逻辑、节省了面积与功耗、降低了计算延迟。

成对的处理块共享四个纹理过滤单元和一个纹理高速缓存。计算一级高速缓存的功能也与纹理高速缓存相结合,而共享显存是一个独立的单元 (类似首款 CUDA GPU —— G80 中所使用的方法),被全部四个块共享。

总体而言,在这一全新设计上,每个SMM的尺寸得到大幅缩减,而性能却能够达到一个KeplerSMX的90%。更小的面积让NVIDIA能够在每颗GPU中实现更多数量的SMM。通过对比GK107和GM107 SM总数的相关指标可发现,GM107有五个SM,而前者只有两个。GM107的峰值纹理性能比前者高25%,CUDA核心数量多1.7倍,着色器性能大约高2.3倍。

NVIDIA Maxwell架构节能技术法宝:片上缓存及显存

Maxwell 包含了容量大增的二级高速缓存设计,GM107 中的容量为 2048KB,而 GK107 中的容量仅为 256KB。 由于片上高速缓存容量更大,因此需要向显卡 DRAM 发送的请求更少,从而降低了整体显卡功耗、提升了性能。

对 GM107 来说,要在显存位宽与 GK107 相同的情况下实现性能大幅提升的目标,增强显存系统也同样重要。内部显存系统带宽实现了提升,另外这一设计的效率也得到了改善。此外,2MB 大容量二级高速缓存配置 (比之前的任何 GPU 设计都大) 十分有效地降低了显存带宽需求,确保了 DRAM 带宽不成为瓶颈。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑