重塑图形计算 NVIDIA GTX280性能实测

互联网 | 编辑: 张杨 2008-07-03 00:30:00原创返回原文

随着显示芯片已慢慢蜕变为GPU后，显卡已经被赋予了可编程的功能。在之后几年中，GPU也以超越CPU的速度而高速的发展。如今即便是最最便宜的显卡也可以实现一切游戏策划者需要的特效。无论是299、599还是1399、2199，它们之间的区别可能更多的是对于执行这些特效的速度，而并非

前言

Long Long ago的某天，我对自己新买的显卡说：“显卡显卡，你能提供什么特效”？显卡骄傲的看着我答道：“主人，我除了能满足你想要的特效外，我还能在你所玩的游戏中很好的发挥出这些特效”。时过境迁，我长大了，工作了，学会了使用Photoshop、Matlab、Adobe Reader、高清影片也让我变得欲罢不能。慢慢的，我走出了游戏，发现了另外一处让我值得去追求的乐土。但此时，我发现的一直陪伴着我的“朋友”却显得有些疲惫。我打开了机箱，拿出他，轻轻的抹去身上的灰尘：“显卡显卡，面对每天上百张高分辨率的图片，你能帮我加快读取速度吗？面对大容量的视频文件，你能帮我减少点压缩时间吗”？显卡惘然若失的看着我答道：“主人，我很想帮你，但我已经无能为力，我累了，想睡一会！”

随着显示芯片已慢慢蜕变为GPU后，显卡已经被赋予了可编程的功能。在之后几年中，GPU也以超越CPU的速度而高速的发展。如今即便是最最便宜的显卡也可以实现一切游戏策划者需要的特效。无论是299、599还是1399、2199，它们之间的区别可能更多的是对于执行这些特效的速度，而并非是否能执行。所以今天我们的主角——NVIDIA GeForce GTX280，他拥有一颗大型多线程多核的视觉运算的GPU，不仅使用了NVIDIA第二代的统一渲架构，更加入了相比前代性能有大幅度提升的平行计算架构。

GPU在以神的速发展并扩充

6月25号，极地列车载着GeForce GTX280来到我们PChome，其实在6月16号，我们就知道这这位乘客非同一般《怪兽来袭 NVIDIA新架构GT200评测前瞻》。通过初步的了解，我们发觉GT200拥有的并不单单是它强劲的游戏执行效能。以前，显卡在很大程度上为游戏和3D应用程序而服务的，但随着激烈的竞争与技术上的高速发展，客观上的成就了目前GPU的爆炸式成果。而GT200的运算能力已经达到了一个高度，甚至浮点运算的能力已经能大幅度的超越最高级别的处理器产品，好像我们所拥有的CPU与GPU，GPU已不单单只在玩游戏的时候才有用，而是在执行PC其它程序有用武之地了。

从93年开始，GPU的性能就以每年接近3倍的速度增长，这个数字已经超过了个人电脑中其它硬件子系统的发展速度。例如一颗频率为3.0GHz的P4处理器，它所拥有的晶体管为1.25亿，即使加上SSE指令集的SIMD，也只有6GFloPhotoshop的峰值浮点处理能力。但在相同时期，一颗GPU就可能拥有2.22亿个晶体管，峰值浮点运算能力突破40GFloPhotoshop。而现在，GT200的峰值浮点运算能力已经超过了1000GFloPhotoshop级，性能不言而喻。当然，我们还没有排除掉GPU还拥有属于自己独立的子存储系统——显存。

那如此看来，GPU拥有如此强劲的性能，它到底能在除游戏以外为非游戏程序进行优化处理呢？虽然浮点运算能力如此强劲，但它毕竟是基于其统一的架构，是无法与X86处理器相比拟的，那到底在何种情况下，我们才能利用GPU去达到这些程序的加速目的呢？

加速起源，何为CUDA

早在2002年，NVIDIA引入了GPU中计算的技术，将32位浮点技术搭载与GPU中，NVIDIA十分期待技术人员能将GPU超强的计算能力应用于程序，还不是图形。但早期的GPU是用类似OpenGL或Cg的图形API编程的，这些API是很难的，并且大多数技术人员对这类API也并不是十分的熟悉。

到了2003年，NVIDIA又开始了新的尝试，这次工程设计的尝试产生了后来在2006年出现在8系列GPU的CUDA技术。而目前所有8系列GPU，包括从笔记本电脑到高性能的系统，都具备了CUDA技术。只不过因为那时候CUDA还未成型，所以没有公布，而现在，基于CUDA的应用程序越来越多，因此伴随着GTX200系列芯片的发布，CUDA也同时正式大范围的推广并介绍给普通消费者。

GPU的性能正逐步变得强大，此时，无论是Intel还是AMD都发现了这一点，不过因为自身处理器发展成熟，所以两家处理器巨头都采用了GPGPU，也就是给予X86处理器构架的平台。GPGPU与NVIDIA概念上的区别就是，GPGPU的应用往往要了解OepnGL编程或者DirectX编程，而CUDA则是仍然通过API送入GPU。如果你应用不涉及到OpenGL或者DirectX的话，就可以不用理会API，也就是说GPGPU进行通用计算，是通过把这些问题转换成图形计算后送到GPU中完成的，而CUDA则可以直接调用GPU的计算资源，成为高性能计算的软件开发环境。

说了那么多肯定会有一些网友不太明白，CUDA究竟是什么呢？好了，CUDA（Compute Unified Device Architecture）就是NVIDIA推出的一个基于GPU的运算平台，它可以让显卡除了用于图像计算以外的目的。CUDA工具集的核心其实是一个C语言编译器。

CPU与GPU？CUDA适合大规模并行处理

可能说到这里，可能我会把网友们引入一个误圈里，就是目前炒得火热的“GPU与CPU事件”。对这个问题，是时候站出来吼一下了：“这显然是不对地”！显然GPU和CPU还是各自做着不同的工作的，GPU的计算主要集中与高效率低成本的高性能并行计算，所以事实上在一个系统里，一个高效的GPU配合高效的CPU，这样，整体的效率才会有很明显的提升。

CUDA还是比较擅长于某一方面的，而并非是面面俱到。CUDA开发平台是基于NVIDIA GPU的平台上，因此发挥GPU的并行优势才是最终的目的。从客观上考虑，CUDA对于非图形的计算，并没有任何的限制性，不过CUDA还是相对比较适合与高度并行的计算。这里所谓的高度并行的数量级为上千个，相对于CPU来讲，双核的CPU也许几个线程就能充满它整个的计算单元，然而CUDA-enabled GPU却能够容纳上千个线程（也就是GPU中数百个SP单元的功力），所以常遇到的高性能计算领域的问题就特别适用于CUDA，而之前通常采用计算机集群的方式来进行计算。

CUDA显卡支持列表

从NVIDIA GeForce6开始，就已经能够支持较为复杂的控制指令，比如条件的转移，分支以及循环和子程序用等。到现在的新一代显卡，GPU的程序控制能力又增强了不少，支持的程序长度也得到了扩展，也就是说GPU的任务不单单为一项，而是还可以写一些较为复杂的程序。

当然，万物皆不完美，其还是主要去做那些能够分成很多个独立线程的数值计算。比如说矩阵的乘法计算，矩阵相对应的元素的计算是没有什么联系的，可以很多个线程同时送入很多个处理器进行并行处理，这就非常适合于用CUDA来解决。当然并不是所有的事情CUDA都能够很好地解决，比如像操作系统这样复杂的指令和纷繁的分支循环而又用很少的线程来处理，这显然就不是CUDA的强项了。高度并行的计算是CUDA的技术特性之一。

目前来说，CUDA已经被应用在了许多领域中，包括在通用计算中的一些GPU加速，游戏中的物理模拟等等，而在科学计算中，CUDA可发挥的功效就更大了。比如有限元的计算、神经元的研究计算、地质分析等等科学研究的领域；当然目前GPU计算的应用还是处于一个早期的阶段，大部分CUDA应用都是专业人员和相关的程序员在开发，随着CUDA的广泛推行，以后会有实际的基于CUDA的程序，更多的程序员能够加入进来，并且开发一些可以给大家日常应用带来好处的程序，只要有支持CUDA的GPU就能够利用到GPU计算的好处。

在我们接下来将要测试的两个CUDA应用实例中，可以发现GTX 280在分布式计算和密集型计算时有着比CPU强上很多倍的能力，随着CUDA的飞速发展，越来越多的程序可以使用GPU来作计算，处理能力比CPU更为强悍，无论对于消费者还是NVIDIA来说，都是非常乐观和期待的。

实际检验CUDA加速体验：Badaboom

NVIDIA联合Elemetal制作了名为BadaBOOM Media Converter的视频转换工具，可以将众多的视频格式转换成直接能在PSP、iPhone等流行手持数码设备上播放的视频格式。软件基于CUDA开发，最大限度的利用GPU加速。不过目前这款软件尚处在测试阶段，仅支持GTX280和GTX260，且驱动程序必须使用ForceWare 177.34之后的版本。我们测试系统基于Q6700处理器平台，这也方面比较顶级CPU和顶级GPU在编码能力方面的差距。

BadaBOOM的界面简单，选择需要压制的视频和需要生成的格式即可。中间的滚动条可以设定转换品质，我们使用最高画质，输出为iPhone默认的分辨率，压缩一段MPEG2编码的动画视频。这段视频就是NVIDIA利用Autodesk MAYA软件制作的首部动画《The Plush Life》，这部720P的片源播放时间近12分钟，容量为183MB，GTX280的实时编码速度达到了155.1帧，完成整个编码过程仅用20几秒。

同样的平台下（Intel Q6700），我们改用最新的iTunes软件来试着压缩这段视频。

转换完毕，总共消耗3分9秒。

使用Wondershare iPhone Video Converter软件进行同样的转换格式工作，我们选择压缩格式为标准的iphoneH.264 480x320。

转换完毕得，到的结果是耗时1分16秒。

通过简单的体验，我们可以看到，通过BadaBOOM和两款软件对比后，之间的速度差距也十分直观放在大家眼前。但目前BadaBOOM只是测试版本，相信等到NVIDIA推出正式版本后，到时软件的兼容性更强，不单只有GT280能支持外，让中低端显卡用户也能感受到CUDA带来的喜悦。

实际检验CUDA能力体验：Folding@Home

Folding@home是美国史丹佛大学推动的分散式运算计划，目的在于使用联网式的计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程，并指引对由折叠引起的疾病的一系列研究。ATI早在2006年就加入了这个计划，最新的客户端能支持Radeon HD 2000/3000系列显卡，NVIDIA一直无缘这项可以说是全球最普及的显卡通用计算应用。

但在日前加州举行的一次媒体会议上，NVIDIA宣布NVIDIA CUDA显卡即将加入Folding@home计划。NVIDIA表示，目前全球有7000万块CUDA显卡（GeForce 8及以上，包括Quadro和Tesla系列），平均拥有100GFLOPS的浮点运算能力。如果这其中有0.1%参与Folding@Home，就能够为该计划带来7PFLOPS的运算能力，远远高于全世界最强大的超级计算机（运算能力不足1PFLOPS）。

目前NVIDIA CUDA显卡已经加入Folding@home计划，资料表明GTX280显卡可以在一天内模拟超过650纳秒的蛋白质折叠，而HD3870只能达到大约170纳秒，PS3仅仅100纳秒，四核心处理器更是不过4纳秒。这就是说，GTX280在这方面的性能是四核处理器的160多倍。

一直强调GPU Computing的GTX200系列首当其冲，我们利用CUDA开发的支持GTX280的Folding@home的客户端，进行了简单试用，在Forceware 177.39 beta驱动中开始加入了对CUDA的支持。Folding@Home是以ns/day来衡量性能的，我们看到GTX 280能提供621ns/day的计算能力，与而一颗四核心CPU的计算能力为4ns/day，HD3870的计算能力则为170ns/day相比，GTX280在此具备着极大的优势。另外，除了CUDA的运用随着NVIDIA的驱动开始对PhysX的支持，玩家更是可以体验到物理加速的快感。

衍生功能：PhysX 与通用处理

作为先前物理加速界的两大厂商，Ageia与Havok相继为NVIDIA与INTEL收购，而就在数天前，AMD方面也宣布与Havok展开合作。而NVIDIA方面则将Ageia物理加速技术融入了CUDA中，成为未来全系列NVIDIA显卡都具备的特殊功能。

对于G80架构及其衍生架构G92，GT200来说，其每一个SP都是一个独立的ALU矢量运算器，而PhysX物理技术仅需要强大的浮点运算能力即可完成。实际上之前Ageia的独立物理卡PPU亦可理解为通用浮点运算器+物理加速应用程序接口（API），而第一代独立PPU拥有25GFlops浮点运算能力。而GTX280/260的浮点运算能力已达到720GFlops/576GFlops，但目前的3D API决定Shader在同一周期内只能够处理1个除法运算或2个加法运算，同时Mini ALU可以充当SFU的角色，作3D+1D或2D+2D的运算。

换句话说，只要加载独立的PhysX API，现在的8/9系列显卡架构体系亦可实现PhysX运算——至少在增强了内部通用寄存器与数据流控制器（DME）的9系列显卡上可得以实现（从局部来看，8/9系列GPU本身已接近于IBM Cell芯片架构的RISC通用处理器）。因为所有的联合渲染器本身是可编程的通用浮点运算器（支持CUDA）。而此API很可能以Driver或外挂Driver的方式发布。

了解了NVIDIA PhysX的技术特性后，相信玩家都非常想知道都有哪些游戏可以支持PhysX技术。其实到目前为止，已经有超过150款游戏支持了PhysX，也就是说未来我们可以通过GeForce GPU来实现这些游戏的硬件级别物理加速。而且在游戏开发人员中已经有超过25000人在使用PhysX工作，目前世界上几个顶级的游戏开发组织也都宣布采用。未来会有更多的游戏支持NVIDIA PhysX。

不过据悉，PhysX物理加速芯片将不再继续开发，也就是不再会单独的出产PhysX显卡，取而代之的是建立在CUDA 2.0的新版PhysX驱动，即使电脑没有安装PhysX物理加速卡，所有拥有Unified Shader Processor的NVIDIA显示卡，包含GeForce 8及 GeForce 9家族，将拥有物理加速能力，提供单纯使用处理器多10倍以上的物理加速运算能力。所有目前已使用PhysX技术的游戏都支持新版驱动程序，如果装有支持CUDA平台的显卡，游戏将自动选取显卡进行物理加速运算，否则仍会使用性能较慢的CPU进行运算。此外，PhysX并不只使用于游戏市场，同时亦会运用CUDA通用运算领域上，应用更广。

实际检验PhysX物理加速：测试项目介绍

本次NVIDIA针对GT200所发布的GeFore Forceware 177.39 Beta驱动只支持于3Dmark Vantage和《虚幻竞技场3》中开启物理加速，并且还要为《虚幻竞技场3》打上一个超大的补丁新增物理效果的地图。因此在时间仓促之下，我们为了让网友更直观的看到物理加速的效果，在测试项目方面我们只选择了3DMark Vantage来进行测试。

3DMark Vantage可以给出准确、详细的测试得分来验证新驱动是否开启了物理加速功能。

在安装完GeFore Forceware 177.39 Beta驱动后，想要支持物理加速，177.39驱动以及NVIDIA PhysX v8.06.12物理驱动是必要的。

这个PhysX物理驱动的安装非常简单，直接点击下一步就可以顺利的安装完毕了。接下来就让我们来看看，在成功的开启GTX280物理引擎之后，性能上与画面上究竟有何区别与提升。

实际检验PhysX物理加速：检验结果

看到下面的图片，大家是否非常熟悉。的确，这里是3DMark Vantage测试中关于CPU Test2部分的测试，也就是一个物理加速测试的环节。测试的场景为一个飞机场，飞机都尝试着穿过圆形的障碍物。并且飞机尾部的彩色喷雾也会彼此产生交错。

在没有安装上PhysX物理驱动的时候，障碍物的数量为4个。

也就是在这张图片中，我们可以看到有4个圆形的障碍物，这4个圆形障碍物的多少是取决于处理器核心和物理加速是否存在的关键，每个核心代表1个障碍物。如果开启物理加速的话，那么物理加速将分别负担4个圆形障碍物，处理器1个核心负责物理卡，其余核心各自负责一个障碍物，也就是障碍物的数量等于处理器核心数减一再加四。（我们使用的处理器为Intel Q6700）

当我们安装完PhysX物理驱动以后，障碍物的个数增至7个。

接下来我们进行测试，测试的步骤为两部，首先是在没安装物理驱动前的成绩，Forceware 177.39 Beta驱动的单项测试。第二次是Forceware 177.39 Beta + NVIDIA PhysX v8.06.12物理驱动后的成绩。

选择Performance模式，Forceware 177.39 Beta单项驱动的测试成绩为P9731。

在相同平台下，同样选择Performance模式，Forceware 177.39 Beta + NVIDIA PhysX v8.06.12物理驱动后的测试成绩为P12093，提升幅度将近24%，十分惊人！

3DMark系列软件向来测试显卡的标杆型测试软件，看来NVIDIA留着一手，驱动的优化让整个性能得到了大幅度的提升，我们确实不可小看Forceware驱动开发小组啊！虽然这次的驱动是针对GT200发布的，但是之前我们说过了，即使GeForce 8及 GeForce 9家族也同样可以享受到这样的性能提升，并且NVIDIA宣称所有支持CUDA的显卡都可以获得PhysX物理加速支持，所以GeForce 9600 GT用户也不必太失望。

附：GPU加速运用之Adobe、Photoshop

在性能得以稳定的发挥下，而完全超越游戏，让GPU为其它应用程序发挥余热，这是此次NVIDIA GT200系列NVIDIA所给予的初衷。当然，NVIDIA能如此鉴定的喊出这样的口号，完全是基于NVIDIA的GPU已经站在了业界的前沿。在NVIDIA与Adobe公司合作后，为其Adobe Acrobat 8以及Reader 8系列软件都很好的提供了页面显示着色的技术，充分的利用GPU来加速对PDF格式的绘图文件进行显示。

同样一个容量达到50MB的期刊读物电子版PDF文件，在使用传统方式打开时，读取时间为8秒。而使用GPU硬件加速功能时，打开时间不超过3秒，且在浏览时不会有拖沓感，PDF文件也变得流畅异常了。

并且除了在效能上有所增加以外，还可以利用GPU的可编程特性（下面我们会有关于CUDA的详细介绍），来进一步加强对PDF文件中的2D内容拓展效果，包括平移、卷动与缩放等等，而实际上，Adobe Reader 8的每一项运用到GPU的功能都有着显著的效能增进。所以，我们在使用过程中可以有效的避免一些包括对比较精细的图片缩放读取出错、读取过慢等。

当然，除了Adobe阅读软件外，如今我们在日常办公中还会经常用到的Photoshop，最近NVIDIA也宣布了关于对Photoshop提供GPU加速功能。虽然Photoshop已经能够支持多核心处理器，但是在遇某些大分辨率的图片或者滤镜较为复杂时，速度仍让人许多精益求精的专业人士抓狂。对于他们来说，浪费时间就代表浪费金钱，浪费时间也意味着浪费生命。但是在Photoshop Creative Suite Next上，我们通过GPU、物理加速的支持（下面我们会有关于PhysX的详细介绍）。Photoshop在打开一个大容量、高像素的图像文件将会变得非常简单，对图片进行缩放、旋转也不会存在任何Lag。

附：GPU加速运用之Google earth、3D浏览

除了Adobe、Photoshop等常用的办公软件外，GPU加速也延伸到了Google earth。Google earth是一款3D地图显示软件，它能够将地球上某一区域的地貌，以3D图像的形式展现出来。这款软件读者都很熟悉，早期的Google earth从2D起步，但是随着深入发展和商业应用，这款软件也进入了3D化，很显然，这类软件将会逐渐成为我们今后生活的必备软件。

在Google earth的设置界面，如果你拥有一个性能强劲的显卡，那么可以将画质设置为最高，这是在没有GPU加速功能的PC上无法体验的速度感。


没有GPU加速状态下	GPU加速状态下

当我们以最高画质量为限查找地图街景时，带有GPU的PC系统可以流畅地进行地图缩放。而同样的场景、同样的搜索速度、同样的处理器，在没有GPU加速时，运转速度简直无法忍受，在Fraps显示的速率上，使用GPU加速和不使用GPU加速情况下，速度落差达到了几十倍之巨，由此可见，GPU的作用和意义绝不仅限于游戏。

图片浏览也向3D迈进—Google Picasa2。Google Picasa2是一款可帮助您在计算机上立即找到、修改和共享所有图片的软件。在使用NVIDIA显卡的电脑上使用Picasa软件，通过GPU加速，图片的拖放或文件夹切换，图片生成的速度都非常快，这跟我们采用NVIDIA的显卡是息息相关的。如果换用没有GPU加速的平台，搜索图片时生成速度可绝非一时一刻，前后对比，数倍的差异十分明显。

Pictomio是一个类似于Picasa的图片浏览和管理软件，它提供了极其华丽3D图片浏览效果。如果PC中具备GPU，那么完全可以利用强大的GPU将浏览方式变更为3D模式，无缝缩放、渐变式切换，效果十分惊叹。但如果没有GPU，平面的交互效果实在是太过让人失望了。

如你所见，视频功能的日渐丰富是当今计算机发展的主流趋势，这些软件通过GPU 的提升可以明显的得到更快、更连贯的显示效果。而这些性能的改变单靠提升CPU的运算性能，是无法完全实现的。可以说，GPU强大的浮点运算能力转化为全新的应用方式，将成为PC机正在经历的一场全新变革；我们的数字生活也将会因GPU的改变而步入全新的视觉时代。

GeForce GTX280 实物赏析

NVIDIA GeForce GTX280整卡长度为26.6cm，采用双卡槽设计。

显卡背面，在NVIO芯片、GPU、供电模块三个部分留有通风栅栏。

风扇进风口直径达到70mm，比以前的产品都要大。

采用6-pin+8-pin PCIE电源接口，顶部还有SPDIF输入接口

GTX280输出接口部分

SLI MIO接口用盖盖着，揭开盖子以后看到里面的MIO金手指。

GTX280的PCB板型设计用的是P651。

GeFroce GTX280 散热器赏析

整卡功耗达到236W的GTX 280对散热器是一个严峻的考验，不过初看起来，这个散热器和9800GTX所用的并没什么大不同，散热面积也只有2000cm^2左右。

不过仔细端详之后，你会发现GTX 280散热器上的热管达到了8根之多，这些热管分别将热量从铜底座导向散热鳍片与外壳。

散热器覆盖了GPU、7个mosfet、8块显存和NVIO芯片。

80*20规格的涡轮风扇采用的是Protechnic生产的风扇，也是近来NVIDIA公版散热器经常采用的风扇

GeForce GTX280 内部细节赏析

拆开以后可以看到，显卡有三部分组成：主卡、散热器和外壳。

GTX 280采用的黑色PCB板，是NVIDIA高端产品的象征。正反面各有8颗GDDR3显存一共16颗，总容量达到1GB

显存采用Hynix 0.8的GDDR3显存，额定工作频率为1200MHz，而GTX 280的额定显存频率为1107MHz，所以还留有一定的超频空间。

GTX 280的供电模块与以往NVIDIA的高端显卡大不相同，看不到以往那种大量电容矗立的情形，而采用了大量的陶瓷贴片电容，综合性能更好。供电电路采用VT1165MF控制芯片，最高支持6相供电技术。5块VT1165SF+2块VT238AWF电源芯片，内置了mosfet+驱动电路，组成5+2相供电电路。

GTX 280核心面积为576mm2，65nm工艺，晶体管数达到惊人的14亿个

NVIO芯片，一度被整合到GPU里的NVIO芯片又被移植出来

影驰GTX280赏析

影驰GTX280，我可以理解为是第一批GTX 280显卡中最快的一款，因为在性能方面有着其独特的卖点，它采用独家的超频版本，705/1400/2200MHz显存频率要高出公版GTX280(600/1300/2200)一筹，所伴随的也将是显卡性能上面看得见的提升。

另外，由于GTX280的售价十分昂贵，因此影驰这次针对旗下GTX280的上市搭配同为最高尊贵等级的零距离“VIP绿色通道”服务。所谓“零距离的星级售后服务”，意思是特意为购买GTX 280的用户开通了影驰VIP绿色通道，包括专人1对1为您解答问题，一级城市均实现收到卡的1个工作日内可返还，而其它城市的购买用户，也将会用最短时间内为用户提供准确有效的服务。

测试平台应用及介绍

测试平台方面依旧为我们评测室管用的一套平台，处理器选择了Intel Q6700（OC 333*9），硬盘容量为1TB 7200 11，电源为1200W，主板为Intel X48，内存DDR3 1066。此次测试的驱动是源自官方最新发布的驱动，GeFore Forceware 177.39 Beta驱动，最早支持NVIDIA CUDA程序的驱动是177.32。

关于游戏测试的设置环节，我们开启了所有可以打开的特效，并设置为最佳的效果，另外AA和AF抗锯齿方面均由游戏内建的情况而定，并不通过驱动面板进行强制的关闭，对于没有内建Benchmark的游戏来说，我们选用Fraps软件来测试，时间设定为60秒，场景则并固定，因此对于这样的成绩也只能作为参考，并不具备可比性。并且由于这次测试的显卡都是最顶级的，因此我们在游戏分辨率设置方面只测试了1680*1050和1920*1200两个分辨率下的成绩。

理论测试：3DMark 06

3DMark06主要使用最新一代游戏技术衡量DirectX 9级别的3D硬件。此前的3DMark都是随着新版DirectX和新一代硬件的发布而推出，在一定程度上限制了3DMark对最新硬件性能的充分挖掘。现在，DirectX 9已经发布3年，该级别的硬件已经遍布高中低各个领域，因此3DMark06可以完全利用DirectX 9的特性。事实上，3DMark06所有测试都需要支持SM3.0的DirectX 9硬件，不过只支持SM2.x的硬件也可以运行大部分测试。

1280x1024 NoAA/AF

1920x1200 NoAA/AF

理论测试：3DMark Vantage

对于3DMark Vantage我们肯定不能错过。3Dmark Vantage作为最新面世的DX10时代基准性能测试软件，其成绩尤其是GPU成绩是衡量DX10世代显卡性能的重要参考标准，与3DMark06相比，完全采用了全新的测试场景，其中两个GPU测试场景，两个CPU测试场景。在GPU测试场景当中，使用了最新的DirectX 10特效，对于不能够支持DirectX 10的产品来说，3DMark Vantage直接为他们选判了死刑，因此3DMark Vantage是一款更加之的测试的DX10基准测试软件。

Performance

Extreme

游戏测试：《西部狂野》

《Call of JuareZ》提供了非常好的Benchmark软件，让我们能简单的对游戏进行测试，而我们所使用的版本为官方最新的版本，因此所测试的结果还是具备一定参考性的。

游戏测试：《英雄连》

《英雄连》这款以二战作为题材的RTS游戏一经发布就备受好评，它采用了当时先进的游戏引擎，它最大的特点就是游戏场景会随着战斗的进行不断发生变化，可以被各种手段破坏游戏场景，比如大量的射击爆炸和烟雾效果，而且游戏的环境、道具和人物模型设计非常细腻。

测试方法：进入游戏图形设置选单，通过游戏自带的Benchmark进行测试，测试三次取平均值。

游戏测试：《失落星球》

《失落星球》是第一款进入我们评测室的DX10游戏，当时评测室的Pupa同学对此游戏的微操还是十分引人注目的的！从画面来说，无论DX10还是DX9版本，都非常出色，但除了绚丽的画面之外，游戏本身也是可圈可点，最大的特色就是节奏紧凑、战斗过程紧张、激烈、刺激，关卡的BOSS战需要很高的操作技巧和灵活性，需要反复尝试才能通过，这非常适合那些喜欢挑战极限的玩家。

测试方法：游戏自带了Benchmark测试软件，但是对于《失落星球》的测试分为两个场景，包括Snow和Cave，我们的测试方法是这样的，通过两个场景下的成绩相加后相除，得出一个平均成绩。

游戏测试：《冲突世界》

《冲突世界》采用了自行研发的MassTech引擎，支持多种当前的主流显示特效，如容积云，景深效果，软阴影等，光照系统也表现出色，尤其是半透明的容积云特效营造出了十分逼真的户外场景，物理加速结合体积光照渲染出了最逼真的爆炸效果。

测试方法：《冲突世界》和《英雄连》类似，所附带的Benchmark也是选择了一段非常华丽的过场动画作为测试程序，最终得出最大、最小和平均FPS，测试结果非常精确。

游戏测试：《孤岛危机》

Crysis（孤岛危机）无疑是现阶段对电脑配置要求最高的PC游戏大作。Crysis的游戏画面达到了当前PC系统所能承受的极限，超越了次世代平台和之前所有的PC游戏。

测试方法：由于游戏自带了Benchmark，我们通过测试三次取平均值。

游戏测试：《使命召唤4》

尽管不是一款基于DX10引擎设计的游戏，《使命召唤4：现代战争》的画面效果、逼真程度毫不逊色于一些所谓的DX10游戏，它真正吸引人的地方还是其超高的可玩性和现场感，以致于不少玩家抱怨COD4的关卡过少，还没玩过瘾就已经通关，只能期待资料片的放出。

测试方法：进入游戏的开始阶段，测试游戏开场一段直行线路，利用Fraps软件记录成绩，多次测试取平均值。

游戏测试：《虚幻竞技场3》

相继几款采用《UT3》引擎的热门游戏大作发布之后，《虚幻竞技场3》终于在玩家们的期待中亮相了。《虚幻竞技场3》采用了最新的“虚幻3”游戏引擎开发，画面效果十分震撼，这在其他几款同样引擎的游戏中也有所体现。

测试方法：采用第三方软件开发的Benchmark软件进行测试，多次测试取平均值。

总结

GT200的发布，并没有如以前NVIDIA发布新一代产品那样大张旗鼓的宣传其一直遥遥领先于对手的3D性能，而将重点更侧重于GPUComputing上。而单从3D性能来看GTX280足以通吃所有DX9以及DX10游戏，包括《Crysis》在内，也能以高分辨率对抗。但这次对于在图形芯片领域里一直领先的NVIDIA，此次对于GT200的出现却一再的唱着“未来GPU才是计算机核心的理念”，鼓励电脑厂商在电脑上采用更主流的显示芯片，而减少对高性能处理器的使用。在我们这次所测的两个CUDA实际运用中，可以很明显的发现，GT280在分布式计算和密集型计算时有着比CPU更为强大的运算能力，那么随着CUDA的发展，也将会有越来越多的程序、软件可以使用GPU来计算，这无论对我们消费者还是对NVIDIA来说，都是值得期待的一件事，并也将意味着GPU今后的发展已经不能完全用游戏来衡量了。

莱曼就这样丢了球

双架构设计的统一体，在图形处理功能的基础上大幅提升了并行计算能力。全新的GT200为我们掀起了一次图形的革命，也是NVIDIA在图形技术方面的另一次释放！而GT200设计所遵循的两个原则"Beyond Gaming"和"Gaming Beyond"实际上是双架构设计的一种很好地诠释。测试到结尾，也看到了本站编辑Tom同学所测得的对手AMD-ATi的新一代4系列显卡的成绩（红色革命 ATI 4800系列显卡激情详测），想说的突然变得很多。所谓“黄氏定律”，每六个月将产品升级一次，性能翻番，面对NVIDIA在直道前方出现的拐点，将是面临一次革命还是一场浩劫，土耳其最后的2分钟“Everything is possible”。

更多精彩的最新配件资讯，请点击进入硬件中心！

大家如果对本栏目有任何建议、意见或任何IT配件资讯的投稿，欢迎发邮件到zhang.yang@staff.pchome.net，我们会尽快给予回复。最后，硬件频道全体同仁感谢大家对PChome一贯的关注和支持!

返回原文

本文导航

每日精选

万级大电池开始普及 OPPO首款破万电池手机来了

OPPO即将推出的OPPO A7 Pro Max，将搭载10000mAh单电芯超大电池，这也是OPPO品牌旗下首款电池容量突破万级的智能手机，该机还配备80W超级闪充，兼顾超大电池与高效补电速度。

标签： OPPO| OPPOA7ProMax| 电池| 2026-07-21
小米18系列或取消Ultra版本标准版诚意十足

据外媒消息称，小米18系列迎来重大产品策略调整，将取消Ultra影像旗舰，仅推出小米18、小米18 Pro、小米18 Pro Max三款机型。

标签：小米| 小米18| Ultra| 2026-07-21
欧盟对阿里AliExpress开出5.5亿欧元罚单 DSA实施以来最高

欧盟委员会宣布，对阿里巴巴旗下跨境电商平台速卖通（AliExpress）处以5.5亿欧元罚款，认定其违反《数字服务法案》（DSA）关于评估和降低非法商品传播系统性风险的相关义务。

标签：阿里| AliExpress| 罚单| DSA| 2026-07-21
AI分级国标测试结果公布 11款手机获L3级认证

在2026世界人工智能大会上，《人工智能终端智能化分级》国家标准实施后的首批测试结果正式公布。华为、moto、荣耀、vivo、OPPO、小米与STEPX Neo等品牌的9款手机，荣获L3辅助级认证。

标签： L3| 国标| AI| 2026-07-21
AI分级国标产品测试成果公布 9款电视斩获L3级

2026世界人工智能大会现场发布《人工智能终端智能化分级》国家标准落地后的首轮产品测试成果，其中电视品类共计9款产品成功取得L3级认证，包括华为、索尼、TCL、海信等头部品牌。

标签：电视| 华为| 海信| TCL| 索尼| 2026-07-21
小米平板9入网信息曝光 9720mAh电池、标配45W快充头

爆料信息称，小米平板9定位常规大尺寸平板，搭载骁龙8系旗舰处理器；续航迎来明显升级，电池容量提升至9720mAh。

标签：小米平板| 小米| 平板| 小米平板9| 2026-07-21
暑假换机首选！990g机身45W性能，华硕a豆14 Air 2026闭眼入

如果你的预算在6K-7K左右的话，那么今年暑假值得重点关注的一款产品，就是华硕a豆14 Air 2026高性能AI超轻薄旗舰本。

标签：华硕| a豆14Air| 换机| 导购| 2026-07-21
刷新行业速度长城H10预售12小时斩获2.2万订单

长城H10开启预售12小时内订单即突破22615台。这款21.48万起的“方盒子大六座”SUV，凭借精准的市场定位、硬核的智能与动力配置以及“一个长城”的品牌背书，成功点燃了中国大家庭的出行热情，成为年度爆款。

标签：长城| H10| 预售| 2026-07-22
双重成本压力来袭 iPhone 18系列涨价成定局

iPhone 18 系列涨价已成定局，全系机型售价将迎来上调，高端版本涨幅尤为明显。

标签：苹果| iPhone18| 涨价| 2026-07-22
机构看好苹果折叠屏预测市场份额超越华为

市场调研机构预测，随着iPhone Fold正式登场，全球折叠屏市场竞争格局将彻底改写，形成三星、苹果、华为三足鼎立的全新态势。

标签：苹果| 华为| 折叠屏| 2026-07-22