揭真相:Kepler的CUDA还和Fermi一样么

PChome | 编辑: 夏阳 2012-04-28 05:00:00原创返回原文

千元级霸主 HD7700系列推荐

也许大家还沉浸在开普勒Geforce GTX680带来的惊艳体验，但我们从架构以及蛛丝马迹中发现出一些与费米不太相同的地方。当然，要取得质的飞跃，进行大刀阔斧的架构优化和改进也是必然的做法。

制程的提升只能改变核心面积以及功耗，但晶体管该需要多少还是需要多少，为什么费米的CUDA数量以及纹理单元暴增了数倍，晶体管反而仅仅增加5亿？难道缩减的光栅单元和显存控制器如此耗费晶体管数目么？为什么同样是200MB的显卡驱动，新版为什么只能兼容Geforce GTX680而改变以往一款驱动可以兼容全系列的情况呢？

在Kepler发布之前有小道消息传出代号为GF104的Geforce GTX680会采用SIMD矢量架构运算模式，以全能的CUDA内核改为包含仅擅长游戏处理的顶点以及着色功能的部分，在正式发布之后也没有明确证实这一点，仅仅是告诉了大家在游戏性能方面会给大家一个惊喜，并且不屑的称对手Tahiti只是纸老虎，事实证明了Kepler不管做了什么样的改变，的确至少在游戏方面大获全胜。

通用计算实际上是指开放性利用可编程语言和接口通过调用GPU来完成本应CPU来完成的部分或全部任务，那么这就需要通用计算处理器本身的体积是比较庞大的。由于游戏的处理和通用计算是不沾边的，那么Kepler完全就没有保留通用计算的必要——Tesla足以，那么在削去CUDA本身的构成是正常的了。

Fermi的工作组（SM）以及CUDA单元的构成示意图

先了解一个数字，Geforce GTX680相对Geforce GTX580在单元上的变化：CUDA单元3倍，纹理单元2倍，显存控制器和光栅单元2/3倍。

特别是我们知道单从数量上看，试猜想CUDA本身体积得到削减，那么再借助28nm的制程，将面积控制的反而比GeforceGTX580还要小很多是很正常的，另外晶体管数量仅仅多出了5亿，没有因为增多删少而在数量上多出许多。因此可以确定：CUDA还叫CUDA，只是构成和Fermi不一样了。

殊途同归配比源自成功案例

事实已经证明了GF104/GF114的构成配比是完美的，那么根据他们的架构图对比Geforce GTX680有很多相似之处。例如同是8个工作组，光栅单元和位宽也都是相同的，不同的是SMX取消了分频之后，即Shader和核心是同步的，但弥补这一点的做法也有，如每个工作组SMX的CUDA有了4倍的提升，而为了对应、匹配，纹理单元也提高2倍。

GF114完整规格示意图

GF104示意图

着色器频率相对来说降低一倍，而纹理单元等增加一倍，如果按照4D的说法来解释的话，Geforce GTX680不就是GTX560Ti的4D SIMD版么？

以296.10版驱动为例，只要是桌面型号，并且操作系统对应，那么在www.nvidia.cn官网上搜到GTX580的驱动都可以驱动GT430，也可以驱动GTS250。

为一个型号的GPU就单独开发一款驱动那实在是太费事了，况且基本架构都相同，在驱动的核心部分例如编译器等之类的程序完全是相同或者是相互兼容的，因此按照惯例来说301.10版驱动是不分型号的，而在www.nvidia.cn官网上默认弹出的Geforce GTX680版驱动只能用于驱动Geforce GTX680，也就是说Geforce GTX680的驱动是专用的，而驱动文件体积仍然是200MB，难道这也意味着驱动核心文件中仅包含的一种编译器，这种编译器又不能驱动除此之外的显卡，这就符合我们猜测的SIMD设想。

如果按照“SIMD”的设想是完全解释的通的，AMD在上代HD6970中就正是这样的架构：1536SIMD ALU，256Bit显存位宽，32光栅单元，并且是AMD一贯奉行的CoreClock与ShaderClock同频，只不过AMD类似线程指派器这样的仲裁单元少于NVIDIA而导致利用率不佳罢了。

其实无论是所谓的SIMD，还是MIMD，对于用户而言并不太重要，而至于在家用的范畴中也不需要保留通用计算的功能，追求能耗比和易用等改进才是可取之处。从开普勒的架构中我们仿佛可以看到AMD和NVIDIA似乎殊途同归，而冥冥之中似乎又能感觉到融合和异构的雏形。

返回原文

本文导航

每日精选

首款安卓阔折叠！三星Galaxy Z Fold8系列抢先上手

三星折叠屏家族全面革新！阔折叠Z Fold8、大折叠Z Fold8 Ultra、小折叠Z Flip8，三款新品同台亮相。本期抢先上手，带你一次看个够。

标签：安卓阔折叠| 三星| GalaxyZFold8| 三星阔折叠| 2026-07-22
三星Galaxy Z Fold8系列发布大阔折12999元起

三星新款折叠屏手机如期而至，这三款手机全系搭载第五代骁龙8至尊版（for Galaxy），配备One UI 9系统，同步升级屏幕、机身工艺与Galaxy AI能力。

标签：三星| GalaxyZFold8| 发布| 2026-07-22
首款安卓阔折叠！三星Galaxy Z Fold8正式发布

三星推出新一代Galaxy Z系列折叠屏手机——Galaxy Z Fold8 Ultra、Galaxy Z Fold8及Galaxy Z Flip8，以更完整的产品矩阵和差异化的体验定位，为全球消费者提供更丰富的折叠屏选择。

标签：三星| GalaxyZFold8| 安卓阔折叠| 阔折叠| 2026-07-22
OPPO Find X10系列真机开测横向阶梯镜头模组

近日有网友曝光，三台OPPO Find X10系列新机正与iPhone 17 Pro同台开展影像对比测试。

标签： OPPO| FindX10| 影像| 2026-07-23
AMD宣布与Anthropic达成合作拟投资最高50亿美元

AMD向Anthropic投资至多50亿美元，锁定2GW Instinct MI450芯片大单，对英伟达发起最强挑战。

标签： AMD| Anthropic| AI| 合作| 2026-07-23
三星Galaxy Watch Ultra2/Watch9开启预约 8月7号正式发售

三星全新Galaxy Watch Ultra2、Galaxy Watch9智能手表现已开放预约，将于8月7日全渠道正式发售。两款新品均搭载骁龙至尊版可穿戴处理器，完成高端产品线的全面升级。

标签：三星| 智能手表| GalaxyWatch| 手表| 2026-07-23
索尼发布全画幅电影摄影机FX5 支持5K Open Gate与机内RAW

索尼正式发布Cinema Line全画幅电影摄影机FX5，定位介于FX3与FX6之间，搭载全新堆栈式传感器、三原生ISO、机内16-bit RAW录制及Open Gate片门全开功能，进一步将旗舰级电影拍摄能力下放至3万元级市场。

标签：索尼| 全画幅| 摄影机| FX5| 2026-07-23
三星推出全新智能眼镜搭载骁龙AR1 Gen1、双大牌联名

三星正式推出全新智能眼镜Galaxy Glasses，搭载高通骁龙AR1 Gen1芯片，携手潮流眼镜品牌Gentle Monster、美国国民眼镜品牌Warby Parker联合设计打造。

标签：三星| AI眼镜| 智能眼镜| 眼镜| 2026-07-23
荣耀启用全新品牌标识荣耀之环敢想敢不同

荣耀终端股份有限公司CEO李健官宣，荣耀将在原有字母标识基础上，新增专属图形标识“荣耀之环”，同步启用全新品牌主张“敢想，敢不同”。

标签：荣耀| 荣耀之环| 品牌标识| 2026-07-23
上半年国内学习平板市场量额双降头部四大品牌市占率近八成

受政策红利消退、行业竞争加剧、用户消费及需求迭代等多重因素叠加影响，国内学习平板行业整体承压，呈现销量、销售额双下滑的发展态势。

标签：平板| 学习平板| 作业帮| 学而思| 2026-07-23