全新的NVIDIA GTX16系显卡虽然在命名上依然采用了GTX前缀,但核心却采用了与RTX20系显卡一样的Turing架构。同样是Turing架构,GeForce GTX 16系显卡与RTX 20系显卡有何不同?与GeForce GTX 10系相比有何提升?下面为大家带来详细解读。
在过去的五年时间里,游戏本市场迎来了爆发式增长,很多台式主机游戏玩家已经逐渐换用笔记本去玩游戏,希望能在移动平台上也享受到畅快的游戏体验。作为游戏本中最重要的部件之一,显卡对用户的游戏体验至关重要,NVIDIA作为图形显示方面的领军企业,其GeForce系列游戏笔记本成为增长最迅速的游戏平台。4月23日,搭载NVIDIA全新GeForce GTX16系显卡的游戏笔记本产品全面上市,包括联想、华硕、惠普等多个厂商都第一时间推出了相应产品。
全新的GeForce GTX16系显卡,虽然在命名上依然使用GTX前缀,但核心却采用了与RTX20系显卡一样的Turing架构。同样是Turing架构,GeForce GTX 16系与GeForce RTX 20系有何不同?与上代GeForce GTX 10系显卡相比有何提升?在早前的NVIDIA技术交流会上,我们进行了深入的了解。
完整的NVIDIA RTX结构
Turing是NVIDIA第12代GPU架构,在这一代架构里面,最重要的变化就是加入了RT Cores光线追踪核心和Tensor Cores张量核心,但其实整个Turing的架构很复杂,里面也并不只有这两个核心。GTX16系显卡与RTX相比,最显著的差异在于去掉了这两个核心,但基于架构优势,它在游戏里依然可以获得部分Turing架构可以获得的好处。
具体来说,有几个方面。
首先,是并发式的浮点和整数指令同步执行。在很多游戏里面或者很多应用程序里面同时有浮点和整数指令运算,并发执行可以让GPU运行的更有效率。
以《古墓丽影:暗影》游戏为例,每100个指令集里面有38个整数,有62个是浮点。如果使用以前的Pascal架构的GTX 10系来做处理,整数和浮点是没有办法同步执行的。100个指令要单独先做浮点,再做整数的。在做浮点运算的时候,整数的那部分就闲置继而造成资源浪费。如果使用新的Turing架构的GTX 1660Ti和Pascal架构的GTX 1060作对比的话,前者只要62个指令就可以把所有100个指令全部执行完成,换算下来的话执行效率就提升了38%。
其次是缓存结构的变化。之前Pascal的架构时候做数据交换每个L1缓存的位宽和容量都是比较小的,中间还有一些是共享的显存部分。每一个显存区块用到的地方是不一样的,并不能共享。而在Turing架构里面,这一部分缓存是打通的,这样的话L1的缓存会更大,L1缓存做交换的数据位宽也更高,提升了整个数据交换的效率。
最后,还有自适应着色技术,这部分很好理解。正常一个画面,如果用百分之百的精度去渲染的话,它用到的Shader(着色器)资源就是百分之百,但其实在一个画面里并不是所有的部分都需要用百分之百的精度去做渲染的。比如说有些阴影的部分以及重复帧,使用百分之百的精度和百分之八十的精度去进行计算并没什么区别。Turing架构里面使用的自适应着色技术,可以根据这一帧里面的不同部分,做不同精度的渲染。由于略去了那些无效的计算,这能够节省最多40%的Shader资源,带来了显著的性能提升。另外由于DirectX 12已经集成了可编辑着色,因此基于图灵架构的GPU在DirectX 12里面的性能会更好。
测试数据显示,使用GTX 1660 Ti的笔记本与采用GTX 960M的笔记本相比性能提升了差不多4倍,与GTX 1060相比有着30%的提升,这将带来体验上的绝对提升。采用GTX1660 Ti的笔记本和GTX 1070相比,性能基本持平,但它支持更多的新技术,同时在功耗上面更有优势。现在的游戏笔记本市场里面,有75%以上的用户还在使用老的平台,这些用户是非常适合升级到GXT 1660 Ti新平台的。目前热门的游戏如《绝地求生》、《堡垒之夜》、《Apex英雄》等都能以100帧以上运行,完全可以获得良好的游戏体验。
不过还有一个问题,既然GTX 1660 Ti性能与GTX 1070差不多,为什么不买GTX 1070呢?
GTX 1660 Ti跟GTX 1060笔记本的对比显示,在不同游戏里面的性能倍率,越是新发布的游戏,采用Turing架构的笔记本产品领先的百分比越高,也就是说新硬件对于新游戏的支持更好。虽然目前有很多经典游戏大作,但随着时间的推移,玩家们还是会去玩新游戏。如果想畅玩近两年新出的游戏,使用基于图灵架构的GTX 1660Ti笔记本,将获得比采用Pascal架构的产品更好的体验。
此外,现在越来越多的游戏玩家加入到了主播的行列,在玩游戏的时候同时进行直播。NVIDIA在新的Turing架构里面,也更新了直播部分的一个编码,使用专门的encoder编码器在不影响系统CPU性能情况下,可以把画质做得更好,CPU占用率只有2%,不会额外占用GPU的资源,也不会影响在游戏当中的性能。
与此同时,全新的GeForce GTX16系显卡还带来了一款入门级的产品,GTX 1650,这款产品的性能可以达到GTX 950M的两倍,与台式机的GTX 1050相比大概有1.7倍的性能提升,在大部分主流的游戏中也可以跑到60帧。
根据NVIDIA提供的数据,使用GTX 16系列Turing GPU的笔记本基本涵盖了所有主流OEM品牌,全球范围内将有80多款搭载GTX 16系GPU的笔记本陆续上市,包括联想、华硕、戴尔、惠普、微星、神舟、机械革命、雷神和机械师等众多品牌。
另外,NVIDIA从2014年开始推出Game Ready Driver(GRD)驱动,至今已经有超过220款游戏得到了支持,通过NVIDIA与游戏开发商的合作确保玩家在入手新游戏后,便可以直接通过NVIDIA进行硬件级驱动。除了游戏用户,视频剪辑、摄影师、设计师等内容创作者也是高性能电脑及高性能显卡的又一主要消费群体,针对这一不断增长的用户需求,NVIDIA从显卡驱动更新方面与游戏用户做出了区分。
游戏玩家需要频繁更新驱动以满足最新游戏的畅快体验,但对于内容创作者来说,频繁更新可能为内容制作软件带来问题,他们需要高性能的同时更要保证系统稳定性,毕竟专业软件(如Adobe Premier、Photoshop、3dMax等)的更新周期要长很多。所以NVIDIA针对内容创作者新添加了“NVIDIA Creator Ready(CRD)更新。在今后更新时,用户可以灵活选择自己需要的驱动进行更新(GRD与CRD两者不可以同时使用)。
NVIDIA表示,尽管CRD更新周期比GRD长、频率相对较低,但针对创作型软件不仅会完成加速等优化,相比GRD还会增加一项“深度测试”,以针对不同版本软件实现更细致、全面的测试,从而最大程度上杜绝不稳定问题。NVIDIA在加强GTX/RTX显卡硬件性能的同时完成软件优化,无疑能够为内容创作者用户带来更好的使用体验。
(文章部分图片来自NVIDIA官方网站)
网友评论