巨擘GF100不够灵活 击垮对手还需小核
● 巨核注定难成中流砥柱,NVIDIA重新设计寻求突破
与RV870相比,GF100确实技高一筹,可是进入市场后却没有看到预期中的强烈反响,ATI显卡价格依然坚挺,NVIDIA呕心沥血开发出的先进产品仿佛就要被寂静淹没。
造成这个现象有几点原因:第一,基于GF100核心的三款显卡GTX480/470/465都属于高端定位,关注人数本来就少;第二,同级别的显卡相比,GTX480比HD5870贵了将近1000元,而且它们之间的性能差距远没有这么大;第三,NVIDIA在GF100上过于追求性能,而忽略了显卡的其它一些重要元素,它的噪音、功耗、发热都令人难以忍受。
NVIDIA在G80时代遭遇的尴尬又再次重现,性能强,技术先进,却得不到市场认可。在GTX400系列现有的产品中找不到像8800GT那样的高性能消费级产品。价格最低的GTX465也卖到2000元左右,离主流游戏用户所能接受的上限1500元相去甚远,而且它同样使用GF100核心,芯片成本不会比GTX480低多少,很难再做出降价调整。
想推广一个先进的产品系列,最好的办法就是让人们使用它,这样才能切身体会到它的优点,人们之间的口口相传会形成比任何广告都宝贵的口碑。可是现在消费者的目光依然聚集在以5830为首的中高端显卡上,NVIDIA迫切需要一款价格让大多数人都买得起,性能不比GTX465差的产品,它同时还需具有静音、低温、低功耗的特性,让人们使用它时觉得宽松而惬意。另外作为中流砥柱的产品还必须产能充足,它显然不能再通过GF100削减规格获得,必须让台积电的300mm晶圆上能切出更多的芯片,那么唯有原生设计这一条路可走。
既然GF100已经将架构设计的大方向定了下来,再开发低级别的芯片就非常容易了。最简单的办法是直接取GF100的一半规格,保留256个流处理器、256bit显存位宽,可是NVIDIA没有选择这条捷径,最后摆在我们面前的GF104出乎意料。
● SM架构重新排版 配置均衡性能更强
就如我们之前猜测的一样,GF104确实是8个SM,但是SM内部却发生了变化。每个SM包含的流处理器数量从32个增加到48个,总数为384个,SFU和纹理单元数量是原来的两倍,任务指派单元Dispatch Unit从两个变成四个。
在GF104里,流处理器和Polymorph的比例为48:1,而GF100的这个比值是32:1。GF100每个SM里只有4个纹理单元,与流处理器的比值为1:8,GF104每个SM里有8个纹理单元,比值为1:6。
DX11的曲面细分在游戏中应用十分有限,GF100里16个Polymorph明显过剩,GF104提高流处理器和Polymorph的比例使实际应用中资源的利用更平衡;原本GF100在《孤岛危机》这种大量采用细致纹理贴图的游戏中表现不理想,那是因为相对较少的纹理单元制约了流处理器性能发挥,GF104将纹理单元数量翻倍解决了这一瓶颈;每个SM内流处理器数量增加,势必会造成任务指派单元的负载繁重,因此Dispatch Unit的数量也翻倍。
● GF104变成长方形 各种顽疾一去不返
GF104是NVIDIA首款长方形的GPU,晶体管数目为19.5,比RV870少2亿。我们还未得到它芯片面积的确切数据,根据以上数据猜测可能低于330mm²。
通过NVIDIA的各种调整和改进,GF104的核心计算规模保留了GF100的70%以上,同时将原来的功耗、发热、噪音的阴霾一扫而光。可即便如此,为了进一步提高良率,保证充足的货源,NVIDIA还是将GF104像GT100那样关闭了一组SM,对应显卡型号为GTX460。它的实际流处理器数量为336个,纹理单元为56个,派生出两款子型号,由显存位宽做出区分,分别是256bit/192bit,价格定位1499元/1299元。
网友评论