苹果推出了M1系列芯片中的新型号M1 Ultra,由两颗M1 Max芯片融合而成,采用5nm制程,晶体管数量高达1140亿,集成20核CPU与64核GPU,支持最高128GB统一内存,带宽高达800GB/s,实现了超高的能效比。
今天凌晨举行的苹果春季新品发布会上,我们没有等来Apple M2芯片,但比M2还令人兴奋的是M1家族中的究极型号——M1 Ultra,原先以为Max就是M1系列中的顶级型号,看来还是我们天真了,没准儿明年还会有M1 Extreme。
先来看看M1 Ultra芯片的规格:
·5nm制程,晶体管数量1140亿
·最高128GB统一内存,带宽800GB/s
·20核CPU,包括16个性能核心与4个能效核心
·64核GPU,8192个执行单元
·32核神经引擎,性能是M1的8倍
·支持H.264、HEVC、ProRes、ProRes RAW硬件加速,2个视频解码、4个视频编码、4个ProRes编解码引擎
顶不顶?这样的规格如何实现?
很简单,可以看作是两颗M1 Max连接在一起,也就是多芯片封装MCM(Multi-Chip Module)。
这样的架构有点眼熟吧?没错,就是类似AMD ZEN的Chiplets设计,民间俗称“胶水大法”,用过AMD线程撕裂者(Threadripper)处理器的用户应该不会太陌生。英特尔新的至强处理器采用的Sapphire Rapids也是这个路子,据传NVIDIA在下一代GPU中也会采用MCM的封装方式。但令人惊艳的是,M1 Ultra中两颗M1 Max采用的芯片间互连模块(die-to-die connector),带宽高达2.5TB/s,苹果称之为“Ultra Fusion”超融合架构,目前还不清楚采用何种封装方式(有可能是3D垂直堆叠?)。
这样的带宽水平着实吓人,要知道,AMD的Infinity Fabric 3总线带宽仅有100GB/s,因此苹果这种连接方式一旦成规模应用,多核心效能将会达到一个恐怖的水平。以后多颗M系列芯片叠加在一起就是M1元宇宙了,40核、64核应该没有太大问题(据传已经有采用4 tile,也就是双倍M1 Ultra芯片规模的版本)…因此采用Xeon处理器的Mac Pro势必将很快退出历史舞台。
甚至,一旦苹果Apple Silicon计划完成之后,M系列芯片很有可能进入ARM服务器、HPC等市场,届时我想不仅如Marvell这样在ARM服务器市场持续耕耘的厂商会面临直接竞争,x86服务器市场的玩家们应该也会感到紧张,毕竟M1系列芯片的PPW(每瓦特性能)已经得到验证,对于现代数据中心来说,降低能耗是很重要的一环。
在前述的设计方式下,M1 Ultra基本实现了两倍于M1 Max的绝对性能,也就是“1+1=2”,对于多核处理器来说,这可以说前无古人,关于M1 Ultra的相对性能,苹果给了一组数据可供参考:
·M1 Ultra相比于10核心桌面CPU(i5-12600K)同等性能下功耗低65%
·相比16核心桌面CPU(i9-12900K)同等性能下功耗低100W、同等功耗下性能强90%,也就是说在40W的功耗下性能即可持平160W的i9-12900K
·相比于高端独立GPU(RTX3090)在同等性能下功耗低200W,相比于流行独立GPU(RTX3060Ti)功耗仅为1/3
从上面这些对比曲线就知道,M1 Ultra已经是降维打击,根本不是领先20%之类的刀法。不过这些数据很明显都是依托于核心数量的增加来获得,我们推测M1 Ultra的IPC,也就是单核性能可能变化不大。
当然了,这些数据应该都是在苹果生态下得出的,所以大家看看就好。
苹果M1 Ultra处理器已经搭载于同时发布的Mac Studio中,预计这台超强的“Mac mini”将会成为创意设计人群钟情的“造梦引擎”。
(文中图片来自网络)
网友评论