CDNA架构跟游戏用的RDNA架构分家了,重点强化了FP64双精度运算,同时还增加了Matrix Core(矩阵核心),用于加速HPC、AI运算,号称在混合精度和FP16半精度的AI负载上,性能提升接近7倍。
在推出7nm RDNA2架构的RX 6000系列游戏卡之后,AMD前不久还推出了CDNA架构的Instinct MI100加速卡,主打高性能计算。
CDNA架构跟游戏用的RDNA架构分家了,重点强化了FP64双精度运算,同时还增加了Matrix Core(矩阵核心),用于加速HPC、AI运算,号称在混合精度和FP16半精度的AI负载上,性能提升接近7倍。
相比目前RX 6900 XT最多80组CU核心,Instinct MI100加速卡集成了120组CU单元,7680个流处理器,搭配32GB HBM2,带宽高达1.23TB/s,同时支持PCIe 4.0,集成Infinity Fabric x16高速互联通道,峰值带宽达276GB/s(相当于PCIe 4.0 x16的大约4倍),而整卡功耗控制在300W。
性能方面,Instinct MI100的FP32单精度浮点性能可达23.1TFLOOPS(1T是1万亿次)),FP64双精度可达11.5TFLOPS,FP32 Matrix单精度矩阵计算为46.1Tflops,FP16 Matrix半精度矩阵计算为184.6TFlops,Bfloat16浮点为92.3TFlops。
论性能的话,Instinct MI100的23TFLOPS性能是大幅领先NVIDIA的A100加速卡的,后者的FP32性能是19.5TFLOPS,FP64性能也只有9.7TFLOPS。
性能是很高,价格呢?此类产品由于主要供应给商业客户,AMD及NVIDIA都不会公布零售价,不过Shopblt网站日前开始预售Instinct MI100加速卡,给出的价格是7377.27美元,约合4.8万元人民币。
这个价格贵不贵?单价不低,但也要看跟谁比,可比的只有A100加速卡,虽然NVIDIA也不公布价格,但是之前也有电商开卖,不含税价格是8299英镑,算下来要1.1万美元了,折合人民币7.3万元。
换句话说,AMD的Instinct MI100加速卡在性能高出20%左右的同时,价格要比NVIDIA A100便宜30%左右,论性价比依然出色。
当然,在高性能计算领域,客户看的不只是性价比,NVIDIA现在靠着CUDA就可以吃下大多数市场了,AMD还要加把劲。
网友评论