在DeepSeek V3.1版本发布后,官方表示UE8M0 FP8是针对即将发布的下一代国产芯片设计,该格式采用8位指数、0位尾数的子结构,主要面向矩阵乘法等核心AI计算场景优化。
8月25日,在DeepSeek V3.1版本发布后,官方表示UE8M0 FP8是针对即将发布的下一代国产芯片设计,该格式采用8位指数、0位尾数的子结构,主要面向矩阵乘法等核心AI计算场景优化,这也是国产芯片迈入新阶段的信号。

消息公布后,国内多家GPU厂商迅速跟进。摩尔线程表示,其产品已原生支持FP8精度,并与DeepSeek功能实现兼容。公司介绍称,当前已具备从FP64到INT8的完整精度谱系,在FP8混合精度下可实现大模型训练20%至30%的性能提升。
同时,砺算科技及东芯股份也公开了相关技术进展。砺算科技正在推进支持端、云、边多层次应用的GPU产品,重点布局AI加速与图形渲染融合。其7G100系列芯片已支持FP32、FP16及INT8等多种运算精度,以适配不同计算负载需求。
