DeepSeek-R2昇腾910B加持效率高达82% 性能不输英伟达A100

PChome | 编辑: 丁新瑀 2025-04-29 10:37:36

4月29日消息,DeepSeek-R2计划将在下个月推出,会采用一种更加先进的混合专家模型,其结合了更加智能的门控网络层以优化高负载推理任务的性能。

4月29日消息,DeepSeek-R2计划将在下个月推出,会采用一种更加先进的混合专家模型,其结合了更加智能的门控网络层以优化高负载推理任务的性能。

有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%,定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

据了解,DeepSeek-R2是一款基于华为昇腾910B芯片集群训练的模型,在FP16精度下达到512 PetaFLOPS的计算能力,芯片使用效率为82%。据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右,看起来十分强大。

据相关人士透露,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

说明:所有图文均来自网络,版权归原作者所有,如果侵犯您的权益,请联系我们删除。

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑