据4月29日最新消息称,下个月AI大模型DeepSeek-R2将推出。
据4月29日最新消息称,下个月AI大模型DeepSeek-R2将推出。

DeepSeek-R2是一款基于华为昇腾910B芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。该模型会采用更先进的混合专家模型,结合智能的门控网路层,从而优化高负载推理任务的性能。有分析师预测,该模型性价可能明显低于OpenAI同类产品,预示着有可能图谱AI服务的定价模式,该模型比GPT-4成本下降97%,主打全方位产业链的自主可控。

有消息称,在MoE架构的加持下,DeepSeek-R2的模型总参数量预计将达到1.2万亿,较之DeepSeek-R1提升约1倍。