欢迎您访问PChome.net

成本直降两成 蚂蚁百灵模型国产GPU跑出英伟达级性能

PChome | 编辑: Michael 2025-03-24 18:49:45

蚂蚁集团今日正式回应业界对其“百灵”大模型训练成本的关注,宣布通过国产芯片适配优化与技术创新,成功将3000亿参数混合专家(MoE)模型的预训练成本降低近20%,并计划逐步开源核心技术。这一突破意味着,中国AI企业首次在同等性能下实现对英伟达高端GPU的“算力平权”,为全球大模型行业注入新变量。

3月24日消息,蚂蚁集团回应业界对其“百灵”大模型训练成本的关注,宣布通过国产芯片适配优化与技术创新,成功将3000亿参数混合专家(MoE)模型的预训练成本降低近20%,并计划逐步开源核心技术。这一突破意味着,中国AI企业首次在同等性能下实现对英伟达高端GPU的“算力平权”,为全球大模型行业注入新变量。

此前,据蚂蚁集团Ling团队称,新推出的百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus)分别拥有168亿(激活参数27.5亿)和2900亿(激活参数288亿)参数规模。两款模型在使用国产低性能GPU训练时,性能与英伟达H800芯片训练的阿里通义Qwen2.5-72B-Instruct、DeepSeek-V2.5-1210-Chat等模型持平。实验数据显示,在五种异构硬件配置下,Ling-Plus模型预训练9万亿token的总成本从高性能硬件的635万元降至508万元,降幅达20%。


蚂蚁集团知情人士透露,此次突破的核心在于“重构训练范式”——通过开源框架DLRover实现多训练框架统一调度,并开发轻量级调试工具XPUTimer,使国产芯片的算力利用率提升40%。这意味着,即便使用天数智芯、壁仞科技等国产GPU,企业也能构建对标国际顶尖水平的大模型。行业分析师指出,此举不仅打破英伟达的算力垄断,更可能引发连锁反应。预计2025年国产AI芯片订单量将激增30%,而英伟达H系列芯片在中国市场的溢价空间或将压缩15%。


对于开源计划,蚂蚁集团明确表示将分阶段开放模型架构、训练策略及工具调用接口。首批开源内容预计包含动态参数分配算法和EDiT框架,中小型企业可基于此快速搭建低成本训练集群。彭博行业研究认为,蚂蚁的技术路径若推广成功,全球AI算力市场格局或迎来“中国方案”主导的拐点。


说明:所有图文均来自网络,版权归原作者所有,如果侵犯您的权益,请联系我们删除。

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑