美团发布并开源5600亿参数模型，输出成本仅5元/百万token

PChome | 编辑: 邸天宇 2025-09-01 10:34:09

美团正式发布并开源其5600亿参数的大语言模型LongCat-Flash，该模型采用混合专家（MoE）架构，创新性地引入“零计算专家”机制，在推理速度和成本控制上表现卓越。

2025年9月1日，美团正式发布并开源其5600亿参数的大语言模型LongCat-Flash，该模型采用混合专家（MoE）架构，创新性地引入“零计算专家”机制，在推理速度和成本控制上表现卓越。

图源：美团

LongCat-Flash的突出之处在于，并非所有Token都同等重要，它能根据上下文需求，从总计5600亿参数中动态激活186亿至313亿参数。这种机制大幅提升了计算效率，使推理速度突破每秒100 Token，而每处理100万输出词元的成本仅5元。

在性能方面，LongCat-Flash在MMLU、ArenaHard、CEval等基准测试中表现亮眼，接近甚至超越DeepSeek V3.1与Qwen3等模型，尤其在指令遵循与智能体（Agent）任务中优势明显，能够调用外部工具完成复杂多步骤任务。目前，该模型已遵循MIT协议在Hugging Face和GitHub开源，相关代码也已适配SGLang和vLLM框架，旨在进一步降低企业级应用的门槛，推动大模型技术在更多领域的应用与创新。

说明：所有图文均来自网络，版权归原作者所有,如果侵犯您的权益，请联系我们删除。

每日精选

春晚推高机器人搜索量暴涨300%，订单量增长150%

2026年2月17日消息，2026年央视总台马年春晚开播两小时，京东“机器人”搜索量环比增长超300%，客服问询量增长460%，订单量增长150%。

关键词：马年春晚,机器人,京东 2026-02-17 14:28:09
苹果春季新品发布会定档3月4日，iPhone 17e等将亮相

2026年2月17日消息，苹果官方宣布将于2026年3月4日晚上10点（北京时间）在上海举办体验活动，同时，在纽约和伦敦同步举办线下体验活动。

关键词：Apple,苹果发布会,iPhone 17e 2026-02-17 13:35:56
2026年春晚节目单公布，宇树科技等4家机器人将登台

2026年2月16日消息，中央广播电视总台2026年马年春节联欢晚会节目单正式发布，宇树科技、松延动力、魔法原子、银河通用等4家具身智能机器人，在今年的春晚舞台上均有表演节目。

关键词：马年春晚,宇树科技,松延动力 2026-02-16 15:13:33