DeepSeek-V3.2-Exp模型上线:推理提速2-3倍,API成本降低50%以上

PChome | 编辑: 金子宸 2025-09-29 20:06:36

9月29日,DeepSeek AI正式发布实验性大语言模型DeepSeek-V3.2-Exp,并在Hugging Face、ModelScope平台同步开源,核心搭载自研DeepSeek稀疏注意力(DSA)机制,实现长文本处理效率与成本控制的双重突破。

9月29日,DeepSeek AI正式发布实验性大语言模型DeepSeek-V3.2-Exp,并在Hugging Face、ModelScope平台同步开源,核心搭载自研DeepSeek稀疏注意力(DSA)机制,实现长文本处理效率与成本控制的双重突破。

作为V3.1-Terminus的升级版本,新模型保持671B参数规模,通过细粒度稀疏注意力技术重构传统Transformer架构,将长文本推理速度提升2-3倍,内存使用量降低30%-40%。在保持综合性能基本持平的前提下,其在数学推理、编程竞赛等任务中表现更优,Codeforces评分较前代提升75分,BrowseComp-zh中文浏览任务得分增长2.9分。此外,本次更新带来了API大幅度降价,开发者调用DeepSeek API的成本将降低50%以上。新用户即便缓存未命中,成本仍比竞品低五成以上。生态适配同步推进,华为云、寒武纪已完成硬件适配,支持160K上下文长度,寒武纪更开源专属推理引擎代码。

目前官方App、网页端已完成升级,开发者可获取完整推理代码与CUDA内核。行业分析指出,此次开源与降价将加速AI技术在长文档处理、智能客服等领域的普及,为大模型架构轻量化提供新范式。

说明:所有图文均来自网络,版权归原作者所有,如果侵犯您的权益,请联系我们删除。

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑