DeepSeek新项目名“MODEL1”曝光,与现有模型“V32”并列出现

PChome | 编辑: 冯可心 2026-01-22 10:19:02

2026年1月22日消息,DeepSeek在开源社区GitHub更新了自研推理加速框架FlashMLA的代码,横跨114个文件中有28处提及“MODEL1”标识符,与现有模型“V32”并列出现。代码差异显示其独立于V3系列架构,属于全新分支。

2026年1月22日消息,DeepSeek在开源社区GitHub更新了自研推理加速框架FlashMLA的代码,横跨114个文件中有28处提及“MODEL1”标识符,与现有模型“V32”并列出现,代码差异显示其独立于V3系列架构,属于全新分支。

据了解,技术社区分析,“MODEL1”并非迭代补丁,而是全新架构,可能与传闻中计划于2月中旬农历新年期间发布的DeepSeek V4直接相关,代码显示,“MODEL1”在键值缓存布局、稀疏性处理、FP8数据格式解码支持等方面与V3.2显著不同。

同时,新增SM100架构专用内核,需CUDA 12.9+环境启用,FP8量化支持显存占用降低30%以上,稀疏算子算力利用率达350 TFlops。

说明:所有图文均来自网络,版权归原作者所有,如果侵犯您的权益,请联系我们删除。

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑