DeepSeek多模态研究员@Xiaokang Chen在X平台宣布,DeepSeek的“识图模式”已在网页端和App端正式上线,与原有的“快速模式”“专家模式”并列作为一级对话入口。
PChome 6月18日消息,DeepSeek多模态研究员Xiaokang Chen在X平台宣布,DeepSeek 的“识图模式”已在网页端和App端正式上线,与原有的“快速模式”“专家模式”并列作为一级对话入口。用户开启该模式后可直接上传图片、截图或含图表的文档,搭配文字提问让模型进行视觉理解与推理。

不同于传统仅做文字提取,DeepSeek识图模式依托自研视觉理解框架,可对日常实物、复杂表格、数学公式、工程图纸及场景语义进行深度分析,并支持开启“深度思考”进行多步推理。网页端即日起全量开放,APP端部分版本正分批推送或显示为内测入口,后续将覆盖全量用户。

这是DeepSeek从纯文本大模型向原生多模态引擎演进的关键一步,此前该产品曾于今年4月底开启灰度测试。具体支持格式、文件大小限制及后续多模态能力扩展以DeepSeek官网及客户端公告为准。