快科技4月29日消息,DeepSeek正在网页端和移动端小范围测试一项全新的识图功能,用户可通过上传图片,交由系统进行内容解读、描述与分析。此举意味着DeepSeek正式涉足多模态领域,补齐了此前在该方向上的技术空白。
该识图模式与快速模式、专家模式并列,作为一个独立的一级入口存在,表明视觉理解已被DeepSeek置于核心能力层面,而非仅作为辅助功能进行布局。

目前,部分用户已能够正常使用该功能,而另一些用户虽然可以看到入口,但点击后会收到提示:“识图模式暂不可用,请稍后再试”。
从产品界面来看,用户进入识图模式后,页面会显示“使用识图模式开始对话”,输入框旁也新增了图片上传按钮。
从实际测试结果来看,当前开放的主要是图片理解能力,包括看图、读图、分析图等场景,涵盖视觉问答、图片解读以及截图分析等功能。目前尚未见到图像生成、视频理解或跨模态生成类功能上线。
这意味着现阶段的识图模式更接近于视觉语言模型(VLM)的范畴,尚不属于完整的多模态生成工具。
(举报)
