DeepSeek识图模式是个新模型？量子位

今天，你被DeepSeek识图模式灰度到了吗？

大家对DeepSeek的多模态属实期待了太久太久，如今惊喜紧随V4的发布而来，没等DeepSeek官方释出更多信息，民间已经从各个方向开始挖掘“识图”背后的种种蛛丝马迹。

还真有不少发现。

比如，DeepSeek识图模式背后，看上去是一个独立于V4 flash/pro的新模型。

又比如，DeepSeek在V4技术报告里的“未来展望”，实际上可能都做的差不多了……

今天眼睛一睁，俺也喜提灰度，这就来展示一下实测成果。

实测DeepSeek识图模式

在识图模式下，可以选择是否开启深度思考。

非思考模式下，这个DeepSeek视觉模型的速度非常快，比闪电五连鞭还要快。

点击发送键，几乎无需等待，答案就吭哧吭哧冒了出来。

那么思考和非思考模式下，DeepSeek识图模式的推理能力会有什么样的差别？

先上一道空间推理题：要想使右侧图形在不旋转的情况下拼合成左侧的正方体造型，还需在问号处添加的图形是哪个？

非思考模式秒给答案，然后……秒错。

开启深度思考后，DeepSeek成功闯关，给出了正确答案D。

但可以看到，它思考这个问题整整用了4分多钟。

这个思考过程的冗长程度，我们可以直观地感受一下——

在思考的中段，其实DeepSeek已经找到了正确答案：

但马上就是一个“等等”，然后……又绕了一大堆。

这个问题有人也在DeepSeek研究员陈小康的推文下反馈了。

再试试图片找不同：找出两张图片中所有的不同点。