DeepSeek识图模式是个新模型?量子位
4/30/2026
今天,你被DeepSeek识图模式灰度到了吗?
大家对DeepSeek的多模态属实期待了太久太久,如今惊喜紧随V4的发布而来,没等DeepSeek官方释出更多信息,民间已经从各个方向开始挖掘“识图”背后的种种蛛丝马迹。
还真有不少发现。
比如,DeepSeek识图模式背后,看上去是一个独立于V4 flash/pro的新模型。
又比如,DeepSeek在V4技术报告里的“未来展望”,实际上可能都做的差不多了……
今天眼睛一睁,俺也喜提灰度,这就来展示一下实测成果。
实测DeepSeek识图模式
在识图模式下,可以选择是否开启深度思考。
非思考模式下,这个DeepSeek视觉模型的速度非常快,比闪电五连鞭还要快。
点击发送键,几乎无需等待,答案就吭哧吭哧冒了出来。
那么思考和非思考模式下,DeepSeek识图模式的推理能力会有什么样的差别?
先上一道空间推理题:要想使右侧图形在不旋转的情况下拼合成左侧的正方体造型,还需在问号处添加的图形是哪个?
非思考模式秒给答案,然后……秒错。
开启深度思考后,DeepSeek成功闯关,给出了正确答案D。
但可以看到,它思考这个问题整整用了4分多钟。
这个思考过程的冗长程度,我们可以直观地感受一下——
在思考的中段,其实DeepSeek已经找到了正确答案:
但马上就是一个“等等”,然后……又绕了一大堆。
这个问题有人也在DeepSeek研究员陈小康的推文下反馈了。
再试试图片找不同:找出两张图片中所有的不同点。


