DeepSeek V4初体验智东西
智东西4月24日报道,今日,DeepSeek正式发布并开源DeepSeek-V4系列预览版本,这是其继V3.2之后的新一代旗舰模型体系,智东西第一时间上手实测。
DeepSeek V4“源神”回归影响力果然不同凡响,几乎瞬间刷屏,在微博热搜榜前五占三,仅次于小米YU7GT。
本次发布包含两款模型:DeepSeek-V4-Pro与DeepSeek-V4-Flash,分别采用MoE架构,总参数规模达到1.6T(激活49B)与284B(激活13B),并统一支持最长100万token上下文。
DeepSeek官方同时说明,受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,其价格会大幅下调。此外,DeepSeek-V4已获得寒武纪Day 0适配支持,相关适配代码已开源至GitHub社区。
DeepSeek-V4-Pro主打性能上限,对标闭源旗舰模型;而DeepSeek-V4-Flash则在参数规模与激活规模上大幅缩小,换取更低延迟与更低成本。
相比上一代模型,其在Agent能力、世界知识与复杂推理任务上进一步抬升,并首次将“百万上下文”作为默认能力开放。
在Agent能力方面,DeepSeek-V4-Pro的Agent能力显著增强。其在Agentic Coding等评测中进入开源第一梯队,内部评测显示交付质量已接近Claude Opus 4.6非思考模式,但与其思考模式仍存在差距。
DeepSeek-V4-Pro在数学、STEM及竞赛型代码等高难度任务中已超过当前已公开评测的开源模型,整体表现接近甚至比肩GPT-5.4、Claude Opus 4.6-Max等顶级闭源模型。
与此同时,DeepSeek-V4在长上下文效率上给出了一组更激进的优化:在100万token场景下,其单token推理计算量仅为V3.2的27%,KV Cache占用降至约10%,显著降低长链路任务的算力与显存成本。
同时,官方公布了DeepSeek-V4系列的API定价:DeepSeek-V4-Pro在输入命中缓存的情况下为1元/百万tokens,输入未命中缓存则为12元/百万tokens,输出为24元/百万tokens;DeepSeek-V4-Flash在输入命中缓存仅0.2元/百万tokens,未命中输入1元/百万tokens,输出2元/百万tokens。
目前,DeepSeek-V4系列已上线官网与App,并同步开放API与模型权重。
体验地址:chat.deepseek.com或DeepSeek官方APP
API文档:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
https://huggingface.co/collections/deepseek-ai/deepseek-v4
https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
01、Agentic编程能力提升明显,读《三体》三部曲烧了54万token
我们初步感受了下DeepSeek-V4的变化,主要测试的模型是DeepSeek-V4-Pro。
在前端网页one-shot案例中,DeepSeek-V4-Pro展现出很高的执行效率。由于我们的需求不复杂,模型仅用了5秒钟进行思考,之后迅速进行开发,这与之前DeepSeek模型在思考上浪费很多token的模式明显不同。
进入到实际生成过程后,DeepSeek-V4-Pro的输出长度要明显长于其他DeepSeek模型。其生成速度较快,基本能做到以5行代码为单位输出。
最终,DeepSeek-V4-Pro的生成结果如下,可以看到其网页的完成度要比DeepSeek-V3.2高一些,设计更为丰富。
▲DeepSeek-V4-Pro打造的网站
https://mcp.edgeone.site/share/9pD1cRzY1QA8bmmBLDZ8S
不过,这样简单的编程题目已经难不住DeepSeek-V4-Pro,我们试着让它完成一个结合Agent能力与编程的任务:规划一次去上海的旅行,然后把所有相关信息整合为一个旅行网站,附上对应的景点定位。
执行过程中,可以看到DeepSeek-V4-Pro可以进行复杂多轮工具调用,联网搜索的条目数量也和之前模型的数量相比有增加,信息收集得更为全面了。
最终,DeepSeek-V4-Pro收集到了完整的行程信息,规划合理,并且配上了每个景点的定位,点开后就可以直接在导航App里使用,十分便捷。在Agent任务中,可以观察到它的行动十分果断,工具调用、思考都在几秒钟内解决,token效率不错。
▲DeepSeek使用Agent能力和编程能力规划的旅行方案旅行方案
https://mcp.edgeone.site/share/4TxFYOy24bgaEwxFoxisj


