DeepSeek又崩了时代周报
5月28日,DeepSeek再次出现服务异常。公司服务状态页面显示,DeepSeek网页对话及API服务于上午10时21分出现中断,并于10时50分恢复服务。根据官网状态页数据,这已经是DeepSeek自2026年以来出现的第18次部分性能异常,也是本月的第5次。
5月28日DeepSeek服务状态(图源:DeepSeek官网截图)
业内共识认为,频繁异常的直接原因是算力供需失衡、系统弹性不足。更深层的矛盾在于,互联网“免费获客—后期变现”的经典路径,在推理成本高企的大模型C端市场,已难持续。
纯免费模式很难持久
在互联网时代,许多免费产品的边际成本趋近于零。但对于大模型,尤其是推理模型而言,每一次对话都需消耗实实在在的算力、显存带宽。用户越活跃,边际成本越发刚性,这与传统互联网模式下成本随规模扩大而逐渐摊薄的逻辑截然不同。
然而,C端需求十分旺盛。根据OpenRouter监测数据显示,上周(5月18日至5月24日)全球AI大模型总调用量攀升至28.9万亿Token,连续五周上涨;其中,中国大模型周调用量达9.22万亿Token,环比激增19.89%,连续四周超越美国(4.93万亿Token,环比增长16.27%)。DeepSeek-V4-Flash更以单周3.43万亿Token、环比暴涨66%的成绩登顶全球榜首。
旺盛用户需求与刚性算力成本的矛盾,成为DeepSeek稳定运营的最大阻碍。
那么,C端纯免费模式还能否持续?
专注研究AIGC、媒介大数据的中央民族大学新闻与传播学院副教授向安玲对时代周报记者表示,从商业逻辑上看,如果有良好的商业闭环,比如通过用户对话获取高价值数据,结合广告或B端买单的方式,理论上也能维持运营,但这往往会影响用户体验。如果不考虑卖数据或卖广告等方式,纯免费模式确实很难持久,因为模型能力、服务成本与用户体验三者相互约束:用户规模增长需要平台持续扩容,导致成本上升,否则就只能让用户排队或降级到小模型,体验会急剧下降。
降价抢占API市场份额
向安玲认为,对大模型可持续发展而言,比较现实的方案有两种:一是分层收费,基础版免费,用于日常问答和轻量任务以实现获客;深度推理、长上下文等增强功能则收费,或采用按量收费,设定免费阈值,超出后按Token计费;二是B端反哺C端的路径,B端企业的付费意愿更成熟,可通过私有化部署、定制化方案或售卖算力和API获得收入,再用这笔收入补贴C端的免费服务,同时将C端沉淀的脱敏使用数据包装成产品卖给B端。
DeepSeek已经出手,进一步吸纳API付费用户。
5月22日晚间,DeepSeek官方宣布,DeepSeek-V4-Pro模型API价格将于2026年5月31日结束限时优惠后将不再恢复原价,而是正式调整为原定价的1/4。这意味着此前2.5折的折扣将永久保留。
据官方披露,DeepSeek-V4采用自研稀疏注意力机制与混合专家模型,在处理百万级Token长上下文时,算力消耗仅为上代产品的27%,大幅减少了单位推理成本。同时,V4兼容华为昇腾等国产芯片,大幅摆脱对海外高端算力的依赖,有效降低了硬件采购与运维成本。
2026年以来,由于HBM(高带宽内存)价格半年暴涨超500%,高端GPU(图形处理器)供不应求,加上推理端调用量激增,亚马逊、微软及国内主流云厂商纷纷上调API定价。DeepSeek和小米是其中的两个异类。5月27日,小米旗下MiMo团队宣布,MiMo-V2.5系列大模型API永久降价,最高降幅达到99%。
向安玲认为,API降价意味着大幅降低中小开发者与企业用户的AI应用门槛,扩大用户付费群体,在“付费已成共识”的API市场抢占份额。
若此番降价成功抢占市场份额,未来DeepSeek或有望通过B端规模化收入,为C端免费模式的持续运转提供资金支撑。


