中国在AI视频生成竞赛中,把硅谷甩在身后头条新闻

5/17/2026

2026年3月24日,OpenAI宣布关停Sora。

这个消息本身已经够震撼了。Sora当初推出时被誉为AI视频的"加冕时刻",全世界的目光都随之聚焦于此。然而它只活了不到两年,关停时每天的运营成本据报道高达1500万美元,产品却打不过竞争对手。而接过这片市场的,不是谷歌,不是Meta,而是北京的字节跳动和快手。

这场AI视频竞赛的格局,在过去一年里已经悄然翻转。

数据的背后:中国产品如何建立护城河

快手旗下的可灵AI,是目前全球用户量最大的AI视频工具之一。截至2025年底,可灵AI已累计服务超过6000万用户,生成视频量突破6亿条,2025年全年收入达到约10.4亿元人民币,折合约1.5亿美元。2025年12月单月收入突破2000万美元,折合年化约2.4亿美元,月活用户达到1200万。

字节跳动则在2026年2月推出了Seedance2.0,马斯克看完在社交媒体上直接说了一句"发展速度太快了"。这个模型支持多模态输入,能够实现原生音画同步、多镜头叙事,一次性生成成功率据称超过90%,被业内人士称为"AI视频的转折点"。它已全面整合进豆包和国际版CapCut,面向消费者和企业同步铺开。

可灵3.0则在同年2月5日全球上线,功能覆盖运镜控制、场景调度和角色一致性,目标直指专业影视制作流程。消息人士称,快手正与投资者谈判,计划以约200亿美元估值将可灵AI分拆独立,预计2027年一季度在香港上市。

相比之下,谷歌的Veo系列虽然技术扎实,但在易用性和商业化节奏上明显慢半拍,Runway和Pika等西方初创公司则面临资源和数据两头受压的困境。

为什么是中国赢了这场比赛

这件事有其深层逻辑,不能简单归因于"中国公司很努力"。

最核心的优势是训练数据。字节跳动同时运营着抖音和TikTok,每天产生天文数字级别的短视频内容,涵盖各类场景、运镜方式、肢体动作和人脸表情。快手拥有中国第二大短视频平台,数据体量同样庞大。这是西方竞争对手根本无法在短时间内复制的结构性优势。训练AI视频模型最需要的,恰恰是海量真实的、多样化的视频数据,而这两家中国公司,几乎天然就坐在这座"金矿"上。

其次是商业化路径的清晰度。中国公司很早就打通了从AI视频生成到广告投放、电商内容、直播素材的完整链条。可灵和Seedance不只是实验室产品,它们从第一天起就嵌入了真实的商业需求——帮中小商家低成本制作广告,帮创作者批量产出内容,帮品牌主做个性化营销素材。这种"边跑边赚钱"的模式,让产品迭代速度远快于那些只靠订阅和API收费的西方对手。

再看全球排行榜的反馈。来自开发者社区的多项评测显示,在视频动作流畅度、物理规律准确性、场景连贯性等核心指标上,可灵和Seedance已经超越了OpenAI、谷歌和Runway的同类产品。这不是中国自己说的,而是独立评测数据呈现出来的结果。

值得注意的是,这一领域的竞争格局,与大语言模型的态势截然不同。OpenAI的GPT系列、Anthropic的Claude以及谷歌的Gemini,目前仍是全球文本和代码任务的主流选择,中国公司在这一赛道的国际影响力相对有限。但视频生成的战场,已经形成了鲜明的"中强美弱"局面,而且这种格局在2025年下半年到2026年之间还在持续扩大。

当然,这个行业的格局远未固化。谷歌的Veo3仍在快速迭代,并在部分专业评测中依然保持竞争力。Runway凭借在好莱坞专业制作领域的深度渗透,守住了一块细分市场。法规和地缘政治的不确定性,也意味着中国AI视频工具在某些市场的扩张并非坦途,字节跳动的Seedance在全球推广时甚至回避了美国市场。

但无论如何,一个明确的信号已经发出:AI的技术领先,不再是硅谷的专利。在视频这张牌桌上,北京的两家公司已经坐到了主位。

Scroll for more