国产视频模型黑马:杀进全球榜TOP2量子位

2/27/2026

全球视频大模型榜单,国产模型杀进前2。

就在最近,权威第三方机构Artificial Analysis更新了排行榜——

来自昆仑天工的SkyReels-V4,直接干到了文转视频(含音频)全球榜第2,位列Veo 3.1、Sora 2之前。

历史榜(包括所有模型的那种)也冲到第4位,稳居全球第一梯队:

要知道Artificial Analysis可是目前公认的“AI领域的Gartner”,其所有测试均在内部独立进行,不依赖各家实验室自行报告的数据,所以上述成绩背后的含金量可想而知。

而且更关键的是,这不单单是一次“纯文生视频”的胜利。

当大多数模型还在卷文生视频时,SkyReels-V4已经玩起了组合技:

「图像A的主体」+「视频B的动作」+「音频C的背景音」= 一条完整视频。

文本、图像、视频片段、掩码、音频参考全部可混合输入,主打一个全模态参考、一体化生成。

好好好,一个月前才刚开源SkyReels-V3,这次V4直接带着全球TOP2的成绩单登场。

只能说这公司节奏够快,成绩够硬。

全球第2,现场表演一个

不过还是那句老话,光说不练假把式,咱这不得召唤SkyReels-V4给大家表演一个(doge)。

锵锵锵锵上场,先给大家来个自我介绍:

(我是)全球首个同时支持多模态输入、联合音视频生成、统一生成/修复/编辑任务的视频基础模型。

没记住不要紧,四个技能show这就给观众姥爷献上:

多模态精准控制

先来点有意思的,用图像的主体+视频的动作和音乐生成新视频。

把@video_1中左侧身穿白上衣配牛仔裤跳舞的女性替换为@image_1里的狗, 并将@video_1中右侧身穿全套西装跳舞的男性替换为@image_2 里的猫,确保动作保持一致。

SkyReels-V4看一眼两张参考图:把狗和猫的毛色、身形全都扒下来,但摒弃了两张图的背景。

再看一眼原视频(来自昆汀电影《低俗小说》片段):噢~俩人在跳舞,女生在左边,男生在右边,他们原来是这么跳的。

然后直接开干,人物主体无缝切换了,狗替女生,猫替男生;但舞台、观众、音乐、动作可都没变。

就连这生成的视频中,狗狗弯腰的动作变化时机都和原版女生动作变化的时机对得上,大概在10s左右,这波动作和音乐可是真·卡点了~

这个案例的背后,体现的是SkyReels-V4对多模态参考的精准控制。

首先,咱可以看出来,模型支持文本、图像、视频片段等多种输入组合。

而且实际上掩码和音频它也能参考,参考完了就能实现:

基于参考图像的风格迁移与主体保留:就拿上面参考的狗和猫图像来说,从毛色、体态到身形大小的细节,都被精准保留并迁移到了视频人物身上;

音频驱动的动作生成:参考视频的背景音乐,模型能让两者的舞步踩准节拍,甚至连动作变化都精准卡点;

多参考融合创作:这个替换案例的整个指令本身就是典型的多模态参考,有多个图像的主体形象、视频的舞蹈动作和音乐节拍,好几种素材都无痛融在了一起。

专业级视频修复

放完组合技之后,再来个更高级的。

SkyReels-V4还支持对已有内容进行专业级修复——

在不破坏整体结构的前提下,替换视频主体、去除水印、抹掉字幕等,几乎都是手拿把掐。

区域智能修复:能精准替换视频中的主体、修改属性(如服装颜色、物体形状)、更换背景;

元素智能移除:能自动识别并去除水印、字幕、Logo,保持背景内容自然连贯;

参考引导修复:可基于参考图像的风格一致性修复,确保编辑前后视觉统一。

就拿去字幕这事儿来说吧,真到了要用的时候那可真是急得人团团转,往往社交媒体全扒一遍也没有真正好用的。

但交给SkyReels-V4,它还真行。

你瞅,原视频是一个10s左右、含大量英文字幕的小片段:

但魔法这么一施,字幕这就没!了!整个画面立马变得干干净净。

该说不说,SkyReels-V4真是一位后期小能手,它能在保留大部分原视频的情况下,实现局部精准改动。

全维度视频编辑

当然了,既然专业后期的活都能干,那各种日常编辑岂不是轻轻松松。

一次生成不满意,SkyReels-V4也支持随心改、自由改。

插一嘴,虽然都是改,但“专业级视频修复”和“全维度视频编辑”侧重的点还不一样。

用一个例子来区分就是,假设原视频为一个女生在草地上走路,“专业级视频修复”追求的是极致的真——消除路人、改衣服颜色等,改完之后,她还是走在那片草地上,整个视频结构不变;

而“全维度视频编辑”追求的是创造的自由——比如让草地瞬间变为赛博朋克都市,甚至让镜头从定点拍摄变为电影级的推拉摇移,整个视频想要表达的意境内容可能都变了。

针对后者当中的局部编辑,先给SkyReels-V4上个开胃小菜,给视频凭空增加素材。

一张帽子图+一段女团舞视频,要求模型给c位dancer戴上帽子。

将@image_1中的蓝色罗纹针织无檐帽添加到@video_1中中央舞者的头上。

Scroll for more