国产世界模型登顶全球第一华尔街日报

3/30/2026

还得是咱国产世界模型牛!

极佳视界最新力作GigaWorld-1,直接击穿谷歌英伟达,WorldArena登顶全球第一。

而且还是唯一一个综合得分突破60分大关的具身世界模型。

什么概念呢?就以三大核心维度为例,几乎是断层式领先:

Physics Adherence(物理遵循):相比第二名提升了整整16%。

3D Accuracy(3D准确度):近乎逼近满分。

Visual Quality(视觉质量):同样遥遥领先。

也就是说,GigaWorld-1是真正的全能型具身世界模型,不仅视觉真实,而且几何精准、物理准确。

这意味着,极佳视界这家由清华系领衔,汇聚了阿里、百度、地平线等一众顶尖大厂核心骨干的中国团队,已经率先完成了一次教科书式的技术超车。

从最严苛的“试金石”脱颖而出

众所周知,WorldArena是世界模型领域公认的“试金石”。

它由清华大学联合普林斯顿大学、新加坡国立大学、北京大学、香港大学、中国科学院、上海交通大学以及中国科学技术大学等8所国内外顶尖高校及科研机构共同打造。

其摒弃了单一维度的片面测试,转而构建包含16项细分核心指标和3大真实应用任务的立体评估体系,旨在对具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与落地能力进行最严苛的压力测试。

也正因如此,WorldArena吸引了全球几乎所有头部世界模型团队同台竞技,首批参评名单包括谷歌、英伟达等。

最终的结果也出乎所有人意料,不是科技巨头,而是这家低调耕耘的技术扫地僧——极佳视界。

其旗下最新的GigaWorld-1凭借硬核实力,成功摘得桂冠!

显式动作建模与可微分物理引擎的完美融合

那么为何GigaWorld-1能取得如此傲人的成绩呢?

首先从技术路线看,GigaWorld-1是一款专为具身场景打造的AC-WM(Action-Conditioned World Model,动作控制世界模型) 。

相较于传统的世界模型,GigaWorld-1深度继承并发展了极佳视界在去年7月发布的EmbodieDreamer核心架构。

该方案不仅引入了显式的动作建模机制,从根本上保证了视频生成过程中的几何一致性;更创新性地融入了可微分物理引擎,从而获取精准的机械臂物理参数,以实现对复杂物理交互过程的真实模拟与严格遵循。

在此前沿架构的基础上,极佳视界进一步引入了团队长期积累的上万小时高质量真实机器人操作视频数据进行训练,极大地增强了模型在开放场景下的泛化能力与高精度的动作遵循表现。

目前,GigaWorld-1的核心代码与部分数据集已开源。

仅开源后的短短半个月内,GigaWorld-1在HuggingFace平台的下载量便火速突破16000次,足见学术界与工业界对其技术实力的高度认可,以及在开发者社区中的巨大影响力。

同时GigaWorld-1还将作为官方Baseline,强力支持即将于3个月后在美国举办的GigaBrain Challenge@CVPR 2026国际挑战赛,为全球开发者积极赋能,共同推动具身智能生态的繁荣发展。

(比赛官网:https://gigaai-research.github.io/GigaBrain-Challenge-2026/)

于是这就引出了一个关键问题——

极佳视界是谁?

国内首家专攻世界模型的公司

在业内,极佳视界是少有的产投双栖玩家,一边闷头做技术,一边又能拿下巨额融资。

在本月初,极佳视界刚刚宣布完成近10亿元Pre-B轮融资,投资方阵容堪称豪华——

中芯聚源、上海半导体产投基金、临芯资本、星源资本、万林国际等顶尖芯片和汽车产业资本领投,中金资本、苏创投、华强资本等重磅国资平台和知名财务机构跟投。

而这,也并非极佳视界首次获得资本追捧。

早在2025年11月,华为旗下的哈勃投资就已联合华控基金,完成了对极佳视界的亿元级A1轮战略投资。

其实华为对世界模型关注已久,此前就将世界模型列为未来智能世界2035年十大技术趋势之首。

但它没有像谷歌、英伟达、特斯拉这些全球科技巨头那样直接布局世界模型,而是通过哈勃投资,先在中国市场找到了最具潜力的标的——极佳视界。

极佳视界是国内第一家布局世界模型的公司,在世界模型的模型架构和数据引擎两方面都拥有行业领先的深入积累。

公司定位相当清晰,就是聚焦物理AI,致力于世界模型驱动的物理世界通用智能。其技术护城河建立在“世界模型×具身大脑”的双轮驱动战略上,并在世界级权威测评榜单中,成功拿下具身大脑和世界模型的双料冠军。

产品矩阵包括世界模型平台GigaWorld、具身基础模型GigaBrain、通用具身本体Maker等物理AI全栈软硬件产品。

GigaWorld:物理世界的“数字沙盒”

GigaWorld是极佳视界自研的世界模型平台,能模拟物理世界运行规律,生成高保真合成数据。

与传统仿真器相比,GigaWorld能通过几何一致、物理准确的世界模型建模,生成高保真、可控、多样化的具身交互数据,实现数据放大。

这使得所训练的VLA模型在新纹理、新视角、新物体位置三大泛化维度上均实现近300%的性能提升。

更关键的是,GigaWorld能带来10-100倍的效率提升。

在具身方向,GigaWorld-0是全球首次让具身世界模型在高水平具身基模上发挥核心价值,其GitHub开源代码斩获1.5k+ Star,奠定了技术验证的基础。

Scroll for more