全球首个：打通双向物理因果链量子位

你从桌上端起一杯水，大脑用了不到一秒，同时完成三件事：

估算杯子的重量，预判水面晃动的幅度，顺便绕开了旁边那个玻璃杯。

在这个动作中，你的大脑不会在意杯子上的花纹，或是杯壁折射出的复杂光影，而是能瞬间抓住核心：手要出多少力，水才不会晃出来。

正是这种忽略无关的环境细节、直接洞察本质的“物理直觉”，让我们干起细活来行云流水。

但对机器人来说，想要学会这种对物理世界的因果直觉，基本属于具身智能领域的高难度悬赏题。

现在，一家成立仅一年的具身智能新锐——无界动力，直接带着新解法交卷了。

其正式发布了全球首个“长时序双向物理因果链”隐空间世界模型MWA™，拓展具身智能的多元场景泛化能力，直击机器人长周期、高精度执行的行业老大难问题。

在由斯坦福大学等顶尖机构联合发起的RoboCasa GR1 TableTop榜单中，无界动力MWA™以75.2%的平均任务成功率拿下全球第一，超过英伟达GR00T-N1.6等一众行业主流模型。

作为赛道里的新晋选手，无界动力是行业里少数坚持“隐空间世界模型 + 强化学习”技术路线的公司。

这条略显特立独行的硬核路线，不仅在技术实测上跑通了闭环，在资本市场也展现出了极强的吸金能力：

公司此前已宣布完成超2亿美元的天使轮融资，而紧随其后的Pre-A轮近2亿美元融资也已接近尾声，背后站着红杉中国、线性资本、京东关联基金等一众头部重仓机构。

这只既能打、又吸金的行业黑马，究竟是如何帮机器人看清物理因果、打破多场景泛化瓶颈的？

我们拆开来细看。

通向终局的路线：隐空间世界模型 + 强化学习

懂了语言和逻辑，机器人就能在现实世界里听懂话、能干活了吗？

答案是：并不行。

过去几年，VLA（视觉-语言-动作）具身智能路线，虽然让机器人听懂了人类的文本指令。

但一到现场，只要光照稍微变一下、桌上的杯子挪个几厘米，机器人就会瞬间“卡壳”甚至动作变形。

本质原因在于，传统VLA模型让机器人干活，更像是一场“刻板的开卷考试”。

它们极度依赖人类演示的模仿学习，只是在死记硬背人类演示的动作轨迹，底层根本不理解物理世界的因果关系，泛化性自然出现断崖式下跌。

人类能处理各种非标任务，靠的是大脑天然具备对物理世界的“直觉推理”。如果机器人对现实的常识认知一片空白，其策略上限就会被锁死在旧范式里。

无界动力选的是另一条路线：隐空间世界模型 + 强化学习。

其中，隐空间世界模型建立“世界观”，负责让机器人认知物理规律与因果关系，构筑起对物理世界认知与未来状态预测的核心能力。

强化学习则塑造“价值观”，通过高频试错与奖励反馈，负责把对物理世界的理解转化为精准的执行策略。

先看懂因果，再学会行动。只有让机器人看清物理世界的因果边界，它才能真正跨越实验室Demo，到多元场景里下场干活。

机器人如何懂物理？别盯像素，去抓环境变化的“潜动作”

但要建这个世界模型，随之而来的第一个问题是：模型到底该看什么？

传统路线在推演未来时，往往在像素空间里做预测。

机器人看一段视频，不仅要学手怎么去抓杯子，还要顺便把背景里光线的微妙变化、无意义的像素噪声、甚至地板的纹理全算一遍。

大量算力浪费在了与任务无关的冗余信息上。

无界动力的MWA™全程在统一共享的隐空间（Latent Space）内完成推演，跳过像素层面的冗余计算。

更关键的是，它提炼出了“潜动作（Latent Action）”，作为场景交互变化的底层表征。

什么叫“潜动作”？

传统具身智能依赖显式的动作空间，需要人类事先标记好机械臂末端走到哪个位置、关节沿什么轨迹转动，标注成本极高。

而“潜动作”绕开了这一步，直接在特征高维空间内，把视频中“物体因受到交互而产生的位置、状态变化”抽象成一组高维表征。

不依赖任何人工动作标注，模型自己能从画面变化中归纳出动作的本质。

有了“潜动作”，MWA™就能摆脱对传统“动作标签（Action Label）”的依赖。

这样一来，面对互联网上数以亿计、根本没有人类标注动作的原始海量视频，MWA™可以直接拿来训练。

它能自动穿透那些无关紧要的背景噪点，利用潜动作直接由果推因，看懂视频里物体受力与演变的本质物理常识。

这相当于直接盘活了互联网这座无标签数据的金山，让多源数据的利用效率向前迈进了一大步。

告别“单步死磕”，“长时序双向物理因果链”创新世界模型核心范式

面对“动作卡顿与连贯性缺失”问题，MWA™在底层设计上采用了“隐空间双向动力学架构”。

这套架构在隐空间内构建了一套“正逆双向逻辑协同”。

简单说，模型内部同时跑着两条推理线：

一条是逆动力学，负责“由果推因”的特征提取，看到结果反推是什么动作导致的；

另一条是正动力学，负责“由因及果”，给定一个动作去推演接下来环境会怎么变化。

这两条线不是各跑各的，架构中引入了“正逆互审机制”。

逆向模型推演出的动作，必须交给正向模型在脑海中进行沙盘推演和虚拟验证，正向模型推演出的环境变化，也必须实时返回，与逆向模型预训练中沉淀的物理本质认知进行因果对齐。

正反互审、反复校验，从而赋予模型极高的因果推理精度。

然而，传统的双向动力学架构在走向复杂现实时，依然存在一个致命盲区：即便进入了隐空间，它们也普遍受限于“单步瞬时潜动作推理”的时序局限。

在这种单步推理机制下，模型缺失了对长时序因果的宏观归纳能力，让机器人只能“走一步、看一步、猜一步”。

这也导致了在面对长周期的连续作业时，任何微小的单步预测偏差，都会在连续时序中像滚雪球一样迅速放大，最终引发动作不连贯甚至系统的全面崩溃。

正是看穿了这一局限，无界动力在双向动力学的基础上做出了核心范式创新，推出全球首个“长时序双向物理因果链”隐空间世界模型。