国产GPU开始造世界量子位

没有新的GPU，没有新的智算卡。

但一家国产GPU厂商，却在一整场发布会的时间里，做了一件非常物理的事儿——发布首个全栈国产化的具身智能仿真平台。

先来看效果。

这只名叫小飞的机器狗，缓缓走上了舞台。

在走到舞台中央后，只见屏幕里仿真世界的小飞侧空翻了一下，随即，物理世界的小飞便做出了一模一样的动作。

转个身，再来一次，动作依旧是像粘贴复制的似的。

小飞的运动策略是这样的：

100%是在仿真世界中训练出来，并无损迁移到真实物理世界的。

那么它背后这家国产GPU玩家是谁？这个具身智能仿真平台又叫什么？

正是由摩尔线程新鲜发布的MT Lambda。

刚才小飞的一套操作，可以理解为：

这是首次在全国产的硬件平台上训练出的运控策略，完整部署到全国产的端侧芯片上，第一次实现了Sim-to-Real（仿真到现实）的真机验证。

至此，摩尔线程也就成为了国内唯一打通“大模型训练 — 仿真模拟 — 端侧部署”全链路的GPU企业。

如果说大模型的爆发是依靠海量互联网数据“喂”出来的，那么具身智能的爆发，则迫切需要一个极度真实的虚拟世界。

而现在，国产GPU，开始自己动手造世界了。

更像是一套物理AI训练的流水线

若我们把MT Lambda拆开来看，其实，它更像一条围绕机器人训练展开的流水线。

最上层，是两个平台：MT Lambda-Lab和MT Lambda-Sim。

MT Lambda-Lab更偏具身策略开发与训练，面向强化学习、模仿学习、VLA模型等任务。

对于开发者来说，这一层要解决的是“怎么让智能体学会做事”的问题，即动作策略怎么训练、行为怎么迭代、模型怎么在复杂任务中逐步变得更稳定等等。

MT Lambda-Sim则更偏高保真物理仿真与渲染，负责场景构建、传感器模拟、数据生成和仿真验证。

它关心的是另一个问题：机器人看到的世界、碰到的物体、执行动作后的反馈，能不能尽可能接近真实世界。

这两者合在一起，就构成一条具身智能开发的主链路：数据合成—策略训练—仿真验证—端侧部署。

为什么这条链路重要？因为现实世界太贵了。

张建中在发布会上，便提到了训练一个好的智能体的三大痛点：

首先缺少大量高质量数据，靠人采集、靠遥操作采集，成本都很高；

其次，真机训练风险和代价很高，不可能让机器人或机器狗每天反复摔倒、损坏；

第三，真实场景往往不可控，也不容易泛化，实验室里能跑，换个环境就可能失效。

这几句话其实点出了具身智能行业当下最现实的矛盾，即模型进化很快，物理场景积累很慢。

大模型可以吃互联网数据，但机器人吃的是现实世界的数据。一个杯子从桌边滑落，一块布料被夹爪抓起，一辆车在雨夜里遇到突发障碍，这些任务很难用简单文本描述完整。它们涉及光照、材质、摩擦、碰撞、运动轨迹和传感器反馈。要让机器人真正学会行动，就必须把这些复杂场景低成本、大规模、可复现地生产出来。

MT Lambda的底层能力，就围绕三类引擎展开：物理、渲染、AI。

先看物理引擎。

MT Lambda集成了MuJoCo-Warp-MUSA、Newton-MUSA等开源后端，也包括摩尔线程自研的AlphaCore物理引擎。

它们基于MUSA架构进行并行求解，支持高精度、可微分的物理计算。在典型仿真负载下，整体仿真吞吐效率可实现约30倍提升。

这意味着什么？

对于机器人来说，物理引擎的价值远远不止让画面里的东西动起来。机械臂抓起一个柔性物体，指尖接触时有力的反馈；四足机器人落地时，不同地面材质会改变受力和姿态；自动驾驶仿真里，车辆、行人、障碍物之间的运动关系要符合真实物理规律。仿真如果不准，训练出来的策略就容易在现实中翻车。

再看渲染引擎。

MT Lambda搭载MT Photon光子引擎，融合光线追踪与混合渲染能力，同时引入3DGS和自研AI生成式渲染能力，用来提升仿真画面的真实感、细腻度和渲染效率。

这部分尤其关键。具身智能既要算动作，也要看世界。摄像头、深度相机、激光雷达、触觉传感器等多模态输入，都会影响机器人如何判断环境。渲染越真实，合成数据越接近真实数据，Sim to Real的鸿沟就越有机会缩小。

现场讲到与光轮智能合作时，张建中提到，MTT S5000具备RT Core光线追踪核心，可以带来接近3倍的图形渲染能力提升；在相关测试中，使用MTT S5000 RT Core硬件光线追踪加速渲染，可获得2.7倍性能提升。

最后是AI引擎。

MT Lambda集成深度适配PyTorch的Torch-MUSA框架，配合muSolver、muFFT等加速库，支持VLA模型开发部署，并融合强化学习和模仿学习训练范式。

放到具身智能里，AI引擎对应的是机器人大脑的训练：它要把视觉、语言、动作连接起来，把环境反馈变成下一步决策。

为什么摩尔线程能把“算、仿、渲”装进一个Lambda？

其实，这也是全功能GPU价值被放大的地方。毕竟，全功能GPU在国内本身便是稀缺的。

因为具身智能对芯片的要求，远不止AI矩阵计算。

机器人训练要跑VLA模型、强化学习和模仿学习，这是AI智算；要模拟碰撞、摩擦、动力学和复杂接触，这是科学计算和物理AI；要生成足够真实的训练画面和传感器数据，这是3D渲染；未来还会涉及大量视频数据的采集、传输、生成和回放，这又离不开超高清视频编解码。

TPU、NPU或者一些GPGPU路线，往往更聚焦AI计算或通用计算的某一类任务。它们在特定场景里可以把效率做到很高，但具身智能的问题更杂，既要训练数字大脑，也要构建物理世界，还要把真实画面和传感器反馈一起纳入训练闭环。