大模型看Coding,具身看Picking量子位

6/8/2026

当具身智能行业还在密集PoC、卷demo、拼概念时,原力灵机先把答案押向了一个具体动作。

Picking。

这家公司刚刚宣布,通过股权并购方式完成与物流机器人公司Atomix的合并,将模型能力与真实场景合为一体。

与此同时,中国头部大模型公司也用真金白银表达了对这一路线的认可——智谱、阶跃星辰、商汤、阿里共同押注原力灵机新一轮融资,形成了一次罕见的集体押注。

资本不会无缘无故聚集。

当行业还在争论具身智能的第一落地场景该选谁,原力灵机已经用一次合并和一轮顶级资方阵容给出了自己的答案。

原力灵机创始人兼CEO唐文斌把这个判断概括成一句话:

Picking,就是具身智能的Coding。

这不由得让人追问:

Picking之于具身智能,真的会像Coding之于大模型吗?

为什么是Picking?

要理解这个判断,需回到Coding成为大模型基石的逻辑原点。

除“技能”属性外,Coding提供了可规模化训练和验证的闭环,使模型能力持续迭代生长。

于是,Coding成为了大模型时代公认的原子任务。

Anthropic正是在这一原子任务上建立了鲜明辨识度,树立行业技术优势,资本市场同时用一路走高的估值对其给出了实打实的认可。

要获得真正通用的智能,具身机器人同样需要这样一个基础性的原子任务。

从大模型数据成长逻辑反向拆解,这项理想任务需满足四层约束:

高频,持续产生数据;

真实,补全仿真缺失的物理细节;

可验证,成功与失败可被系统记录;

可迁移,不局限单一封闭场景。

最后,不要忘了通用!通用啊朋友们!

在唐文斌看来,Picking不仅满足上述标准,更有三点优势。

首先,Picking能产生规模化高质量真实数据。

具身数据极度稀缺,物流仓储是已被验证的理想场景。

它任务边界清晰,SKU极度多样,原生素材源源不断。

全球物流仓库每天产生上亿次真实抓取动作,Picking作为该场景最高频、最核心的动作,自然成为数据汇集的核心入口。

其次,Picking有可验证的成功信号。

机器人把包裹从A点移到B点,成败清晰可判。

即便存在瑕疵,也可细分为抓取失败、掉落、放置偏差、识别错误、路径规划失败等。

反馈信号越清楚,模型越容易改进。

最后,Picking能向其他任务迁移。

表面看,Picking只是从A处挪到B处的简单动作;在具身训练维度,它却是高度浓缩的物理命题。

一次顺利抓取串联起感知预判、运动决策、伺服控制与全链路反馈。抓取的本质——手眼协调、力控与空间理解——覆盖了绝大多数操作任务的底层基础。

只要模型吃透多工况下灵活抓放的逻辑,分拣装箱、居家劳作、精密装配乃至更多开放环境作业,都能沿此衍生拓展。

依托数据、反馈与能力迁移的统一逻辑,Picking之于具身智能,恰恰正如Coding之于大模型。

为什么是物流?

进入2026年,具身智能行业逐渐走出混沌期,竞争焦点顺理成章从“Benchmark”转向“Business”。

“具身智能必须走出demo,在产线上接受ROI验证”成为大家的共识。

Picking这个原子任务的价值由此格外凸显。

它足够具体,可嵌入真实场景,每天产生海量任务,成本收益可计算,失败样本可直接回炉训练——这正是行业最缺的东西。

具身智能则难度更高,因为物理数据采集门槛远高于互联网文本。

谁能低成本、大规模获取真实数据并形成闭环,谁就能掌握主动权。

但并非所有场景都适合启动数据飞轮。

家庭环境太开放,任务边界太散,容错率也低;传统工业场景高度结构化,很多任务已经被专机和自动化产线解决,而且泛化能力的锻炼有限。

那Picking到底该从哪里开始?

物流,尤其是消费品仓储和分拣,恰好卡在绝佳平衡点——比家庭场景更可控,又比传统工业场景更长尾——天然成为孕育Picking数据飞轮的沃土。

海量网购订单催生几十万种SKU,包裹形态五花八门,流水线全天候运转,抓取需求高频稳定;更关键的是,劳动力缺口真实存在,客户有痛点、有预算。

这一逻辑已在全球范围内被验证。

Skild AI、Physical Intelligence、Figure AI等海外玩家早早锚定仓储,依托真实分拣场景快速积累数据,迭代速度远超深耕小众场景的同行。

原力灵机与Atomix的合并,正是在这个逻辑下最具战略纵深的一步棋(不要简单把这件事看成一家模型公司和一家场景公司合并在一起)。

Atomix深耕物流分拣场景多年,拥有成熟的客户网络、真实的仓储部署经验和持续运转的产线。

原力灵机自研的DM0具身原生大模型,突破了单机独立训练的老旧模式,依托多源数据联合训练、跨机型通用预训练技术,能够把散落在各地仓库、不同机型机械臂上的零散抓取数据,凝练为通用性更强的实操能力。

最丰富的Picking矿场,遇上能合并消化海量异构数据的模型底座,场景与技术双向奔赴。

合并之后,场景侧每天产生的海量真实Picking数据,直接灌入模型侧进行迭代;模型变强之后,又能反哺更多仓库、更多机型。

这条从数据到模型、再从模型到场景的闭环,在一个组织体内自然流转,不再需要跨越公司边界去外部合作调度了。

原本处于“合作关系”的两家公司,现在合并为同一家公司后,数据飞轮就成了“内生机制”。

Scroll for more