中国机器人在跳舞,美国机器人在发论文远川科技评论
从去年春晚的转手绢,到今年春晚各路机器人联手登台,各大机器人主机厂轮番出圈。过去一年里,从走猫步到拳打创始人,再到机器人马拉松演唱会热舞都没落下,机器人的国民度更上一层楼,唯一遗憾是春节期间股票不开盘。
相比群众基础渐深、看得见摸得着的中国机器人,美国机器人行业好像冷清很多。
激进如特斯拉不惜停产Model S/X服务机器人量产,目前口径也还是“2026年下半年开始交付”。沉寂多年的老网红波士顿动力勉强算另一个,在年初的CES上发布了一个脸上长着大型USB接口的机器人:
波士顿动力的人形机器人Atlas
美国的机器人确实很少,但机器人公司其实非常多。
人工智能泰斗李飞飞初次创业就瞄准了机器人赛道,其公司World Labs主攻数据合成和机器人模型,OpenAI投资的Physical Intellence也是一家做模型的公司,创始团队就出自OpenAI和谷歌的DeepMind。
英伟达自然也不会闲着,除了做芯片,还专为人形机器人设计了Isaac大模型平台,年内连更三次,比GPU还勤快。
英伟达Issac平台为人形机器人提供模型训练和仿真测试
可见中美产业界在机器人的发展前景上不乏共识,但科技树似乎点向了截然不同的方向:
中国主攻硬件,机器人舞刀弄枪不在话下,有出息的已经在工厂拧螺丝了;美国主攻软件,虽然机器人没做出几个,但算法和论文发了不少,专利申请了一堆,产品发布会像是学术研讨会。
前有Figure AI发布VLA模型带动公司估值大涨,后有特斯拉第三代机器人公开“端到端”视频学习取代传统编程,让硅谷的视线长久地停留在了公式和代码上。
中国有强大的生产制造能力,美国有计算机科学深厚的产业基础,在机器人这个赛道上,双方似乎又要迎来一场赛跑。
两条分道扬镳的科技树,代表了人形机器人落地的两条腿:硬件和软件。
有别于传统的工业机器人,人形机器人长远的目标是“通用性”,即机器人能像人一样,完成所有人类能做的事情。
人类改造自然的工具都以人为基准设计,小到锅碗瓢盆的尺寸大到工厂产线的规划,即普罗泰戈拉所说“人是万物的尺度”。机器人想要做到“通用”,就得适应人类创造的事物,因此不但要做成人形,还要有人类一样灵活的四肢和灵巧的双手。
同时,机器人无法感知真实世界的触感、重力、反馈,因此需要软件算法,让机器人理解真实世界的物理学规则。举例来说,当机器人拿起一个鸡蛋,硬件部分负责执行这个动作,软件决定机器人施加多大的力,不至于把鸡蛋捏爆。
也就是说,硬件是机器人的肉身,软件是机器人的大脑,两者缺一不可,既可以共同进步,也可以互为绊脚石。
对中国主机厂来说,机器人跳舞不是纯粹的传播诉求,而是各种意义上的秀肌肉,向产业界展示自己在硬件上下了多少功夫。
机器人是个全新的产业,与现有产业的零部件通用程度不高。比如覆盖在机器人外表的“电子皮肤”,需要实现类似人类皮肤对外界的感知力,对传感器的灵敏度和精确度的要求远超行业标准,还要兼顾重量、成本,尚未形成统一的解决方案。
又比如硬件价值占比最高的关节。就像人类关节支撑四肢活动,机器人的关节是完成一切复杂操作的基础,髋关节的强度决定了能搬运多重的货物,拇指、食指的指尖关节决定了能穿多细的针、引多细的线。
就连走路时更自然的步态、热舞时更灵活的扭胯,都由关节方案的先进性决定。
特斯拉展示的人形机器人的膝盖关节
相比之下,美国机器人公司的重心集中在软件环节,致力于越过大语言模型与空间智能的分水岭:对物理规则的理解。
举例来说,语言模型也知道苹果会掉到地上,因为它在训练过程中输入过无数个苹果会掉在地上的数据,但这是对物理现象的一种描述,而不是理解物理规则本身。
语言模型类似一种概率预测,推测下一个词是什么,但空间智能更接近真实物理世界的模拟,算法需要判断下一秒周围环境的变化。相比舞刀弄枪,拧瓶盖、开罐头,反而是更难攻克的场景。
无论是谷歌和英伟达这类大公司,还是World Labs和Physical Intellence这些初创公司,瞄准的都是软件层面的世界模型,让AI学会物理学这门必修课。
中国在给机器人重塑金身,美国在给机器人训练大脑,这样一硬一软的默契分工,似乎总让人似曾相识。
没错,就是新能源车产业。
长了腿的电动车
电动车——确切的说是自动驾驶,可以视为人形机器人的“前置产业”。如果电动车是长了轮子的机器人,那么人形机器人就是长了腿的电动车。
自动驾驶与人形机器人的主体架构都可以看作“AI大脑+执行器”:两者都依靠各类摄像头、传感器获取外界数据,通过算力芯片和模型算法进行决策,再通过电机驱动车身或机体执行任务。
区别在于,人形机器人需要获取的数据更精确(更多类型传感器和更高的精度),需要处理的决策更复杂(通用大模型),执行的任务更多样(更灵活的关节和更科学的工学设计)。
对比两者的关键零部件,大多都在技术上同根同源,只是在规格和参数上有差异。
人形机器人的关节本身就是微缩版高性能电机;特斯拉Optimus胸前的2.3kWh的电池组,电路保护和能量管理系统都复用了电动车的电池包技术;还有用来控制电动车车轮转速的电控技术,机器人要手持鸡蛋不碎,靠的就是这个。
硬件高度通用,软件更是拿来就用。对机器人来说,在工厂里识别一个螺栓和在路上辨别红绿灯用的算法都是类似的,Optimus甚至照搬电动车用的FSD算法。
Optimus照搬特斯拉的FSD模型
这也是为什么在电动车上有所建树的公司,都动过机器人的心思。特斯拉自然不必多说,小鹏的机器人也已经造出来了,理想也表示自己要All in AI,转型具身智能公司。
中美两国一硬一软的默契分工,在供应链上体现的更加明显。中国是脱胎汽车产业的制造业企业,美国则是成片的软件和芯片设计公司。
中国的机器人供应链,最忙的都是车圈的老熟人。例如被多方爆料拿下Optimus关节订单的三花智控,就是特斯拉电动车热管理模块的供应商。传闻中拿到订单的,还包括特斯拉底盘供应商、Model 3/Y铝合金压铸件供应商。
汽车Tier1均胜电子则直接官宣升级为“汽车+机器人双轨Tier 1”,凭借过去在电动车电池管理、底盘控制等积攒的综合实力,开始给人形机器人核心零部件供货,客户除了传言中的特斯拉,还有宇树、智元等中国主机厂。
人形机器人这两年体操跳得越来越好,很难说没有这些汽车供应商的功劳。
硬件有中国供应链送温暖,软件自然有美国巨头跨界驰援。
英伟达不必多说,霸占高算力芯片市场多年,专门为机器人准备了算力芯片Jetson Thor——其实就是自动驾驶芯片Drive Thor的“机器人版本”,不仅用的同样的芯片架构(Blackwell),连最高算力都差不多。
美国自动驾驶的全村希望Waymo,同样是机器人积极分子,不仅兄弟公司DeepMind联手推出机器人世界模型,还将其激光雷达和摄像头技术,移植到了谷歌的RT-2机器人实验平台,谷歌自己则在去年发布了用于机器人的Gemini Robotics模型。


