我每天做8小时家务,给机器人当燃料镜相工作室
“以后都是机器人在工作,咱们又要出去找新工作了。”排队等待的时候,我的临时搭档李晨晨看着前一组的两人,突然感叹到。
前一组正在凌乱的桌子前,重复着一个颇有未来感的画面:
一个人,戴着装有运动相机的头盔和手套,身后拖着三根粗细不一的长线,行动迟缓地微微弯腰,单手把一本书拉到桌子边缘,拎起,放进置物架,然后又慢慢侧身,把一包随意放置的湿纸巾推到置物架旁边摆正。
长线另一端,她的搭档坐在电脑前,盯着显示器上的传感器和相机画面,挪动鼠标、切换视角,观察映射出的3D模型运动轨迹是否和真人一致、相机信号是否稳定……
一组采集员正在采集桌面整理数据。图源:AI生成
他们在教机器人如何整理桌面、打扫卫生、铺床或者折衣服。人做的每一个动作——先拿什么后拿什么、用什么姿势、抓物品的哪个地方、使多大劲……都会被相机和传感器记录下来,转换成数据,经过质检、标注后用于训练机器人模型。
通俗点来说,我们是数据采集员,也是机器人的老师。
就像人类幼儿要学会走路、拿筷子,需要大人手把手地教,机器人也一样,需要大量的人类动作数据来“喂”它。只不过,这些数据在互联网上十分稀缺。机器人要学会叠衣服、擦桌子、开门、整理书籍,必须先有人一遍遍地做给它看。
原本机器人最美好的愿景是服务于人,但在它学会服务之前,人先弯下腰,成了它的燃料。
在北京的一间民宿里,我见到了被裁员的程序员、背着房贷的前房产中介、结伴来的大学生......他们戴上头盔和手套,一遍遍重复叠被子、折毛巾、整理桌面,把自己的身体经验拆成数据,卖出去,全勤一个月能拿大约6000元。
这短暂地成了他们的一份工作,一份谁也不知道能干多久的工作。
李晨晨今年36岁,做了很多年IT运维工作,2024年被裁员后创业,亏光了积蓄,还倒欠了几万元。她看着前“一组”那个缓慢整理桌面的人,像看到了某种隐喻——等机器人学会了所有这些,人还能做什么呢?
一种巨大的无力感席卷这个空间,这里的人或许都希望那一天不要来得太快。
像机器人一样地行动
6月的一个下午,我花了半个小时,在招聘网站海投了近十家公司的机器人数据采集岗。
很快,有四家公司联系了我,三家确定了第二天的线上面试,其中一家还是估值百亿元的机器人公司。但也只有这家招全职,并会通过第三方劳务公司缴纳“五险一金”,其余两家是“外包”公司,后来我发现它们都为同一家数据采集公司服务。
事实上,缴纳“五险一金”的公司占比极低,这些机器人数据采集岗大多在兼职渠道流通。一般是200元一天,工作八小时,晚班因为昼夜颠倒,会比白班每天多50元。工资有周结也有月结,干的时间过短,可能会被扣除一部分工资。
机器人数据采集岗招聘信息。图源:截屏
成为一名机器人数据采集员不算难。投简历、被拉进招聘群、线上面试、线下试岗,整个过程最快24小时内就能完成。我最终参加了两家公司的线上面试,只被询问了身高和体重,最终都通过了,并去了无需全职的公司试岗。
这个岗位几乎不看学历和经验,入行门槛最终退回到了身体机能。
有30多个人和我参加了同一场视频群面。
一位众包外卖员很热情,圆胖的脸被晒得黢黑,声音高亢地做了一段自我介绍。他说自己以前是程序员,被裁员后开始送外卖,但还是想找份稳定的工作。他不太确定岗位到底叫什么,憋了半天说自己是来应聘“抓娃娃”的。面试官很平静地纠正他,“是机器人数据采集”。
一位应届毕业生报完身高体重,身形比较娇小,面试官的言语间表现得有些迟疑,让她把手掌伸到镜头前,看了看说,先来试试吧。
整场面试下来,只有一位应聘者被当场拒绝。理由是体型过于肥胖,无法穿戴数据采集设备。
对于这个刚刚兴起的行业来说,什么才是最理想的数据采集范式,还没有形成统一答案。目前主流的方案大致可以分为三类:真人数据、仿真数据和真机遥操数据。
真机遥操数据,是由人远程操作或通过外骨骼设备,控制机器人在真实环境中完成任务,机器人身上的传感器同步记录全过程。这类数据最接近机器人未来实际工作的场景,被认为价值最高,但其成本也最高——相当于同时承担机器人本体和人工操作两层成本,目前主要由机器人厂商自建采集体系完成。
仿真数据则是在虚拟环境中生成的数据,不需要真实场地和真人,成本主要来自算力,可以大规模并行训练。但由于虚拟世界与现实世界之间存在差距,材质、摩擦、光照等细节很难完全复刻,训练出来的机器人到了现实里可能会“水土不服”。
真人数据则有两种情况,一种仅采集真人行为视频,成本最低,但能够提供的信息相对有限。另一种在视频基础上加上了动作捕捉、传感器轨迹等,能记录更多细节,价格适中,是目前最划算的方案。
我们应聘的便是真人数据采集岗。一套真人采集设备,主要由一个装有运动相机的骑行头盔、两只内置传感器的数采手套、手部运动相机、多个定位器以及配套软件组成。加起来约十万元,招聘方告诉我们,这套设备目前正在申请专利。
正式工作前,需要经过三天培训和试岗。
第一天,项目经理和组长挨个“捏手”,检查每个人的手部条件。数采手套是均码,手指太长不行,太短不行,太胖不行,太软也不行。四十多个试岗人员排排坐,把手放在身前待检。检查结束后,现场少了四五个人。
李晨晨也在被淘汰的边缘。她的小拇指偏短,戴上手套后,传感器在指节位置皱成一团,软件无法准确还原指关节的动作。她仰头瞪大眼盯着组长,央求说让她再试试。组长点了点头。
但手指只是第一关。
第二天,开始实操,人少了一半。我和李晨晨被分到一组,她调试软件,我穿戴设备。先戴头盔,确保固定牢靠;再套上一层一次性手套防汗,然后戴上内置了传感器的数采手套,最外层再加一层针织手套,用来隔绝信号干扰;三根长长的数据线从手套和头盔延伸出来,被一根松紧带固定在腰间。
接下来,我需要双手平举在胸前保持不动,等待软件校准。
李晨晨坐在电脑前,对着屏幕里的虚拟手模型不断调整参数,组长坐在旁边指导。十分钟过去,模型手依然没调到合适的位置。组长有些着急,直接接过鼠标,点了几下,“就这样,换人,下一个。”
李晨晨起身帮我拆设备。那天天气不热,房间里开着空调,但她额头上已经冒出一层细汗。“学不会。”她低声说。
第三天试岗,李晨晨没有出现,组长重新给我安排了搭档,一位护理专业应届生。
这一天工作地点安排在一间两室一厅一厨一卫的民宿。我和搭档在主卧,任务是整理床铺、折叠毛巾;另一组人在客厅采集整理桌面的数据。还有一些同事被安排到桌游馆、厨房等场景工作——具体去哪里、做什么,取决于机器人公司的数据需求。
一位数据采集员在工作。图源:AI生成
我们被要求像机器人一样地行动——慢,手指活动幅度小。这是一个和本能对抗的过程。
起初,我像平时做家务那样,尽可能高效的完成。弯腰、拿起枕头、放一边,组长在一旁说:“快了,视频里都成虚影了,等下传感器会跟不上。”我有意识地放慢速度,组长又说:“太僵硬了,自然一点,只是动作慢,但要像人一样。”
于是,我不得不紧绷腰臀部的肌肉,拎起毛巾、展开、铺平、折叠、压实,拉平被子、掖好边角、整理褶皱,每一个动作都尽可能地缓慢、完整、连续。
“不要甩毛巾、抖被子。”组长补了一句。因为小臂处没有相机和传感器,机器人看不懂、跟不上,这类动作都被禁止。
我们还被要求灵活变换物品摆放的位置和整理物品的动作。有时毛巾在被子上方,有时夹在枕头缝隙里,我们有时要用一只手拎起枕头的一角,有时又要用两只手把枕头抱起。这是为了丰富数据的类型。
工作前,组长跟我们说,工作地点就在民宿,上厕所还是很方便的。但事实上,穿脱、调试设备往往需要至少十五分钟,上一次厕所,会浪费两个人将近半小时的时间,而少采一分钟,都可能影响最终的绩效考核——采集的数据过少不扣钱,但每天采集的有效数据达到5小时、18000秒,才会奖励50元。


