月入五千,成为人形机器人教育的引路人

admin162025-03-06 00:51:53

标题:揭秘机器人“奴役”人类的新职业:教机器人如何“做人”



尽管机器人尚未完全征服地球,但它们已经开始在“奴役”人类,教导我们完成各种工作。

作者|Li Yuan
编辑|郑玄

春节过后,宇树机器人再次引发了热议。

上周,宇树机器人发布了一段视频,展示了机器人转身踢腿、打功夫拳的表演,短短一周时间便获得了近五万的点赞。

一套功夫拳打下来,机器人统治世界的梦想似乎已经触手可及?

然而,在机器人越来越像人的背后,却有一群人在默默付出。

近期,极客公园发现,招聘软件上悄然出现了一批新的工作信息,员工的唯一任务就是教会机器人如何更像人类。

01

新物种工作

去年,我开始注意到,各大一线城市的招聘平台开始悄悄上架了一批全新的工作。

这些工作的标题通常是“数据采集专员”或“机器人数据采集员”,它们专为机器人提供服务。

工作内容很简单——操作机器人,进行一些人类日常会做的行为。

一个工作描述这样描述:控制机器人进行操作,如叠衣服、系鞋带、物品收纳等日常生活操作。


另一个工作描述则提到,“根据桌面零件分拣”的场景,需要操作动作捕捉服来操控机器人的动作。


一些其他类似的工作描述中,还出现了不晕3D、身体强壮、了解一些编程基础等要求。

这究竟是什么样的工作?

我潜入了一个动作捕捉的招聘群,与招聘者进行了一次对话。

我很快了解到,这个岗位主要是为国内某机器人公司服务,负责采集机器人的动作数据。

主要分为两种岗位:

一种是携带动作捕捉设备,远程操作机器人——工作人员站在机器人旁边,拿取面前的东西,而通过动作捕捉设备的传输,机器人会摆出几乎一样的动作去拿取机器人面前的东西,这在机器人领域的术语中被称为遥操作。过去在新闻中经常出现有人操作机器人进入危险环境作业,就是使用的遥操作方式。

另一种则是面对屏幕操作机械臂——工作人员操作机械臂,而屏幕里的机械臂会做出一样的动作,只不过实体空间中并没有真正的物品可以拿取,工作人员操作机械臂的目的是让屏幕里的机械臂拿取虚拟空间的物品。有点像是隔着屏幕操控抓娃娃机。

两种工作对操作人员的要求都不高,只需做出最基本的人类动作即可。因此,招聘对学历等硬性条件并没有要求。

不过有趣的是,第一类岗位,对操作人员的身材倒是有要求:身高165~170cm左右,体重62kg以内,不能有肚子,男性。第二类岗位则男女不限。

我查看了其他公司的类似岗位,工资在5000-10000元不等。而这家公司,则是按天计费,每日200元。

招聘者特别问我,你是计算机专业的吗?

在得到否定回答后,招聘人员大方地提到,现在有一个领域正在“崛起”,那就是人工智能!不要看目前只是一个兼职岗位,未来可能会变得非常重要。

当我问起,会不会已经招满了,招聘人员表示,位置很多,第一批就有几百人,而后面北京、上海、广州,都在陆续开设类似的岗位。

02

卖动作给机器人的工作,正在迅速扩张

把动作卖给机器人?听起来似乎有些不可思议。为什么要这样做呢?

带着疑问,我采访了动作捕捉设备提供商诺亦腾的联合创始人、CTO戴若犁博士。

戴博士立刻肯定了这一趋势的存在。“是的,我们也观察到了类似的现象。诺亦腾每年会卖出几千套动捕设备,是全球出货量最大的动捕设备提供商。在过去十年里,卖给机器人企业的动捕装备一直不超过我们出货量的5%,但到了2023年,情况发生了变化。”戴博士表示。

戴若犁回忆道,通常情况下,机器人企业采购动捕设备,通常用于操作机器人在危险地区进行特殊操作,这样的需求不会很多,通常的采购都是一套两套这个量级。

“我们的设备算是全球性价比最高的了。不过即使这样,贵的设备大概要十几万块钱一套,便宜的设备也要大几万块钱。只有应急演练、消防这样的市政甚至军事项目才会进行百套左右的采购。”戴若犁表示。

从2023年开始,诺亦腾开始逐渐接到越来越多的机器人企业的订单,而且一次就是上百台——这些订单,正是为前面所述的工作岗位服务的。


图片来源:诺亦腾官网

2023年,正是人形机器人开始爆发的前夕。

在2023年之前,人形机器人在机器人的研究发展中,相对是一个异端。大部分需要机器人的能力,用一个专用的机械臂已经可以解决得很好,为什么要研究人形机器人呢?我记得2023年第一次来到这里时,就曾经想过这个问题。

这背后,其实是技术的一次大跳跃。

2022年-2023年,大语言模型的进展,第一次解决了机器人泛化性的理解和规划。也就是说,现在和机器人说话,机器人第一次可以开始理解了,甚至可以自己对于语言背后的含义进行拆解,能够意识到“拿桌上的水果”这件事指的就是拿起桌上的某个特定苹果了。

这时候,人形机器人的卡点,出现了新的变化——不在于智慧,而在于动作能力上了。在智慧能力出现突破之后,如果人形机器人的动作的泛化能力能够进一步突破,那么机器人的应用场景将有很大的扩展。

而在机器人的动作问题上,实际上则有两个分支。

一个是运动能力(locomotion),我们也可以简单理解为下肢动作。

一个是操作能力(manipulation),我们也可以简单地理解为上肢动作。

我们看到的宇树机器人,能打拳、能跳舞,其擅长的,正是机器人的“下肢能力”。而正如我们所看到的,虽然仍面临着承载力等一系列问题,机器人的“下肢能力”已经相对成熟。

而机器人的“上肢能力”则是完全另外的命题。

“四足平衡或者双足平衡,其实容错能力是比较好的。你一步踩错,它通过迅速的纠偏,通过一些算法其实可以迅速找回来的。但是泛化的抓拿和操控,容错很低。细微操作这件事情,大家目前还是相信要大量的数据进去才能够训练好这个事情。”戴若犁解释道。


图片来源:Figure机器人官网

事实上,使用上肢进行灵巧操作,即使宇树机器人,也很难做到可以在现实中实用的地步。

宇树机器人在春晚的表演,使用的转手绢的动作,使用了一个取巧的战术——手绢是直接被固定在手部电机上进行高速转动的,只是用黑布遮挡,营造出“隐形”效果。其技术难点在于机器人关节扭矩更高(能够高速转动手绢)和其全身动作中的平衡,而并不在于机器人本身的手部动作灵敏到完全类人。

而想要机器人的上肢动作真正类人,业界通常认为,需要模仿学习——通过模仿人类的动作。而这意味着,需要大量的相关数据。

与无处不在的互联网数据相比,机器人的现存的相关数据则少得多。因此许多企业开始自建动作捕捉工厂,来为自家的机器人提供数据——也就出现了本文出现的新工作:卖动作给机器人的人。

这也带来了动作捕捉设备本身的爆火,据了解,截止到2024年年底,诺亦腾来自机器人领域的需求订单获得了超过六倍以上的增长。诺亦腾不但为机器人公司提供动作捕捉设备,也开始与不少厂商共建数据工厂,直接参与到具体的数据采集业务中。

03

采集数据的四象限

在招聘网站的调研中,我发现,虽然参与者做的任务都是类似的,但招聘岗位的具体称呼却有所不同。

比如我尝试面试的公司,就分出了“动作捕捉岗”和“仿真岗”两种不同的岗位。

我就这两种岗位的不同,采访了戴博士。

戴若犁将目前获得数据的途径,按照是否采取动作是否由真人完成,采集的动作是否来自机器人本体等,分成了几个象限。


图片来源:诺亦腾

对于机器人训练而言,质量最高的数据,就是用遥操作采集的真实数据,也就是我看到的第一类型招聘的内容,被称为“动作捕捉岗”。

虽然使用的是动捕设备,但是实际上记录的数据,并不是穿着动捕设备的工作人员身上的动作,而是动捕设备操作的机器人的动作。

机器人成功进行了一次抓取,设备就会记录机器人胳膊的转角等等。因此这样的数据是质量最高的——数据直接从真实的机器人身上得到,甚至可以直接从你训练的这款机器人中得到,数据十分准确。

这也就是为什么这类的工作对工作人员的身高有要求:“如果是一个两米的人,但是机器人的胳膊只有一米六的人那么长,那么有可能出现机器人再往前够,我手已经没法再往前伸了的情况。”戴若犁表示。


图片来源:诺亦腾官网

在这类的工作中,采集数据的手段,也会有一些略微的差异。

一些采集采用工作人员在一旁观察机器人的动作的方式进行,是否成功直接由工作人员的肉眼判断。

而另一些招聘要求中则提到使用VR设备。这种采集通常是让操作机器人的人员,戴上VR眼镜,直接以机器人的视角进行观察——机器人本体上会存在视觉传感器,戴上VR眼镜的工作人员,相当于看到的就是机器能看到的状态,这时候再进行遥操作,又能记录下更多的数据。

遥操作的设备本身也不只有动作捕捉一种。我接触到的另一个机器人公司,就自研了自己的外骨骼遥操作装置。操作人员在身上背上外骨骼,做动作,将动作传递到机器人身上。该机器人公司表示,这种框架下能记录到的关节转角更多。

去年8月,特斯拉也传出要招聘员工进行机器人的数据采集,招聘岗位提到要求员工每天步行超过7小时,携带重达30磅(约13.61千克)的设备,并长时间佩戴VR头显。

戴若犁推测,很有可能就是穿上了外骨骼设备进行数据采集。纯动捕设备的话,全部加一块不会超过4公斤。另一种可能就是工作人员要采集非常多的全身动作,直接把采集数据的电脑背在身上了。

“虽然正常的走路动作,并不需要采集模仿学习的数据就能进行训练。但是到俯身、协同等动作的时候,人的重心是怎么动的,在一个动作中左右的重心是怎么分配的,如果能够获得数据,对于机器人的运控仍然是有参考意义的。”戴若犁表示。


有新闻表示特斯拉的人形机器人利用Xsens动作捕捉系统进行训练 | 图片来源:Youtube

质量次高的,则是半合成数据。也就是我看到第二种岗位。

半合成数据中,动作仍然是由真实人类完成,但是收集的机器人数据,则不来自机器人本体,而来自于虚拟环境。

“半合成数据是人操作虚拟世界里的假机器人本体抓假杯子。在英伟达等公司的努力下,虚拟世界里的重力、力矩、摩擦、水流目前都已经能模拟得很好了。虚拟世界的机器人也在通过虚拟的电机运行,整套建模下来,就离现实很接近了。”戴若犁表示。