前段时间,名为“Figure 01”的机器人因会冲咖啡而走红。这两天,它还找到了新工作,要去宝马的美国工厂“实习”,干得好的话,一两年后就能到流水线上参与“造车”了。
Figure 01是创业公司Figure的大作,该公司仅成立一年,主营开发和制造人形机器人,估值已经超过4亿美元。最近,Figure与知名车企宝马达成重要协议,将在今年晚些时候将Figure 01机器人引入到南卡罗来纳州斯巴达堡的宝马工厂。
斯坦福的机器人能炒虾,特斯拉的擎天柱机器人能在人类的操纵下做家务,而Figure 01的特别之处在于超强的自主学习能力,它能看着视频学会操作技能,这意味着,它的技能会在学习中变得越来越丰富。
如果2023年的科技前沿是ChatGPT引领的人工智能自然语言大模型,那么2024年的前沿很可能是AI模型加持下的机器人,各种具备服务人类能力的机器人将不断涌现,它们不再是狗、蛇、属这些仿动物形态,而是直接仿人造型,协助甚至替代人类执行体力劳动。
Figure 01看个视频就掌握了技能
刚刚进入2024年,各家身怀绝技的人形机器人一个接一个的冒了出来。前有斯坦福炒虾机器人,后有特斯拉的叠衣机器人,最近,会冲咖啡的机器人Figure 01也来了。
打开机盖、放入咖啡包、按下开始按钮,Figure 01一整套动作十分流畅。与其他机器人做家务的视频不同,Figure 01冲咖啡的视频并没有做加速处理。
当然,Figure 01还远不如钢铁侠的“贾维斯”那么厉害,但“小贾”毕竟只存在于电影里,而Figure 01已经随着人工智能的发展走进了现实。
它完全由AI驱动。别小看了这一点,因为有了AI后,要求Figure 01完成事务时已无需事先预设程序,AI为它注入了强大的学习能力。官方说法是,Figure 01只需要看一看人类示范的演示视频,再加上10小时端到端的训练,就能学会视频里的操作技巧,然后完全自主地搞定任务。
冲咖啡只是证明Figure 01具备自学能力的第一步,开发公司Figure表示,只要给它足够的时间,它还就能攻克更复杂的任务。复杂到什么程度呢?Figure公司直接用一单合作给出了答案。
今年1月18日,Figure表示,将会把这款机器人送入宝马斯巴坦堡的工厂进行试点应用,主要替代人类从事一些危险度高的任务。
Figure与宝马达成合作将Figure01引入汽车工厂
宝马的斯巴坦堡工厂位于美国的南卡罗来纳州,是宝马X系列和Z系列的主要组装工厂,BMW X6的车身制造就在这个工厂里用到了300多个机器人,其中,车窗玻璃安装都是机器人在执行操作,只有侧窗玻璃由人工安装,如此一来,加工时间缩短了一半以上。
而即将进宝马工厂“上工”从事危险作业的Figure 01,身高5英尺6英寸,也就是1米67的个头;可承重19.95公斤,差不多是饮水机用的一大桶桶装水的重量;充电后,它可以运行5小时,行走速度为4.3公里/小时。
“通用目的机器人的潜力完全未被发掘。”Figure的首席执行官兼创始人布雷特·阿德科克表示, 他们的机器人能让公司提高生产力、降低成本,并创造一个更安全、更一致的工作环境。
据悉,初期阶段,Figure 01将从“少量工作”开始,随着时间推移,这些由AI驱动的人形机器人将加入更多的制造工作,包括箱子搬运、拾取和放置任务、托盘装载,以及汽车制造商一直难以留住人工工人的其他岗位。
如果达到目标,Figure 01的部署数量将会增加,预计需要12-24 个月的时间真正集成到宝马的制造流程中,包括车身车间、钣金和仓库等工区。
一大批人形机器人已在路上
Figure 01不过是众多人形机器人中的一款,2024年,更多的仿人机器人正在来的路上。
今年刚刚成立的中国公司MagicLab推出了运动型的纯电动机器人,它已经能完成后空翻落地、优雅起身这样的体操运动员动作了。
挪威的人形机器人初创企业 1X Technologies今年直接带来了EVE 和 NEO 两款产品。EVE已在美国和欧洲部分地区投入商业化应用,能巡逻,能搬运,能导航,能放哨,相当于机器人保安;而NEO目前仍处于研发阶段,据称,它会像人类一样柔软、轻巧,可以通过面部表情与人类沟通。
1X Technologies推出两款人形机器人
机器人赛道的元老DeepMind当然不甘落后,持续在仿人机器的“大脑”层面做开发,其有关机器人的三个关键研究AutoRT、SARA-RT和RT-Trajectory,将有效提高机器人的数据收集效率和泛化能力。
其中,AutoRT是机器人训练系统,能够同时指导多台机器人在不同环境中执行多样化任务;SARA-RT是提升机器人Transformer模型效率的系统;RT-Trajectory则是实现机器人泛化能力的模型,能让机器人从2D轨迹图像中学习控制策略。
强调自身定位是“人工智能/机器人公司”的特斯拉,最近带火的视频是旗下人形机器人“擎天柱”叠衣服的画面。视频中,“擎天柱”站在桌子前,从盒子里取出一件黑色T恤,然后缓慢地将之叠好。
不过,这段视频遭到质疑。有网友指出,马斯克使用了CGI(三维动画)技术伪造了视频;还有人发现视频里露出了机械臂,据此,网友称这一系列叠衣动作可能并非完全由机器人自主完成,而是外部遥控操作的结果。
特斯拉机器人叠衣服视频中出现机械臂
被“打脸”后,马斯克也老老实实承认,“擎天柱”目前还不能自主执行叠衣服操作,但“未来肯定行”。
如果单从技术性看,“擎天柱”还是有所进步,它新增了触摸传感器,对接触对象的形状、大小、位置和方向等信息能实现精准获取和分析,尤其是对压力有了更好的判断,从而精准控制力度,比如,机器人用“手”拿起鸡蛋也不会捏碎。
在自主执行操作层面,其实大多数机器人都还做不到。
比如,前段时间在视频平台爆火的斯坦福家务机器人 Mobile ALOHA,它采用的是自动+遥控的学习模式,需要人类先操控机械臂为它打个样,然后 Mobile ALOHA才能“照葫芦画瓢”学习类似的动作。
而且,不是只要演示过后Mobile ALOHA就能全部学会。根据论文,它学会擦红酒渍的成功率为95% ,推椅子为80% ,炒虾只有40%。此外,我们看它操作时也会发现,视频是倍速播放的,可以想象,在真实场景中,Mobile ALOHA做家务的速度一定十分缓慢。
到了Figure 01,自主学习能力在AI的加持下得到了提升。Figure公司称,他们的机器人完全由AI驱动,能够处理通用任务,并最终实现机器人与环境的学习和互动。据说,Figure 01冲咖啡就是通过观看视频后上手执行的,并没有人类远程操作。
英伟达高级研究科学家Jim Fan曾预测,2024年将是“机器人年”,而从去年热到今年的AI,将是人形机器人智能化的加速器。