前段时间，名为“Figure 01”的机器人因会冲咖啡而走红。这两天，它还找到了新工作，要去宝马的美国工厂“实习”，干得好的话，一两年后就能到流水线上参与“造车”了。

Figure 01是创业公司Figure的大作，该公司仅成立一年，主营开发和制造人形机器人，估值已经超过4亿美元。最近，Figure与知名车企宝马达成重要协议，将在今年晚些时候将Figure 01机器人引入到南卡罗来纳州斯巴达堡的宝马工厂。

斯坦福的机器人能炒虾，特斯拉的擎天柱机器人能在人类的操纵下做家务，而Figure 01的特别之处在于超强的自主学习能力，它能看着视频学会操作技能，这意味着，它的技能会在学习中变得越来越丰富。

如果2023年的科技前沿是ChatGPT引领的人工智能自然语言大模型，那么2024年的前沿很可能是AI模型加持下的机器人，各种具备服务人类能力的机器人将不断涌现，它们不再是狗、蛇、属这些仿动物形态，而是直接仿人造型，协助甚至替代人类执行体力劳动。

Figure 01看个视频就掌握了技能

刚刚进入2024年，各家身怀绝技的人形机器人一个接一个的冒了出来。前有斯坦福炒虾机器人，后有特斯拉的叠衣机器人，最近，会冲咖啡的机器人Figure 01也来了。

打开机盖、放入咖啡包、按下开始按钮，Figure 01一整套动作十分流畅。与其他机器人做家务的视频不同，Figure 01冲咖啡的视频并没有做加速处理。

当然，Figure 01还远不如钢铁侠的“贾维斯”那么厉害，但“小贾”毕竟只存在于电影里，而Figure 01已经随着人工智能的发展走进了现实。

它完全由AI驱动。别小看了这一点，因为有了AI后，要求Figure 01完成事务时已无需事先预设程序，AI为它注入了强大的学习能力。官方说法是，Figure 01只需要看一看人类示范的演示视频，再加上10小时端到端的训练，就能学会视频里的操作技巧，然后完全自主地搞定任务。

冲咖啡只是证明Figure 01具备自学能力的第一步，开发公司Figure表示，只要给它足够的时间，它还就能攻克更复杂的任务。复杂到什么程度呢？Figure公司直接用一单合作给出了答案。

今年1月18日，Figure表示，将会把这款机器人送入宝马斯巴坦堡的工厂进行试点应用，主要替代人类从事一些危险度高的任务。

Figure与宝马达成合作将Figure01引入汽车工厂

宝马的斯巴坦堡工厂位于美国的南卡罗来纳州，是宝马X系列和Z系列的主要组装工厂，BMW X6的车身制造就在这个工厂里用到了300多个机器人，其中，车窗玻璃安装都是机器人在执行操作，只有侧窗玻璃由人工安装，如此一来，加工时间缩短了一半以上。

而即将进宝马工厂“上工”从事危险作业的Figure 01，身高5英尺6英寸，也就是1米67的个头；可承重19.95公斤，差不多是饮水机用的一大桶桶装水的重量；充电后，它可以运行5小时，行走速度为4.3公里/小时。

“通用目的机器人的潜力完全未被发掘。”Figure的首席执行官兼创始人布雷特·阿德科克表示，他们的机器人能让公司提高生产力、降低成本，并创造一个更安全、更一致的工作环境。

据悉，初期阶段，Figure 01将从“少量工作”开始，随着时间推移，这些由AI驱动的人形机器人将加入更多的制造工作，包括箱子搬运、拾取和放置任务、托盘装载，以及汽车制造商一直难以留住人工工人的其他岗位。

如果达到目标，Figure 01的部署数量将会增加，预计需要12-24 个月的时间真正集成到宝马的制造流程中，包括车身车间、钣金和仓库等工区。

一大批人形机器人已在路上

Figure 01不过是众多人形机器人中的一款，2024年，更多的仿人机器人正在来的路上。

今年刚刚成立的中国公司MagicLab推出了运动型的纯电动机器人，它已经能完成后空翻落地、优雅起身这样的体操运动员动作了。

挪威的人形机器人初创企业 1X Technologies今年直接带来了EVE 和 NEO 两款产品。EVE已在美国和欧洲部分地区投入商业化应用，能巡逻，能搬运，能导航，能放哨，相当于机器人保安；而NEO目前仍处于研发阶段，据称，它会像人类一样柔软、轻巧，可以通过面部表情与人类沟通。

1X Technologies推出两款人形机器人

机器人赛道的元老DeepMind当然不甘落后，持续在仿人机器的“大脑”层面做开发，其有关机器人的三个关键研究AutoRT、SARA-RT和RT-Trajectory，将有效提高机器人的数据收集效率和泛化能力。

其中，AutoRT是机器人训练系统，能够同时指导多台机器人在不同环境中执行多样化任务；SARA-RT是提升机器人Transformer模型效率的系统；RT-Trajectory则是实现机器人泛化能力的模型，能让机器人从2D轨迹图像中学习控制策略。

强调自身定位是“人工智能/机器人公司”的特斯拉，最近带火的视频是旗下人形机器人“擎天柱”叠衣服的画面。视频中，“擎天柱”站在桌子前，从盒子里取出一件黑色T恤，然后缓慢地将之叠好。

不过，这段视频遭到质疑。有网友指出，马斯克使用了CGI（三维动画）技术伪造了视频；还有人发现视频里露出了机械臂，据此，网友称这一系列叠衣动作可能并非完全由机器人自主完成，而是外部遥控操作的结果。

特斯拉机器人叠衣服视频中出现机械臂

被“打脸”后，马斯克也老老实实承认，“擎天柱”目前还不能自主执行叠衣服操作，但“未来肯定行”。

如果单从技术性看，“擎天柱”还是有所进步，它新增了触摸传感器，对接触对象的形状、大小、位置和方向等信息能实现精准获取和分析，尤其是对压力有了更好的判断，从而精准控制力度，比如，机器人用“手”拿起鸡蛋也不会捏碎。

在自主执行操作层面，其实大多数机器人都还做不到。

比如，前段时间在视频平台爆火的斯坦福家务机器人 Mobile ALOHA，它采用的是自动+遥控的学习模式，需要人类先操控机械臂为它打个样，然后 Mobile ALOHA才能“照葫芦画瓢”学习类似的动作。

而且，不是只要演示过后Mobile ALOHA就能全部学会。根据论文，它学会擦红酒渍的成功率为95% ，推椅子为80% ，炒虾只有40%。此外，我们看它操作时也会发现，视频是倍速播放的，可以想象，在真实场景中，Mobile ALOHA做家务的速度一定十分缓慢。

到了Figure 01，自主学习能力在AI的加持下得到了提升。Figure公司称，他们的机器人完全由AI驱动，能够处理通用任务，并最终实现机器人与环境的学习和互动。据说，Figure 01冲咖啡就是通过观看视频后上手执行的，并没有人类远程操作。

英伟达高级研究科学家Jim Fan曾预测，2024年将是“机器人年”，而从去年热到今年的AI，将是人形机器人智能化的加速器。

Source

Visited 4 times, 1 visit(s) today

人形机器人将进宝马工厂「实习」之前它还只会冲咖啡

Figure 01看个视频就掌握了技能

一大批人形机器人已在路上

You missed

闫瑞祥：美国10月经济数据喜忧参半，降息预期调整

扩散模型失宠？端侧非自回归图像生成基础模型Meissonic登场，超越SDXL！

【追踪】涉1亿多元资产，“德御系”实控人田文军夫妇在英资产或被没收

20万，中国新能源车给世界的震撼

人形机器人将进宝马工厂「实习」 之前它还只会冲咖啡

Figure 01看个视频就掌握了技能

一大批人形机器人已在路上

You missed

闫瑞祥：美国10月经济数据喜忧参半，降息预期调整

扩散模型失宠？端侧非自回归图像生成基础模型Meissonic登场，超越SDXL！

【追踪】涉1亿多元资产，“德御系”实控人田文军夫妇在英资产或被没收

20万，中国新能源车给世界的震撼

人形机器人将进宝马工厂「实习」之前它还只会冲咖啡