RoboHorizon AI 赋予机器人长期任务能力

瑞典家具设计师们可能要坐立不安了——研究人员重磅发布了RoboHorizon,这是一个全新的AI框架,它能显著提升机器人执行复杂多步骤任务的能力。该系统巧妙地利用大型语言模型(LLM)充当“项目经理”,将模糊的指令分解成一系列可实现的子任务,并生成密集的奖励结构,以确保机器人循序渐进。这种全新的“识别-感知-规划-行动”(Recognize-Sense-Plan-Act, RSPA)流程,让机器人在长周期任务上的成功率飙升了29.23%。

长周期机器人技术的核心问题在于任务通常提供稀疏奖励;机器人可能需要经过十几个复杂步骤后才能知道自己是否成功,这使得它很难学习哪些具体行动是正确的。RoboHorizon通过让LLM为每个步骤创建详细的检查清单并设置奖励来解决这一难题。此外,它还结合了一种“关键帧发现”方法,帮助机器人将视觉系统聚焦于任务中最关键的时刻,例如机械臂接触到物体的那一瞬间。这简直就是机器人界的“别分心,好好看说明书!”

一张图表,展示了RoboHorizon所使用的识别-感知-规划-行动(RSPA)流程。

没有什么比在FurnitureBench基准测试上的表现更能说明问题了。这是一系列受宜家家具组装任务启发而设计的测试,专为让自主系统抓狂而生。这项测试要求长期规划、精确操控以及正确连接不同部件的能力——这些都是目前许多模型难以逾越的挑战。RoboHorizon在此处的成功,标志着机器人向处理复杂真实世界组装任务迈出了重要一步,而在此之前,这类任务一直是人类专属的“甜蜜负担”。

一张表格,展示了RoboHorizon在各种基准任务中的性能指标。

这为何如此重要?

这项研究攻克了打造真正通用型机器人的一大根本性障碍。通过将LLM的抽象规划能力与机器人世界模型的物理执行能力完美融合,RoboHorizon为机器人的发展提供了一张蓝图,让它们能够可靠地完成各种复杂任务。这种方法不再局限于单一、重复性动作,而是开启了机器人能够规划、适应并执行工厂、实验室乃至家庭中多阶段工作的可能性,让能干的机器人助手从梦想照进现实,又向前迈出了里程碑式的一大步。