架构巅峰对决:Humanoid KinetIQ 硬碰硬 Figure Helix 02

在打造通用人形机器人“数字大脑”的巅峰对决中,一场引人入胜的哲学分歧正在上演。现在的竞争早已超越了“谁能让机器人走得稳”或“谁能帮主人拿可乐”的初级阶段,真正的战争发生在认知架构的最深处。

一方是崇尚“端到端”的天才派,主张让机器通过观察来学习一切;另一方则是严密的“层级官僚派”,强调用逻辑和分工来掌控全局。最近,Humanoid 带着其全新的 AI 架构 KinetIQ 强势杀入后者的阵营。这套系统不仅是为了控制单一机器人而生,它的野心是像指挥家一样,统领一整支机器人交响乐团。

这无疑开启了一场针尖对麦芒的对决,其对手正是 Figure AI。后者的 Figure Helix 02:告别十万行代码,人形机器人也能优雅做家务 凭借如行云流水般的长程自主操作能力,此前已令业界惊艳。当 Figure 致力于构建一个能够学习复杂多步任务的统一神经网络时,Humanoid 却在攻克一个更具烟火气、也更具工业挑战的难题:机群管理。这是一场“全能天才”与“总承包商”之间的较量,其胜负可能决定未来几十年机器人融入人类世界的方式。

KinetIQ:认知领域的“职场晋升阶梯”

Humanoid 的 KinetIQ 建立在所谓的“跨时间尺度(cross-timescale)”架构之上。通俗点说,这就像一个四层高的指挥塔,每一层都有明确的权责。这套代理框架(Agentic framework)的思考逻辑极像一家现代化大企业,每个层级都以不同的速度和抽象程度运行。

坐镇塔尖的是 System 3,即“智能机群调度官”。它是公司的 C-Suite 高管层,负责对接工厂或仓库的管理软件,接收高层指令。它的运行周期以秒到分钟计,将机群中无论是双足还是轮式的各类机器人视为一种资源,通过精准调度实现效率最大化。

往下走一级是 System 2,它扮演着“机器人级项目经理”的角色。这一层利用全模态语言模型来解读 System 3 的指令,并将其拆解为单个机器人可执行的一系列子任务。它负责对环境进行推理,并能动态调整计划——本质上是在执行过程中即时解决问题。

负责下达实时指令的是 System 1,一个充当“领班”角色的视觉-语言-动作(VLA)网络。它以 5-10Hz 的频率高速运转,持续为机器人的肢体(双手、躯干、骨盆)生成目标姿态流,以执行 System 2 制定的计划。

最后,真正干苦力活的是 System 0。这是“全身控制器”,运行频率高达 50Hz。它完全在模拟环境中经过约 1.5 万小时的强化学习(RL)训练而成。它的唯一目标就是疯狂地将上层传来的姿态目标转化为稳定、平衡的关节运动,确保机器人在搬运箱子时不会一头栽倒在地。

Video thumbnail

Helix 02:端到端的全能大师

而在赛道的另一头,Figure AI 的 Helix 02 则代表了完全不同的哲学。它没有采用多层官僚架构,而是围绕一个统一的视觉运动神经网络构建。它的座右铭是“全传感器输入,全执行器输出”,将视觉、触觉和本体感受直接连接到每一个关节,构成一个连续的系统。

虽然 Helix 02 也有层级,但其结构更为紧凑:

  • System 2 处理高层语义推理,类似于 KinetIQ 的高层。
  • System 1 是见证奇迹的地方。这是一个强大的策略网络,能以 200Hz 的速度将感知直接转化为全身关节目标。
  • System 0 是其物理化身的基石,负责确保动作的平滑与稳定。但与 KinetIQ 纯粹的强化学习路径不同,Helix 的 System 0 经过了超过 1000 小时的人类运动数据训练,在通过 RL 优化之前,它就已经领悟了人类平衡协调的细微神韵。此外,它的运行频率达到了令人咋舌的 1 kHz。

正是这种方式,让 Figure 能够展示其机器人自主完成长达 4 分钟的洗碗机装载任务——这种长程自主能力至今仍是该领域的标杆。

两种大脑:一场关于灵魂的哲学分歧

KinetIQ 与 Helix 02 的区别不仅仅在于技术参数,更代表了对机器人未来愿景的两种截然不同的预判。

特性Humanoid KinetIQFigure AI Helix 02
核心目标多样化机器人的机群调度单体机器人的长程自主能力
架构4 层智能代理框架3 层统一视觉运动网络
System 0 训练约 1.5 万小时纯强化学习1000+ 小时人类运动数据 + RL
System 0 频率50 Hz1000 Hz (1 kHz)
核心优势可扩展性、可靠性及多平台管理动作流体感、灵巧度及复杂新任务学习
形象类比运作精良的物流巨头训练有素的全能运动员

KinetIQ 这种基于代理的分层设计非常务实。通过解耦,Humanoid 理论上可以在不重构整个系统的情况下,单独对某一层进行升级、调试甚至更换。这种模块化特性非常适合工业环境,因为在工业领域,跨机器的可靠性和协调性高于一切。

Figure 的端到端路径在追求通用人工智能(AGI)方面则显得更有野心。通过在人类数据上进行训练,它的目标是创造一种物理动作的“底层大模型”,使其天生具备更优雅的姿态,能更好地适应现实世界中那些杂乱无章的突发状况。它学习的是“像人一样行动”,而不仅仅是“达成目标”。

终极赛道:从华丽演示到脏活累活

最终,谁的架构更胜一筹,评判标准不在实验室,而在工厂车间和千家万户。Humanoid 押注的是价值数千亿美元的物流和制造业市场,在这些领域,调度专业的机器人机群才是核心痛点。KinetIQ 正是为那个世界量身定制的。

Figure AI 专注于以人为中心的复杂任务,似乎在下一盘更长的棋,旨在打造一个终有一天能穿梭于任何人类环境的真正通用机器人。它所展示的惊人灵巧度——从抓取药丸到精准操控注射器——都在挑战微细动作控制的极限。

比赛已经鸣枪。机器人技术的未来,究竟是掌握在一位严谨的 AI 机群调度官手中,还是由一位天赋异禀的机器人天才引领?KinetIQ 为前者提供了强有力的论据:它不是为了短视频里的华丽集锦而生,而是为了应对工业化 24/7 全天候部署的残酷现实。欲了解更多信息,您可以访问 thehumanoid.ai 阅读官方发布公告。