打造一款能干的类人机器人,这场竞赛正迅速地从硬件的比拼,转向一个更深层次的哲学拷问:机器究竟该如何学习?一边是像 Sunday 这样,全力押宝“人类教师大军”;另一边则是 Tesla 和 Nvidia 这样的巨头,期望机器人能靠“刷YouTube”自学成才。这场战略分歧不仅定义了整个行业,也让所有人都对“正确答案”莫衷一是。
Sunday 全力押注模仿学习,为500名“记忆开发者”配备特制手套,一丝不苟地记录下每项 conceivable 家务活的高质量数据。该公司声称,这种方法使其每隔一到两周就能训练并评估一项新任务,从而打造出其所谓的“世界上学习速度最快的机器人”。这是一种亲力亲为的“匠人精神”数据收集法,重质不重量。

这种以人为本的模型也有其变体。挪威公司 1X Technologies 也采用人类指导,但它不依赖手套和精心策划的训练,而是将 1X Neo:您的AI管家来了,但价格不菲 机器人直接部署到现实世界中,通过远程操作进行学习。这与其说是课堂教学,不如说是“在岗学徒制”。与此同时,Figure 正在搭建实体“神经健身房”(Neura Gyms),这些结构化环境能让其机器人在特定任务上进行训练,有时还会与宝马(BMW)等公司合作。
然后是“只看视频”学派。Tesla 一直高调宣称,其擎天柱(Optimus)机器人只需观看人类操作视频就能学会任务。Nvidia 则凭借其 NVIDIA 用 Cosmos 为机器人构建矩阵 平台,利用模拟和海量的互联网视频数据来训练其机器人基础模型。这种方法前景广阔,毕竟网上的“教学视频”时长,远超任何一支“记忆开发者”团队所能生产的数据总量。但它在语境理解、具身性以及非结构化数据的“噪音”处理上,却步履维艰。
为何如此重要?
训练方法上的分歧,是打造真正通用型机器人所面临的最大障碍。这场辩论的核心,是一个经典的“质量与数量”问题,而物理交互的复杂性又使其难度倍增。
像 Sunday AI 绕过机器人木偶,用手教做家务 这样精心策划、高质量的人类演示数据集,是实现可靠任务执行的关键吗?抑或是像 Tesla 和 Nvidia 所坚信的那样,互联网上海量而混乱的数据,最终能为人工智能提供一条更强大、更具可扩展性的道路?哪家公司能解开这个可扩展学习的谜题,它不仅会打造出更好的机器人,更可能定义未来十年的人工智能和自动化格局。






