1X 向 VLA 封装器宣战,启动世界模型实验室

在通往物理世界“通用人工智能(AGI)”的硬核赛道上,一场关于技术路线的“灵魂之争”正演变成一道深不见底的鸿沟。

一边是务实派,主张站在巨人的肩膀上,充分榨取现有大语言模型(LLM)的恐怖算力;另一边则是原教旨主义者,他们坚信真正的物理智能绝非“嫁接”而生,必须从底层逻辑开始重塑。本周,人形机器人新锐 1X Technologies 旗帜鲜明地站到了后者一边,官宣成立 1X World Model Lab(世界模型实验室)。这一举动,无异于向整个行业投下了一枚重磅炸弹。

“你无法通过‘微调’(Fine-tuning)通向 AGI,”1X 首席执行官 Bernt Bornich 在一份措辞犀利的声明中直言不讳,“你更不可能通过微调,让机器人在物理世界中自如行走。”

这番言论直接将矛头指向了那些沉迷于 VLA(视觉-语言-动作) 模型的竞争对手。VLA 路线本质上是给 GPT-4 这种强大的视觉语言模型(VLM)套上一层“电机控制”的外壳。而 1X 决定孤注一掷,选择了一条更艰难、更具颠覆性的道路:具身世界模型(Embodied World Models)

路线之争:微调补丁 vs. 第一性原理

要理解 1X 这一举动的分量,必须先看清机器人大脑进化的两条路线。

VLA(Vision-Language-Action) 路线以 Figure AI 等公司为代表,被视为通往成功的“捷径”。其逻辑极具诱惑力:拿一个耗资数十亿美元、已经精通语言和视觉的基础模型,用机器人动作数据进行微调,然后——瞧!一个能听懂指令的机器人就诞生了。这种方法借了 LLM 爆发的东风,但批评者认为,这些模型缺乏对物理定律的真实感知。它们是顶级的“模式匹配者”,而非“物理引擎”。它们可能从训练数据中学到“不要摔碎玻璃杯”,但它们并不从本质上理解引力会导致破碎。

世界模型(World Model) 路线则是一条“少有人走的路”。其目标是构建一个能够对世界进行内部预测仿真的基础模型。在学习“拿起苹果”这种具体任务之前,它必须先理解空间、运动、物体恒存、因果关系以及物理定律。支持者认为,这是实现“泛化能力”的唯一途径——只有这样,机器人在面对训练数据中从未出现过的新场景时,才能表现出真正的智能。

Bornich 的立场异常坚定:“前沿技术不应该是更华丽的 VLA 壳子,而是具身世界模型。”

1X 的豪赌与“神来之笔”的挖角

新成立的 1X World Model Lab 正是这一野心的载体。它的使命是从零开始,为人形机器人打造最具泛化能力的基础模型。为了领导这一宏大计划,1X 从生成式视频 AI 领域的明星公司 Luma AI 挖走了其创始研究科学家 Sam Sinha。

这绝对是一次战略级的“神来之笔”。Luma AI 擅长构建高度逼真的视频模型,这在逻辑上与预测未来物理状态的“世界模型”高度契合。Sinha 的职业生涯一直处于多模态生成式视频模型的最前沿。正如他所言,长期以来机器人学在 AI 领域一直像个“二等公民”,机器人数据仅仅是被当作“缝合在模型上的薄薄一层微调”。而新实验室的目标是反客为主,将具身数据视为“第一性原理”的核心养分。

1X 的战略依托于一个良性的“数据飞轮”:

  • 起步: 利用互联网规模的多媒体数据、第一视角人类视频以及仿真数据。
  • 加持: 引入来自远程操作机器人的灵巧作业数据。
  • 部署: 投放 NEO 人形机器人集群,收集真实世界中的同策略(on-policy)数据。
  • 迭代: 机器人收集数据 -> 模型进化 -> 机器人更强 -> 循环往复。

世界构建者的同盟

在这一哲学阵营中,1X 并不孤单。世界模型阵营中不乏重量级选手,即便他们并不都在造双足机器人。

Tesla 的完全自动驾驶(FSD)系统或许是这一概念最著名的现实应用。FSD 依赖“世界模型”来预测周围车辆、骑行者和行人的潜在动作,在内部运行无数个“可能未来”的仿真,以指导驾驶决策。它不只是在反应,而是在预判。

AI 泰斗 Yann LeCun(在 Meta 功勋卓著后,现领导 AMI Labs)多年来一直是世界模型的坚定拥趸。他认为 LLM 存在“根本性缺陷”,因为它们缺乏对世界运行规律的内部建模。他提出的联合嵌入预测架构(JEPA),旨在通过观察和预测视频来让模型学习“常识”,这正是世界模型的核心教义。

前方:由拍字节铺就的进阶路

1X 的这一招是典型的高风险、高回报。从头开始构建基础世界模型,其资金消耗和对数据的渴求将是天文数字。当 VLA 阵营站在 GoogleOpenAI 等巨人的肩膀上疾步前行时,1X 却选择在大地上亲自挖掘地基。

1X 世界模型实验室的成败,取决于它能否在大规模尺度上转动那个“数据飞轮”。如果成功,它将建立起一道坚不可摧的数据护城河,并催生出比 VLA 机器人更强韧、更具通用智能的新一代机器物种。如果失败,这或许会成为科技史上一个关于“为了追求优雅理想而放弃务实捷径”的警示故事。

战线已经划定。机器人学的未来究竟是 LLM 革命的延伸,还是需要一场彻底的“另起炉灶”?全球都在屏息以待,看 1X 这场“从零造世界”的豪赌,最终是会赢得满堂彩,还是会陷入财务报表的“微调”困境。