Rhoda AI 揭秘视频训练机器人,获 4.5 亿美元融资,估值达 17 亿美元

如果说 AI 浪潮有任何放缓的迹象,Rhoda AI 显然并不认同。这家总部位于帕洛阿托(Palo Alto)的机器人智能初创公司在结束了为期 18 个月的“潜行模式”后,正式宣布完成高达 4.5 亿美元的 A 轮融资。此次融资由 Premji Invest 领投,直接将公司的估值推向了 17 亿美元的独角兽高度,并首次公开了其雄心勃勃的计划:利用海量互联网视频训练出的 AI,为工业机器人装上一个真正懂物理世界的“大脑”。

Rhoda AI 打造的平台名为 FutureVision,旨在攻克机器人领域长期以来的顽疾——如何让机器人在杂乱、多变的现实环境中灵活应变,而非仅仅局限于执行刻板的预设程序。该公司的核心“杀手锏”是其研发的“直接视频动作”(Direct Video Action)模型。与传统依赖人类远程操作、费时费力采集数据的方法不同,Rhoda 选择在数亿个公开互联网视频上对 AI 进行预训练,让系统建立起对物理规律、运动轨迹和物体交互的基础认知。随后,再利用少量的机器人专属数据进行微调,使其能够游刃有余地处理制造和物流场景中的各种突发状况。

这种利用海量非结构化视频数据构建通用型 AI 模型的策略,标志着其与传统机器人技术的彻底决裂,也与 NVIDIATesla 等巨头推崇的基座模型(Foundation Model)思路不谋而合。如果说 Tesla 正在利用其庞大的车队数据训练 Optimus 人形机器人和自动驾驶系统,NVIDIA 正在通过 Isaac 平台和 GR00T 基座模型构建生态体系,那么 Rhoda 则将自己定位为更广泛工业市场的“大脑供应商”。这种“硬件中立”的打法,意味着它可以为现有的各类机器人机群提供智能化升级。

为什么这很重要?

对于一家纯软件驱动的公司来说,A 轮融资就能达到如此惊人的规模,释放出了 Premji InvestKhosla VenturesTemasek 等顶级投资机构的强烈信号。这表明市场坚信:下一波自动化浪潮的核心价值不在于机械臂或夹具本身,而在于驱动它们的 AI 灵魂。

通过让机器人在互联网的“混沌”中学习,Rhoda AI 正在押注一种可扩展、适应性极强的智能,试图以此绕过传统编程的效率瓶颈。如果 FutureVision 真的能将 YouTube 级别的海量知识转化为工厂车间的精准动作,那么自动化复杂任务的门槛将大幅降低——而这些任务在此之前一直被认为是人类的专属领地。这不仅是一次大胆的技术尝试,更是在为一个机器人能力大爆发的世界,打造属于它们的“安卓系统”。