以色列初创公司 Mentee Robotics 刚刚上演了一出“神操作”:未来,操控人形机器人可能就像动动嘴皮子那么简单。该公司发布了一段视频,展示其 MenteeBot 简直是“技惊四座”,完全凭借自然语言语音指令,就能自主搞定一系列复杂的多步骤任务——比如从厨房里精准定位并取回一瓶“指定款”汽水。看样子,这下一代“家庭小助手”要彻底告别厚厚的说明书了,一句“您说啥?”就能搞定一切。
这项在易用性上的“惊天一跃”,并非孤芳自赏,而是与一项更严酷的工业任务“同台竞技”。在另一段长达18分钟、未经任何剪辑的视频中,两台 MenteeBot V3 人形机器人在一个仓库环境中,上演了一出“默契双人舞”。这对“黄金搭档”成功地将32个箱子从八个不同的堆叠搬运到四个滚动货架上。据该公司透露,整个过程是100%全自主的,完全没有人类远程操控(teleoperation)的“暗箱操作”。这些机器人不仅展现出稳健的移动(locomotion)和精巧的操作(manipulation)能力,甚至还能在共享工作空间中彼此协调,巧妙避开碰撞,简直是“智商在线”。
Mentee Robotics 由 AI 和计算机视觉领域的“三巨头”——Amnon Shashua 教授(同时也是 Mobileye 的创始人)、Lior Wolf 教授和 Shai Shalev-Shwartz 教授——于2022年联手创立。他们的目标很明确:打造融合了尖端 AI 技术与自研硬件的人形机器人。这款 V3 机器人身高1.75米,能轻松“扛起”高达25公斤的“重担”(payload)。其核心决策完全由“板载计算”(onboard compute)处理,彻底摆脱了对云连接(cloud connectivity)的依赖,也一并解决了潜在的延迟(latency)问题——毕竟,谁也不想机器人“卡顿”吧。
这为何意义重大?
Mentee Robotics 的“杀手锏”可不仅仅是造出个能干的机器人,更在于让它部署起来“简单到离谱”。他们成功地将大型语言模型(LLMs)用于命令解读,并与实时 3D 场景映射(3D scene mapping)技术完美融合,这一手直接将人形机器人的操作技术门槛“砍”到了新低。这意味着,你不再需要工程师苦哈哈地编写复杂的特定程序,普通用户只需“动动口”,就能告诉机器人该干啥。这种“导师式学习”(mentoring)方法,让机器人通过几次演示就能“get到”精髓,有望大幅加速其在物流领域,乃至最终进入寻常百姓家的普及速度。当一众竞争对手还在“卷”速度和纯粹的力量时,Mentee 却独辟蹊径,坚定地认为:最有用的机器人,莫过于那个真正“懂你心意”的家伙。






