这是一个科幻照进现实的时刻,也是航天史上的一座里程碑:一颗地球观测卫星首次完全依靠自身能力,在茫茫地表找到了预定目标。
今年4月,在 Loft Orbital 公司的 YAM-9 卫星上,视觉语言模型(VLM)首次实现了在轨运行。这一突破让卫星终于摆脱了对地面分析师的深度依赖。这不仅仅是一个精巧算法的胜利,更是空间传感器能力的本质飞跃——卫星正在从“摄影工具”进化为“智能大脑”。
此次演示运行的是 Google DeepMind 的 Gemma 3 模型,这是一款专为算力受限的“边缘侧”应用而设计的 AI 架构,非常适合在太空中疾驰的卫星。硬件方面,则由 NVIDIA Jetson Orin AGX GPU 提供算力支撑,并由 NASA 喷气推进实验室(JPL)开发的软件套件进行管理。
在传统的作业模式下,卫星需要将数以 TB 计的原始图像传回地面,再由精疲力竭的人类分析师进行筛选。而现在,YAM-9 能够直接接收自然语言指令——例如“识别铁路枢纽周边的基础设施”——随后,在轨 AI 会自行完成初步筛选,仅回传关键的有效数据。
这为何至关重要?
这次演示标志着卫星正从“盲拍相机”转变为具备自主意识的观测者。通过在源头处理数据,它彻底打破了卫星运营中长期存在的带宽瓶颈,大幅削减了需要传回地面的冗余信息量。
更深层的意义在于,它为 Loft 公司 AI 负责人 Paul Lasserre 所称的“全天候在轨巡逻层”铺平了道路。未来的运营商不再需要费力地给卫星下达具体的拍照指令,而是可以给它一个长期的“巡逻任务”,比如:“持续监视这段边境线,一旦发现可疑迹象立即报警。”
这是航天基础设施从单纯的“数据收集者”向“决策制定者”进化的第一步。我们也由此进入了一个空间基础设施不仅能看,而且能“思考”的新时代。

