你的机器人知道你不开心，但它可能并不在乎

事实证明，如果一个机器人在搞砸了你的早间咖啡后，能用一种恰到好处的、电子合成的愧疚语气对你说出“万分抱歉”，它依然只是一个把咖啡泼在你键盘上的笨拙机器。我们正在步入一个金属同事被赋予“社交礼仪”的时代，但一项引人入胜的新研究表明：即便机器人把礼貌修养刷到满分，也无法弥补其业务能力的“拉胯”。

研究人员正日益关注人机交互（HRI）这一微妙的科学领域。他们意识到，随着机器人走出工厂车间、走进家庭和办公室，单纯的物理操作能力已远远不够，它们需要学会“察言观色”。最近发表在《IEEE Robotics and Automation Letters》上的一项研究深入探讨了这一挑战。研究人员训练了一个协作机器人，使其不仅能通过面部表情，还能结合情境来读取人类情绪。然而，实验结果给那些认为“共情机器人就是终极形态”的人泼了一盆冷水——过程既发人深省，又有些令人啼笑皆非。

教会机器人“读懂空气”

这项研究由墨尔本大学的 Seung Chan Hong 在其本科阶段主导。他决定跳出那些陈旧的情绪检测方法。与其仅仅分析静态的面部表情（这种方法经常把因专注而紧锁的眉头误判为愤怒），团队采用了视觉语言模型（VLM）。你可以把它想象成 ChatGPT 的亲戚，只不过它长了一双眼睛。

他们通过向 VLM 展示人机交接物品的视频来对其进行训练，并由人类志愿者标注视频中表达的情绪。至关重要的一点是，这些志愿者能看到全貌：失落的物件、轻微的皱眉、因不耐烦而敲击的手指。这种富有情境感的训练收效显著。在与仅依赖面部分析的传统 AI 系统对决时，VLM 的表现明显更胜一筹——其与人类观察者标注的相似度得分为 0.86，而旧模型仅为 0.77。

“我认为 [VLM] 能够更好地与人类观察者的视角对齐，因为它不仅仅是在短时间内盯着人的脸看，而是在观察整个场景，”Hong 在接受 IEEE Spectrum 采访时指出。

完美的道歉，救不了“翻车”的表现

有趣的地方来了。研究团队随后设计了一个由 40 名志愿者参与的实验。每个人都要与搭载 VLM 的机器人合作，而机器人被设定为会“故意”犯错。在不可避免的失败之后，机器人会提供两种道歉方式之一：一种是通用的、预设好的台词；另一种则是根据人类沮丧程度量身定制的“情感自适应”道歉。

结果显而易见：人们压根无法拒绝一个能读懂你的烦躁并精准说出“对不起”的机器人。在 40 名参与者中，有 31 人更倾向于那种情感投射精准的回应。看起来，个性化的道歉确实是一种强力的“社交润滑剂”。

但这里有一个神转折。当被问及对机器人的信任度时，无论机器人的道歉有多诚恳，参与者的信任评分都全线暴跌。一个扎心的事实是：即便一个机器人像诗人一样敏感，如果它连本职工作都干不好，我们还是无法信任它。正如 Hong 直言不讳地指出的，道歉“无法修复因机器人物理任务失败而丧失的信任”。

不是“读心者”，只是个优秀的“观察员”

这项研究还揭示了另一个关键局限。虽然 VLM 能很好地模拟“第三人称”观察者的视角，但一旦将其预测与志愿者的“真实内心感受”（根据自我报告得出）对比，它的情绪猜测能力就遭遇了滑铁卢。

这揭示了感知外部社交信号与理解内在真实情感之间的鸿沟。VLM 可以发现皱眉和垂头丧气的姿态，并正确推断出“不开心”，但它无法捕捉到用户内心深处那种失望、挫败或被背叛的复杂细微差别。“虽然 VLM 是外部社交信号的优秀观察者，但它并不会读心术，”Hong 解释道。

这项工作为整个机器人行业敲响了警钟。虽然追求能无缝融入我们生活的“高情商”机器是一个值得奋斗的目标，但这绝不能以牺牲基础可靠性为代价。在我们指望机器人能提供“情绪价值”之前，还是先确保它别把事情搞砸吧。欲了解更多细节，请在 IEEE Xplore 阅读完整论文：《Can Robots Read Your Mind? A User Study on Inferring Human Emotions in HRI》。

你的机器人知道你不开心，但它可能并不在乎

教会机器人“读懂空气”

完美的道歉，救不了“翻车”的表现

不是“读心者”，只是个优秀的“观察员”

向我们发送更正或建议

NVIDIA ENPIRE 让 AI 智能体运行机器人研究实验室，无需人类参与