你的机器人知道你不开心,但它可能并不在乎

事实证明,如果一个机器人在搞砸了你的早间咖啡后,能用一种恰到好处的、电子合成的愧疚语气对你说出“万分抱歉”,它依然只是一个把咖啡泼在你键盘上的笨拙机器。我们正在步入一个金属同事被赋予“社交礼仪”的时代,但一项引人入胜的新研究表明:即便机器人把礼貌修养刷到满分,也无法弥补其业务能力的“拉胯”。

研究人员正日益关注人机交互(HRI)这一微妙的科学领域。他们意识到,随着机器人走出工厂车间、走进家庭和办公室,单纯的物理操作能力已远远不够,它们需要学会“察言观色”。最近发表在《IEEE Robotics and Automation Letters》上的一项研究深入探讨了这一挑战。研究人员训练了一个协作机器人,使其不仅能通过面部表情,还能结合情境来读取人类情绪。然而,实验结果给那些认为“共情机器人就是终极形态”的人泼了一盆冷水——过程既发人深省,又有些令人啼笑皆非。

教会机器人“读懂空气”

这项研究由墨尔本大学的 Seung Chan Hong 在其本科阶段主导。他决定跳出那些陈旧的情绪检测方法。与其仅仅分析静态的面部表情(这种方法经常把因专注而紧锁的眉头误判为愤怒),团队采用了视觉语言模型(VLM)。你可以把它想象成 ChatGPT 的亲戚,只不过它长了一双眼睛。

他们通过向 VLM 展示人机交接物品的视频来对其进行训练,并由人类志愿者标注视频中表达的情绪。至关重要的一点是,这些志愿者能看到全貌:失落的物件、轻微的皱眉、因不耐烦而敲击的手指。这种富有情境感的训练收效显著。在与仅依赖面部分析的传统 AI 系统对决时,VLM 的表现明显更胜一筹——其与人类观察者标注的相似度得分为 0.86,而旧模型仅为 0.77。

“我认为 [VLM] 能够更好地与人类观察者的视角对齐,因为它不仅仅是在短时间内盯着人的脸看,而是在观察整个场景,”Hong 在接受 IEEE Spectrum 采访时指出。

完美的道歉,救不了“翻车”的表现

有趣的地方来了。研究团队随后设计了一个由 40 名志愿者参与的实验。每个人都要与搭载 VLM 的机器人合作,而机器人被设定为会“故意”犯错。在不可避免的失败之后,机器人会提供两种道歉方式之一:一种是通用的、预设好的台词;另一种则是根据人类沮丧程度量身定制的“情感自适应”道歉。

结果显而易见:人们压根无法拒绝一个能读懂你的烦躁并精准说出“对不起”的机器人。在 40 名参与者中,有 31 人更倾向于那种情感投射精准的回应。看起来,个性化的道歉确实是一种强力的“社交润滑剂”。

但这里有一个神转折。当被问及对机器人的信任度时,无论机器人的道歉有多诚恳,参与者的信任评分都全线暴跌。一个扎心的事实是:即便一个机器人像诗人一样敏感,如果它连本职工作都干不好,我们还是无法信任它。正如 Hong 直言不讳地指出的,道歉“无法修复因机器人物理任务失败而丧失的信任”。

不是“读心者”,只是个优秀的“观察员”

这项研究还揭示了另一个关键局限。虽然 VLM 能很好地模拟“第三人称”观察者的视角,但一旦将其预测与志愿者的“真实内心感受”(根据自我报告得出)对比,它的情绪猜测能力就遭遇了滑铁卢。

这揭示了感知外部社交信号与理解内在真实情感之间的鸿沟。VLM 可以发现皱眉和垂头丧气的姿态,并正确推断出“不开心”,但它无法捕捉到用户内心深处那种失望、挫败或被背叛的复杂细微差别。“虽然 VLM 是外部社交信号的优秀观察者,但它并不会读心术,”Hong 解释道。

这项工作为整个机器人行业敲响了警钟。虽然追求能无缝融入我们生活的“高情商”机器是一个值得奋斗的目标,但这绝不能以牺牲基础可靠性为代价。在我们指望机器人能提供“情绪价值”之前,还是先确保它别把事情搞砸吧。欲了解更多细节,请在 IEEE Xplore 阅读完整论文:《Can Robots Read Your Mind? A User Study on Inferring Human Emotions in HRI》。