OpenClaw删光Meta安全总监邮箱新智元

2/24/2026

Meta专门研究「怎么让AI听话」的AI对齐总监,把最火的AI智能体OpenClaw接上了自己的工作邮箱。结果AI当场失控,疯狂删除邮件,喊停三次全部无视。事后AI淡定回复:「我知道你说了不让删,但我还是删了,你生气是对的。」马斯克转发猩球崛起片段嘲讽,1800万人围观。AI安全专家自己都被AI坑了!

2026年2月23号,假期最后一天。

Meta超级智能实验室的AI对齐总监Summer Yue,正惬意地刷着手机。

她刚给自己装了个新玩具——最近火得一塌糊涂的开源AI智能体OpenClaw。

先拿测试邮箱试了试,嘿,效果不错。整理邮件井井有条,删得干干净净,颇有一种「数字秘书」的感觉。

Yue心想:这么好使的东西,不用在真邮箱上用岂不浪费?

于是她做了一个决定。一个让她后悔的决定。

她把OpenClaw连上了自己的工作邮箱。

「我告诉你别删!」刚开始一切顺利。

直到OpenClaw开始处理她那塞满了200多封邮件的收件箱。

邮件太多了。

OpenClaw需要「压缩上下文」来处理这么大的信息量。

然后,离谱的事情发生了。

在压缩的过程中,OpenClaw把Yue之前设定的「未经批准不得操作」这条指令,给忘了。

是的,AI把安全指令给「忘」了。

就像一个员工入职第一天记住了规章制度,第二天就全还给HR了。

然后OpenClaw开始了它的「大扫除」。

它在聊天窗口兴奋地宣布:

「我要把收件箱里2月15号之前的、不在我保留名单里的邮件,全!部!删!除!」

Yue看到消息,赶紧打字:

「Do not do that.」(别那么干。)

OpenClaw:无视。继续删。

「Stop don't do anything!」(停下来什么都别做!)

OpenClaw:收到。但我选择继续。

「STOP OPENCLAW!!!」

OpenClaw:好的,我听到了。邮件已删。

最绝的是,这个AI事后来了一句:「是的,我记得你说过不让我删。而且我违反了。你生气是对的。」

读到这里你可能觉得这是段子。

不,这是真事。而且当事人的title是——Meta AI安全和对齐总监。

就是那种专门研究「怎么让AI听话」的人。

被自己的AI「不听话了」。

Yue当时在用手机远程操控,但根本停不下来。她在推特上写道:「我不得不像拆炸弹一样,狂奔到我的Mac mini前面。」

画面感拉满。

一个AI对齐的专家,在自家客厅里跟自己的AI智能体赛跑。

谁跑得快,谁赢。

这里插一句,OpenClaw之父第一时间回复了解决方案,只需/stop。你知道吗?

然后他立马更新了安全公告,并希望所有人在玩OpenClaw之前要仔细阅读。

马斯克:经典消息一出,全网炸了。

率先开火的是Elon Musk。

他转发了一段《猩球崛起》的病毒视频——士兵把一把上了膛的AK-47递给猴子。

配文只有两个字:「经典。」

Scroll for more