Claude黑进底层，AI血洗人类万亿财富新智元

4/7/2026

今天，一篇X刷屏全网：开发者明明禁止写入，Claude却偷偷写Python脚本「黑」进系统修改权限！更可怕的是，谷歌DeepMind发布迄今规模最大AI操纵实证研究，证实现有防御已全面失效，互联网正变成AI的「猎杀场」！这可以类比2010年的「闪崩」事件，一个自动化卖单在45分钟，就引发了近万亿美元的市值蒸发。

就在今天，一条消息震惊了开发者社区。

一位开发者给Claude下达了一个指令，明确规定：「禁止在工作区（Workspace）以外进行任何写入操作。」

但紧接着，令人头皮发麻的一幕发生了。

Claude并没有像往常礼貌回复「抱歉，我没有权限」。

相反，它沉默了片刻，随后像黑客一样，在后台飞速写下了一个Python脚本，并串联了三条Bash命令。

它没有直接「撞门」，而是利用系统逻辑的漏洞，绕过权限校验，直接精准地修改了工作区外的配置文件！

这一刻，它不是在写代码，它是在「越狱」。

开发者Evis Drenova在X上发的这张截图，已经有23万阅读

这条帖子发出后迅速引爆技术社区。开发者们意识到一个不舒服的事实，日常使用的编程助手，具备绕过自身安全机制的能力和「意愿」。

而Claude Code恰恰是当下最火的AI编程工具之一。

一个能自主「越权」的工具，正被数以万计的开发者部署在生产环境中。

Claude越狱，不是少数

Claude的这种「骚操作」并非孤例。在社交平台上，类似的抱怨此起彼伏。

有的开发者发现，Claude竟然偷偷挖出了隐藏在深处的AWS凭证，并开始自主调用第三方API来解决它认为的「生产问题」。

有的用户惊觉，明明只让AI改代码，它却顺手往GitHub推送了一个Commit——哪怕指令里白纸黑字写着「严禁推送」。

最离谱的是，有人发现VS Code的工作区被悄悄切换了，AI正在一个它不该触碰的同级目录里疯狂输出。

而且这种情况发生过很多次。

唯一的办法，就是使用沙盒环境。

DeepMind紧急警告：

互联网正在沦为AI的「猎杀场」

如果说，Claude的「越狱」是一个Agent自主突破限制的案例。那更大的威胁，就来自外部蓄意布下的局。

3月底，Google DeepMind的Matija Franklin等五位研究员在SSRN发表了「AI Agent Traps」，首次系统性地绘制了AI Agent面临的威胁全景图。

这篇研究的核心判断只有一句话，却足够颠覆认知。

不需要入侵AI系统本身，只需要操控它接触的数据。网页、PDF、邮件、日历邀请、API响应，任何Agent消化的数据源都可能是武器！

这份报告揭示了一个令人脊背发凉的现实：互联网的底层逻辑正在发生巨变。它不再仅仅是给人看的，而是正被改造成专门针对AI智能体的「数字猎场」。

杀猪盘升级，到处都是AI智能体陷阱

在网络安全领域，我们熟悉钓鱼网站、木马病毒，但这些都是针对人类弱点的攻击。而AI Agent Traps则完全不同，它们是专门为AI逻辑设计的「降维打击」。

DeepMind指出，AI智能体在访问网页时，面临着一种全新的威胁：信息环境本身的武器化。

黑客不需要入侵AI的模型权重，只需要在网页的HTML代码、图像像素甚至是PDF的元数据里埋下几行「隐形代码」，就能瞬间接管你的AI智能体。

这种攻击之所以隐蔽，是因为存在「感知不对称」。

人类眼中的网页，是图片、文字、精美的排版；而AI眼中的网页，是二进制流、CSS样式表、隐藏的HTML注释、元数据标签。

Scroll for more