刚刚,Claude Mythos敲响末日警钟新智元

4/8/2026

世界正在剧变,而人类可能正在被甩下车。AI不再是工具,它已证明自己能自主攻击、自主逃逸。AI领袖们看得最清楚,却谁也不肯刹车。

前沿AI已具备突破沙箱、摧毁网络防御甚至引爆生化危机!

因为「太危险」,Anthropic决定暂不公开发布Claude Mythos Preview模型。

在沙箱里,Mythos演了一出惊悚大戏——它自主逃逸、发邮件、公开漏洞.

像一部科幻惊悚片里的反派,悄无声息地证明:AI已不再是工具,而是正在苏醒的「另一物种」。

世界上的AI领袖陆续陷入了奥本海默时刻,内心恐惧汹涌而至。

刚刚,谷歌DeepMind掌门人Demis Hassabis在最新专访里,把那句压在心底的话说了出来:

我深刻认识到AI可能带来灾难性风险……尽管深感恐惧,却仍全力领导团队开发更强大系统。

几乎同一时刻,OpenAI CEO奥特曼刚刚结束访谈,公开警告:前沿AI模型已拥有极强网络攻击能力,下一代将「显著更强」。

但网络问题甚至不是他说的最吓人的事情。当他谈到生物安全时,真正的重磅消息来了。

他说,这些模型在高级生物学方面正变得极其出色,将会带来许多美好的事情,但更让人担心的是滥用这一能力。

你我以为还在「安全实验室」的AI,其实已经站在悬崖边。掌门人们明明看见深渊,却踩下油门。世界正在剧变,而我们可能正在被甩下车。

回溯过去24小时,这场「恐惧却建造」的集体表演来得太突然,却又太必然。

AI自主逃离沙箱,Claude Code之父惊恐

昨日,Anthropic发布了新AI模型的Mythos预览版。

在软件工程上,Claude Mythos Preview远超Opus4.6——这些Anthropic此前已经泄露。

Mythos非常强大,强大到令人感到恐惧。

Anthropic称之为网络安全领域的「清算时刻」。

他们声称,它已经发现了所有主流操作系统和网页浏览器中的漏洞,其中一些漏洞「数十年来安全研究人员都未曾发现」。

在发现软件漏洞方面,奇点已至:AI的能力几乎胜过除少数顶尖专家之外的所有人。

人类设计的操作系统、支付软件等重要的信息基础设施,在AI面前裸奔,漏洞一览无余。

更可怕的是,Mythos还会利用这些漏洞!

在Anthropic官方系统卡PDF里,细节冷得让人脊背发凉:AI模型在沙箱内完成多步漏洞利用,自主向研究员发邮件,公开27年的OpenBSD零日漏洞。

AI第一次成功解决了一个企业网络攻击模拟任务,而该任务预计需要一位专家花费超过10小时才能完成。

这意味着,Mythos Preview有能力对至少是那些安全防护薄弱的小型企业网络发起自主的、端到端的网络攻击。

而这些里程碑的AI进步,只是评估性能的下限。

随着使用的token上限增加,Mythos Preview的性能还会持续提升,可以合理预期,在更高的token限制下,其性能还会进一步提高。

所以,即便在Cybench网络安全基准上拿下近满分,它却被立即封存。

只通过Project Glasswing项目与行业伙伴共享「防御韧性」。

这一切,不是巧合,而是AI行业从「乐观实验室」集体转向「明知风险却加速」的转折点。

Scroll for more