Claude最强模型发布,但不敢给用户用雷科技
昨天夜里,Anthropic 最新发布的 Claude Mythos(神话)预览版,又让整个 AI 圈炸锅了。Claude Mythos 预览版,官方自称「迄今为止最强大的 AI 模型」,一个全新能力层级,甚至大幅甩开了之前自家最强的 Claude Opus 4.6。至少从目前展现出的数据和结果来看,这不是营销话术,是真正质的飞跃。首先在几乎所有公开基准测试上,Claude Mythos 预览版都是第一,更为惊艳的是它的进步幅度:
面向软件工程的 SWE-bench Verified 从 Opus 4.6 的 80.8% 暴涨到 93.9%,SWE-bench Pro 从 53.4% 冲到 77.8%;面向高难度数学推理的 USAMO 2026,更是从从 42.3% 直接飙到 97.6%——几乎满分。
图片来源:Anthropic
可以说是目前的地球最强模型。
这还只是一些「小」例子,更惊艳我们的是,Anthropic 在过去几周进行了实际测试,Mythos 预览版在主流操作系统和主流浏览器中自主发现了数千个高危零日漏洞(zero-day),包括 Linux 内核、OpenBSD、Firefox 浏览器、FFmpeg 等核心组件。
很多漏洞连人类安全团队审了十几、二十年都没发现,比如在以安全著称的 OpenBSD 里,Mythos 预览版就找到了一个藏了 27 年没被发现的远程崩溃漏洞。Anthropic 官方甚至很肯定地表示,Mythos 预览版在网络安全能力上远超任何其他 AI 模型。
这不是一个「更好用的 Claude」,它写代码、做推理、搞安全,全都达到了前所未有的自主性和深度,开发者们本来期待着「终于能彻底解放生产力了」,但结果:
Anthropic 直接把门关上了。
是的,至少目前,Claude Mythos 预览版并不对公众开放。按照官方说法,Mythos 预览版目前仅用于「防御性网络安全」,并且仅 12 家合作伙伴(AWS、苹果、博通、思科、CrowdStrike、Google、摩根大通、Linux 基金会、微软、英伟达、Palo Alto Networks)以及 40 多个构建或维护关键软件基础设施的组织,拥有 Mythos 预览版的访问和使用权限。
图片来源:Anthropic
这就是 Anthropic 同时推出的 Project Glasswing(玻璃翼计划)。Anthropic 甚至还砸了 1 亿美元的额度,支持 40 多家额外组织使用 Mythos 预览版维护开源生态的「地基」。
但为什么一个「最强模型」要藏着掖着,不给人用?
武器太强,需要过渡首先是明确的是,Claude Mythos 预览版,或者类似水平的超级大模型一定会开放公众使用。Anthropic 官方写得非常直白:
「虽然我们目前没有计划向公众开放 Claude Mythos 预览版,但我们的最终目标是让用户能够安全地大规模部署 Mythos 级模型——这不仅是为了网络安全,也是为了这些功能强大的模型将带来的无数其他好处。」
就像官方博客字里行间说的,这个模型「太危险」。
去年底,Google Threat Intelligence Group(GTIG)就发现了 PromptFlux 和 PromptSteal 这两个真实样本:它们会在运行时直接连接商业大模型(比如 Gemini API)时,动态生成恶意脚本、实时混淆自身代码,还能根据目标环境「现场」创建新功能,完全绕过传统签名检测进行攻击。
这不是孤例。根据市场研究机构 SQmagazine 的报告,全球报道的 AI 驱动网络攻击数量增长了 47%,预计超过 2800 万起。
回过头来,Mythos 预览版寻找漏洞的能力已经初见端倪。尤其对比之前 Claude 最强模型 Opus 4.6 自主发现并利用漏洞的成功率接近 0%,Mythos 预览版的表现可以堪称逆天。
以 Mozilla Firefox 147 JavaScript 引擎中发现的漏洞(已修复)为例,Claude Opus 4.6 在利用漏洞上尝试了数百次,只成功了 2 次;而 Claude Mythos 预览版则在同样测试中成功利用漏洞 181 次。
图片来源:Anthropic
另外从测试报告来看,在过去几周的内部红队测试里,Mythos 预览版展现出的进攻能力,已经远超人类顶尖安全专家。它不只是「能找漏洞」,而是能自主发现、链式利用、数千个高危零日漏洞。
众所周知,黑客也分白帽和黑帽,白帽黑客发现安全漏洞通常会提醒项目管理者,在开源项目中甚至主动修补。但黑帽黑客就不一样了,他们很可能利用安全漏洞攻击系统。
既能攻,也能守,但 Mythos 预览版的进攻潜力还是大到让人担忧。一旦落入不怀好意的人手里,就能瞬间武装起 AI 级别的攻击链。Anthropic 自己都说,这不是普通的前沿模型,通用能力已经强到能把网络战直接拉到新维度。
而计算机安全领域的攻防战,一向都是「魔高一丈,道高一尺」,过去两年围绕 AI 大模型的安全攻防战也是行业,尤其是大厂关注的重点之一。远的不说,国内的字节跳动、蚂蚁这两年都有举办类似的 AI 大模型攻防战,通过红(攻击方)、蓝(防御方)对抗发现和解决 AI 时代的安全挑战。
图片来源:全球 AI 大模型攻防挑战赛
不过 Anthropic 也指出,长远来看像 Mythos 预览版这样强大的语言模型,更利于「蓝队」进行防御。但在短期内,Mythos 预览版如果开放公众使用很快就会被攻击者利用,用前所未有的效率攻击现在的全球网络。关键问题在于,防御行为更被动,攻击行为更主动,考虑到利益,攻击方也更有动力积极使用 Mythos 预览版这样的模型。
所以为了「平稳过渡」,Anthropic 推出了「玻璃翼计划」。
这里额外一提,这个项目名的灵感来自一种广泛分布在美洲的宽纹黑脉绡蝶,因为透明的翅膀更多被称为「玻璃翼蝶」,尽管看起来很脆弱,但实际上它们的翅膀可以承载相当于自身体重 40 倍的重量。
玻璃翼蝶,图片来源:Pixabay
「玻璃翼计划」的逻辑也很简单,就是让防御方先拿到武器,在攻击方拿到同级别 AI 之前,先把漏洞全堵上,并学会基于先进 AI 的安全防御。
所以从这个角度来说,Claude 的最强模型,不给人用是对的。但不仅如此,就算从普通 Claude 用户的角度来看,暂时不开放 Claude Mythos 预览版也是利大于弊。
最强模型不开放,Claude 反而更好用?很多人看到 Mythos 预览版不开放,第一反应是失望:这么强的模型,为什么不给大家用?
但如果你是普通 Claude 用户,或者每天靠 Claude Code 写代码、做项目的开发者,你可能会发现一个有点反直觉的事实,暂时不开放 Mythos 预览版,对我们反而利大于弊。
先说说最近大家最有感的痛点。
大概从今年 2 月开始,Claude 和 Claude Code 就迎来了「史诗级性能削弱」。Reddit 的 r/ClaudeCode 和 r/ClaudeAI 里,相关帖子刷屏,有人直接发帖《4.6 Regression is real!》,有人吐槽「Claude Code has been dumb over the last 1.5-2 days」。
图片来源:Reddit
还有开发者用数据追踪,文件读取次数从以前的 6-7 次掉到只剩 2 次左右,复杂任务里模型越来越「懒」,思考深度明显变浅,经常直接 edit-first 而不是先调研。


