Claude最强模型上线:编程封神AI信息Gap

6/10/2026

Claude Mythos,就这么,静悄悄地、没有任何大张旗鼓地,来了。

编程基准 SWE-bench Pro,80.3%。

这是 Anthropic 新模型的成绩。

作为对比:Claude Opus 4.8,69.2%。GPT-5.5,58.6%。

刚刚,Claude Fable 5 正式上线。

之前的 Mythos「强到不敢公开发布」,只对少数安全机构开放。今天的 Fable 5,就是它的公开版本。

Fable,「寓言」,Mythos,「神话」。「寓言」是更安全的「神话」。同一个模型,区别只有安全护栏。

划重点,6 月 22 日前,所有 Claude 订阅用户可以直接用,不额外收费。

Claude Fable 5 的跑分,只能用「强的离谱」来形容。

Opus 在它面前,简直就像个弟弟。

小编注:编程、法律这些不触发安全护栏的领域,Claude Fable 5 就是满血 Claude Mythos 5。但涉及网络安全和生物、化学的基准,Claude Fable 5 会因为护栏回退到 Claude Opus 4.8,得分会低一些。

FrontierCode Diamond,Claude Fable 5 29.3%,一骑绝尘。这个基准测的是代码能不能达到生产级水准。

Claude Opus 4.8 拿了 13.4%,GPT-5.5 只有 5.7%。

Terminal-Bench 终端编程,88%,Codex CLI 83.4%,Gemini CLI 70.7%。Claude 终于在这一项上超过了 GPT。

法律推理,Claude Fable 5 13.3%,GPT-5.5 2.1%,Gemini 3.1 Pro 直接交了白卷,0 分。

「人类最后一场考试」不带工具版准确率 59%,这个分数比大多数模型的带工具版都要高。

网络安全基准 ExploitBench,Claude Mythos 5 拿下 78%,Claude Opus 4.8 只有 40%。

Stripe 用 Claude Fable 5 在自家 5000 万行 Ruby 代码库里做了一次整体迁移。一天搞定。放在以前,这可能需要一整个团队干两个多月。

以前的 Claude 玩宝可梦,需要一整套辅助工具才能玩下去。地图、导航、游戏状态信息,一个都不能少。

现在,Claude Fable 5 只看游戏截图就通关了。没有地图,不需要导航和任何额外信息。就纯靠「看」。

Anthropic 还让它玩了杀戮尖塔。打开记忆功能后,Claude Fable 5 的进步是 Claude Opus 4.8 的三倍。

它会自己记笔记,越玩越聪明。

Anthropic 内部用 Claude Mythos 5 跑药物设计流程,速度提升了约 10 倍。14 个蛋白质靶点有 9 个得到了有潜力的候选分子,目前正在进一步研究。

Claude Mythos 5 还独立完成了一项基因组学研究。前后花了一周多,基本全程自主进行。汇集了 138 个物种、数百万个细胞的单细胞数据,自己设计并训练了一个机器学习模型。

结果超过了近期发表在 Science 上的同类研究。模型体量还只有对方的百分之一。

注意,Claude Fable 5 和 Claude Mythos 5 有着同一个底层模型。只不过 Claude Fable 5 多了一套安全分类器。涉及网络安全、生物化学和模型蒸馏的请求它不会直接拒绝,而是自动切换到 Claude Opus 4.8 回答。

Anthropic 官方给出的数据显示,超 95% 的对话完全不会触发这个机制。

外部红队测试了 1000 小时,也没找到通用的越狱方法。

Claude Mythos 5 则去掉了安全护栏,目前只对 Glasswing 项目合作机构开放。后续计划扩展到更多安全组织和生物医学研究人员。

Claude Fable 5 模型 ID claude-fable-5,今天就能调用。但 API 价格翻倍了。

输入 10 美元/百万 token,输出 50 美元/百万 token。Claude Opus 4.8 分别是 5 和 25。正好翻了一倍。

不过这个价格不到此前 Claude Mythos Preview 的一半。

6 月 22 日前,Claude Pro、Max、Team 和企业订阅用户可以直接用 Claude Fable 5,不额外收费。但要注意,Claude Fable 5 的额度消耗速度是 Opus 的两倍。

6 月 23 日起消耗额外的 API 积分。不过 Anthropic 官方也说了,「如果后续算力允许,会把 Claude Fable 5 重新纳入订阅计划。」

三天前,Anthropic 发布了那篇「当 AI 开始建造自己」,说 Claude 写了自家 80% 的代码,呼吁全球暂停 AI 研发。

再往前几天,递交了 IPO 申请。估值 9650 亿美元。

今天,放出了有史以来最强的公开模型。

一边喊暂停。一边冲刺上市。一边放出最强模型。

Anthropic,也是没谁了。

Scroll for more