Claude 5史诗级泄露新智元
Anthropic的新模型要来了!代号Fennec的Claude Sonnet 5马上要发布,性能吊打市面上所有编程大模型,价格还砍掉50%,还能比肩一整个人类开发团队,可以说达到编程领域的巅峰。
Claude Sonnet 5,马上就要发布了!
多条信息显示,Claude Sonnet 5(代号Fennec)已经存在于谷歌基础设施中,在性能上领先谷歌的「Snow Bunny」整整一代。
它有100万token上下文窗口,定价比Opus 4.5便宜50%,将直接解决开发者对Opus「太慢、太贵」的核心不满。
而且,这次不是简单的模型升级,而是Anthropic直接把一个开发团队塞进了模型里。
在SWE-Bench上,它的成绩超过80.9%,远超当前目前市面上所有的编程大模型!
可以说,这个更便宜、更快、更强代码能力和多智能体开发模式的智能体,是Claude Code的关键解锁时刻。
开端:一条「404错误日志」
事情的开端是这样的。
2月2日,有开发者在Google Vertex AI调用API时,发现了一个神秘模型ID。
claude-sonnet-5@20260203
它的访问结果,是404 Not Found。
懂的都懂,这就说明,模型现在已经在谷歌的基础设施中部署,只是还没给你用。
随后,知名AI博主Pankaj Kumar直接下场确认—— Claude Sonnet 5的代号是Fennec,已经在Google基础设施中了。
而发布时间,很可能就是2026年2月3日,最快明后天就会发布。
AI编程大战,已经是箭在弦上,一触即发!
并且,现在已经有早期评测泄露出来。
测试者发现,在处理结构化视觉生成任务时,Sonnet 5展现出了极强的性能,仅仅凭借「ASCII世界地图」的提示词,它就生成了测试者见过的最完整、最详细的结果!
Sonnet 5生成网站
此外,在UI渲染和复杂代码构建方面,Sonnet 5也表现得游刃有余。
Sonnet 5玩游戏
Sonnet 5,性能越级吊打Opus 4.5
泄露信息显示,在多个内部基准测试中,Claude Sonnet 5的整体性能已经超越了Claude Opus 4.5。
然而,它的定位却是Sonnet,而非Opus。也就是说,Anthropic在用中端的模型,干着旗舰的活。
而Sonnet 5的编程能力也是一如既往的强。
内部测试数据显示,Claude Sonnet 5在SWE-Bench上的得分已经超过了80.9%。
此前的SWE-Bench,最高分为74.4%
因此,它能独立完成大部分软件工程师日常会遇到的问题,比如修bug、重构、补测试、跑CI、找回归问题等等。
一句话,Claude Sonnet 5不只是在写代码,还是在交付代码!
同时,最让友商失眠的部分来了——它的推理成本显著下降,价格仅为Claude Opus 4.5的50%!
原因很简单:Sonnet 5,是直接在谷歌TPU上训练和优化的。别人还为H100抢破头的时候,Anthropic早已另辟蹊径。
除了价格上的优势上,Sonnet 5的上下文还长达100万tokens,而且运行速度还有提升,还有更低的延迟。
从此,我们可以把整个项目代码库塞进去,它不是简单的「看文件」,而是理解全局再动手。
对于大项目、遗留系统、屎山代码来说,这简直是一项救命功能。
自动开发团队模型,上线!
真正恐怖的部分来了,Claude还进化出一种「自动开发团队」模型。
这种全新形态,被称为Dev Team。
在Dev Team模式下,Sonnet 5能自动生成多个子智能体,然后并行协作完成开发。
只要给一句需求,多个子智能体会同时并行工作、互相校验。
最终输出的不是一段代码,而是一个完整可用、可测试、可迭代的功能模块。
可以说,这已经不是Copilot,而是一整个不请假的开发团队!
爆料:Claude Code「蜂群」模式来了
其实在前几天,就有关于Claude Code蜂群模式(Agent Swarm)的爆料。
可以猜测,这个蜂群模型跟传说中要上线的Dev Team有着极其密切的关系。


