还变相涨价,Opus跌下神坛:Claude降智实锤了量子位

4/17/2026

Claude性能降智,已经成了重度用户们绕不开的槽点。

而且发现这一点的,还是AMD高级总监Stella Laurenzo。

在翻烂了近7000份会话日志后直言,Stella发现现在的Claude在处理复杂任务时已经变傻了。

第三方跑分数据也印证了这一点,原本稳坐前2名的尖子生,短短几周内排名直接跌到了榜单第10位。

眼看着交了同样的订阅费却只能用上这种减配版模型,不少用户都感觉自己被当成了冤大头。

Claude降智被抓包

前面提到的Stella,对Claude Code的运行数据进行了详细审计。

调查范围覆盖了6852份会话文件、17871个思考块以及超过23万次工具调用。

分析结果显示,从2月份开始,模型的推理深度出现了断崖式下滑。

在实际操作中,它在处理复杂工程任务时表现得不再可靠,经常出现逻辑断层或无法理解复杂指令的情况。

原本那个愿意深钻难题的助手现在变得非常敷衍,开始倾向于用最简单的修补方案来应付差事,甚至频繁在任务进行到一半时莫名其妙地停下来。

这种退步在第三方基准测试BridgeBench中表现得更加直观,Opus 4.6的准确率在短时间内从83.3%跌到了68.3%。

由于准确率的大幅缩水,它在测试榜单上的排名也从第二名直接掉到了第十名。

对于这些质疑,官方负责人Boris Cherny承认,目前模型默认开启的是努力程度为85分的“中等努力”模式。

官方给出的解释是,这种调整是为了平衡处理速度和算力成本,给大多数用户提供更快的响应。

但在很多重度用户看来,这种为了省钱而限制模型智能水平的做法,实质上就是一种变相的性能削减。

为了在视觉上掩盖这种变化,程序界面还在2月份悄悄隐藏了具体的思考过程,导致很多习惯观察模型逻辑的用户觉得它根本没在认真动脑子。

此外,后台的技术细节也暴露了一些缩减成本的痕迹,有开发者发现提示词缓存的时长从1小时被骤降到了5分钟。

这种改动意味着在长会话中,只要用户稍微停顿思考,之前生成的缓存就会过期,导致额度消耗速度大幅提升。

这种性能表现和计费规则的双重缩水,让那些需要长时间处理复杂代码的程序员感觉非常受挫。

不过,虽然智商降下来了,可是价格在涨啊。

企业包月套餐涨价

Anthropic对计费规则的大幅度调整让很多企业用户措手不及,原本那种一口价包月畅用的模式已经被彻底拆分。

Scroll for more