还变相涨价，Opus跌下神坛：Claude降智实锤了量子位

Claude性能降智，已经成了重度用户们绕不开的槽点。

而且发现这一点的，还是AMD高级总监Stella Laurenzo。

在翻烂了近7000份会话日志后直言，Stella发现现在的Claude在处理复杂任务时已经变傻了。

第三方跑分数据也印证了这一点，原本稳坐前2名的尖子生，短短几周内排名直接跌到了榜单第10位。

眼看着交了同样的订阅费却只能用上这种减配版模型，不少用户都感觉自己被当成了冤大头。

Claude降智被抓包

前面提到的Stella，对Claude Code的运行数据进行了详细审计。

调查范围覆盖了6852份会话文件、17871个思考块以及超过23万次工具调用。

分析结果显示，从2月份开始，模型的推理深度出现了断崖式下滑。

在实际操作中，它在处理复杂工程任务时表现得不再可靠，经常出现逻辑断层或无法理解复杂指令的情况。

原本那个愿意深钻难题的助手现在变得非常敷衍，开始倾向于用最简单的修补方案来应付差事，甚至频繁在任务进行到一半时莫名其妙地停下来。

这种退步在第三方基准测试BridgeBench中表现得更加直观，Opus 4.6的准确率在短时间内从83.3%跌到了68.3%。

由于准确率的大幅缩水，它在测试榜单上的排名也从第二名直接掉到了第十名。

对于这些质疑，官方负责人Boris Cherny承认，目前模型默认开启的是努力程度为85分的“中等努力”模式。

官方给出的解释是，这种调整是为了平衡处理速度和算力成本，给大多数用户提供更快的响应。

但在很多重度用户看来，这种为了省钱而限制模型智能水平的做法，实质上就是一种变相的性能削减。

为了在视觉上掩盖这种变化，程序界面还在2月份悄悄隐藏了具体的思考过程，导致很多习惯观察模型逻辑的用户觉得它根本没在认真动脑子。

此外，后台的技术细节也暴露了一些缩减成本的痕迹，有开发者发现提示词缓存的时长从1小时被骤降到了5分钟。

这种改动意味着在长会话中，只要用户稍微停顿思考，之前生成的缓存就会过期，导致额度消耗速度大幅提升。

这种性能表现和计费规则的双重缩水，让那些需要长时间处理复杂代码的程序员感觉非常受挫。

不过，虽然智商降下来了，可是价格在涨啊。

企业包月套餐涨价

Anthropic对计费规则的大幅度调整让很多企业用户措手不及，原本那种一口价包月畅用的模式已经被彻底拆分。