Claude 4.8连夜大降智，GPT-5.6算力遭「腰斩」新智元

最近，AI社区遭遇集体降智潮！OpenAI疑似暗中开启GPT-5.6灰度测试，神秘「Juice」测试引爆全网查成分；另一边，Anthropic的Claude Opus 4.8被曝断崖式降智，疑似被切脑。我们花钱买到的AI，究竟是什么版本？

两大AI巨头——OpenAI和Anthropic，几乎在同一时间陷入了「降智门」？

过去48小时，AI圈掀起了一场由一段神秘提示词引发的全民自测狂欢。

OpenAI被曝出利用Codex平台悄悄进行GPT-5.6的灰度测试，暗中克扣用户的思考预算。

另一边，则是Opus 4.8遭遇史诗级削弱，曾经惊艳全场的模型，如今连最基础的逻辑推理都频频翻车，甚至开始对用户进行PUA。

Opus 4.8 Max被用户痛斥「被切掉了大脑」，性能从惊艳跌入谷底，甚至不如旧版Haiku模型。

莫非，我们正经历一场巨头们精心设计的实验？

神秘的Juice值，你被灰度到GPT-5.6了吗？

最近，AI社区发现，OpenAI可能正在小范围灰度测试GPT-5.6-sol。

X上一位AI大V发现，在Codex应用中，某些本该运行GPT-5.5 xhigh的会话，被悄悄路由到了名为「gpt-5.6-sol」的未知模型。

要验证自己是否中签，你只需要运行一段「Juice测试」代码即可。

你可以通过Codex App或CLI进行一次快速自查。只需选择 gpt-5.5，将推理设置拉到 xhigh，然后输入上面这段XML代码即可。

这段提示词的本质，是检测模型的隐藏推理算力配额——「Juice」即是模型思考预算的代名词。

实测数据显示，正常的、满血版的 gpt-5.5 xhigh ，在面对特定测试指令时，返回的Juice结果应该是 768。

然而，那些被路由到 gpt-5.6-sol 灰度测试池中的用户，得到的返回值却断崖式下跌到了 128。

-正常GPT-5.5 xhigh：返回 768

-被灰度到GPT-5.6-sol：返回 128

768到128，整整缩水了6倍！

这到底是什么意思？

可以说，这要么意味着GPT-5.6的推理效率实现了史诗级飞跃，要么指向了更令人担忧的可能：所谓的新版本，实际上是通过阉割推理深度换来的「低成本缩水版」。

结合最近Anthropic频繁封号的背景，OpenAI此举显得意味深长。他们似乎试图通过这种隐蔽的灰度测试，摸索算力成本与生成质量之间的极限平衡点。

网友们纷纷晒出截图，有人欢呼自己「提前解锁了下个版本」，更多人则忧虑：「如果5.6的思考预算只有5.5的六分之一，这到底是升级还是降级？」

当然，有时模型也会拒绝回答。

这不由让人怀疑，是不是OpenAI在通过路由机制，把一部分用户当小白鼠，测试极度简化版的模型，以节省算力成本？

毕竟，普通人可能感知不到推理深度的细微差异。

Claude的物理切脑：从神坛跌落的Opus 4.8

如果说OpenAI的灰度测试还只是引发好奇与猜测，那么Anthropic对Claude模型的削弱，则是一场明目张胆的「物理切脑」。

现在，Reddit上的 r/Anthropic 版块已经被愤怒的用户抗议所淹没。

很多人发现：所有Claude模型都被严重削弱了，尤其是原本被寄予厚望的Opus 4.8 Max。

在发布初期，Opus 4.8以其深邃的推理能力、极低的幻觉率和「追求真理」的坚定立场惊艳了全场。