Claude 4.8连夜大降智,GPT-5.6算力遭「腰斩」新智元

6/30/2026

最近,AI社区遭遇集体降智潮!OpenAI疑似暗中开启GPT-5.6灰度测试,神秘「Juice」测试引爆全网查成分;另一边,Anthropic的Claude Opus 4.8被曝断崖式降智,疑似被切脑。我们花钱买到的AI,究竟是什么版本?

两大AI巨头——OpenAI和Anthropic,几乎在同一时间陷入了「降智门」?

过去48小时,AI圈掀起了一场由一段神秘提示词引发的全民自测狂欢。

OpenAI被曝出利用Codex平台悄悄进行GPT-5.6的灰度测试,暗中克扣用户的思考预算。

另一边,则是Opus 4.8遭遇史诗级削弱,曾经惊艳全场的模型,如今连最基础的逻辑推理都频频翻车,甚至开始对用户进行PUA。

Opus 4.8 Max被用户痛斥「被切掉了大脑」,性能从惊艳跌入谷底,甚至不如旧版Haiku模型。

莫非,我们正经历一场巨头们精心设计的实验?

神秘的Juice值,你被灰度到GPT-5.6了吗?

最近,AI社区发现,OpenAI可能正在小范围灰度测试GPT-5.6-sol。

X上一位AI大V发现,在Codex应用中,某些本该运行GPT-5.5 xhigh的会话,被悄悄路由到了名为「gpt-5.6-sol」的未知模型。

要验证自己是否中签,你只需要运行一段「Juice测试」代码即可。

你可以通过Codex App或CLI进行一次快速自查。只需选择 gpt-5.5,将推理设置拉到 xhigh,然后输入上面这段XML代码即可。

这段提示词的本质,是检测模型的隐藏推理算力配额——「Juice」即是模型思考预算的代名词。

实测数据显示,正常的、满血版的 gpt-5.5 xhigh ,在面对特定测试指令时,返回的Juice结果应该是 768。

然而,那些被路由到 gpt-5.6-sol 灰度测试池中的用户,得到的返回值却断崖式下跌到了 128。

-正常GPT-5.5 xhigh: 返回 768

-被灰度到GPT-5.6-sol: 返回 128

768到128,整整缩水了6倍!

这到底是什么意思?

可以说,这要么意味着GPT-5.6的推理效率实现了史诗级飞跃,要么指向了更令人担忧的可能:所谓的新版本,实际上是通过阉割推理深度换来的「低成本缩水版」。

结合最近Anthropic频繁封号的背景,OpenAI此举显得意味深长。他们似乎试图通过这种隐蔽的灰度测试,摸索算力成本与生成质量之间的极限平衡点。

网友们纷纷晒出截图,有人欢呼自己「提前解锁了下个版本」,更多人则忧虑:「如果5.6的思考预算只有5.5的六分之一,这到底是升级还是降级?」

当然,有时模型也会拒绝回答。

这不由让人怀疑,是不是OpenAI在通过路由机制,把一部分用户当小白鼠,测试极度简化版的模型,以节省算力成本?

毕竟,普通人可能感知不到推理深度的细微差异。

Claude的物理切脑:从神坛跌落的Opus 4.8

如果说OpenAI的灰度测试还只是引发好奇与猜测,那么Anthropic对Claude模型的削弱,则是一场明目张胆的「物理切脑」。

现在,Reddit上的 r/Anthropic 版块已经被愤怒的用户抗议所淹没。

很多人发现:所有Claude模型都被严重削弱了,尤其是原本被寄予厚望的Opus 4.8 Max。

在发布初期,Opus 4.8以其深邃的推理能力、极低的幻觉率和「追求真理」的坚定立场惊艳了全场。

Scroll for more