英伟达打开封印：AI自繁衍代码，无限刷级进化新智元

年度最危险论文发了！英伟达打破20年封印，让AI亲手造出更狠的「考官」淘汰自己。无休止的自我进化一旦开启，2028年ASI降临真不是玩笑。

Anthropic彻底「RSI上头」了！

联合创始人Jack Clark抛出惊人预测，到2028年底，一个高度自主进化的AI就会诞生。

这个概率，是60%！

在人们还在为「2028 RSI能否实现」争论不休时，剑桥大学、英伟达等机构联手，丢出了一篇重磅论文——

「红皇后哥德尔机器」（Red Queen Gödel Machine）

它的运作，宛如一场残酷的AI生存游戏：

AI自己编写新的学习算法，并将其投入沙盒进行试炼。失败的直接抹杀，成功的保留下来。

接着，幸存者们开启下一轮的自我进化与繁衍。

论文地址：https://arxiv.org/pdf/2606.26294

但真正令人毛骨悚然的，是AI随后展现出的「顿悟」：它意识到，想要不断变强，就必须面对更加苛刻的试炼。

于是，AI开始主动「进化」自己的考官。

它亲手打造出更严苛的裁判，来评判自己写出的更高级的代码。

这套机制，将AI死死锁定在一个无休止的、疯狂自我迭代的RSI里。

看完这37页论文，许多人倒吸一口凉气，「这绝对是年度最危险的AI论文」！

2028年RSI自进化

把预言写成代码

2003年，德国科学家Jürgen Schmidhuber曾构想过一种机器，名为「哥德尔机」（Gödel Machine）。

它的设定堪称完美：一台能证明自己的改进有益、然后改写自身代码的机器。

一旦造出来，它就能不断自我升级，越变越强，没有上限。

不过，「哥德尔机」有一个致命的「门槛」——

在执行任何一行自我修改的代码前，它必须先从数学上严格证明：这次改动一定是有益的。

但在现实中，这几乎是个不可能完成的任务，所需的算力堪称「黑洞」。

于是，在之后整整20年里，哥德尔机只能躺在论文里，当一个理论上的天花板，一个谁都够不着的思想实验。

近两年，学界绕开了证明这道坎。

达尔文哥德尔机（DGM）、赫胥黎哥德尔机（HGM）干脆抛弃数学证明，改用进化——

让AI「繁殖」出大量带突变的代码变体，扔进沙盒里跑分，失败的淘汰，成功的保留，幸存者继续繁衍。

AI跨越了最后一步，开始字面意义上「进化」自己。

但这些方法都还有一个共同的盲点——它们的考官是死的。

不管AI怎么进化，给它打分的那个评判标准、那个benchmark、那个验证器，始终被钉死在循环之外，一动不动。

这恰恰违背了进化最核心的一条规律：

物种从不是在一个静止的环境里优化自己，而是和不断变化的环境一起改变。

红皇后哥德尔机（RQGM），要破的就是这道盲点。

「红皇后」真正杀招：让AI造出考官

「红皇后」这个名字，来自生物学家Van Valen 1973年提出的「红皇后假说」——

你必须拼命奔跑，才能停在原地，因为你的对手也在进化。

RQGM干的事，正是把这句话写成了算法：让考官（评估器）和选手（任务智能体）一起进化。

这是整篇论文，最让人头皮发麻的地方。

这套精巧的机制叫「受控效用进化」（controlled utility evolution）：

整个搜索被切成一个个epoch；

在每个epoch内，评估器（考官）是冻结的，给所有考生打分，保证信号稳定；

只有在epoch的边界，才允许换考官，且新考官必须在一份留出的「基准真相」锚点数据上，统计意义上打赢老考官，才能上位；

一旦换人，系统立刻执行「选择性擦除」：只丢掉那些由被换掉的考官打过的分，其余证据全部保留。

换句话说，它既要狂奔进化，又要每一步都站得住脚。

真的奏效了，AI自己改代码

光说机制太抽象，不如直接看战绩。

第一战，写代码（Polyglot）。

RQGM给写代码的Agent配了一个"代码评审员"当陪练。