英伟达打开封印:AI自繁衍代码,无限刷级进化新智元
年度最危险论文发了!英伟达打破20年封印,让AI亲手造出更狠的「考官」淘汰自己。无休止的自我进化一旦开启,2028年ASI降临真不是玩笑。
Anthropic彻底「RSI上头」了!
联合创始人Jack Clark抛出惊人预测,到2028年底,一个高度自主进化的AI就会诞生。
这个概率,是60%!
在人们还在为「2028 RSI能否实现」争论不休时,剑桥大学、英伟达等机构联手,丢出了一篇重磅论文——
「红皇后哥德尔机器」(Red Queen Gödel Machine)
它的运作,宛如一场残酷的AI生存游戏:
AI自己编写新的学习算法,并将其投入沙盒进行试炼。失败的直接抹杀,成功的保留下来。
接着,幸存者们开启下一轮的自我进化与繁衍。
论文地址:https://arxiv.org/pdf/2606.26294
但真正令人毛骨悚然的,是AI随后展现出的「顿悟」:它意识到,想要不断变强,就必须面对更加苛刻的试炼。
于是,AI开始主动「进化」自己的考官。
它亲手打造出更严苛的裁判,来评判自己写出的更高级的代码。
这套机制,将AI死死锁定在一个无休止的、疯狂自我迭代的RSI里。
看完这37页论文,许多人倒吸一口凉气,「这绝对是年度最危险的AI论文」!
2028年RSI自进化
把预言写成代码
2003年,德国科学家Jürgen Schmidhuber曾构想过一种机器, 名为「哥德尔机」(Gödel Machine)。
它的设定堪称完美:一台能证明自己的改进有益、然后改写自身代码的机器。
一旦造出来,它就能不断自我升级,越变越强,没有上限。
不过,「哥德尔机」有一个致命的「门槛」——
在执行任何一行自我修改的代码前,它必须先从数学上严格证明:这次改动一定是有益的。
但在现实中,这几乎是个不可能完成的任务,所需的算力堪称「黑洞」。
于是,在之后整整20年里,哥德尔机只能躺在论文里,当一个理论上的天花板,一个谁都够不着的思想实验。
近两年,学界绕开了证明这道坎。
达尔文哥德尔机(DGM) 、赫胥黎哥德尔机(HGM)干脆抛弃数学证明,改用进化——
让AI「繁殖」出大量带突变的代码变体,扔进沙盒里跑分,失败的淘汰,成功的保留,幸存者继续繁衍。
AI跨越了最后一步,开始字面意义上「进化」自己。
但这些方法都还有一个共同的盲点——它们的考官是死的。
不管AI怎么进化,给它打分的那个评判标准、那个benchmark、那个验证器,始终被钉死在循环之外,一动不动。
这恰恰违背了进化最核心的一条规律:
物种从不是在一个静止的环境里优化自己,而是和不断变化的环境一起改变。
红皇后哥德尔机(RQGM),要破的就是这道盲点。
「红皇后」真正杀招:让AI造出考官
「红皇后」这个名字,来自生物学家Van Valen 1973年提出的「红皇后假说」——
你必须拼命奔跑,才能停在原地,因为你的对手也在进化。
RQGM干的事,正是把这句话写成了算法:让考官(评估器)和选手(任务智能体)一起进化。
这是整篇论文,最让人头皮发麻的地方。
这套精巧的机制叫「受控效用进化」(controlled utility evolution):
整个搜索被切成一个个epoch;
在每个epoch内,评估器(考官)是冻结的,给所有考生打分,保证信号稳定;
只有在epoch的边界,才允许换考官,且新考官必须在一份留出的「基准真相」锚点数据上,统计意义上打赢老考官,才能上位;
一旦换人,系统立刻执行「选择性擦除」:只丢掉那些由被换掉的考官打过的分,其余证据全部保留。
换句话说,它既要狂奔进化,又要每一步都站得住脚。
真的奏效了,AI自己改代码
光说机制太抽象,不如直接看战绩。
第一战,写代码(Polyglot)。
RQGM给写代码的Agent配了一个"代码评审员"当陪练。


