Anthropic联创定下deadline：2028机器之心

MLNLP社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。

社区的愿景是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进步，特别是初学者同学们的进步。

AI 很快就能自己改造自己了？

Anthropic 联合创始人 Jack Clark 发帖称，他最近几周阅读了大量公开的 AI 开发数据后，认为到 2028 年底，递归自我改进（recursive self-improvement）发生的概率有 60%。

也就是说，AI 系统可能很快就能自主构建和改进自己，进入自我加速的阶段。

这一观点并非凭空而来。他看了一堆公开基准，发现 AI 在 AI 研发相关任务上进步非常快。

比如，CORE-Bench 考察 AI 实现他人研究论文的能力，这是 AI 研究中至关重要的一环。

PostTrainBench 则测试强大模型能否自主微调较弱的开源模型以提升性能，这正是 AI 研发任务的一个关键子集。

MLE-Bench 基于真实 Kaggle 竞赛任务，要求构建多样化的机器学习应用程序来解决特定问题。此外，像 SWE-Bench 这样广为人知的编码基准，也展现出类似的进步。

Jack Clark 将这一现象描述为「分形」式的向上向右趋势，即在不同分辨率和尺度上，都能观察到有意义的进展。他认为，AI 正在逐步接近端到端自动化研发的能力，一旦实现，AI 将能够自主构建自己的后继系统，开启自我迭代的循环。

此言论一出，在社交媒体引发不少讨论。

一些人视其为迈向 ASI 和奇点的关键第一步，可能彻底改变科技发展的节奏。

然而，也存在不同声音。

华盛顿大学计算机科学教授 Pedro Domingos 指出，AI 系统早在上世纪 50 年代 LISP 语言发明时就具备了「构建自身」的能力，真正的问题在于能否获得递增回报，而目前还没有明显证据支持这一点。

有网友质疑，从 2027 年到 2028 年，概率一下子增加 30%，这暗示 AI 能力会在 2027 年底前后出现一次突然的重大突破。到底哪一个具体的里程碑或事件，会让 AI 实现递归自我改进的概率在短时间内大幅提升？

还有网友表示，Jack Clark 是 Anthropic 新上任的公关负责人，这正是他们新战略的一部分：我们并非危言耸听者，有大量的论文都印证了我们一直以来警告你们的事情。

Jack Clark 专门在 Import AI 455 这期 newsletter 里写了一篇长文详细阐述。

文章地址：https://importai.substack.com/p/import-ai-455-automating-ai-research?r=1ds20&utm_campaign=post&utm_medium=email&triedRedirect=true

AI 系统即将开始自我构建，这意味着什么？

Clark 表示，他写下这篇文章，是因为在梳理所有公开可获得的信息后，他不得不形成一个并不轻松的判断：到 2028 年底之前，出现无人类参与的 AI 研发的可能性已经相当高，或许超过 60%。

这里所谓的无人类参与的 AI 研发，指的是一种足够强大的 AI 系统：它不仅能辅助人类做研究，还可能自主完成关键研发流程，甚至构建出自己的下一代系统。

在 Clark 看来，这显然是一件大事。

他坦言，自己也很难完全消化这件事的含义。

之所以称这是一个不情愿的判断，是因为它背后的影响过于巨大，让他感到难以把握。Clark 也不确定，整个社会是否已经准备好迎接 AI 研发自动化所带来的深层变化。

他现在相信，人类可能正生活在一个特殊时间点：AI 研究即将被端到端自动化。如果这一刻真的到来，人类就像跨过了卢比孔河，进入一个几乎无法预测的未来。

Clark 表示，这篇文章的目的，是解释他为什么认为，通向完全自动化 AI 研发的起飞正在发生。

他会讨论这一趋势可能带来的一些后果，但文章的大部分篇幅，都会集中在支撑这一判断的证据上。至于更深层的影响，Clark 计划在今年的大部分时间里继续梳理。

从时间点来看，Clark 并不认为这件事会在 2026 年真正发生。但他认为，未来一两年内，我们可能会看到某种模型端到端训练出自己后继者的案例。至少在非前沿模型层面，出现一个概念验证是很有可能的；至于最前沿模型，难度会更高，因为它们成本极其昂贵，也依赖大量人类研究员的高强度工作。

Clark 的判断主要来自公开信息：包括 arXiv、bioRxiv 和 NBER 上的论文，以及前沿 AI 公司已经部署到现实世界中的产品。基于这些信息，他得出一个结论：自动化生产当下 AI 系统所需的各个环节，尤其是 AI 开发中的工程组件，基本已经具备。

如果 scaling 趋势继续延续，我们就应该开始准备面对这样一种情况：模型会变得足够有创造力，不仅能自动改进已知方法，还可能在提出全新研究方向和原创想法方面替代人类研究员，从而自行推动 AI 前沿继续向前发展。

编码奇点：能力随时间的变化

AI 系统是通过软件实现的，而软件由代码构成。

AI 系统已经彻底改变了代码生产方式。这背后有两个相关趋势：一方面，AI 系统越来越擅长编写复杂的真实世界代码；另一方面，AI 系统也越来越擅长在几乎不依赖人类监督的情况下，把许多线性的编码任务串联起来完成，比如先写代码，再进行测试。

体现这一趋势的两个典型例子，是 SWE-Bench 和 METR time horizons plot。

解决真实世界的软件工程问题

SWE-Bench 是一个被广泛使用的编程测试，用来评估 AI 系统解决真实 GitHub issue 的能力。

当 SWE-Bench 在 2023 年底推出时，当时表现最好的模型是 Claude 2，整体成功率大约只有 2%。而 Claude Mythos Preview 的成绩已经达到 93.9%，基本上接近打满这个 benchmark。

当然，所有 benchmark 本身都会有一定噪声，所以通常会出现这样一个阶段：当分数高到某个程度之后，你碰到的可能不再是方法本身的限制，而是 benchmark 自身的限制。比如在 ImageNet 验证集中，大约 6% 的标签就是错误或存在歧义的。