OpenAI前研究员:AI拐点逼近,人类成NPC新智元

4/4/2026

工业革命让体力变廉价,互联网让信息变廉价,这次AI让执行力变廉价。那么,接下来什么会变得更值钱?答案是:定义「为什么」的能力——这是AI永远无法外包的意图问题。

上一次转行,你在是多少天前?

之所以问这个问题,是因为AI Futures Project的研究人员正在非常认真地计算另一件事——AI的能力,每隔多少天会翻一倍。

他们最新的答案是:88.6天。

不到三个月。

那份没有人庆祝的报告

2026年1月29日,AI研究机构METR,悄悄发布了一份技术报告。

没有发布会,没有CEO站台,没有科技媒体的头版头条。

METR是什么?

你可以把他们理解成AI能力的「计量标准局」——专门负责用标准化的方法测量AI到底有多强。

他们的数据,是全球最严肃的AI研究者用来做预测的底层依据。

这一次,他们升级了测量工具,重新测了一遍。

结果不是小修小补,而是把之前的判断整体推快了一截。

旧工具显示,自2023年以来AI能力的翻倍周期是165天。

新工具测出来是131天。

如果只看2024年以后的数据,这个数字进一步压缩到了88.6天 。

更令人不安的,不是新数字,而是一个元问题:旧尺子量出的AI,比真实情况慢了整整20%。

我们一直以为自己在密切监视着这件事,但连我们用来监视的眼睛,都跟不上它的速度。

「时间视界」是什么,为什么它让人害怕先解释一个概念,因为它是理解接下来所有事情的钥匙。

METR把AI的能力叫做「时间视界」。

简单说,「时间视界」就是AI能独立完成一项任务的最长时间跨度。任务越复杂、越需要持续推进,时间视界就越长。

你可以这样理解:

一年前,AI的时间视界大约是十几分钟。它能帮你写段代码、改一封邮件,但给它一个需要「规划→调研→实施→测试→修复」全流程的真实工程项目,它会迷路。

现在,Claude Opus 4.6的时间视界已经超过320分钟——超过5小时的连续自主工程工作,不需要人类在旁边不断纠偏。

而按照88.6天翻倍一次的速度往后推:

2027年底,这个数字将超过人类工程师一个月的工作当量。

到那个节点,一个AI不是在「辅助」你——它是在替代一个完整的项目周期。

这不是幻想,这是指数函数最枯燥、最机械的运算结果。

三个月,预测家的自我打脸

现在说说那群认真计算时间的人。

Daniel Kokotajlo和Eli Lifland是AI Futures Project的核心研究者。

他们专门做一件事:预测AI什么时候会达到各种关键里程碑,并且公开记录自己每次更新预测的原因。

他们追踪的最重要的里程碑叫「自动化编码器」( Automated Coder,AC) ——定义很具体:当AI强大到一家顶级AI公司宁愿裁掉所有人类软件工程师,也要继续用AI写代码的那个时刻。

三个月前,Daniel认为这个时刻会在2029年末到来。

2026年4月的最新更新里,他把这个预测改成了2028年中。

Eli的预测也从2032年初前移到了2030年中。

18个月,在三个月内凭空消失了。

但真正令人震动的,不是时间线的移动,而是移动的原因之一:

Daniel把AC所需的AI能力门槛,从「需要达到人类3年工作当量的时间视界」,直接下修到了「只需要1年」——

理由是Claude Opus 4.6的表现令他重新估计了整件事的难度。

翻译成人话:他们不仅发现AI比预期进化得更快,还发现他们之前连「需要多强才算够」这件事都估错了。

目标更近了,门槛更低了,速度更快了——这三件事同时发生在同一个季度报告里。

飞轮已经启动,不再等人类批准预算

这时候可能有人会说:这些都是研究者的预测,预测可能是错的。

是的。但有一件事不是预测,是已经发生的财务数据。

Claude Code——Anthropic的AI编程助手——在发布仅9个月后,年化营收就突破了25亿美元。Anthropic整体保持着每年营收10倍增长的趋势,已进入百亿美元区间。

9个月,25亿。

这意味着什么?意味着AI编程不再是实验室里的研究项目,它已经是一门能自己赚钱的生意。

这是历史上第一个工具,它的进化速度不再主要取决于科学家的好奇心,而是取决于市场的反馈——有多少人愿意为它付钱,就有多少钱流回去加速它的迭代。

人类批不批准预算,已经不是最关键的变量了。

这是一道选择题

历史上每一次大规模的生产力跃迁,都重新定义了「人的价值」而不是彻底消灭它。

Scroll for more