黄仁勋:Prompt已死,loop当立量子位

6/25/2026

黄仁勋表示,AI编程正从“写Prompt”转向“设计Loop”,即构建自动化循环系统,让AI自主迭代、验收并完成任务,人类退居规则制定者。Claude Code、OpenAI Codex已落地该范式。但专家提醒,警惕Token成本与“理解力债务”,AI可外包思考,却无法替代人类对问题的真正理解。

Prompt已死,loop当立。

这就是最近网上热传热议,然后老黄黄仁勋给AI新趋势画的新重点:

Nobody writes prompts anymore. The new job is to write and handle loops.(现在根本没有人写Prompt了,新时代的核心工作是编写和管理loop。)

啥是loop?这个词直译过来是“循环”,换成AI圈的说法就是:

你不再亲手给AI下指令,而是设计一个系统,让系统替你下指令、替你验收、不合格自己重来,直到活干完。

嗯?这不就是如今Agent那一套吗?为啥又搞个新概念出来?

暂且按下此疑惑不表,待我环顾一圈后发现,这个“loop”还真挺火——

除了老黄,“龙虾之父”Peter、“Claude Code之父”Boris Cherny、吴恩达等一众大佬全都在谈、在大力推loop。

(Peter)别再给编程Agent写提示词了,去设计循环,让循环替你提示Agent。

(Boris)我已经不给Claude写提示词了。我有一堆循环在跑,是它们在给Claude下指令、决定下一步做什么。我的工作,就是写循环。

而当“写loop”取代“写prompt”成为大佬们新的日常,loop显然已经越过了“又一个新概念”的阶段。

剩下的问题就只有:

loop具体是指什么?它怎么就突然火起来了?

loop到底是什么

要理解loop这个新东西,我们得先回顾一下之前的那套旧范式。

过去两年AI编程的标准动作是这样的:

你写一条prompt,AI吐一段代码,你看了不满意,再写一条,AI再改,你再看……

反正就是来回拉锯,人全程盯着。

卡帕西之前还侧面吐槽了“人就是瓶颈”这件事,而且劝告大家:

你不能坐在那里等着给每一步写prompt,你得把自己从流程中抽离出来。

把人从流程中抽离出来,这正是loop要解决的事。

其核心逻辑只有一句话:

你定义一个目标,AI自己跑,跑完自己验收,不合格带着报错再来一轮,直到通过或者撞上预算上限才停。

此时人的角色就从“传话人”变成了“规则设计者”。

所以回到开头的疑问:这跟Agent有什么区别?

显而易见,Agent是干活的那个人,而loop是让这个人不用你盯着也能持续干活的那套管理机制。

没有loop的Agent,你提一句它动一下,本质上还是个听话的工具。

套上loop的Agent,才真正变成了一个能自转的系统。

原理听起来确实不复杂,但貌似仍有点抽象。

别急,我又去翻了下当前loop的实际落地情况,结果发现它其实已经藏在了我们熟悉的系统里。

围绕loop,产品落地层目前已经形成了“双雄对峙”格局。

一个就是大家天天都在用的Claude Code,它围绕loop做了三件套:

/loop负责定时循环,/goal负责目标驱动(跑到验收条件满足为止),/schedule负责云端定时任务(合上电脑也能跑)。

其中最精妙的设计是/goal,它背后藏着loop最关键的一条原则——自己不能判自己的卷子。

Claude Code把这条原则直接写进了产品架构:

写代码的是大模型,验收的是另一个独立的小模型Haiku,两个模型各司其职。

这样一来,Agent不会自己给自己打高分,验收才有真实的约束力。

另一个就是OpenAI Codex。

Codex的玩法更接近“自动化流水线+目标驱动+多个子Agent”的组合,在一些开发者的实际体验中,能看到最多8个Agent同时跑在各自的云端沙箱里,各干各的活,最后把结果汇总回来。

有意思的是,虽然两家的实现路径不太一样,但最终长出来的形态高度相似——

都是把复杂任务拆碎,分给多个Agent并行去跑,再统一汇总。

在公开评测和社区口碑里,两者的表现也已经非常接近。

这也说明一个问题,模型本身已经卷不出太大差别了,真正的差距在上层的loop编排。

说到这儿,咱们直接看看“Claude Code之父”Boris Cherny每天怎么工作的就全明白了。

他自述去年11月卸载了IDE,一个月没打开过,索性删了。

现在他手下几百个小Agent同时跑,有的扫GitHub issue,有的读Slack上的用户反馈,有的监控CI失败。每个Agent在自己隔离的代码分支里干活,一个写代码,另一个跑测试验收。

搞不定的才进他的收件箱,等他来做判断。

据他透露,自Opus 4.5以来,其所有代码都是Claude Code写的,如今大部分代码都是直接在他的手机上完成。

接下来是循环,Agent之间互相提示,中间无需人工审核。

看到没,loop的终极形态已经很清晰了:

人不写代码,也不写prompt,只写规则和判断,剩下的全交给loop。

怎么loop起来

那么,我们该怎么loop起来呢?

X上有个叫Codez的博主已经都替大家总结好了,他发了一份14步实操roadmap,这里我挑了一些干货。

step 1:先别急着建,先做“4条件测试”

loop不是什么活儿都能往里面塞,瞎建只会亏钱。

在动手之前,先回答四个问题:

任务重复发生吗?

有自动化验收手段吗?

Token预算扛得住吗?

Agent有“高级工程师”的工具吗?

△图片由AI生成

Scroll for more