最短一年内,模型会吞噬Harness?51CTO技术栈

6/14/2026

“最短在 12 个月内,我认为模型届时已经消化吸收了 Harness 的很大一部分。它会被上游化到模型中,而红利将会转移到其他地方。”

“这些天我花了太多时间在思考 AI 编程上。我认为其他那些具有可验证性的领域,像数学、金融和科学,显然也是你会迅速看到成果的领域。”

“对谷歌来说,成功可能并不意味着‘最大化用户在产品前的眼球停留时间’,而是‘最大化客户的成果’,让他们能做自己想做的事,然后去享受生活、成为他们想成为的人。”

上个月 2026 谷歌 I/O 大会才刚结束,这个月红杉资本 Sequoia Capital 播客便邀请 Google AI Studio 和 Gemini API 的负责人 Logan Kilpatrick,就 Agentic AI、AI Coding 和世界模型等话题来了一场深度对谈。

这次 Logan 也是坦诚地分享了很多自己的独到见解。比如,最短在 1 年内,Harness 的很大一部分会成为模型的原生能力,到时候应用层公司再折腾 Harness 就没什么收益了。

而且,他提出当下及未来需要类似“Harness Bench(框架基准测试)”这样的东西,“它能实际衡量所有这些不同的模型在适应所有这些不同 Harness 方面的表现如何”。

对于 AI Coding,他认为现在的 AI 编程水平,有点近似窄域超智能。AGI 可能不会一步到位,而是会先出现一堆“参差不齐的垂直超智能”,比如像数学、金融、科学这些有明确可验证标准的领域,会率先出现超过人类水平的窄域超级智能。

AI 编程能力的提升,也让他重新设定了自己产品开发的野心水平,他的原话是“我不能只做这个东西的 MVP,我实际上需要再往前走 10 步,因为技术允许我这么做”。

同时,因为 Vibe Coding 的存在,谷歌 AI Studio 用户在一周多的时间内就开发了 35 万个安卓应用,其中很多是个人应用。他认为,“也许生成式用户界面还离得比较远,但现在为了解决你个人问题而构建软件的想法是非常现实的”。

在世界模型上,他认为现在有一批很有意思的初创公司正在弄清楚世界模型的脚手架是什么,让世界模型在真实场景中落地。对于谷歌最新推出的 Omni,他说,视频编辑是该模型当下最好的应用场景,也是其迭代的第一个轮次。他很喜欢 Omni,因为“它没有改变我,它改变的是周围其他一堆不属于我的部分”。

此外,他还透露了一个反行业预测的事实,那就是根据谷歌自有数据,他们发现 AI 并没蚕食搜索业务,反而带来了令人难以置信的正向增长,人们搜索得更多了,Agent 也会进行大量搜索。原以为是“负和博弈”,结果却是“正和”推动。

对谈中,Logan 还讲到两件很有意思的事情。一个是他自己用 AI Studio 做的第一个安卓应用,居然是用来打理后院植物的园艺工具。另一个是,在 AI Studio 的开发者生态中,最初有 20% 的用户在开发游戏,而当下有 20% 的用户是在开发金融产品,可以看出人类最有热情的还是娱乐和财富。

以下为这场播客的主要内容,enjoy:

现在谷歌所有产品的主线是 Antigravity Agent Harness

主持人: Sundar(谷歌 CEO) 在 I/O 大会的开幕演讲中,将当前称为“Agentic Gemini 时代”。对谷歌来说,Agentic AI 究竟意味着什么?

Logan:我认为现在的 Gemini 3.5 的时代,我们已经进入了Agentic Coding 或智能体产品,以及全员智能体的时代。我认为对我们来说,我们在 I/O 大会上也正式宣布了这一点,这个智能体层是由 Antigravity Agent Harness 驱动的,这是谷歌一条贯穿始终的新主线,它将我们所有的产品连接在一起,成为它们现在的基础。

从历史上看,在 Gemini 出现之前,谷歌那大概不到一百个产品线之间其实并没有一条统一的主线。后来我们有了 Gemini,它成为了这条主线,现在所有产品都在以某种方式使用 Gemini。而现在,随着所有产品都在进行重构,逐步转变为“原生智能体产品”,开始真正代表用户采取行动并帮助他们完成工作,这一点在 Antigravity 上也在成为现实。你可以看到这条全新的主线正在浮现,我认为这真的非常有趣。

主持人: 抱歉,帮我理清一下,Antigravity 是指那个 IDE 对吧?还是指它的名字或概念?

Logan: 没错,Antigravity 包含了很多东西,我认为这再次为我们带来了一个机遇。你有一个核心的 IDE,如果你想要网页端的“智能体优先”体验,它也提供。你还可以使用 CLI 和 SDK 。但实际上,我不知道我们之前是否这样界定过它,它本质上是我们构建的一个庞大的生态系统,旨在随时随地满足开发者的需求。因此,如果你愿意,你完全可以通过 Gemini API 来使用它,如果你需要一个托管智能体,你不需要做任何底层的架构工作。

而最有趣的一点在于,它不仅仅是 Antigravity 这一套东西的生态系统,它实际上也在直接驱动谷歌的其他所有产品。也就是说,相同的底层框架也在为其他所有谷歌产品提供动力。未来,Antigravity 将驱动搜索、Gemini 应用、云端以及 AI Studio 中的一大堆智能体功能,这非常令人兴奋。

主持人: 我明白了。所以过去是 Gemini API,语言模型是一条主线,决定了 AI 如何融入每个谷歌产品中。而现在,不仅仅是 API,还有这个 Coding Harness 。它被应用在这些产品中,因此是 Coding Agent 本身在推动产品中具备更多的智能体属性。

Logan: 是的,这个描述很贴切。而且我认为从更通用的角度来看,它本质上就是 Agent Harness 。事实证明,Coding Harness 除了在编写代码方面表现极佳之外,也完全可以作为通用的 Agent Harness 。

主持人: 那 Agent Harness 和 Coding Harness 是同义词吗,还是有区别?

Logan: 这中间绝对是有细微差别的。我认为通过针对特定场景进行专门化定制,你可以压榨出更多的优化空间。事实上你也能看到这一点:从技术上讲,AI Studio 所使用的 Agent Harness 针对 Vibe Coding 的使用场景进行了稍微的定制;而 Gemini 应用使用智能体框架的方式,则针对那种面向消费者、24 小时全天候在线的智能体进行了定制。因此,你拥有一个基础 Harness ,其中大概 80% 的内容是相同的,然后你再针对编程或任何具体的应用场景进行专门的定制。

智能体化不仅没有蚕食谷歌搜索,反而推动了业务增长

主持人: 很有意思。你是怎么看待对现有业务的“蚕食”(cannibalization)的?特别是现在你们正在更加激进地投入到 Agentic 中。

因为我可以预见到,例如,如果你做的只是搜索或摘要,那么对业务蚕食的担忧可能没那么大;但如果 AI 实际上在帮我浏览邮件并替我回复,那我甚至都不需要亲自去打开邮箱了。因此我可以想象,由于拥有了更强大的智能体能力,用户在你们产品上停留的注意力时长(eyeball hours)实际上会变少。

这种看法客观吗?或者你是怎么看待这种蚕食效应的?

Logan: 是的,这很有意思。我的一个观察是,在当前 AI 时代的初期,所有人都理当然地认为,AI 能够直接为你解答问题对于搜索业务来说将是一场“负和博弈”。但实际上,最终发生的结果是,它对搜索业务带来了令人难以置信的“正和”推动。人们搜索得更多了,做的事情也更多了。

(注:负和博弈是指参与者在冲突中总收益为负数的博弈模式,即双方或多方都可能遭受损失,甚至胜者收益低于败者损失。

正和博弈是指通过合作或创新,使参与各方的利益总和增加,实现双赢或多赢的博弈模式。)

主持人: 而且智能体也在进行搜索。

Logan: 没错!智能体也在搜索。同样,在人类搜索量增加的同时,智能体做的事情也变多了,从而诞生了一个全新的市场。因此我认为,虽然世界上的人类总时间显然是有限的,但从我目前对这一切发展态势的早期感受来看,从生态系统的价值创造角度来说,它确实是非常积极的正和博弈。

至于人类行为层面最终会如何演变,我认为未来 1 到 2 年内还算相对清晰,但在 3 到 5 年后,当技术进一步提升、产品形态可能变得大不相同时,就很难说清楚了。但归根结底,这就是产品的成功所在。

我们经常和 Demis(谷歌DeepMind CEO)聊天,构建技术的目的就是为了让它能够走出去替你完成工作。对谷歌来说,成功可能并不意味着“最大化用户在产品前的眼球停留时间”,而是“最大化客户的成果”,让他们能做自己想做的事,然后去享受生活、做他们想做的人。所以我感觉,你大概会看到我们走向一条最大化客户成果、而不是最大化眼球停留时间的道路。

主持人: 是的,我脑子里一直冒出“智能体增长”这个词。因为对我来说,我在私人时间里大量使用编程智能体,我直接让智能体帮我做所有的架构选择。我会说“我不在乎你推荐哪种数据库,你决定就行”。

Logan: 哈哈,明白。

主持人: 我之所以问这个,是因为既然这在如今的编程中已经成为了现实,我可以想象,它未来大概会普遍适用于很多事情,比如以后的购物。那你认为这将如何改变广告的运作方式,以及聚合平台(aggregators)捕获价值的方式?

Logan: 这感觉是一个非常类似的趋势。虽然不能说完全一样,但这些事情在很大程度上互为映射。比如 SEO(搜索引擎优化)的运作方式,我认为它与,比如 GEO(生成式引擎优化)之类的叫法直接相关。因此,这些事物之间确实存在着高度的相关性。我的猜测是,它的变革幅度可能并没有我们现在想象的那么激进,仅仅是因为这些事物是在彼此的基础上叠加并复合发展的。

谷歌全域产品智能体化程度还处于“爬”的阶段,但 Gemini 和 Antigravity 处于“走”的阶段

主持人: 如果让你用“爬、走、跑”来对智能体化程度进行分级,目前谷歌系列产品的智能体化处于什么阶段?

Logan: 这是一个非常棒的问题。现在绝对还处于“爬”的阶段。我认为这在一定程度上是因为谷歌固有的产品张力,你拥有几十个用户量超过十亿级别的庞大产品线。

因此,尽管我们确实有一些更接近 Labs 的体验,在那里你可能已经接近“走”甚至“跑”的阶段了,但就目前绝大多数的产品体验而言,绝对更接近“爬”。

我认为这正是我们作为开发被大众广泛使用的产品的管理责任所在。因为我觉得长尾客户们并没有完全准备好让 AI 直接跑起来替他们处理所有事情,他们依然希望自己坐在驾驶座上,谨慎地迈出第一步。

谷歌团队,尤其是搜索团队,或许就是这方面最典型的例子。他们在推进这项技术时承担着巨大的责任,必须以一种能够带领用户共同前进的方式来做,而不是直接颠覆他们与互联网互动、以及他们与产品建立联系的固有方式。

(注:产品张力是指产品在满足用户需求的同时,保持合理的成本和性能平衡。

长尾客户是指数量庞大但单个贡献度较低、需求分散且个性化的客户群体,他们在整体市场中虽单独价值有限,但累积效应显著。)

主持人: 你认为哪些产品目前最接近“走”的阶段?

Logan: 好问题。我认为 Gemini 应用绝对是最接近“走”的阶段。对于 Spark,我认为拥有一个 24/7 全天候在线的智能体,能够真正潜在地代表你执行一连串的操作,绝对是目前最前沿的应用场景之一。

此外,我认为 Antigravity 是另一个例子,在其中你可以拥有自主的编程智能体,比如重构操作系统、处理成千上万亿的 token,并代表你花掉数千美元。

我认为这些更偏向前沿探索,事实上它们同时存在于 GDM(谷歌 DeepMind)和工程团队的视角中。因此,我认为 GDM 正在以一种非常前沿的视角来看待这个问题,而谷歌的其他产品则是在更渐进地向那个方向靠拢,这在我看来是非常合乎情理的。

长时程智能体非常重要,编程模型是谷歌全业务的催化剂

主持人: 明白。你认为谷歌最终会拥有 1 个、2 个还是 3 个用于交互 AI 的产品入口,还是会拥有成千上万个?

Logan: 这很难说。我认为这很大程度上取决于人类消费产品的方式。我的感觉是,“模块化”和“产品专业化”是有其美妙之处的。如果你最终得到的是一个替你包揽一切的产品,那么在默认状态下,使用这个版本的产品本身就需要付出更多的精力。当然,也许有人能把某种真正魔幻的体验整合在一起,打破这个定律。

但我认为,对于绝大多数的长尾用户来说,要让一个通用型产品去准确完成他们想做的那件具体事情,他们最终不得不耗费更多的心理能量和时间。相比之下,有些东西简单点反而很好,比如我点击日历应用,它就只显示我的日历,我不需要操心或处理任何其他事情。

主持人: 这就是为什么幻灯片存在了这么长时间的独到见解(hot take),你就是希望你想要的那条信息刚好出现在完全相同的地方。而且我认为,我们人类其实非常习惯于这种模式;相比之下,生成式界面的想法听起来固然很酷,但对我们的大脑来说,这难道不是更多的认知负荷吗?

Logan: 在某些情况下绝对是的。同样,世界上有很多极其聪明的人,所以也许有人会找到一种让它感觉更自然的交互体验。但对我来说,现在预测的话,成千上万个或许太极端了,我猜测它看起来会更像是更多的产品去深耕不同的细分领域。而另一个层面的答案是,我不知道这对谷歌意味着什么,但对于整个生态系统来说,它显然意味着会涌现出多得多的产品,这非常令人兴奋。至于谷歌最终会在战略上如何抉择,比如我们的客户是希望面对 10,000 个产品,还是只保留 3 个会更好,这将取决于我们自身的战略决策。

Scroll for more