劈柴对话实录:谷歌的算力不够用了数字开物
5月21日,谷歌CEO Sundar Pichai 接受了 Forward Future CEO Matt Berman 的现场访谈。两人围绕AI Agent的未来走向、谷歌的安全战略、模型开源策略、中国AI生态、算力瓶颈等核心话题进行了一场炉边对话。
关于 AI Agent 与互联网的关系,Sundar Pichai 表示,AI Agent 必将成为人们日常工作方式的核心基石,他预见 AI Agent 会成为使用网络的核心方式。他认为,AI Agent 将接管那些令人烦躁的任务,但不会削弱人们主动上网的意愿。他指出,娱乐、情感驱动的浏览行为,以及人们对信任内容源的连接需求,是人类上网的基本驱动力,AI Agent 无法也不应该取代这部分体验。
关于对 AI Agent 的信任机制,Sundar Pichai 表示,信任的建立是一段与用户相互的旅程,必须让用户在使用 AI Agent 的过程中始终感受到掌控力、自主权与透明度。他认为,垃圾邮件过滤器和 Waymo 自动驾驶都是用户已经在日常生活中接受的 AI Agent 形态,信任来自于长期数据与运营表现的积累。他指出,Gemini Spark 之所以采取审慎的分步开放策略,先打通 Gmail、日历等第一方平台,再通过模型上下文协议(MCP)向第三方开放,正是为了在功能扩展的同时持续收集用户反馈,确保用户始终处于掌控之中。
关于 AI Agent 是否会阻断原始互联网的探索体验,Sundar Pichai 表示,技术发展带来的抽象层叠加是必然现象,但他并不认为这会最终剥夺人们探索互联网的乐趣。他认为,内容创作工具的爆炸式增长正在降低创作门槛,人们将创造出更加丰富的内容,互联网生态会找到新的平衡。他指出,人类始终存在自主探索的基本需求,这是不会消失的。
关于 AI 驱动的网络安全攻防,Sundar Pichai 表示,谷歌的内部安全团队正在积极部署 AI Agent 工作流来检测漏洞并制定修复方案,过去两年随着模型能力的提升,能够识别的系统漏洞数量显著增加。他指出,谷歌即将对外开放一款名为 Code Mender 的产品,这也是本次访谈中首次公开披露的信息。Code Mender 能够全天候实时运行,自动识别漏洞、生成补丁、测试验证并完成部署。他认为,结合近期完成的 Wiz 收购,将谷歌现有技术、Wiz 的实时漏洞监控能力与 Code Mender 整合在一起,不仅将使谷歌内部安全体系保持领先,对整个行业而言也是一个重要的转折节点。
关于危险 AI 模型的发布边界,Sundar Pichai 表示,是否限制发布取决于模型自身的具体能力,核心判断标准是该模型是否从根本上颠覆了当前的技术前沿现状。他认为,安全行业已有成熟实践可供参照,谷歌 Project Zero 零日漏洞项目长期遵循的“90天披露惯例”体现了同样的逻辑,即在给予相关方足够修复时间的前提下再公开披露。他指出,关键的判断维度在于新模型相较于当前最高水平,究竟是百分之一到百分之二的微幅提升,还是实现了百分之二十的断层式跨越,这是需要专业判断的核心依据,并非一条固定的绝对门槛。
关于开源前沿模型的策略,Sundar Pichai 表示,谷歌是开源理念的坚定支持者,Chromium、Android、Kubernetes 等均是谷歌对开源社区重大贡献的体现,在 AI 领域 Gemma 系列模型是当前开源策略的核心阵地,最新发布的 Gemma 4 表现尤为出色。他认为,触及前沿并做到极致需要极其庞大的投资,在构建前沿模型的过程中会探索并发现全新的技术路径,因此必须保持审慎,这是谷歌不开源前沿旗舰模型的根本原因。他指出,在技术演进速度极快的阶段,开源社区有时难以完全跟上步伐,但一旦技术曲线放缓,开源力量就会迎来飞跃式爆发,市场对强大开源生态系统的需求将长期存在。
关于在中国 AI 生态,Sundar Pichai 表示,当前模型迭代速度极快,构建 AI 应用的核心策略必须是保持底层模型可随时升级替换的灵活架构。他认为,灵活性与适应能力是度过当下这个阶段的必要条件,现在判断依赖中国模型是否构成实质性隐患还为时过早。
关于 Flash模型,Sundar Pichai认为,Flash 模型在 AI Agent 工作流中扮演着独一无二的角色,高频、反复调用的场景对模型速度和成本效益的要求远高于对绝对能力上限的要求。他指出,谷歌内部已采取 Pro 与 Flash 混合使用的方式,认为大多数公司都应该学会这种使用策略;同时他坦承,私下听到许多 CIO 对 AI 预算严重超支表达了强烈的焦虑,这个问题会随时间推移愈发严重,Flash 模型正是应对这一现实压力的关键解法。
关于AGI 竞赛,Sundar Pichai 表示,这项技术伴随着重大责任,必须不惜一切代价避免陷入恶性竞赛的局面。他认为,前沿实验室之间的竞争瞬息万变,各有优劣,感知上的领先差距可能在四到六周内就发生剧烈反转,当下对"谁领先谁就赢得一切"的判断是对技术现实的误读。他指出,递归自我改进等机制一旦真正出现,其影响烈度将类比当年的互联网安全转折点,届时必须成为社会层面的公共议题,而非任何一家公司的闭门决策,AI 越先进就越需要全社会共同参与讨论。
关于谷歌当前的算力状况,Sundar Pichai 表示,谷歌面临的 AI 推理需求已经明确超过了自身能够提供的算力上限,这也是谷歌大力强调 Flash 模型的直接原因之一。他认为,算力扩张的各项成本持续攀升,包括内存价格上涨在内,给定预算能买到的算力往往少于预期,在长期规划与实时客户需求之间保持平衡绝非易事。他指出,当前整个技术栈的各个层面同时面临系统性瓶颈,包括数据中心建设的物理许可、电力供应、芯片及内存,瓶颈的本质是解决一个立刻暴露下一个,目前几个硬性瓶颈是并行存在的,已经很难区分哪一个是最主要的制约因素。
AI Agent 将重塑互联网使用方式,但不会替代人类的探索欲
互联网正在我们眼前经历一场巨变,AI Agent 正在渗透各个角落。AI Agent 会成为大多数人接入互联网的首要入口吗?
Sundar Pichai:AI Agent 必将成为我们日常工作方式的核心基石。就我的使用体验来看,今天处于 AI Agent 运作前沿的群体主要是开发者。特别是在代码编写领域,两年前大多数开发者就开始使用这些工具。起初他们让工具提供越来越多的自动补全建议,大家只需点击接受即可。但在过去的几个月里,开发者们已经实实在在地用上了 AI Agent 工作流。走在最前沿的开发者已经在部署和编排 AI Agent。你在 Anti-Gravity 看到过那个构建操作系统的演示,实际上那已经是一个 AI Agent 工作流了。
一旦大家体验过类似工具的魅力及其带来的超能力,就会发现它们确实能以人们愿意接受的方式创造真正的价值。关键在于,我们在构建这种工具时,要让用户在使用 AI Agent 的过程中感受到掌控力、自主权以及透明度,这点至关重要。我确实预见 AI Agent 会成为我们使用网络的核心方式,但这并不意味着它会削弱人们亲自上网的意愿。有时大家是为了娱乐,有时是为了做些有意义的事。这取决于具体的购物目标,比如是为了采买每周的日常杂货,还是想用心为爱人挑选一份礼物。因此 AI Agent 将让人们以带来快乐和目标感的方式使用互联网,而不是总是被迫去处理那些烦人的琐事,比如为了更新车管所执照而不得不填写十八个表格字段。这就是 AI Agent 带来的差异化体验。
信任 AI Agent,正如信任垃圾邮件过滤器和自动驾驶
如果把如此多的信任托付给 AI Agent,让它们真正成为信息获取的把关人,我们该如何确保将信任寄托在正确的 AI Agent 身上?AI Agent 又该如何准确判断我们需要哪些信息?
Sundar Pichai:如果你使用 Gmail,并且后台有垃圾邮件过滤器为你拦截垃圾邮件,你实际上已经在体验这种信任机制了。在某种程度上你正信任着一个代理,过滤器本身就是一个 AI Agent。我看待这个问题就像看待我们在 Waymo 自动驾驶上的工作一样。必须让人们放心坐在 Waymo 的后排,任由车辆自动行驶。从某种意义上说车辆也是一个 AI Agent,而人们愿意给予信任。那是因为我们长久以来通过数据和运营方式向人们证明了它在根本上是安全的,并且能将大家解放出来去享受这段旅程。
这一切都取决于产品提供的价值。因此与用户共同建立自主权和信任是一段相互的旅程,我们必须在这一环节做到完美。这也是我们在 Gemini Spark 上采取特定策略的原因之一,Gemini Spark 的底层技术其实非常强大,但我们刻意采取了审慎的步骤,先让它与 Gmail 和日历等第一方平台无缝协作,之后才会通过模型上下文协议(MCP)、完整的计算使用权以及浏览器使用权向第三方开放。它完全具备处理这些任务的能力,但我们希望确保用户始终处于掌控之中并感到安心。在逐步开放这些功能的过程中,我们也在不断收集用户反馈来打磨产品。
我们正在增加自身与原始互联网之间的缓冲层,这种趋势之前在浏览器上出现过,在各类应用程序上表现得更明显,而现在 AI Agent 进一步加剧了这种情况。我们该如何应对?
Sundar Pichai:从我们运营谷歌搜索和 YouTube 的经验来看,YouTube 就是个绝佳的例子,人们对喜爱和关注的创作者有一种强烈的连接感。这是他们上网寻求的核心体验之一。我认为人们在使用网络时处于不同的心境。有时大家只是想在网上随意浏览发现内容。很多时候购物本身就是一种乐趣,所以人们并不想把这些体验完全外包给 AI。这也是为什么我试图去区分哪些是偶尔让人觉得枯燥的苦差事,而哪些又是真正令人愉悦的体验。
同样的情况也适用于新闻领域。人们有自己信任的信息源。至少在谷歌内部,无论是通过搜索和 YouTube,还是未来通过 AI Agent,我们都坚信用户希望与之连接的生态系统中始终蕴含着不可替代的价值,而 AI Agent 的职责就是促成这种连接。你的担忧有道理,有些时候 AI Agent 确实在中间扮演着代理角色。有时这种介入非常有效,因为它能帮助用户以更优的方式获得所需从而提高满意度。但这里面确实也多了一层抽象。技术的发展总是伴随着这种现象,但我并不认为它最终会剥夺人们探索的乐趣。与此同时,内容创作的工具在爆炸式增长,门槛不断降低,因此人们也会创造出更加丰富的内容。我相信我们会找到一种新的平衡,这确实是一个非常有趣的演进时刻。
替我们进行内容筛选方面,AI Agent 肯定会大显身手,尤其是在当下劣质垃圾内容泛滥的时代。但同时那种自主探索的乐趣依然会被保留下来。
Sundar Pichai:没错,因为那是人类永远存在的基本需求。
Code Mender 首次公开:谷歌将 AI 攻防能力从内部向行业开放
网络安全攻击正在日益加剧,AI 在发起网络攻击方面正变得越来越强。谷歌在网络安全领域布局已经有几十年了,是否观察到针对谷歌的网络攻击,尤其是 AI 增强型的网络攻击正在激增?
Sundar Pichai:我们一直非常明确地表示高度重视网络安全,因为我们长期致力于前沿技术的研发。谷歌开创了许多重要的安全前沿理念,比如零信任架构。我们不遗余力地保持公司在安全领域的领先地位,同时还在全球范围内运营着众多触及数十亿用户的产品和平台。在部署 AI Agent 工作流以应对安全威胁方面,我们一直非常积极。内部的安全团队正是利用 AI Agent 工作流来协助检测漏洞并制定修复方案。
过去两年来,随着模型能力的稳步提升,我们发现自己能够检测出更多的系统漏洞,并且一直在全力以赴地修复这些问题。我认为 Anthropic 的 Mythos 模型的出现,精准捕捉到了这一时代节点的转折时刻。他们发布了一个专门针对该任务精心打造的模型,并在该领域确立了前沿地位。但真正让我们感到兴奋的,也是今天想要分享的一个或许被低估的发布,那就是 Code Mender。
Code Mender 是我们在内部广泛使用并正准备向外部开放的一款产品。它不仅能帮你识别漏洞,自动生成补丁,测试并验证其有效性并最终完成部署,而且它是全天候实时运行的。我们最近刚完成了对 Wiz 的收购,Wiz 在实时漏洞监控方面代表着目前的业界最前沿水平。将我们现有的技术、Wiz 以及 Code Mender 结合起来,不仅能让内部安全保持领先地位,这对整个行业来说也是一个重要时刻。不得不说,我为目前正在进行的跨行业合作感到非常振奋。今天想特别提到的例子就是,无论是 SynthID 还是数据水印技术,各大公司都在围绕网络安全紧密团结在一起。对于掌握这项技术的行业来说这至关重要。这些积极的趋势让我深受鼓舞。
危险模型发布的边界
Anthropic 决定不对外公开发布 Mythos,仅提供给少数几家公司,而 OpenAI 发布了 GPT-4.5 Cyber。哪种做法更妥当?哪种策略更适合谷歌?是否存在某种模型因为过于强大而必须被雪藏,还是说采取更具迭代性的部署策略更符合谷歌的理念?发布强大 AI 是否存在一条明确的门槛,一旦跨过就不能发布?还是更多是一种动态评估过程?
Sundar Pichai:我认为这取决于模型自身的具体能力。如果它并没有从根本上颠覆当前最前沿的技术现状,公开发布是绝对没有问题的。但在安全领域,业界已经形成了一套成熟的行业规范。谷歌开展 Project Zero 零日漏洞项目已经很长时间了。我们有专门的团队负责寻找漏洞,然后通知相关的供应商,给予他们九十天的修复期,在此之后我们才会在公开环境中披露该漏洞。
安全行业在处理这类问题上有着非常成熟的实践。如果你突然掌握了某种能极大改变前沿现状的技术,限制发布是合理的。在这方面与政府保持密切合作非常重要,必须以负责任的态度来应对。这与安全行业的运作逻辑是一致的。但我同时也认为,必须确保有足够多的人能够访问这些技术以便及时修补自身的系统,这两者是相辅相成的。所以那种谨慎的方法是有合理性的。
关于明确门槛的问题,这正是我想要表达的观点。关键在于评估即将推出的下一个模型是否会大幅改变前沿现状。它相较于当前的最高水平,仅仅是百分之一到百分之二的微幅提升,还是实现了百分之二十的断层式跨越。这就是需要进行专业判断的地方,这也是我会据此调整策略的核心依据。
谷歌坚守开源,但前沿模型不会开源
几乎只有谷歌和英伟达拥有真正意义上的开源模型策略,谷歌的开源模型体积较小,主要针对边缘设备运行进行了优化。为什么不发布一个大型的开源前沿模型?美国开源生态的商业模式目前是否具备可行性?
Sundar Pichai:首先要强调的是,在谷歌我们一直都是开源理念的坚定支持者。谷歌本身就是建立在众多开源系统之上的。我们也主导或参与了许多重量级的开源项目。我个人就曾参与过 Chromium、Android 以及 Kubernetes 的开发工作,我还能列举出很多谷歌为全球开源社区做出过巨大贡献的项目。在 AI 领域我们一直在倾力打造 Gemma 模型,年复一年地进行更新迭代,它们的表现非常出色。最近发布的 Gemma 4 就是一个极佳的版本,我们也在积极推动它的应用。
我们所有人都致力于确保前沿技术的正确发展,而要触及前沿并做到极致需要极其庞大的投资。大家也看到了我们的资本支出规模。企业需要投入海量的研发资金来迭代生成那些前沿模型。在构建这些模型的过程中,会探索并发现全新的技术路径,所以我们所有人都必须对此保持审慎。但与此同时,我们也坚定致力于培育一个能够持续发展的开源生态系统。我们在这两者之间采取了一种平衡的策略,并且将继续坚持这种平衡的做法。


