谷歌悄悄加了个按钮,Gemini长出手脚变打工人新智元

4/16/2026

谷歌悄悄加了一个Agent新入口:Gemini开始长出「手脚」,不再只负责回答问题,还准备下场替你干活了。

一张截图,提前透露了今年谷歌I/O大会的一点重要信息:

Gemini不只想聊天了,它还想当Agent工作台。

近日,长期追踪谷歌产品变动的TestingCatalog抓到了Gemini上一个新的「Agents」入口。

它和Gems、Files并列,直接摆在一级入口,而不是只有开发者才能看到的隐藏选项。

这个改变释放出一个清晰的信号:

Gemini的下一阶段,不再只是一个「你问我答」的聊天框,而是一个「你下任务、它来执行」的工作台。

把谷歌过去半年的产品动作串起来看,这条线已经很清楚了:

Agent Designer在Gemini Enterprise全面上线,NotebookLM补上音频生成和视频摘要,Agentspace整体并入Gemini Enterprise成为其核心引擎,Chrome嵌入Gemini侧边栏并上线Auto Browse让AI代你操作浏览器。

而现在,Gemini的聊天界面里出现了一个与Chat并列的「Agents」标签页,用户可以直接在里面新建任务、指定目标、挂载工具和文件,整个界面更像一个任务执行工作台,而不是聊天窗口。

每一步都在做同一件事:把Agent能力从开发者后台搬到普通用户面前。

I/O还没开场,谷歌的牌其实已经亮出了一半。

Chat不再是唯一中心

翻一下谷歌官方的产品描述,你会发现画风已经变了。

2024年2月Gemini for Google Workspace刚上线的时候,那时的卖点是什么?Chat。

跟AI聊天,帮你写邮件,帮你做会议纪要,本质上是一个塞进Workspace里的聊天助手。

现在再看谷歌官网对Gemini Enterprise的描述:「Gemini Enterprise让团队在一个安全平台上发现、创建、分享和运行AI Agent。」

聊天能力依然是Gemini Enterprise的核心之一,但它现在已被清晰地纳入到一个更大的Agent平台框架之中。

TestingCatalog曝光的Gemini Enterprise测试界面

根据TestingCatalog曝光的Gemini Enterprise测试界面显示,Agent已进入主交互区:左侧可在Chat 与Agent间切换,右侧则整合目标、Agent、应用连接与文件面板。

在新增的「智能体」标签页面中,首先映入眼帘的是「新建任务」和「收件箱」这两个明确的入口。

当启动一项新任务时,界面会展开为一个功能强大的任务工作区。

虽然核心的聊天视图依然保留,但它的右侧出现了一个结构化的任务面板。

该面板清晰地定义了任务的各个要素,包括明确的「目标」、执行任务的「智能体」、可访问的「已连接的应用」以及所需的「文件」。

此外,右侧边栏还出现了一个「Require human review」(需要人工审核)开关,用户可以对任务执行过程加入人工审核节点,整个界面也因此更像一个任务执行工作区,而不只是普通聊天窗口。

这表明你打开Gemini,将不再仅仅是为了聊天,而是要「跑一个任务」。

这也印证了谷歌对Gemini Enterprise的定义,已经从一个「聊天助手」转变为一个强大的「Agent运行平台」。

也能造Agent

落到产品层面,最硬的一块拼图是Agent Designer,它已于2025年底正式上线了。

谷歌官方对它的定义是:

一个交互式的无代码/低代码平台,用于在Gemini Enterprise中创建、管理和发布单步及多步Agent。

拆开来看三个关键能力:

第一,多步骤Agent。

不是「帮我写封邮件」这种单次指令,是支持多步任务编排,Agent下面还能挂子Agent,串成工作流。

第二,连接真实工具。

Gmail、谷歌Drive、Jira、GitHub、Notion、SharePoint,这些都是官方更新日志里列出来的已上线连接器,Shopify等更多连接器也已进入公开预览。

第三,定时执行。

Agent不需要你盯着,设好时间自己跑。

而在此之前,谷歌已经通过Agentspace(现已并入Gemini Enterprise)验证了这条路线:把知识搜索和Agent执行捏到同一个平台里。

员工不用关心后面跑的是哪个Agent、调的是哪个数据源,在一个界面里搜、问、跑,全搞定。

而泄露界面里出现的C端Agent标签页,意味着这套能力不会只留在企业版。

谷歌大概率要把它推给所有用户。

光有大脑不够

这里有个容易混淆的概念需要拆清楚。

Agent不等于大模型。

大模型更像是 Agent 的「大脑」,负责理解任务、推理路径和生成决策。

但要真正把事情做完,还需要一层「手脚」,也就是编排层,负责拆解步骤、调用工具、衔接上下文,并处理执行过程中的异常。

谷歌这次补上的,正是这层能力。

从公开资料看,Gemini Enterprise里的Agent Designer,可以理解成一个面向普通企业用户的可视化Agent工作台:不用写代码,也能把单步、多步任务编排出来。

相比之下,Vertex AI Agent Builder里的Agent Designer更偏底层和开发者场景。

两者能力框架高度相似,只是前者被做成了更易用、门槛更低的产品界面。

换句话说,谷歌做的不是单纯把模型变得更会聊天,而是把原本更偏开发者的 Agent 构建能力,包装成了普通用户也能上手的可视化工作台。

对C端用户来说,这意味着一件事:你不需要懂API,不需要写Python,拖拖拽拽就能让AI帮你跑完一个工作流。

从「能聊天的AI」到「能干活的AI」,中间隔的就是这个编排层。

编排层三国杀

把视野拉远一步:谷歌不是唯一在抢编排层的人。

Anthropic和OpenAI各自押了完全不同的路线,三家的分歧大到像在做三个不同的产品。

谷歌走的是平台化。

把Agent能力嵌入已有产品矩阵:Workspace、Search、NotebookLM、谷歌 Cloud,靠分发优势碾压。

逻辑很清楚:20亿+用户的触达能力是护城河,Agent做出来直接塞进用户已经在用的工具里。

Anthropic走的是工具化。

Claude Cowork运行在桌面端,直接操作本地文件、文件夹和应用程序。

Anthropic的官方产品页写道:

Scroll for more