从Manus到Claude Code:Agent正在“六阶段”范式转移AI科技评论
Agent 时代真正的变革,才刚刚开始。
过去一年,日新月异的Agent 赛道完成了一轮螺旋式上升的范式循环:
2025 年 3 月,Manus 以三级结构落地,首次将 “数字化员工” 产品化,完成了全行业的用户启蒙;
随后 OpenClaw 凭借本地化部署、数据主权与轻量化体验迅速爆火,验证了市场对 AI 操控电脑(Computer Use)的真实付费意愿;
近期,Anthropic 携原生系统级能力的 Claude Code 强势入场,以底层架构优势冲击工业级市场。
三款现象级产品接连引爆,标志着 Computer Use 已成为大厂与创业者的核心战场,Agent 发展正式从 “单体能力比拼” 进入 “系统工程与生态卡位” 的深水区。
"这说明了Agent的演进不是线性的,而是螺旋式上升的。"在GAIR Live第27期的圆桌讨论中,OpenManus核心贡献者张佳钇这样评价。就在Claude Code发布的同一时期,Manus、OpenClaw、Codex等Agent产品密集涌现,整个行业仿佛在一夜之间进入了"深水区"。
这场由OpenManus 主要贡献者张佳钇、Nanponova AI 创始人兼 CEO 常楠两位实战派嘉宾共同参与的对话,试图回答一个核心问题:当Agent从Demo走向生产环境,从技术尝鲜走向工业级应用,创业者的真正壁垒究竟何在?
答案或许藏在张佳钇提出的"六阶段"理论中,也可能藏在常楠所说的"脏活累活"里。但有一点是确定的:Agent 竞争已从模型智力的单点突破,转向工程能力、场景落地、数据主权、生态构建的全方位较量,螺旋上升的背后,是能力、产品、商业、生态四重逻辑的同步重构。
Manus、OpenClaw、Claude Code 的定位与跃迁
Agent 产业的爆发并非无序狂奔,而是遵循清晰的阶段化规律。张佳钇基于其提出的Agent 发展六阶段论,为当前三款现象级产品划定了精准的技术坐标,也厘清了行业螺旋进击的内在逻辑。
反直觉的是,不同于部分自媒体“Claude Code全面‘龙虾化’”的总结,他提出技术演进顺序应为 Claude Code/CodeX 在前,OpenClaw 在后 —— 正是 Claude Code 等工具验证了 Coding 与系统操控的极强可用性,才催生 OpenClaw 将能力从开发者群体延伸至普通非开发者用户,完成了大众化市场的渗透。
Computer Use 成为核心战场
OpenClaw 的爆火,本质是市场对本地操作、数据主权、隐私可控需求的集中释放,也让 Computer Use 正式成为 Agent 竞争的核心赛道。而这一赛道的崛起,既是模型能力突破的必然,也是旧 API 自动化范式走到尽头的结果。
常楠直言,Computer Use 解决的是人机交互的 “历史遗留问题”:过去所有软件都为人类设计,GUI 统治生态;而 Agent 时代,交互正在向计算机原生的 CLI 形态回归。未来应用会拥有两套接口,即保留 GUI 供人类使用,同时搭建 AI 专属原生接口。而当前 Computer Use 的爆发,核心驱动力是多模态大模型(VLM)的技术成熟,视觉能力与系统操作能力结合,让模型代劳的工作范围呈几何级扩张。
当前 Computer Use 形成两条核心技术路线:基于视觉 VLM 模拟点击(OpenClaw 路线)、通过原生指令集系统接管(Claude Code 路线)。海外平台接口开放,原生指令集效率更高;国内内容生态高度封闭,视觉方案成为跨越 “围墙花园” 的主要渠道。张佳钇补充,Computer Use 的核心是为 Agent 获取更多上下文与权限,CLI 方案在专业场景效率更高,而视觉 VLM 是更通用的能力,能覆盖海量未知长尾场景。长路径决策的幻觉积累是最大技术难点,巨头在强化学习数据上占据优势,而 Claude Code 走出的 “视觉 + 系统指令” 混合模式,成为全行业可借鉴的方向。
Coding 是 Agent 的 “第一性原理”:自主造工具才是真智能
在本轮范式演进中,Coding 的核心地位被反复强调,两位嘉宾一致认为:Coding 是 Agent 扩展能力边界的第一基石,是 Agent 的第一性原理。
常楠高度认可 Anthropic 的路径:编程不只是写代码,而是系统级问题解决。当 Agent 能在现有工具不足时自主编程创造新工具,才真正具备工业级价值,这也是区分 “单纯效率工具” 与 “真正智能体” 的分水岭。相比简单的屏幕识别和模拟点击,能够理解系统底层逻辑并生成执行代码的 Agent,才能支撑复杂任务、长程执行与跨场景协作。
2025 年初 Claude Code 初版受限于基座能力,随着模型迭代,Agent 架构从 Manus 式的 “手工流” 快速升级为深度 “智能体流”。未来理想场景是Agent 网络:向网络发布任务,现有 Agent 无法完成时,自动协作并自主编写新工具解决问题,这正是 Coding 作为第一性原理的终极体现。
效率工具创业者面临 “降维打击”,垂直场景迎来红利
范式的快速演变,对一线创业者带来了生存空间的剧烈波动,行业呈现两极分化。
常楠判断:基模公司必然从售卖 Token 延伸至产品侧与效率侧,纯效率工具类创业者将面临降维打击;而垂直场景应用开发者则迎来重大利好。他的团队围绕 Claude Code 构建 Skill Set 与 Harness,实现从需求分析、PRD 生成、TDD 到代码编写的全链路自动化,原本一两个月的交付周期压缩至一周,效能提升呈指数级。
同时,企业需求的分化进一步加剧行业格局:大型企业极度看重过程可审计、数据私有化,倾向私有化部署;中小企业与个人用户更看重便利性,愿意适度让渡隐私。中国与海外的生态差异,也让 OpenClaw 这类轻量化、本地化产品在国内获得远超硅谷的热度。
Agent 的下一轮爆发点:从模型智力到系统工程
圆桌的最后,两位嘉宾共同指向一个核心结论:Agent 竞争已彻底从 “模型智力” 转向 “系统工程能力”,VLM 与 CLI 路线、开源与闭源、通用与垂直,最终都要回归 “为用户创造真实价值” 的本质。
张佳钇预判了 Agent 的两大未来方向:一是个性化学习,Agent 从交互中学习个人偏好,行业急需建立个人偏好与智能体行为关联的数据标准;二是智能体网络(Agent Network),企业内智能体获得全员权限,处理文档、会议、协作,推动组织向 AI Native 转型;社会层面,个人知识技能通过 Agent 资产化、可交易,智能体间实现自动任务定价,这一方向将在近几个月迎来重大机会。
而整个产业的螺旋进击,最终会走向一个清晰的终局:模型厂商聚焦底层能力与生态构建,开源社区负责轻量化创新与用户体验补全,创业者深耕垂直场景与行业 Know-how,三方形成互补共生的生态。Manus 完成启蒙,OpenClaw 验证需求,Claude Code 定义工业级标准,三者共同推开了 Agent 时代的大门,而真正的产业变革,才刚刚开始。
以下是本次圆桌的实录,AI 科技评论进行了不改原意的编辑:
岑峰(主持人):欢迎来到雷峰网AI科技评论主办的GAIR Live线上圆桌。最近一年,Agent 领域正经历一场螺旋式上升:
2025 年 3 月,Manus 以三级结构亮相,将“数字化员工”概念首次产品化并完成了用户启蒙;随后,OpenClaw 凭借本地化与数据主权优势爆火,验证了用户对 AI 操控电脑(Computer Use)的付费意愿。近期,Anthropic 携带具备原生接管能力的 Claude Code 杀入战场,试图利用系统级优势进行工业级收割。
这三款现象级产品的崛起,标志着“Computer Use”已成为大厂与创业者竞争的核心战场。今天我们请到了这一领域的两位顶尖实战者:OpenManus的主要贡献者张佳钇,以及Agent领域的资深创业者、Nanponova AI的创始人CEO常楠和我们一起讨论。
佳钇曾提出过 Agent 发展的“六阶段论”,在这个理论框架下,我们如何看待当前的范式演进?三款现象级产品,分别处于你那六个阶段当中的怎样的位置?
张佳钇:我先回顾一下我们之前说的六个阶段。当时我们想的是,第一个阶段是说纯粹的对语言模型去做调用;第二个阶段是要去做Agent for Flow;第三个阶段是能够跨环境的Financial Agent;第四个阶段是Agent for Coding;第五个阶段是真正每一个人拥有自己的Agent;第六个阶段是Agent Network,能够去跟其他人去做定价和交流。
Manus 处于“预定义环境自主 Agent”阶段,其目标、环境权限均由人类预设。反直觉的是,我认为演进顺序应该是 Claude Code 与 CodeX 在前,OpenClaw 在后。正是因为 Claude Code 等工具展现了极强的可用性,才催生了 OpenClaw 进一步将该能力从开发者群体引向非开发者领域。
我是CodeX的重度用户,从个人体感来看,其能力经历了两次显著的跃迁:
1.2025 年 9 月: 当时的工具已能完成约 80% 的科研代码工作,能够支持三至四小时的长程执行。
2.2025 年 12 月: 长程执行能力进一步增强,且代码产出质量较上一版本有质的飞跃。
再到下一个阶段,可能是Codex 5.4,或者说是Opus他们最近出的Computer Use功能。在这样的情况之下,我们会注意到Agent已经实现了一个非常Native的通过Bash的工具,能够去同时地对文本、对Code、对GUI环境去做处理,也能够通过OS指令直接操控屏幕,也会有一些多模态的UI点击操作。这个时候意味着模型本身已经进入了一个能够同时很好地去做不同环境任务处理的空间。
岑峰: 佳钇划定了技术坐标,但坐标变迁对一线创业者意味着生存空间的波动。常楠老师,Manus 火热时,大家在争论“Agent APP”是否为终极形态。但现在看,后面又出现了OpenClaw和Claude Code这样的形态。这一年来的范式演变对追求落地的创业者产生了哪些影响?
常楠:我跟佳钇感受还是蛮近的。我从 2024 年底开始使用 Cursor,见证了 AI 编程从自动补全到 Agent 化的过程。2025 年初 Claude Code 第一个版本受限于基模能力,但随着模型增强,Agent 架构从早期的“手工流”(如 Manus)演进为深度的“智能体流”。
我非常认可 Anthropic 的路径。编程不仅是写代码,更是系统级问题。它解决了 Agent 在发现现有工具不足时,如何通过自主编程创造新工具来完成任务。因此,Coding 是 Agent 扩展能力边界的第一基石。
在 2025 年 9 月至 10 月期间,我开始将 Claude Code 与现有工作流结合。
对于非效率工具类的创业者,这种系统级能力的提升是巨大的赋能。我们围绕 Claude Code 构建了一套 Skill Set 和 Harness:
▪ 全链路自动化: 从需求分析、设计文档、PRD 生成到 TDD(测试驱动开发)及代码编写。
▪ 效能提升: 模型直接调用 CLI 工具进行自动化测试与回归测试。原本需要一两个月交付的成果,现在一周即可完成。
我的判断是:基模公司必然从售卖 Token 延伸至产品侧与效率侧,这会让纯效率工具类的创业者感到焦虑,但对像我这样做垂直场景的应用开发者则是极大利好。
岑峰:OpenClaw 的爆火证明了用户对本地操作及隐私主权的看重。在商业落地中,客户更在意Agent能“独立完成任务”,还是在“视线范围内受控干预”?
常楠:这取决于具体的应用场景。大型企业对“过程可审计性”极度看重。商业场景对确定性要求极高,企业不希望系统是黑盒,必须确保过程可追溯。此外,数据和工作流是企业的核心私有资产,大公司不愿将其暴露给外部模型厂商,因此更倾向于私有化部署。
相比之下,部分中小企业或个人用户更愿意为了便利性牺牲一定隐私。因为在他们的某些领域里面,他们没有非常私有的工作流,或者不太了解这些Knowhow,他们可能没有那么关注这件事。
值得注意的是,中国用户在移动互联网时代已习惯于用隐私交换便利,而海外用户则更为敏感。这种生态差异也解释了为何OpenClaw在中国引发的热潮比在硅谷更强烈。
我认为Coding能力的提升是延展模型能力的基础。Anthropic当时的设想或许是:当Agent发现任务无法完成时,能够自主编写工具来解决问题。未来可能形成一个Agent网络,不同Agent之间通过自主协作完成工具开发与任务分发。这与单纯的OpenClaw模式在底层逻辑上仍存在差异。
岑峰:你刚才提到,你很确定Anthropic的路径是正确的。可以稍微展开吗?
常楠:2025 年初与 Anthropic 交流时,我意识到他们的逻辑非常前瞻:Coding 是一切能力的延展。未来的理想场景是一个“Agent 网络”:当你向网络发布一个 Job 或 Task,如果现有的 Agent 无法直接完成,它们会自动协作并“自主编写”出一个新工具来解决问题。
这种“自主创造工具”的能力,是区分单纯“效率工具”与真正“智能体”的分水岭。这也是为什么 Coding Agent 在这一轮竞争中占据了绝对的制高点。相比简单的屏幕识别和模拟点击,能够理解系统底层逻辑并生成执行代码的 Agent,才具备真正的工业级价值。
岑峰:效率和主权永远是客户在不同场景当中需要权衡的一个因素。说到这个,开源社区会是一个有力的补充。回想当初Manus之后,社区迅速地出现了OpenManus。佳钇,当时你也提到OpenManus更像是一个中间性的意外产物。今天面对Claude Code这样一个具备OS级原生权限的正规军,开源社区的竞争策略又会是怎么样的?
张佳钇:OpenManus当时确实是一个比较粗暴的中间东西。关键是在现在这样的情况之下,开源这边要怎么样来跟Claude Code去互补。OpenClaw本身就已经给了一个很好的例子,就是通过非常快速迭代去增加,能够让用户更多实际使用上体感更多的功能。OpenClaw做好的一点就是它可能通过非常多能够让你在真实生活中很方便地去做一些事情,通过这个东西来抢占用户的心智,相比Claude Code可能有一个更迅猛的流量入口。
开源项目也是要考虑一样的事情。如果只做开源,很难能够预测模型能力本身的发展方向,可能更多能做的事情还是要从大家实际去使用的体验去入手。
比如说最近我觉得有个非常好的开源项目叫OpenCLI,它会去把小红书、推特,包括还有一些其他的软件变成一个自动CRA工具,大家直接开箱就能用。虽然它本身不涉及非常多非常炫的概念,但是因为它本身是解决用户的一个问题,所以本身也是得到了非常多的关注跟声量。
如果到后面要做什么,可能还是要去做让用户本身更好用的功能。虽然这个东西可能也会很快被吃掉,但是带来的信任,它可能是不太会被砍掉的。


