OpenClaw终于长出手和眼新智元
OpenClaw 的专属 Computer Use 工具 Peekaboo v3 正式回归,并在发布后高频更新。它补上了 OpenClaw 最缺的一环,让 AI 不只会回消息,还能看屏幕、点按钮、操作真实桌面。
OpenClaw 终于要长出眼和手了!
过去几个月,OpenClaw 的热度像一锅刚烧开的水,先是咕嘟咕嘟冒泡,随后逐渐归于平稳。
项目跑起来了,用户开始上手,讨论也从「这是什么」变成「它还能做什么」。
这时,一个被搁在旁边的老问题重新浮上来。
AI 能接消息,能理解指令,能调用工具,下一步总得碰一碰真实世界。
桌面上的按钮、菜单、弹窗、输入框,才是多数工作的最后一公里。
一个 Agent 如果只能在聊天框里给建议,多少像坐在副驾驶上指路,嘴上懂路,手上碰不到方向盘。
Peekaboo 就是在这个时候回来的。
这个名字本身就有点俏皮。Peekaboo 是「躲猫猫」的意思。
电脑界面确实天天跟自动化躲猫猫。
按钮躲在弹窗里,菜单躲在系统栏里,窗口一动坐标全变,焦点一跑输入落空。
人类会凭直觉修正,AI 只能靠一套更靠谱的眼睛和手。
如今,Peekaboo 要补上的正是这套眼睛和手。
从停更到一日三更
Peekaboo 从去年年末发布 v3.0.0-beta 3 后,开始停更。
之后,Peter 将主要精力转向 OpenClaw。
可以理解,OpenClaw 本身就是一张更大的网,要接消息平台,要做网关,要处理本地运行,要支撑 Agent 调度,还要让普通用户装得上、跑得稳、用得明白。
于是 Peekaboo 暂时退到幕后。
变化发生在最近两周。
v3.0.0-beta 4 先出来试水。
就在前天,正式版 v3.0.0 发布。
正式版落地之后,更新节奏开始狂飙,今天一日三更,v3.1.0、v3.1.1、v3.1.2 接连推出。
这种更新密度一般只有两种可能。
一种是出现了重大 Bug,维护者正端着灭火器忙着救火。
另一种是方向终于对齐,积累已久的东西开始往外倾泻。
Peekaboo 这次更接近后者。
过去几个月,OpenClaw 把渠道、网关、Agent 的外壳先搭起来了。
现在,项目开始补最重要的课。
Peekaboo 到底在补什么
对普通用户来说,Peekaboo 最好理解成一套 macOS 自动化工具。
它能截图,能识别窗口,能读 UI 元素,能找按钮,能点、能打字、能滚动、能切应用、能操作菜单。
传统脚本最怕环境变化。
按钮位置换一下,窗口遮一下,弹窗突然出现,脚本就像踩空楼梯,啪一下摔进错误分支。
Agent 更麻烦,因为它要边看边想边操作,任何一步看错、点错、等错,后面都会一路歪下去。
Peekaboo 的价值,是把桌面变成 Agent 能理解的工作场域。
它不只是截一张图给模型看,还要把图里的控件、窗口、文本、按钮关系整理出来,形成可追踪、可复盘、可继续操作的现场记录。
AI 看到的不再只是一片像素,而是一张带结构的桌面地图。
这就像给一个会读菜谱的人配上厨房灯、砧板和锅铲。没有这些东西,厨艺只能停在嘴上。加上这些东西,才有可能开火。
为什么现在才变得关键
Peekaboo 并非横空出世。
它早在去年6月就已上线初版,问题是过去的模型能力还没完全到位。
视觉模型能看图,但未必能稳定理解复杂界面。


