豆包手机被各禁,但趋势已经不可逆转知危

1/11/2026

2025 年 12 月,豆包手机助手技术预览版的发布引发热烈关注和讨论。

然而,人们的关注点一般都在于字节跳动如此激进的做法是否 “ 不讲武德 ”。

但在与知危交流的几位业内专家看来,豆包手机助手正在启动一场深刻的变革,字节跳动在下一盘更大的棋。

如果说移动互联网生态是一潭看似平静、实则利益固化的 “ 深水湖 ”,那么豆包手机助手的出现,则是在湖底引爆了一个深水炸弹。

在豆包手机助手出现前,各大超级 APP 已经形成了稳固的 “ 孤岛生态 ”,彼此互不往来,用户在不同 APP 间跳转极其繁琐。豆包手机助手一举砸破了 APP 之间的围墙,它通过系统级权限强行 “ 识屏 ” 和 “ 代操作 ”,让沉寂已久的应用生态泛起剧烈波动。

这场波动不可逆也不可阻挡,原因很简单,它反映了用户的真实需求。

对于用户,这是效率和体验的升级,对于生态中的重要玩家比如手机厂商、应用厂商,特别是中小企业或新入局者,将有机会在新的利益博弈巨浪中崛起,最后,这也是苦于烧钱大战的大模型厂商寻求变现的良机。

用更加正式的语言表达,移动互联网正经历着一场从 “ APP 为中心 ” 到 “ Agent 为中心 ” 的范式转移,它也是顺应互联网入口遵循 “ 聚合-解绑 ” 或 “ 分久必合,合久必分 ” 的周期规律的自然体现。甚至,我们今年已经见证了这场变革更加悄无声息的镜像版本,也就是 AI 搜索以及增长迅猛的 GEO 市场。

在与知危沟通的专家们看来,随着智能硬件生态的逐渐成熟,移动互联网和 AI 手机助手也将寻求更加合适的载体。也就是说,这场变革的主角,绝不会仅仅是手机。

尽管对于变革终点有共识,但对于演进的路径、最终赢家归属,专家们有着不同的见解。

有人寄希望于 “ 协议文明 ”,认为终局将是大模型厂商、手机厂商、应用厂商、开发者乃至用户的生态共生,有人则认为 “ 丛林法则 ” 不可避免,胜出者或利益最大化者将是大模型厂商,用户消费心理和内卷环境将极力推进这一结果。

在接下来的内容中,我们将首先解读豆包手机助手引发现象的关键点,比如 APP 厂商封锁豆包手机助手的实质考虑和未来变化;然后,我们将讨论这场新趋势的具体表现,它对旧有生态构成比如 APP 广告的具体影响,并解答为何趋势不可逆;最后,我们会重点探讨这场新趋势下的最后赢家归属和原因,以及在演变到终局的过程中,各方将如何博弈,这种博弈模式或商业竞争环境的特点,以及与海外相比的差异。

对于目前多个 APP 对豆包手机助手进行的限制,白鲸开源 CEO 郭炜向知危表示,确实更多是出于安全方面的考虑,特别是银行类、支付类 APP,“ 豆包手机助手仍然在试错,目前它对安全维度的考量确实还不够周全,尤其令人担心的是它可能模拟人脸识别,或者在底层截取相关数据,所以出现一些限制是非常正常的。”

“ 微信集成了微信支付,这就让情况变得更加复杂和微妙。但淘宝、闲鱼对豆包手机助手的限制,我认为就不属于金融安全层面的考虑。”

前 OPPO 商业数据挖掘组组长及 “ 数据虫巢 ” 主理人黄崇远表示,“ 就目前行业现状,对于很多 APP 比如电商,其商品的相关信息,本身就存在企业之间的爬取与反爬的相互攻防。对于豆包手机助手,可以尝试与 APP 厂商建立 ‘ 数据付费使用 ’ 的条款或协议,但原则一定是经过了用户的授权,而且目前是没有成熟的案例可供参考的。”

另一方面,豆包手机助手引发的安全问题似乎也不是很难解决。

比如,人们对豆包手机助手的一个担忧是其被用于黑灰产中的群控系统。对于目前风控技术是否能区分 AI 手机助手和群控系统,狮桥集团高级风控总监蒋宏解释道,“ AI 手机助手获得了手机更加底层的权限,并且使用了大模型灵活的交互能力,操作模式接近人类,群控大多数是基于规则的批量操作,机械重复度更高。通过权限合法性、行为模式( 人类化 vs 机械性 )、设备环境( 真实设备 vs 模拟器 )、多设备关联分析等手段,一定程度上是可以实现区分的。”

“ 当然,现阶段的风控系统有一些反欺诈的规则和模型来识别批量欺诈行为,可以防范一部分群控欺诈行为,但是 AI 手机助手的加入,确实让识别的难度增加了,一些原来可以识别的模式不再可用,所以需要风控系统持续升级才能应对。”

“ 对于互联网金融业务而言,反欺诈更加注重身份信息的核实,而不是操作模式上的风险。”

“ 乐观地讲,AI 手机助手的威胁还是相对可控。”

但 phone-use 开源技术框架的出现可能加剧相关风险,“ 开源特性降低黑产技术门槛,容易被用于非法目的的自动化操作。黑产利用模式可能包括:批量注册养号、自动化薅羊毛/刷量、模拟操作实施诈骗。应对方式上,可以增加操作行为模式特征和模型、升级设备指纹、精细化行为建模等。”

“ 总体来看,AI 或大模型时代确实衍生了不少新黑产类型,比如 AI 内容伪造( 换脸/虚假内容 )、智能自动化攻击、AIGC 批量养号等。为此,风控需要进行升级,比如利用大语言模型能力升级现有的风控模型,增加多模态识别、动态特征挖掘等风控模型能力。”

“ 目前还有很多未解决的问题,比如黑产技术迭代快导致防御被动、数据隐私与风控需求冲突、欺诈样本相对少不足以训练好的反欺诈模型、安全与用户体验难平衡等。”

社区开源动态以及投资机构、行业专家向知危描述的信息都表明,AI 手机助手的真实技术门槛其实并不高。

而据了解,“ 跨应用调度 ” 在国内手机行业确实有先例,但后来监管部门叫停,如今行业内已不再轻易公开讨论这个话题。

《 UI 智能化与前端智能化:工程技术、实现方法与编程思想 》作者甄焱鲲表示,“ 不是友商不会做,而是不敢做、不愿做、不能做。豆包的尝试更像是 ‘ 压力测试 ’,为行业探明政策底线和商业雷区,相比功能,其价值更在于推动规则重构。这条路风险极高,但是,在国内鼓励AI发展的宏观背景下,或许会是一个精准的破局点。”

豆包手机助手引发的冲突确实超乎想象,目前各方发声都比较谨慎,与此同时各种假消息和辟谣声明满天飞。比如,近期关于 “ OPPO 拒绝与字节合作豆包手机 ” 的市场传闻,OPPO 就亲自回应该消息不实。

实际上,大模型技术引发的 “ 跨平台调用 ” 类型的商业冲突并非首次,AI 搜索就是非常典型的场景。Perplexity 就曾被多家媒体平台起诉爬取行为未经授权。在国内,与 AI 搜索相关的诉讼案例尚未出现,这里就大致体现出了冲突量级的差异。

甄焱鲲解释道,“ 区别在于操作深度和商业模式冲击程度。AI 搜索主要是在信息层面对内容进行摘要和引用,虽然也涉及数据爬取,但不会直接替代用户的操作行为和商业决策。而 AI 手机助手能够直接执行购买、支付等商业行为,这直接影响了平台的交易闭环和数据控制权。”

“ 更重要的是,AI 助手取代了人的浏览行为,使得推荐算法带来的注意力机制被颠覆,这不仅影响广告收入,还影响流量分发和会员收入。”

“ 通常达成合作的方式是建立数据授权协议,但目前缺乏成熟的行业标准。先例方面,搜索引擎与内容平台之间建立了 robots 协议和商业合作协议,但 AI 助手的主动操作模式与搜索引擎的被动爬取有本质区别。搜索引擎的爬取是被动的、可控制的,而 AI 助手的操作是主动的、不可预测的,对平台商业模式的冲击更为直接和剧烈。”

黄崇远补充道,“ 本质区别是,AI 搜索是 ‘ 信息层赋能 ’,而 AI 手机助手是 ‘ 操作层替代 ’,后者对 APP 生态的破坏性更强,因此引发的抵制更激烈。”

AI 手机助手的产业颠覆性巨大,并且可预见阻力将会很大,甚至也会触及字节跳动自己的基本盘,比如抖音 APP。那么,为什么字节跳动要推出如此激进的豆包手机助手?

郭炜表示,“ 从方向上来看,这绝对是字节未来的一个突破口。”

“ 未来的智能终端一定不再是手机。‘ 豆包手机助手 ’ 其实只是字节在手机上的一个试水而已。不应该过度关注豆包本身,而应该关注 AI 以及未来的交互形式。将来可能不再有 APP 的概念,而是一种基于 Agent 或者某种新型组件的交互生态。”

“ 他们真正要做的是下一代智能硬件,所以绝对会投入巨大精力深挖。”

黄崇远也持类似观点,并补充道,“ 从字节内部的 Ocean 团队的动作( 收购 PICO VR、Oladance 耳机等 )来看,他们的目标很清晰,就是 ‘ 大模型+超级APP+硬件终端 ’。”

“ 虽然目前有不少应用方在对抗,但这是一个大势所趋的方向。因为从人的角度来说,解放双手,提升效率,让终端变成一个大的 ‘ 对话入口 ’,让 APP 变成一个底层工具,这对于人的服务体验来说,是巨大的效率提升,只不过还需要衡量数据隐私的问题。”

郭炜进一步基于豆包手机助手的原理来佐证,“ 之前人们提到的所谓 ‘ 豆包建立了独立于应用沙盒的通信管道 ’ 的理解,应该是不准确的。”

“ 实际的技术实现逻辑是:它直接在安卓底层模拟了一个手机屏幕。这个屏幕对于用户是不可见的,用户只有通过点击中间的状态栏才能把它调出来。所以它完全不需要一个物理屏幕。它在后台模拟这个屏幕后,大约每隔 3 秒会截一次屏,并将截图发送到云端进行 AI 解析。云端解析完成后,会返回下一步的操作指令,可能是点击、拖拽或挪动。它再把这些操作反向作用于那个模拟屏幕。”

“ 可以理解为,豆包在操作一个 ‘ ToDesk ’( 远程桌面控制 ),只不过这个 ‘ ToDesk ’ 的屏幕用户看不见。基于这种逻辑,这个虚拟桌面理论上是可以操作任何内容的,这也就解释了它为什么拥有如此高的权限。”

“ 按照这个原理,智能终端最后发展的形态并不必要是手机。它现在有屏幕,会让第一批用户觉得安全一点或提供习惯转换的缓冲时间。但等用户熟悉以后,比如假设将来 PICO VR 和豆包手机进行结合,那用户戴着 PICO VR,其实操作的也是用户的手机,这时是不需要屏幕的。”

“ 如果再放宽一些,它甚至不一定是在用户本地设备上,也可以是云端的一个虚拟服务,道理是一样的。”

这其实相当于互联网流量从各个孤立的 APP 重新汇集到统一的 AI 交互界面,几乎等于是行业重新洗牌。

而且,用户接收到的信息并不是原始的,而是经过了大量的二次处理。这是否意味着这个流量池的总量其实是变小了的,商家竞争将会变得更加激烈?

郭炜表示,这个问题其实要辨证地看,“ 首先,这个变化未必完全等同于 ‘ 洗牌 ’。人们现在刷抖音,也不可能刷 24 小时,但眼镜可以戴 16 到 20 个小时,耳机也可以连续戴 8 个小时。所以,它对人的占用和交互时间会更长。只是目前这种形态的具体形式和价值还没有完全被找到。”

“ 所以,很容易理解现在市面上为什么会卷智能眼镜。当然,目前的 AI 眼镜产品都还是过渡产品,强调录像、拍照功能而不强调交互都是本末倒置,还费电,用绿光来显示内容也对眼睛健康不利。交互和屏幕设计一定要做好,它既不能影响我正常看东西,又要让我方便地看到我需要的信息,这并不容易。更不用提重量这个显而易见又常被忽视的问题。”

总体来看,郭炜对未来保持乐观,“ 我已经在豆包身上看到了一些苗头。接下来是谁来接这个棒继续往下走,还很难说,但很可能会像 iPhone 当年一样,引领一次大的变革。”

“ 如果 AI 助手形态最终定型,它确实会成为一个新的流量入口。但最终还是要看谁能真正解决问题,大家才会明白该怎么做。”

AI 智能终端需要解决什么问题?这个发展趋势可能再一次戛然而止吗?

对于后者,郭炜给出了否定的回答,“ 一旦这种新的硬件场景出来之后,发展就是不可逆的。为什么豆包手机这么火?其实就是因为这就是用户最终的需求,是不能违背的。”

“ 因为说实话,移动互联网发展到目前这个阶段,频繁地点手机屏幕这个动作本身就已经很反人类了,特别是像比价这种场景。人永远是懒的,能更简单地办成一件事,就不会愿意去点一堆 APP 再把事情搞完。 所以用户一定会去找更简单的方式来解决问题。对用户来说,最简单的方式不是点屏幕,而是自然语言,是视觉,是听觉。这正是从最终用户角度要解决的问题。”

“ 下一代流量入口的争夺,一定会让人们用更简单的方式来使用 APP。GUI 这种方式,在这个过程中会慢慢落后于时代。”

甄焱鲲表示,最终对刚需的判断还是在于用户个人使用手机无法完成的事情,因人而异,“ 对于操作手机不熟练、接触时间不长的中老年人,AI 手机助手的刚需可能更侧重:找到、安装并使用 APP 解决具体的问题,例如:医疗保险异地备案。不仅是操作,还包括资料的管理、信息的生成、表单的填写等。”

黄崇远表示,“ 移动端生态一定会将孤岛打破的。对于用户来说,在乎的是整个使用流程是不是更加顺畅、便捷、高效,体验更加良好。生态孤岛不是用户的诉求,用户并不在乎。但短期来看,AI 的完全托管也不是一个刚需,因为人的习惯迁移是需要时间和教育过程的,部分人甚至是在有意识的在对抗 AI,避免形成依赖。”

郭炜则认为,这个教育可能已经在手机以外的场景完成了,“ 现在新能源车几乎全都配备了语音控制,比如通过语音把车窗打开,已经成了标配。开车、行走的时候使用手机,往往操作困难或有风险,如果用豆包如果配一个眼镜或耳机,就很容易实现了。”

从博弈的角度来看,在这个赛道里大家也已经没有太多犹豫的时间,“ 尤其是在中国这么卷的环境里,只要 AI 助手厂商先拿到大量最终用户,就有极大的谈判优势,到时没有一个 APP 厂商不会屈服。如果不屈服,就会有新的 APP 出现,去对接 AI 助手获取的用户,旧 APP 原来的领头作用可能就消失了。”

黄崇远补充道,“ 先发优势一方面是占据了定义权,另一方面是更加前置的技术积累。当行业顺利发展,先发的优势就会很明显。行业认知、市场口碑、技术积累,以及生态伙伴的壮大,都会带来额外的议价权。”

一家大数据基础设施企业级 SaaS 公司创始人王通( 化名 )向知危表示,“ 以中国的制造能力以及在智能领域的突破能力,再加上政策环境相对宽松,相对于全球来说,在 APP 和最新技术领域,对个人隐私的限制没那么严,而且从个人角度来看,大家对隐私的在意程度也没有那么高。我相信如果下一代 iPhone 不好好努力,下一个划时代手机可能会在中国出现。”

而且,这个赛道的玩家可能不仅是对未来焦虑,对现状也存在焦虑。甄焱鲲表示,“ 传统 APP 应用生态,因为流量天花板和增长阻滞,迫切需要新的商业动力,进一步推升了 AI 应用成为破局点的可能性。” 以字节跳动为例,他们目前一个主要挑战是核心业务遭遇天花板。首先,抖音国内日活( DAU )增速从 2020 年惊人的 50%( 基于 TechCrunch 和 CNBC 的报道 ),到今年已经降至 6%( 据雪球分析 )。竞争对手的威胁也很大,微信视频号月活在 2022 年就达到了 8 亿,超过了抖音。

“ 对于互联网公司,可以认为公司价值 = 用户时长 × 变现效率 × 市场预期( 资本市场对未来增长潜力的溢价,例如高成长公司可能获得更高的估值倍数 )。当用户时长见顶,必须重构变现效率和市场预期,豆包 AI 手机助手是能同时提升两者的杠杆。”

既然趋势不可逆,那么在新趋势下,各类 APP 该如何存活或借机重获竞争优势?传统互联网生态的常见变现玩法将经历什么变化?

一旦趋势开始启动演化,所有 APP 厂商都要开始行动起来,郭炜表示,“ 比如淘宝不配合,但可能京东配合,那将来这个入口的流量就会被京东拿走。即便大厂都不配合,也可能一些新的或中小垂直电商会配合,比如得物、当当等。如果要预估演进的速度有多快、多彻底,可以参考如今 AI 搜索替代传统搜索的速度和程度。”

“ 中小 APP 厂商如果选择拥抱这个路线,可以为豆包做一些 GEO 优化或特殊场景的适配,让自己更可能被选择和使用,从而在新的流量入口中占据优势或先机。比如,APP 厂商可能针对豆包做非常方便的 API 和搜索、Agent 交互设计。也可能是直接通过语音、文字或者一段总结来回答用户的问题,而不是通过图片。这样操作起来比直接去传统电商用屏幕搜索,反应更快、速度更高、质量更好。 自然而然,它会被豆包排在前面。”

豆包手机助手在使用过程中会自主关闭广告,这其实也暗示了一个趋势,也就是说,原来 APP 上各种广告贴片、弹窗,在新趋势下为了优化 AI 助手的使用,APP厂商也可能会选择减少、优化甚至清除广告,“这是必然的,因为交互方式发生了彻底的变化。”

Scroll for more