
文 | AI价值官,作家丨星 野,编 辑丨好意思 圻
三个月前,努比亚M153首销售罄的音信刷屏科技圈,豆包手机助手让东说念主第一次直不雅感受到AI真确\"接收\"手机是什么体验。但热度还未散去,、支付宝、各大银行App的顽固相继而至。差未几归并时刻,OpenClaw在设备者圈以另一种相貌考证了归并件事的价值,只不外是在电脑端而非搬动端。
跟着联手三星推出Gemini手机智能体,小米运行下场“养虾”,由豆包手机助手领先开启的手机AI Agent赛说念,竞争样子已迎来要道更始,成为软件厂商、手机厂商、操作系统三路东说念主马的同场竞技。
三条道路的期间底座不同,生态身份不同,濒临的阻力也各自迥异。豆包的读屏决议、谷歌的AppFunctions框架、的系统原生API——名义上都在解同全部题,内核的逻辑却大相径庭。谁的决议能真确跑通,取决于它在通盘搬动生态中处于什么位置,而不仅仅期间自身的优劣。
豆包手机走到今天,面对的还是不仅仅愚弄生态的阻力,还有手机厂商用系统级权限构筑起来的新壁垒。但字节的处境,也并非外界看起来那样被迫。它在B端的MCP布局、飞书积蓄的条约化造就、以及独家内容期间生态,都是手机厂商无法复制的财富。问题在于,如何把这些财富转动成愚弄厂商倨傲合作、硬件厂商无法冷落的实践筹码。
手机版“龙虾”来了,但第三方愚弄还没跟上
最近一段时刻,一只叫作念OpenClaw的\"龙虾\"火出了AI圈,“赛博养虾”快速出现东说念主传东说念主景观。不外,对大大量粗鄙用户来说,OpenClaw的门槛依然不低——它运行在电脑端,需要一定的期间布景才能部署和使用,距离真确的人人提高还有特别距离。
3月6日,小米庄重启动搬动端系统级智能体Xiaomi miclaw的小范围封闭测试。雷军在转发公告时只写了三个字:\"手机龙虾\"。这是小米对OpenClaw激越的正面回答,亦然手机厂商\"养虾\"海浪中领先亮相的那一只。意味着这场AI Agent改进的战场,庄重从极客的电脑蔓延到了粗鄙用户的手机。

从官方先容来看,miclaw的核心卖点是把手机系统身手变成AI可平直调用的器具集。Xiaomi miclaw可将手机系统身手封装为跳动50项器具,并不息扩张,即便实施20步复杂操作也能保持需求连贯性。
生态联动是miclaw目下最核心的相反化身手。小米深耕IoT多年,米家生态接入设立已跳动10亿台,而miclaw第一次让这个宏大的设立矩阵真确被AI统一调理——读取设立气象、发送限度指示,在用户授权的情况下,扫数接入米家的智能设立都能成为AI可驱动的末端。
关于第三方愚弄的接入,小米给出了两条旅途:一是通过MCP条约,PC端已有的数千个MCP器具表面上不错平直接脱手机AI;二是发布了第三方愚弄接入SDK,第三方App主动声明我方能提供的器具身手,Xiaomi miclaw动态发现和调用。

这两条旅途都有一个戒备的前提:第三方需要\"主动\"接入。从目下公开的演示和官方描写来看,微信、支付宝等高频第三方愚弄,并未出目下职何实践操作场景之中。小米也明确将miclaw定位为\"早期期间探索阶段\"。
即便第三方生态的接入仍是未解题,miclaw还是构建出一个其他厂商难以复制的私有上风。一个小米重度用户,还是不错用一句话调理家里扫数的智能设立、读取全部系统见知、惩办日期和健康数据,并在小米自有愚弄矩阵里完成特别一部分的日常任务。
值得热心的是,小米并不会是独逐个家“养虾”的厂商。华为、OPPO、vivo均已在系统级Agent标的不息过问。对用户而言,异日可能无需罕见装置任何愚弄,通过系统OTA更新就能赢得Agent身手,提高门槛将降至历史最低。
但对愚弄生态而言,当各家手机厂商同期推出各自的设施化调用体系,意味着好意思团、携程、支付宝等平台需要面对多套SDK的接入央求——在生意探求尚未理顺的阶段,这可能反而酿成适配压力,KY Gaming让愚弄厂商在通达力度上愈加审慎。
更真切的影响在于:当系统级Agent成为每部手机的标配,AI调理愚弄的相貌将徐徐取代用户主动大开App的习尚,愚弄分发逻辑将被重写。谁掌捏了AI调理的进口,谁就掌捏了下一代流量的分派权——而这,恰正是每一家手机厂商都明晰的终局。
GUI向左,OpenClaw向右
AI手机的正确姿势是什么?
要是说2025年底豆包手机助手的亮相,是一场模子公司与硬件厂商聚首的突袭。到了2026年开年,这场战争的样子还是今是昨非。手机厂商、操作系统、AI模子公司正在归并条赛说念上加快,量度高度一致:让AI接收手机操作,成为用户的万能代理。
要颐养它们的实质相反,需要先厘清一个更底层的期间问题:AI到底应该如何\"操作\"手机?
OpenClaw的核心筹算理念是腹地运行,基于MCP条约的三层结构——核心层调用大模子,适配层畅达平台,技巧层实施任务——它不依赖视觉识别,而是通过系统API平直实施指示。
豆包手机助手的旅途则迥然不同:用户下指示,手机截屏发给云霄大模子,模子看懂屏幕后复返操作指示,手机实施,再截屏,如斯轮回。这是一种绝对的\"视觉仿东说念主\"道路,AI像东说念主一样盯着屏幕干活。

这套读屏道路的早期奏效有目共睹。2025年12月1日,豆包手机助手期间预览版发布,搭载该助手的努比亚M153工程样机首批3万台通宵售罄,在科技圈激励景观级热心。跨平台比价点外卖、自动整理旅行攻略、批量处理音信,真的障翳手机日常使用的全场景,只在付款等要道法子需要东说念主工介入。
但这一期间道路,与现存搬动愚弄生态存在自然突破。实践落地中,微信曾触发“登录环境特别” 安全教唆,开云sports部分银行App也弹窗条目关闭AI助手关联功能,豆包因此书记暂停金融场景的AI自动操作。这背后既有效户诡秘与安全的合规考量,更核心的是生意利益博弈:AI时期流量进口、用户数据与操作链路的价值愈发要道,读屏道路试图绕开现存App壁垒,例必濒临极大的生态阻力。
谷歌和在2026年2月给出了一条更接近OpenClaw精神的旅途。三星Galaxy Unpacked2026发布会上,谷歌安卓生态系统总裁萨马特展示了Gemini智能体,大要在后台自动完成订餐、叫车、购物等跨愚弄复杂任务。
谷歌暴露了一套名为\"AppFunctions\"的底层框架,雷同MCP条约的腹地版块,通过AppFunctions,愚弄设备者不错界说功能接口,让Gemini更精确地调用;同期谷歌也在设备\"UI自动化框架\",让AI能在莫得官方适配的愚弄上通过视觉识别完成任务。这是一套\"双保障\"道路:优先推动愚弄主动通达API,同期保留视觉读屏当作备用。
该决议目下仅面向好意思国、韩国的Galaxy S26与Pixel 10 系列推出Beta版,仅障翳外卖、网约车等一丝合作场景,身手落地高度依赖愚弄方的适配与授权。
{jz:field.toptypename/}
对此,中兴通信末端做事部总裁、努比亚总裁倪飞直白评价:\"看到三星S26+Gemini的组合,雷同采取了GUI相貌,但只竣事了努比亚M153的局部身手,如故有些缺憾。\"这个对比并非毫暴戾理,但恰恰讲解了两条道路的实质遴选——豆包走 “先落地、再谐和” 的快速障翳道路,谷歌+三星走 “先定生态步骤、再徐徐通达” 的适宜道路。
小米miclaw 的举座念念路与谷歌高度邻近,但二者的上风各有侧重:谷歌掌控安卓全球系统级底层进口,而小米当作国内头部手机厂商,依托自身末端与用户体量,在国内愚弄生态的实践落地对接中更具言语权。
国内六家主流手机厂商的智能体用户领域,一年内整个增长6500万,举座达到5.35亿。这一体量让手机厂商在与第三方愚弄的合作中更具主动权,接入通达SDK,可借助系统级AI进口赢得新的用户触达渠说念,两边更易酿成互利的合作联系。
不论是谷歌AppFunctions如故小米的通达SDK,核心艰苦都在于愚弄厂商倨傲通达的身手领域。AI智能体替代用户完成操作后,用户无需大开App,平台的告白曝光、用户交互、流量进口价值都会被大幅消弱,致使可能冲击现存App的居品形态与核心利益,这亦然愚弄方存在费神的蹙迫原因。
这也决定了这类API通达道路能落地的场景,仅局限于愚弄方主动让渡的范围,难以王人备倨傲用户的全场景需求。
三条道路的问题由此知道呈现。豆包手机道路障翳场景最广、用户感知最平直,但愚弄顽固的压力恒久存在。谷歌+三星道路法度性最强,有安卓生态和宏大愚弄联系汇集托底,但先谈妥再落地的节拍,决定了它能障翳的场景深度有限。小米miclaw道路言语权最高,系统原生的身份让生态探求更顺畅,但第三方核心愚弄的接入雷同莫得现成谜底。
这场博弈的核心矛盾不是期间问题,而是利益问题。谁能让超等App确信通达API带来的增量收益大于被AI抽走流量的蚀本,谁才能真确买通手机智能体的全场景身手。在这个问题莫得谜底之前,扫数道路都仅仅在各自还是谈妥的一亩三分地里,跑得尽可能顺畅。
豆包手机助手的下一步
应该若何走?
豆包手机是这场竞赛的创始者,但创始者巧合是终局的赢家。面敌手机厂商集体入场,字节需要找到一条与硬件厂商摩擦最小、自身上风进展最大的道路。
字节初期以纯大模子供应商身份鼓励合作遇阻,转而通过与手机厂商开展系统级深度合作落地豆包手机助手。华为、小米、OPPO、vivo 均将自有智能体视为系统核心与流量分派进口,不肯向第三方通达系统级主导权。在此布景下,字节一边不息与多家手机厂商洽谈合作,一边优先采纳与中兴等厂商联手,以裁汰合作门槛、快速考证身手落地。
这条道路的逻辑是知道的:将AI身手深度植入硬件,打造\"智能核心\"而非自有品牌手机。据供应链音信,字节已于2025年底开启豆包手机助手郑再版神情,豆包二代手机展望将于2026年第二季度中后期发布,依旧延续与中兴努比亚的合作模式。
豆包二代最要道的期间决策,是如那处理GUI读屏与设施化API调用之间的联系。两者的根底相反在于:读屏是AI去符合东说念主类的操作界面,API调用是愚弄主动为AI提供身手接口,前者纯真但脆弱,后者踏实但依赖愚弄方的主动配合。
两套决议并行,是豆包二代目下最现实的旅途。阿里在内的部分App与字节达成和谈条约,允许努比亚设立浮浅登录,豆包主动收尾操作场景;另有手机厂商智能体负责东说念主暴露,主动寻求合作的App大厂昭彰加多了。
目下豆包团队已与打车、外卖、订票等领域的部分平台达成常用权限合作,这是从读屏向API调用迁徙的早期信号。已谈妥的高频场景鼓励设施化调用,尚未障翳的长尾场景保留读屏当作补充——这是向条约化道路徐徐逼近的过渡决议,而非一次性的道路切换。
在这个经由中,定位的调理比期间道路的切换更为要道。OpenClaw之是以让大厂省心,是因为它不试图成为用户与数字天下之间的独一中介,仅仅提供器具,让用户我方决定用谁的模子、部署在谁的云上。豆包要是能将定位从\"流量中介\"调理为\"身手增强层\",主动通达接口、让愚弄厂商也能从AI调理中获益,顽固的动机当然会弱化。
字节在B端积蓄的MCP工程化造就,是守旧这一瞥变的蹙迫基础。飞书的Lark MCP Server已将音信、日期、云文档、多维表格等联结身手以MCP设施对外通达,这套设施化身手的千里淀,意味着豆包在鼓励C端API接入时有无缺的期间框架不错平直复用。
对字节而言,豆包的契机不在于成为下一个流量限度点,而在于能否在通达生态中成为最不成替代的身手提供者。创始一个赛说念,和赢得一个赛说念,从来都是两件事——但对字节来说,至少这场仗还远莫得打完。
