智谱把“能操作手机的AI”开源了,这事对普通人有啥影响?

上周,科技圈热闹了一阵子。字节跳动和努比亚合作推出了一款叫“豆包手机”的新机型,它的特别之处在于:你只要跟它说“帮我点个外卖”或者“发个微信”,它就能自动打开相应App、完成操作,就像有个隐形助手在帮你点手机。消息一出,很多人抢着买,第一批很快卖光,二手平台上甚至被炒到近万元。

但没过几天,微信、淘宝这些常用App就开始限制这种自动操作功能,理由是担心安全和隐私。大家以为这事可能就这么被按下去了。没想到,12月9日晚上,另一家做AI的公司——智谱AI,突然宣布:把他们自己研发的、能让AI操作手机的核心技术,完全开源,免费给大家用。

这个动作,其实比“豆包手机”本身影响更大。因为这意味着,不只是字节能做这种手机,其他手机品牌、小公司,甚至普通开发者,现在都可以用这套技术,做出自己的“智能助手”。

下面咱们就聊聊,这事到底意味着什么。

智谱AutoGLM开源

1. 手机上的AI,终于不只是“喊一声就答应”了

过去几年,手机里的AI助手(比如小爱、Siri)基本只能干点简单活:设个闹钟、放首歌、查个天气。你得说得特别清楚,它才能照做,而且不能跨App操作。

但现在的新AI不一样。它能“看”懂你手机屏幕上显示的是什么,还能像真人一样,点开外卖App、选餐厅、下单,或者在淘宝里比价、加购物车。整个过程你只需要说一句“帮我买个便宜点的牛奶”,剩下的它自己搞定——当然,最后付款前会让你确认。

这有点像从“能听指令的机器人”升级成了“能主动办事的帮手”。手机不再是被动等你点来点去,而是能真正帮你省时间、省力气。

2. 为什么智谱开源这事很重要?

以前,这种能操作手机的AI技术,只有大公司才做得起来——要花很多钱、很多时间训练模型。智谱自己就干了快三年。

但现在,他们把整套东西(包括已经训练好的模型、用手机操作的工具、还有在微信、淘宝、美团等50多个常用App里怎么用的示例)全都公开了。任何公司、团队,甚至个人,只要懂点技术,就能拿来用,不用从零开始。

这就相当于:以前只有米其林大厨会做这道菜,现在他把菜谱写下来,贴在网上,谁都能照着做。

3. 这种AI怎么绕过App的“封锁”?

你可能好奇:微信、淘宝不是封了自动操作吗?那新AI还能用?

关键在于技术路线不同。以前的自动化工具,靠的是系统里的“无障碍服务”,很容易被App识别出来然后禁止。但智谱这套AI,是靠“看屏幕”工作的——它先截一张图,用AI模型看懂界面上有什么按钮、文字,然后像人一样点击。

从手机系统角度看,这和你自己用手点一模一样,App很难分辨是不是AI在操作。只要人能完成的操作,它理论上也能做。这让“封杀”变得没那么容易。

4. 隐私问题怎么办?

很多人担心:AI能点我手机,那会不会偷看我的聊天、账单?

智谱这次开源的方案,特别强调“本地运行”。也就是说,AI的分析和操作都在你自己的手机里完成,数据不上传到云端,也不会发给第三方。训练模型的时候,用的也是模拟的虚拟手机,没碰真实用户数据。

这样一来,所谓“隐私泄露”的风险就小了很多。巨头们再拿“安全”当理由拦着,就没那么站得住脚了。

5. 从中受益会是谁?

手机厂商:像小米、OPPO、荣耀这些品牌,不用自己从头研发,就能快速做出自己的AI助手,提升产品竞争力。
普通用户:未来买手机,可能不用纠结“哪家AI更好”,因为底层技术大家都能用,体验会更统一、更好。
开发者:可以基于这个开源工具,做出专为老人、视障人士服务的助手,或者帮上班族自动填报销单、挂号看病的小工具。创新门槛大大降低。

6. AI手机真的要来了?

其实“AI手机”这个概念喊了好几年,但大多数时候只是换个说法,比如加个大模型聊天功能,实际用起来差别不大。很多人觉得是“炒概念”。

但今年情况不一样了。国家层面开始支持(比如《政府工作报告》提到了“人工智能手机”),市场也在动——有机构预测,2025年中国AI手机出货量会超过1亿台,占整体市场的40%以上。

“豆包手机”让大家看到真实需求:人们想要的不是更聪明的语音,而是能真正帮做事的AI。而智谱的开源,让这种能力不再被一家公司垄断,而是变成整个行业可以一起做、一起改进的基础。

这次开源,不代表明天你的手机就能自动帮你回微信。技术落地还需要时间,厂商适配、App兼容、体验优化都得一步步来。但它确实打开了一扇门:未来每台手机,都有可能拥有一个真正懂你、能帮你干活的AI助手。

而且因为是开源的,大家都能参与改进,说不定你用的某个小众App,反而因为开发者热情,AI体验比大厂还好。

技术不是为了炫酷,而是为了让生活更简单。如果AI手机真能做到“你说一句,它就办好”,那才是它最有价值的地方。

这场变化,才刚刚开始。