首页 > 业界 > 关键词  > 文章搜索最新资讯  > 正文

智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

2025-08-21 11:28 · 稿源: 数字生命卡兹克

声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。

智谱今天,终于发了AutoGLM2.0

想一想,AutoGLM1.0的版本,距离我第一次首发写他们,已经过去快10个月了。

那个时候,他们掀起了一波Agent热潮,甚至连A股都出现了智谱概念股,他们也开启了Agent的另一条支线,用视觉的方式来操控原有设备。

当时,我对着我的手机说:我29号要去一趟深圳,你帮我定个罗湖地铁站附近的酒店,预算600元以内,大床房。

然后,我的手机,就像被一个看不见的幽灵接管了一样。它自己解锁,自己打开携程,自己输入目的地、日期、价格区间,自己筛选大床房,然后把一个个符合要求的酒店,像清单一样呈现在我面前。

全程,我没有碰过屏幕一下。

那一刻,我嘴里除了卧槽,已经发不出任何别的声音。

两岸卧槽啼不住,AI已过万重山。

我以为,那个我从小就幻想的贾维斯,真的来了。

但狂喜之后,是漫长的、逐渐冷却的现实。

去年10月那时候,AutoGLM很惊艳,但它并不完美。它能操作的App还很有限,我想让它用滴滴、京东,它都做不到。它还不太能很好地跨App工作,我想让它在小红书搜完攻略,再把地址发到高德地图导航,它就会在复杂的跳转中迷路。

最大的问题是,它需要完全占据我的手机。

也就是AutoGLM在帮我点外卖的时候,我就不能用手机回微信,不能刷视频,什么都不能干。我只能像个监工一样,看着它在屏幕上,一步步地,执行我的命令。

于是,在最初那几天的兴奋劲过去之后,AutoGLM就和我手机里很多其他的App一样,被我静静地放在了一个角落里。它很酷,但它不方便。它是一个属于未来的产品,但它还没准备好,活在我的现在。

然后,就是长达半年的等待。

直到今天,智谱终于更新了。

不仅首次支持了IOS,甚至连logo都改了。

图片

而这一次,他们掏出来的东西,彻底解决了那个最要命的问题。

他们送了每个AI玩家一部,可以跑Agent的云手机。

这个概念,听起来可能有点复杂,但说白了,就是智谱在云端,给你开了一台只属于你的、7x24小时不关机的虚拟手机。而AutoGLM,就住在这台云手机里。

这意味着,我终于可以,一边让我的贾维斯在云端帮我干活,一边用我自己的手机,刷B站,打游戏,聊微信。

你现在点进AutoGLM里,就能看到一个智能体手机和一个智能体电脑。分别对应生活助手和办公助手。

图片

生活助手进去就是云手机,办公助手就是类似于Manus那种虚拟机。

点进智能体手机以后,看到的就是两个tab,一个是对话,一个是手机。

图片

对话界面很简单,就是给AutoGLM发任务的地方,而手机页面,则是智谱送给你的云手机,每隔一段时间进去都要启动一会,大概十几秒钟。

启动完成以后,这个界面你肯定就非常熟悉了。

图片

这是正儿八经的一台手机。

你可以点击最下面的那个接管手机的按钮,来真正的操作他,你没看错,这真的是一台手机,主流APP全都装好了,你是真的可以用它的。

图片

比如我就把我的抖音、B站、小红书等等的小号登在了云手机上,很棒的解决了iPhone用户没有应用双开的问题,实现完美隔离,可以刷一些大号不能刷的内容了。。。

甚至,你是真的可以用它来拍照的,虽然这个像素的画质有点感人。

图片

不过这台云手机还是会有一些限制,比如你是无法下载新的APP的,只能使用这些已经预装好的APP。

这个带来的一个非常大的问题,除了自定义能力差了一些之外,就是如果你细心的话,会发现,这上面没有微信。

大概率是出于隐私保护问题,所以AutoGLM选择拿掉了微信,因为之前的AutoGLM1.0的时候使用的本地版,对微信的支持是非常好的。

然后就是毕竟在云上跑,延迟稍微有一点点高,不是特别跟手,基本上按个按键需要0.5s到1s时间才能反应。

不过这个问题,其实也没啥,因为理论上这个云手机,也不是给你用的,是给AI用的。。。

比如我们在对话界面,可以说直接发一句:

我饿了,给我在附近的烧烤店里点20串望京小腰。

(PS:我强烈建议在使用AutoGLM之前,把一些APP都在云手机登上,强烈建议用小号,然后保存登录状态,要不然过程中登录还挺烦的)

在发送任务之后,AutoGLM拆解了任务,然后就打开了云手机,找到了最近的一家烧烤店,然后1、2、3、4、5的点了20串望京小腰,没有任何问题。

最后的结算环节,因为涉及到金钱交易,还是需要人工来确认一下支付。

甚至后面发现个好玩的,在结算的时候,它还知道自己去买神券然后用优惠券。。。

图片

又比如,让它去京东上搜索小米AI眼镜的好评与差评。

在整个过程中,你都是可以随时把AutoGLM划到后台的,自己去看别的事,聊微信、刷小红书、看微博等等,跟你自己的动作,不会有任何冲突,只要你想起来的时候,再回去看一下结果就好。

而且整体因为是他们自己的GLM-4.5和GLM-4.5V做的底层模型,所以一次任务的成本也极低,应该只有0.2美元,比正常的Agent便宜多了,所以这一次,也能全面免费像所有人开放。

而且在我看来,其实真正大众化的场景,都是以手机为主导的,比如短视频、外卖、打车、导航等等。

AutoGLM不同于各种各样的网页端的通用Agent,而是从普通人出发,去做真正生活化、真正普通人的场景。

这也是第一个,为手机而生的通用Agent。

不过,我觉得最酷的最有价值的,其实是他们说8月底,下个版本马上就要上新的新功能:

定时任务。

AutoGLM+定时任务,绝对是绝配,是手机Agent最正确的打开方式。

比如,吃早饭。

我每天早上,大概9点40左右起床,洗漱一下,10点就得冲出门。我不是不想吃早饭,我是真的,没有那个点外卖的时间和心气。我总不能每天设个9点的闹钟,把自己叫醒,点个外卖,然后再迷迷糊糊地睡过去吧?那睡也睡不好。

但如果,有了AutoGLM和定时任务,一切都变了。

我可以直接给AutoGLM下一个长期的、模糊的指令:

从现在开始,每个工作日的早上9点,帮我点一份早餐送到家。我不挑食,可以是汉堡王的超值麦芬三件套,也可以是711的包子,或者是楼下的天津煎饼。你看着办,帮我随机选一个就行。

然后,我就再也不用管这件事了。

当我每天早上,睁开眼睛,一份热气腾腾的、带着点随机惊喜的早餐,已经在家门口等我了。

每天上午10点抢星巴克券、凌晨零点蹲京东秒杀这种麻烦到爆炸的事情,终于可以从你的生活里彻底消失了。

还有比如定时给家里的猫主子买猫粮,每个月给爸妈交话费。这些事,说大不大,但你一旦忘了,后果就很麻烦。

现在,我都可以把它们,变成一个个定时的、自动执行的任务,扔给那台在云端为我打工的手机。

还有那些,我们每个人都在经历的,被各大App绑架的数字苦役。

B站每天的签到领硬币,京东的签到领京豆,支付宝的定时领积分,美团的签到领饭票。每一个App,都想尽办法,让你每天都得像打卡上班一样,去点一下那个签到按钮。

现在,也都可以让AutoGLM自动去处理。

人的生活本就不应该被这些重复且无聊的琐碎小事消耗。

真正该做的事,从来都不是什么代替你创造、代替你思考,而是干掉那些占用你脑子和精力、却毫无价值的机械重复劳动。

现在,有了智谱给的这台7x24小时不关机的AutoGLM,有了这个手机上的Agent,很多能真正解放你注意力的可能性,终于第一次变得真实起来了。

这也是第一个,手机上的Agent。

不过说实话,兴奋劲过去之后,我心里还是隐隐约约有个小疙瘩。

当我把抖音、B站、小红书这些账号都登录在这台云手机上的时候,我突然想到了一个细思恐极的问题。

这些账号,都是存在智谱的云端服务器里的。

虽然他们已经有提示了,说了自己不会存储任何的密码等问题。

图片

坦率地说,目前AI行业,甚至整个互联网行业,都还没能彻底解决云端隐私安全这个难题。智谱也一样,可能他们选择不放微信,就是出于这样的顾虑吧。

所以,我的建议是,未来可以把那些日常但又特别琐碎的、低敏感度的操作,放到云端,让你的真手机不再被绑架,你可以放心追剧、刷抖音。

但我建议大家还是有所选择,可以不用拿自己最核心的敏感账号来用,毕竟隐私的顾虑,需要非常长时间的信任培养,这一点,咱们坦诚相待。

说实话,看到AutoGLM2.0的这个云手机的方案,想起来当年我第一次看iPhone3GS的感受。

第一台iPhone发布至今,人们一直在追寻真正的智能手机。乔布斯当年对Siri寄予了多么强烈的期盼,最后Siri垮得就有多么惨淡。

或许,站在未来的时间节点回望,我们正在见证AI技术,从能说会道,向能干会活的关键跃迁。

AutoGLM的出现,就是最有力的注脚。

因为它在做的,不是一件更酷、更宏大的事。

它在做的,是一件更小、但更温暖的事。

举报

  • 相关推荐
  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 第一个能帮你做生意的Agent来了。

    这是一个面向外贸、面向海外的tob产品,所以国内可能知道的人并不是很多。 但其实,Accio已经默默攒了200万企业级客户了。 ToB领域,200万客户,这是什么水平,大家懂得都懂。。。 我之前因为刘世奇,认识了阿里国际站,我自己本身就对外贸非常感兴趣,后来又当主持人和阿里国际站一起搞过他们的新品发布会,关系很不错。 所以托他们的福,这次,我也能第一手,抢�

  • 一个邪修方法,帮你把用Agent的钱省掉80%。

    ​之前我分享过一个Agent,Minimax的那个,因为我觉得Agent能力,是真的很棒,东西好用也是真的好用。 但文章发出去之后,评论区里最多的声音,几乎都指向了同一个字: 贵。

  • Agentic AI落地加速:迈富时企业级智能体中台2.0,让 AI Agent成为企业 “数字员工”

    Gartner将代理型AI列为2025年十大战略趋势之首,预测到2028年15%的日常工作决策将由自主智能代理完成。迈富时发布的AI-Agentforce2.0企业级智能体中台,通过"技术赋能+场景落地"双轮驱动,构建了从模型能力到业务价值的闭环。该平台具有三大核心优势:1)"模型-应用-开发平台"三位一体架构;2)ChatBox+工作流双开发模式,支持快速部署;3)企业级安全保障,满足金融等敏感行业需求。已在保险、零售、供应链等领域实现规模化应用,最高提升37%销售转化率。该方案让企业能低成本打造专属数字员工团队,真正释放代理型AI的战略价值。

  • 格创东智再获权威认可,AI Agent解决方案入选甲子光年报告

    格创东智凭借工业AI+Agent创新实践入选甲子光年智库《企业级AI+Agent(智能体)价值及应用报告》,继获评"星跃100"2025中国AI产业逐浪者奖项后再获头部科技媒体认可。报告指出,该公司在复杂工作流编排、工具集成和领域知识沉淀三大维度表现突出,成为工业智能化转型标杆案例。其自主研发的章鱼智脑Agentic+AI平台支持多Agent协同和复杂工作流编排,通过"模型即服务、知识可视化、流程任编排"重构工业AI开发范式。典型案例"设备知识库Agent小鲁班"为半导体企业实现故障处理效率提升62%,年增收数千万元。公司持续深化"工业智能体"等研发投入,累计投入超10亿元,沉淀工业机理模型35000+个,构建了AI、工业软件、智能装备三合一的全栈服务生态。预测到2026年认知型Agent将覆盖70%企业复杂决策场景,格创东智将持续引领工业AI解决方案创新,助力中国制造业数字化升级。

  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • 第十三届互联网安全大会开幕:All In Agent

    2025年8月6日,第十三届互联网安全大会(ISC.AI2025)在北京国家会议中心开幕。本届大会以"All In Agent"为主题,聚焦智能体时代下的数字安全与人工智能前沿。360创始人周鸿祎指出,大模型必须进化成智能体才能成为生产力工具,并揭示了智能体演进的四个层级:从聊天助手到多智能体蜂群协作。360推出的安全智能体基于大模型,具备自主规划、工具调用等能力,可复制人类安全专家能力。在网络安全领域,智能体正形成颠覆性影响,360将推动全线产品智能化,用安全智能体重塑数字安全。周鸿祎强调"安全是数字化的底座,AI是数字化的巅峰",360将坚持"安全+AI"双主线发展。

  • Testin XAgent 赋能:金融机构如何打赢 AI 测试升级战?

    在金融科技领域,软件质量是企业生存发展的生命线。从高频交易系统到在线银行平台,软件的稳定性直接关系到金融机构的声誉与客户信任。随着数字化转型深入,AI 技术正为软件测试带来革命性变革,推动行业从传统模式向智能化、自动化跨越。过去两年,生成式 AI 的崛起让软件测试迈入 “自驱” 时代。世界质量报告显示,75% 的公司正积极投资 AI 以提升质量保证能力;

  • AI日报:腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher;我国首个法律垂直大模型“小包公”发布

    本文介绍了AI领域最新动态:1)腾讯推出电影级音频生成工具AudioGenie,展现中国AI技术实力;2)阿里开源多模态智能体WebWatcher,突破现有系统局限;3)港大等高校联合推出3D建模技术OmniPart,实现模型组件独立性和清晰度;4)Meta发布无需标注数据的通用图像处理模型DINOv3;5)国内首个法律大模型"小包公"发布;6)ChatGPT移动端收入突破20亿美元;7)安卓厂商借鉴灵动岛设计,新芯片推动AI功能普及;8)欧洲AI公司推出仅94MB的超小模型;9)Claude Code新增编程教学模式;10)AI技术被滥用于电商恶意退款;11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

  • 提升服务效能与客户体验:合力亿捷电话客服Agent引领文旅行业服务变革

    文章探讨了文旅产业向"体验经济"转型过程中电话客服的重要性与挑战。传统人工客服模式面临三大痛点:高峰时段电话难接通、服务标准不统一、夜间节假日服务缺失。合力亿捷推出的智能电话客服Agent解决方案,通过大语言模型(LLM)与行业知识库融合,实现7×24小时不间断服务、精准语义理解、复杂问题处理等功能。该方案不仅能提升80%高频重复问题的处理效率,还能沉淀客户数据资产,助力企业精细化运营。智能客服正从成本中心转变为创造营收的价值中心,推动文旅企业数字化转型和服务升级。

今日大家都在搜的词: