首页 > 业界 > 关键词  > Mobile-Agent-v2最新资讯  > 正文

Mobile-Agent-v2:让AI学会自动刷手机

2024-06-06 11:42 · 稿源:站长之家

站长之家(ChinaZ.com)6月6日 消息:Mobile-Agent-v2是一个先进的AI系统,旨在通过自动化操作和视觉感知技术,实现对移动设备的全面控制。这一系统能够模拟真人的各种交互行为,如点击、滑动和输入等,从而自动化地完成一系列复杂的任务。

image.png

以下是Mobile-Agent-v2能够实现的一些关键功能示例:

  • 搜索和购买商品:AI可以在购物应用中自动搜索特定商品,将其添加到购物车,并执行购买操作。

  • 邮件发送:在Gmail等邮件应用中,AI能够自动填写邮件内容并发送。

  • 导航:AI可以在Google Maps等导航应用中自动进行路线规划和导航设置。

  • 视频观看:在YouTube等视频平台上,AI能够自动搜索视频并执行评论等互动操作。

与之前的Mobile-Agent相比,Mobile-Agent-v2引入了创新的多代理协作架构。这种架构允许多个AI代理协同工作,以实现更加高效的任务规划和执行。这种协作机制不仅提升了任务处理的灵活性,还显著提高了任务完成的效率。

实验结果显示,Mobile-Agent-v2在任务完成率方面相较于单代理架构的Mobile-Agent有了显著提升,提高了30%以上。这一进步表明,多代理协作的方法在自动化任务执行方面具有明显优势,能够为用户带来更多便利,同时也为AI在移动设备自动化领域的应用开辟了新的可能性。

论文地址:https://arxiv.org/pdf/2406.01014

举报

  • 相关推荐
  • 醒醒,只靠MCP和A2A还带不来AI Agent的大繁荣

    文章探讨了AI Agents发展需要类似HTTPS的安全协议保障。回顾互联网发展历程,TCP/IP协议统一了网络通信标准,HTTP协议实现了全球互联,而HTTPS通过SSL加密解决了安全问题。类比互联网发展,当前AI Agents产业面临类似挑战:Anthropic推出的MCP协议解决智能体与工具连接问题,Google的A2A协议实现智能体间协作,但缺乏安全标准。IIFAA联盟正致力于构建AI Agents安全生态,推出ASL中间件保障数据隐私和身份认证。文章指出,正如HTTPS推动电商繁荣,AI Agents的安全标准化将加速商业化进程,蚂蚁集团等企业已开始实践MCP应用。未来AI Agents可能通过统一入口调用工具池,改变现有交互模式。

  • 多模态和Agent成为大厂AI的新赛 点

    这是《窄播Weekly》的第52期,本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景,多模态能力和代理执行成为两个焦点。大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现,需要给到大模型多

  • 多模态和Agent成为大厂AI的新赛点

    本期《窄播Weekly》聚焦AI大厂竞争策略向应用场景倾斜的趋势,重点分析了多模态能力和代理执行两大发展方向。文章指出,大模型落地的核心在于让人机交互更自然,具体表现为:1)通过多模态技术降低用户使用门槛,如阿里夸克新推出的"拍照问夸克"功能;2)通过代理执行提升复杂任务处理能力,如字节、百度等推出的通用Agent产品。国内外厂商路径差异明显:国�

  • DK Mobile Reborn上线!注册账号教程+下载教程+官网地址分享

    MMORPG新游《DKMobile Reborn》 4 月 18 日上线,还是我们熟悉的泡菜三端互通游戏,这种游戏最好的地方就在于随时随地都能玩,而且游戏还支持"离线战斗模式",也是就玩家无需启动游戏也能延续自动战斗。首发五个职业,剑盾,狂战,射手,法师,奶妈。新游大家还是值得关注一下,尤其是搬砖选手,这个很有戏。今天给大家带来注册账号教程+下载教程+官网地址分享。DK Mobile Re

  • 接替Manus,字节的Agent王牌能打多久?

    字节跳动旗下智能体平台"扣子空间"推出首款由大厂发布的Agent爆款产品,自4月18日上线后引发用户疯抢邀请码。该产品具备规划、工具调用和记忆等关键能力,支持游戏攻略撰写、市场调研等复杂需求,并首创"探索模式"和"规划模式"双交互设计。虽然底层模型能力较DeepResearch和Manus仍有差距,但凭借产品设计优化和量大价优的优势,成功填补了Manus留下的市场空白。字节同步推出企业版HiAgent解决私有化部署问题,半年内智能体业务订单量增长超330%。当前行业正迎来Agent爆发期,但企业落地仍面临系统接入、数据安全等挑战。

  • 「扣子空间」内测上线,和 Agent 一起开始你的工作

    “摘星空间”平台正式推出,集生产、专业领域支持及双模系统协作能力,通过多类型AI智能体实现高效办公,具备生产提升、专家深度支持、双模协同等四大核心功能,未来将持续扩展Agent能力边界。

  • 大厂Agent混战:复刻Manus的野心与困局

    国内AI智能体市场竞争激烈,字节、阿里、百度等大厂纷纷推出对标Manus的产品。字节"扣子空间"定位职场助手,阿里"心流"侧重深度研究,百度"心响"聚焦医疗法律等垂直场景。尽管产品形态各异,但都面临技术复制与流量争夺的双重挑战。当前智能体仅能完成基础任务,与Manus仍有差距。大厂通过免费策略抢占市场,而创业公司如GensPark已开始商业化探索。技术窗口期正在缩短,2025年被视为"智能体爆发年",这场围绕下一代AI入口的竞赛才刚刚开始。

  • 微软发布2025工作趋势:每位员工将是Agent老板

    微软发布《2025年工作趋势指数报告》,揭示"前沿公司"这一新型组织形态正在兴起。报告基于全球31个国家/地区的31,000家企业数据,结合LinkedIn劳动力市场趋势分析,指出"智能体+人类"的人机协作模式正在重塑企业架构。前沿公司以AI智能体为核心,通过动态任务协作图(WorkChart)取代传统职能架构,实现高效人机协作。报告显示:67%的领导者已熟悉智能体概念,79%认为AI将加速职业发展;员工需从"工具使用"转向"协作共创",掌握AI管理技能;组织需重构职能,建立"智能资源部门"统筹人力与数字劳动力分配。人机协作的关键在于科学管理框架,最优状态是AI处理标准化任务,人类专注战略指导与复杂决策。

  • 挤爆字节服务器的Agent到底啥水平?一手实测来了

    字节推出"量子位"智能协作系统"扣子空间",具备信息整理、任务执行、工具调用等多项能力。测试显示其自主任务规划和资料搜集表现惊艳,已具备解决实际任务的潜力。系统分为探索和规划两种模式,前者重效率,后者可详细拆解任务。实测中能自动整理信息生成报告,并直接制作包含丰富内容的网页或PPT。在虚拟沙盒环境中还能操作电脑、浏览网页、订票�

  • 再获权威认可!数势科技上榜IDC中国AI Agent应用市场全景图报告

    近日,国际数据公司(IDC)发布的《IDC Market Glance:中国AI Agent应用市场概览,1Q25》(Doc#CHC53057625, 2025 年 3 月)研究报告中,数势科技凭借在企业级智能体应用领域的技术突破,成功入围"数据分析"细分领域代表厂商,成为该赛道智能化转型的标杆企业。数势科技首发企业级决策分析智能体平台SwiftAgent数势科技SwiftAgent 作为基于DeepSeek及行业先进大模型构建的企业级智能决策分�