首页 > AI头条  > 正文

微软发布Web智能体Magentic-UI,专门设计用于解决复杂的网页任务

2025-05-22 14:17 · 来源: AIbase基地

微软研究院正式宣布开源 Magentic-UI,这是一款以人为中心的 AI 智能体研究原型,旨在通过网页浏览器实时协助用户完成复杂的网络任务。

image.png


Magentic-UI 基于微软此前发布的 Magentic-One 多智能体系统和 AutoGen 框架打造,强调透明性、可控性和人机协作,为用户和研究人员提供了一个探索 AI 智能体交互和监督机制的强大平台。本文将从 AIbase 的视角,深入剖析 Magentic-UI 的核心功能、技术亮点及其潜在应用价值。

与追求完全自主的 AI 工具不同,Magentic-UI 将用户置于任务执行的核心,强调透明性和可控性,确保用户在自动化过程中始终保持主导权。Magentic-UI 支持用户通过计划编辑器或文本反馈直接修改 AI 的执行计划,在任务开始前即可明确每一步操作。这种协作规划(co-planning)机制让用户能够清晰了解 AI 的行动意图,避免了传统 AI 工具“黑箱”操作的不确定性。

此外,Magentic-UI 引入了行为防护(action guards)功能,敏感操作需经用户明确批准,用户还可自定义审批频率,确保安全性和灵活性。系统采用 Docker 沙箱技术隔离运行环境,有效防止对主机环境的意外影响,并通过网站白名单机制限制 AI 的访问范围,进一步提升安全性。据微软官方披露,Magentic-UI 已通过红队评估,成功抵御了跨站提示注入和钓鱼攻击等多重威胁。

多智能体协同,高效处理复杂任务

Magentic-UI 的核心在于其多智能体架构,基于2024年发布的 Magentic-One 系统,并由 AutoGen 框架驱动。系统由四个专业智能体组成,各自承担特定任务:

Orchestrator:作为主导智能体,负责任务规划、分解和协调,动态调整执行策略。

WebSurfer:专注于网页导航和操作,能够搜索信息、填写表单、与在线元素交互。

Coder:支持代码生成与执行,适合需要编程支持的任务,如数据分析或脚本自动化。

FileSurfer:处理文件管理,浏览本地目录、分析文件内容,支持多类型文档操作。

这些智能体通过内外双循环机制协同工作:外部循环管理任务整体计划,内部循环跟踪子任务进度,确保高效完成复杂工作流。例如,Magentic-UI 可用于自动化网页表单填写、深度网站导航(如筛选航班信息)或结合网页数据生成分析图表,显著提升生产效率。

Magentic-UI 以 MIT 许可证开源,代码已上架 GitHub(https://github.com/microsoft/Magentic-UI),并集成于 Azure AI Foundry Labs,为开发者、企业和研究人员提供了一个实验和创新的平台。用户可以通过文本输入和图像附件与 Magentic-UI 交互,系统生成自然语言计划,并支持实时编辑和干预。此外,Magentic-UI 具备计划学习(plan learning)功能,能从历史任务中学习并保存执行计划,优化未来任务的自动化效率。

微软表示,Magentic-UI 的设计遵循以人为中心的方法论,通过试点用户反馈不断优化,确保用户体验直观高效。这种开源模式不仅推动了人机协作技术的研究,还为开发者提供了模块化、可扩展的框架,助力构建更智能的 AI 应用。


  • 相关推荐
  • 易数智发布CoreAgent智能体开发平台及多款行业智能体

    5月23日,网易在杭州举办"万象新生"2025创新企业大会。网易数智宣布品牌升级,LOGO颜色从"科技蓝"变为"网易红",展现拥抱AI时代的决心。会上发布一站式智能体开发平台CoreAgent,整合知识库、运行沙箱等功能,助力企业智能化转型。同时成立AI生态联盟,首批成员包括英特尔、人民中科等上下游企业。网易数智还推出导购数字员工、智能外呼数字员工等多款行业智能体产品,加速企业数字化进程。

  • 微软发布2025工作趋势:每位员工将是Agent老板

    微软发布《2025年工作趋势指数报告》,揭示"前沿公司"这一新型组织形态正在兴起。报告基于全球31个国家/地区的31,000家企业数据,结合LinkedIn劳动力市场趋势分析,指出"智能体+人类"的人机协作模式正在重塑企业架构。前沿公司以AI智能体为核心,通过动态任务协作图(WorkChart)取代传统职能架构,实现高效人机协作。报告显示:67%的领导者已熟悉智能体概念,79%认为AI将加速职业发展;员工需从"工具使用"转向"协作共创",掌握AI管理技能;组织需重构职能,建立"智能资源部门"统筹人力与数字劳动力分配。人机协作的关键在于科学管理框架,最优状态是AI处理标准化任务,人类专注战略指导与复杂决策。

  • Manus与Lovart之后,又一颠覆B2B外贸行业的智能体来了!信风AI引智能化拓客浪潮

    我们见过太多传统的外贸获客方式:买一份客户数据、雇几个人做电话/邮件、甚至手动跑展会、查黄页、看海关单。但这些方法普遍存在两个问题——效率低、成本高。尤其是试图开拓新市场时,语言不通、信息不全、时间滞后,成了外贸人绕不开的难题。

  • AIbase解锁AI无限可能!MCP 圈疯传的神器,让AI智能体直接原地起飞

    AI时代来临,MCP资源宝库网站(https://mcp.aibase.cn)横空出世,一站式整合12万+AI开发资源。该平台提供网页搜索、数据库交互、图像视频处理等全方位服务,包含DuckDuckGo搜索API、百度地图MCP协议等热门工具。精选服务如Figma设计数据转换、EdgeOne网页快速部署等,大幅提升开发效率。网站还提供详细教程,新手也能轻松上手。紧跟AI发展前沿,这个功能强大、资源丰富的平台为开发者搭建了通往无限可能的桥梁,助力打造更智能的AI应用。

  • 联想Lecoo战者G1智能体AI眼镜首发1999元:搭载天禧个人超级智能体

    据悉,这款产品搭载天禧个人超级智能体,天禧的突破在于,它首次将感知、认知、决策与自主演进能力深度融合,形成了一套完整的人工智能双胞胎”逻辑。支持AI翻译/AI对话/AI识图,通过Hi小天”启动多模态AI助手。

  • 大厂Agent混战:复刻Manus的野心与困局

    国内AI智能体市场竞争激烈,字节、阿里、百度等大厂纷纷推出对标Manus的产品。字节"扣子空间"定位职场助手,阿里"心流"侧重深度研究,百度"心响"聚焦医疗法律等垂直场景。尽管产品形态各异,但都面临技术复制与流量争夺的双重挑战。当前智能体仅能完成基础任务,与Manus仍有差距。大厂通过免费策略抢占市场,而创业公司如GensPark已开始商业化探索。技术窗口期正在缩短,2025年被视为"智能体爆发年",这场围绕下一代AI入口的竞赛才刚刚开始。

  • 智邦国际一化ERP:企业一智能体成型,重塑企业未来

    近期制造业、轻工业、电子凭证、人工智能等领域密集出台政策,推动企业全方位数智化转型。智邦国际推出"企业一体化+"数智生态体系,以ERP为核心构建全维一体化管理平台,覆盖企业全生命周期各环节。其一体化ERP系统支持30多套软件灵活组合,并集成AI获客、智能客服等创新应用,帮助企业打通内外数据孤岛,实现从数字化向智能化的跃升。该方案通过一站式的数据互通和智能协同,正在成为企业降本增效的新引擎,引领万物互联时代的数智化转型浪潮。

  • OpenAI发布云端AI编程智能体Codex:代码准确率高达90%

    OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力,支持Python、JavaScript、C等主流语言,覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工,代码准确率达90%以上,能显著提升开发效率。Codex深度集成GitHub,支持智能代码补全和结构化代码自动生成,使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放,未来有望成为软件开发领域的标配工具,推动AI辅助编程进入新阶段。

  • Agent真的卷疯了,AI办公Agent也来了。

    ​我一直说,每个行业,都一定会有专门优化的垂直领域的Agent。 你看,通用Agent的王座上有Manus,研究类的有DeepResearch,旅游有飞猪问一问,设计类有Lovart。 那现在,办公领域的Agent也来了。 专为办公打造。 这玩意就是昆仑万维的Skywork Super Agents。

  • 1445元起!一图读懂联想moto edge 60系列:搭载天禧个人超级智能体

    值得注意的是,moto edge 60系列搭载全新的天禧个人超级智能体,它能根据输入上下文并结合用户个人特点,理解用户复杂意图,不仅能针对有多种涵义的专有名词缩写,给出最符合用户职业属性的解读,还能利用端云协同的计算与学习技术,将存在不同个人设备

今日大家都在搜的词: