首页 > AI头条  > 正文

颠覆传统!新多智能体框架OWL获17K Star,超越OpenAI开创智能协作新时代

2025-06-17 14:04 · 来源: AIbase基地

随着大型语言模型(LLM)的迅猛发展,单一智能体在应对复杂现实任务时显露出诸多局限。为了解决这个问题,香港大学与 camel-ai 等多家机构联合推出了一种名为 Workforce 的全新多智能体框架,并配套了一种名为 OWL(Optimized Workforce Learning)的训练方法。最近,这一创新成果在权威基准测试 GAIA 上获得了69.70% 的准确率,不仅刷新了开源系统的记录,还超越了 OpenAI Deep Research 等多家商业系统。

这一研究成果的所有代码已在 GitHub 上开源,当前已获得超过17,000个 Star 的点赞,标志着社区对这一创新的认可。

image.png

那么,Workforce 框架是如何突破多智能体系统的局限性的呢?其核心在于创新的 “解耦设计”。框架将整个系统拆分为三个关键组成部分:领域无关的规划器(Planner Agent)、智能协调器(Coordinator Agent)和专业工作节点(Worker Nodes)。这种设计不仅提升了系统的灵活性,还显著降低了跨领域迁移的复杂性。尤其是在需要适应新领域时,用户只需替换或添加工作节点,而不必对核心系统进行全面修改。

image.png

OWL 训练方法则是这一框架的另一大亮点。该方法采用了两阶段的训练策略,第一阶段是监督微调,通过专家演示数据对规划器进行初步训练;第二阶段则是强化学习优化,通过直接偏好优化(DPO)算法进一步提升决策能力。这一系列优化确保了规划器能够处理现实世界中的多样化任务。

在 GAIA 基准测试中,Workforce 框架展示了其显著的优势,尤其是在多智能体推理方面,达到了69.70% 的准确率,远超以往的开源系统。同时,OWL 训练方法也在测试中取得了显著成果,提升了 Qwen2.5-32B-Instruct 模型的性能。这一突破使得多智能体系统在处理复杂任务时,不再受限于以往的设计思路,展现出强大的自我纠错和进化能力。

Workforce 框架的推出不仅提升了多智能体系统的整体性能,也为智能助手的未来发展指明了方向。

论文地址:https://arxiv.org/pdf/2505.23885

  • 相关推荐
  • 智能体时代,还得看豆包大模型

    火山引擎,又有大动作了。 2025年6月11日,火山引擎Force原动力大会发布豆包大模型1.6、视频生成模型Seedance1.0pro等重磅新模型,以及迭代了一站式AI云原生全栈服务。 对此,字节跳动CEO梁汝波表示:“做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新�

  • OpenAI发布云端AI编程智能体Codex:代码准确率高达90%

    OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力,支持Python、JavaScript、C等主流语言,覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工,代码准确率达90%以上,能显著提升开发效率。Codex深度集成GitHub,支持智能代码补全和结构化代码自动生成,使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放,未来有望成为软件开发领域的标配工具,推动AI辅助编程进入新阶段。

  • 网易数智发布CoreAgent智能体开发平台及多款行业智能体

    5月23日,网易在杭州举办"万象新生"2025创新企业大会。网易数智宣布品牌升级,LOGO颜色从"科技蓝"变为"网易红",展现拥抱AI时代的决心。会上发布一站式智能体开发平台CoreAgent,整合知识库、运行沙箱等功能,助力企业智能化转型。同时成立AI生态联盟,首批成员包括英特尔、人民中科等上下游企业。网易数智还推出导购数字员工、智能外呼数字员工等多款行业智能体产品,加速企业数字化进程。

  • 智能体经济时代:展会沟通“零时差转化”时代开启

    2025年印尼雅加达国际工业周于6月4-7日盛大开幕,米奥兰特推出全球首个展会场景外贸AI+Agent系统,实现"沟通即生成"的智能贸易新模式。展会吸引超4.5万专业买家,AI预展平台和智能体技术驱动下,买卖对接率突破50%。核心亮点包括:1)AI眼镜支持128种语言实时翻译,打破语言壁垒;2)外贸信AI Agent自动生成含产品参数、运输条款等定制邮件,10分钟完成传统需通宵的工作;3)"慧记"系统结构化记录谈判细节,智能匹配买家偏好。米奥兰特通过AI慧展系统实现"预热-执行-客户管理"闭环,累计生成2万+外贸信,翻译时长超9000分钟,助力企业高效开拓RCEP及"一带一路"市场。

  • Manus与Lovart之后,又一颠覆B2B外贸行业的智能体来了!信风AI引智能化拓客浪潮

    我们见过太多传统的外贸获客方式:买一份客户数据、雇几个人做电话/邮件、甚至手动跑展会、查黄页、看海关单。但这些方法普遍存在两个问题——效率低、成本高。尤其是试图开拓新市场时,语言不通、信息不全、时间滞后,成了外贸人绕不开的难题。

  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。

  • 微软张祺:智能体将成为广告行业的变革引擎

    微软在北京举办"MSA Accelerate营销峰会2025",聚焦AI与智能体对广告行业的变革。微软全球资深副总裁张祺博士指出,AI时代已至,推理能力和记忆机制的突破让模型更强大高效。峰会发布多项创新产品,包括海外市场"品牌智能体",可执行复杂任务、实时响应并自主决策,显著提升品牌与消费者互动效率。微软广告业务中国区副总裁黄秀兰强调将持续深化本土生态合作,通过技术赋能助力中国品牌拓展国际市场。核心亮点包括:Copilot在广告个性化体验的重大突破,相关搜索广告效果提升25%;沉浸式展厅广告打造线上品牌旗舰店;动态筛选器通过对话交互实现精准投放。微软承诺坚持"信任优先"原则,确保数据安全可控。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • 百度心响上线iOS版,多智能体协作应用终于卷对地方了

    今年的4月26日,我们测评了百度新发布的多智能体协作应用心响APP。当时只上线了安卓版,很多网友在线求苹果版链接。 就在这几天,iOS版也终于上线了,只需要在苹果的APP Store搜索关键词即可下载。 现在,苹果安卓用户全部免费用,完全不限量! 在第一时间体验了iOS版心响APP,我们基本上可以下一个判断:智能体应用,终于卷对地方了。

  • 下手帮你干活直接交付结果 纳米AI超级搜索智能体发布

    ​当搜索不再只是获取信息的工具,而能直接帮你完成购物决策、行程规划甚至输出专业报告——这一愿景随着纳米AI超级搜索智能体的发布成为现实。

今日大家都在搜的词: