首页 > AI头条  > 正文

ART框架发布!用Python一键训练AI Agent,邮件搜索到游戏操控全能搞定!

2025-07-18 09:43 · 来源: AIbase基地

人工智能技术的快速发展为智能Agent的训练带来了全新机遇。近日,一款名为ART(Agent Reinforcement Trainer)的开源强化学习框架正式发布,引发开发者社区的广泛关注。该框架通过集成GRPO技术,为Python开发者提供了便捷工具,可训练AI Agent执行多步骤任务,如邮件搜索和游戏操控等。

 ART框架:强化学习新利器

ART框架专注于通过强化学习(RL)提升AI Agent的性能,使其能够从经验中学习并优化任务执行。ART支持开发者将强化学习无缝集成到Python应用中,适用于多种场景,包括邮件检索、游戏AI开发以及其他需要复杂决策的任务。框架特别推荐使用如Qwen2.5-7B的小型模型,因其高效性和灵活性,适合驱动零散任务。ART支持Qwen2.5、Qwen3、Llama和Kimi等多种语言模型,为开发者提供了广泛的选择。

image.png

通过ART,开发者可以构建能够处理多轮交互、递归调用子Agent或压缩历史记录的长期运行Agent。这种灵活性使ART成为从个人项目到企业级应用的理想工具。

 简单集成,开发者友好

ART框架以易用性和模块化为设计核心,采用客户端与服务器分离的架构,极大降低了使用门槛。ART客户端与现有代码库无缝对接,开发者只需通过简单的Python命令即可集成强化学习功能。安装ART仅需运行以下命令:

```bash

pip install art

```

ART服务器负责处理复杂的训练和推理过程,支持在本地GPU或云端 ephemeral GPU环境中运行,开发者无需深入管理底层训练服务。ART还与W&B、Langfuse和OpenPipe等平台集成,提供强大的可观测性和调试功能,方便开发者监控Agent训练进展。官方提供的示例笔记本和详细文档,覆盖邮件检索到游戏任务的多种场景,帮助开发者快速上手。

 多场景应用,释放潜力

ART框架在多个领域展现出强大应用价值,尤其在以下场景表现突出:

- 邮件搜索与自动化:ART训练的Agent能够高效完成多步骤邮件检索任务,快速定位目标邮件,提升工作效率。

- 游戏开发:开发者可通过ART训练AI Agent在复杂游戏环境中自主学习,例如在Atari游戏或自定义场景中实现智能决策。

- 多Agent协作:ART支持递归调用子Agent和多轮交互,适合开发复杂的多Agent系统。

ART基于GRPO算法,通过并行执行多次 rollout 收集数据,结合最新检查点进行迭代训练,确保模型在长期任务中的稳定性和高效性。ART兼容大多数vLLM和HuggingFace Transformers支持的因果语言模型,为开发者提供高度灵活性。

 开启Agent开发新篇章

AIbase认为,ART框架的发布为AI Agent开发带来了全新可能。其模块化设计和对小型模型的优化,使得中小型团队和个人开发者也能快速构建高性能Agent,打破了传统强化学习框架的技术壁垒。ART的开源特性进一步促进了社区协作,未来有望在更多领域激发创新应用。

目前,ART框架正处于活跃开发阶段,官方鼓励开发者通过GitHub贡献代码或提出建议,共同完善这一生态系统。开发者可访问ART的GitHub仓库(https://github.com/openpipe/art)获取最新文档和示例,快速探索其潜力。

 未来展望:多模态与复杂任务融合

ART开发团队表示,未来将扩展框架功能,支持多模态数据处理和超长上下文推理,满足更复杂的任务需求。ART的灵活架构允许开发者自定义训练参数和推理引擎配置,为多样化应用场景提供了可能。无论是个人开发者还是企业团队,ART都将成为构建智能Agent的强大助力。

项目地址:https://github.com/OpenPipe/ART

  • 相关推荐
  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • 刚刚,OpenAI通用智能体ChatGPT Agent正式登场

    ​Agent AI 时代,比我们想象中来得要早一些。 北京时间周五凌晨,OpenAI 突然开启了新产品直播。 本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。

  • 专为企业打造的智能体中台来了!迈富时AI-Agentforce 2.0让Agent正式走向工作岗位

    Gartner预测到2028年,15%的日常工作决策将由自主智能代理完成。迈富时最新发布的AI-Agentforce2.0作为企业级智能体中台,采用"技术赋能+场景落地"双轴驱动模式,重新定义企业智能化转型路径。该平台通过"模型-应用-开发平台"三位一体架构,提供从底层能力到上层应用的完整闭环,包含五大技术模块:模型管理、知识引擎、工具生态、流程编排和企业级基座。相比传统开发方式,该平台将Agent开发周期从3-6个月缩短至2分钟-2周,并已在金融、零售、供应链等行业实现规模化落地,典型应用包括智能导购、财务审批等场景。

  • ZEGO AI Agent:支持一张图生成数字人

    即构科技推出AI Agent2.4,用户只需上传一张正面照即可生成1080P高清数字人,支持实时互动对话。该技术具备400ms超低延迟、2秒内完成自然交互响应,唇形同步准确,支持文本/音频/语音流驱动。适用于教育、客服等场景,提供API灵活定制,实现低成本批量生成。核心技术融合照片驱动与实时AI交互引擎,在生成效率、拟真度方面显著提升,带来低门槛、高沉浸的数字人互动体验。

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • MasterAgent颠覆性上线:一键式生成智能体集群,分钟级构建专属AI协作网络

    全球首个L4+级智能体母系统MasterAgent在深圳发布,标志着AI从"被动执行工具"升级为能主动思考、跨界解决问题的"数字伙伴"。该系统突破性实现三大功能:一键生成智能体集群、多智能体自主协作、灵活定制优化。核心技术突破包括动态Agent生成框架将开发周期压缩至分钟级,以及去中心化多智能体协同机制,支持数百个智能体像"数字团队"一样高效协作。由深圳深元人工智能科技自主研发,其团队依托中国科学技术大学专家资源,已快速成长为国家级高新技术企业。这一突破让AI真正成为能创造实际价值的"新生产力单元"。

  • 领先OpenAI三个月,百度文库GenFlow领跑通用Agent领域,2.0版本8月上线

    百度文库即将在8月发布GenFlow2.0版本,该版本具备更强大的多模态能力,支持生成多种内容形态,大幅缩短任务交付时间。相比OpenAI同日发布的ChatGPT+Agent,百度文库早在4月就已上线GenFlow1.0,实现全场景覆盖和全链路调度。GenFlow基于MoE架构,在成本、性能和效率上占优,能快速生成PPT、研报等多样化内容,且依托百度14亿专业文档资源,内容质量更可靠。此外,GenFlow还能调用用户个人数据实现个性化定制,并提供内容后期编辑功能,灵活性更高。

  • 聚焦AI Agent营销新局,明略科技主办第六届媒介力学论坛圆满落幕

    7月17日,第六届媒介力学论坛在上海举办,聚焦AI时代营销新范式。论坛由秒针系统主办,以"营销新范式·媒介新主张"为主题,探讨AI Agent对营销触达力、内容力和触动力三大核心能力的赋能。与会专家指出,AI正重塑营销全链路,品牌需构建"面向AI的营销"体系,通过数据驱动和情感互动实现深度心智认同。秒针系统发布《2025品牌增长潜力榜》等三大报告,为行

  • 最强Agent?3分钟看懂Kimi K2真的好用吗?

    Moonshot AI于2025年7月11日发布开源大模型Kimi K2,主打代码编写、数学推理和Agent工具调用功能。该模型采用MoE架构(1T参数,激活32B),在SWE-Bench等测试中表现优异,数学推理得分达97.4。支持128k上下文、工具调用和API集成,定价为输入4元/百万tokens、输出16元/百万tokens。相比闭源模型,Kimi K2具有开源免费、成本低等优势,适合开发者和企业使用。同时推荐AIbase平台,可系统比较�

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

今日大家都在搜的词: