ART框架发布！用Python一键训练AI Agent，邮件搜索到游戏操控全能搞定！

2025-07-18 09:43 · 来源： AIbase基地

人工智能技术的快速发展为智能Agent的训练带来了全新机遇。近日，一款名为ART（Agent Reinforcement Trainer）的开源强化学习框架正式发布，引发开发者社区的广泛关注。该框架通过集成GRPO技术，为Python开发者提供了便捷工具，可训练AI Agent执行多步骤任务，如邮件搜索和游戏操控等。

ART框架:强化学习新利器

ART框架专注于通过强化学习（RL）提升AI Agent的性能，使其能够从经验中学习并优化任务执行。ART支持开发者将强化学习无缝集成到Python应用中，适用于多种场景，包括邮件检索、游戏AI开发以及其他需要复杂决策的任务。框架特别推荐使用如Qwen2.5-7B的小型模型，因其高效性和灵活性，适合驱动零散任务。ART支持Qwen2.5、Qwen3、Llama和Kimi等多种语言模型，为开发者提供了广泛的选择。

通过ART，开发者可以构建能够处理多轮交互、递归调用子Agent或压缩历史记录的长期运行Agent。这种灵活性使ART成为从个人项目到企业级应用的理想工具。

简单集成，开发者友好

ART框架以易用性和模块化为设计核心，采用客户端与服务器分离的架构，极大降低了使用门槛。ART客户端与现有代码库无缝对接，开发者只需通过简单的Python命令即可集成强化学习功能。安装ART仅需运行以下命令:

```bash

pip install art

```

ART服务器负责处理复杂的训练和推理过程，支持在本地GPU或云端 ephemeral GPU环境中运行，开发者无需深入管理底层训练服务。ART还与W&B、Langfuse和OpenPipe等平台集成，提供强大的可观测性和调试功能，方便开发者监控Agent训练进展。官方提供的示例笔记本和详细文档，覆盖邮件检索到游戏任务的多种场景，帮助开发者快速上手。

多场景应用，释放潜力

ART框架在多个领域展现出强大应用价值，尤其在以下场景表现突出:

- 邮件搜索与自动化:ART训练的Agent能够高效完成多步骤邮件检索任务，快速定位目标邮件，提升工作效率。

- 游戏开发:开发者可通过ART训练AI Agent在复杂游戏环境中自主学习，例如在Atari游戏或自定义场景中实现智能决策。

- 多Agent协作:ART支持递归调用子Agent和多轮交互，适合开发复杂的多Agent系统。

ART基于GRPO算法，通过并行执行多次 rollout 收集数据，结合最新检查点进行迭代训练，确保模型在长期任务中的稳定性和高效性。ART兼容大多数vLLM和HuggingFace Transformers支持的因果语言模型，为开发者提供高度灵活性。

开启Agent开发新篇章

AIbase认为，ART框架的发布为AI Agent开发带来了全新可能。其模块化设计和对小型模型的优化，使得中小型团队和个人开发者也能快速构建高性能Agent，打破了传统强化学习框架的技术壁垒。ART的开源特性进一步促进了社区协作，未来有望在更多领域激发创新应用。

目前，ART框架正处于活跃开发阶段，官方鼓励开发者通过GitHub贡献代码或提出建议，共同完善这一生态系统。开发者可访问ART的GitHub仓库（https://github.com/openpipe/art）获取最新文档和示例，快速探索其潜力。

未来展望:多模态与复杂任务融合

ART开发团队表示，未来将扩展框架功能，支持多模态数据处理和超长上下文推理，满足更复杂的任务需求。ART的灵活架构允许开发者自定义训练参数和推理引擎配置，为多样化应用场景提供了可能。无论是个人开发者还是企业团队，ART都将成为构建智能Agent的强大助力。

项目地址：https://github.com/OpenPipe/ART

相关推荐

OpenAI发布ChatGPT Agent智能体：支持写代码、做PPT、分析金融

OpenAI推出ChatGPT智能体，整合网页交互、数据搜索与多模态协作功能，可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放，Pro版近乎无限使用，其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限，并

OpenAI ChatGPT智能体人工智能
荐刚刚，OpenAI通用智能体ChatGPT Agent正式登场

Agent AI 时代，比我们想象中来得要早一些。北京时间周五凌晨，OpenAI 突然开启了新产品直播。本次发布的是全新的 ChatGPT Agent，它实现了通用智能体（Agent）能力的关键升级。
专为企业打造的智能体中台来了！迈富时AI-Agentforce 2.0让Agent正式走向工作岗位

Gartner预测到2028年，15%的日常工作决策将由自主智能代理完成。迈富时最新发布的AI-Agentforce2.0作为企业级智能体中台，采用"技术赋能+场景落地"双轴驱动模式，重新定义企业智能化转型路径。该平台通过"模型-应用-开发平台"三位一体架构，提供从底层能力到上层应用的完整闭环，包含五大技术模块：模型管理、知识引擎、工具生态、流程编排和企业级基座。相比传统开发方式，该平台将Agent开发周期从3-6个月缩短至2分钟-2周，并已在金融、零售、供应链等行业实现规模化落地，典型应用包括智能导购、财务审批等场景。
ZEGO AI Agent：支持一张图生成数字人

即构科技推出AI Agent2.4，用户只需上传一张正面照即可生成1080P高清数字人，支持实时互动对话。该技术具备400ms超低延迟、2秒内完成自然交互响应，唇形同步准确，支持文本/音频/语音流驱动。适用于教育、客服等场景，提供API灵活定制，实现低成本批量生成。核心技术融合照片驱动与实时AI交互引擎，在生成效率、拟真度方面显著提升，带来低门槛、高沉浸的数字人互动体验。
荐A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布ChatGPT Agent；Suno推人声替换功能

【AI日报】汇总了近期AI领域重要进展：1)月之暗面推出Kimi Playground平台，实现从对话助手到智能助理的转变；2)OpenAI发布ChatGPT Agent，支持自主执行浏览、购物等任务；3)Suno发布v4.5+版本，新增人声替换等音乐创作功能；4)谷歌Veo3视频生成模型上线，支持文本转视频；5)全球首个直播流扩散模型MirageLSD发布，实现实时视频转换；6)VSCode编程助手Traycer提升大型代码库处理效率；7)ART框架支持Python一键训练AI Agent；8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低；9)Mistral AI推出Le Chat挑战ChatGPT；10)百度小度上线首个支持物理交互的MCP Server；11)Lightricks的LTXV模型实现60秒高质量视频生成；12)开源模型LTX-Video13B支持30倍速高清视频生成。
MasterAgent颠覆性上线：一键式生成智能体集群，分钟级构建专属AI协作网络

全球首个L4+级智能体母系统MasterAgent在深圳发布，标志着AI从"被动执行工具"升级为能主动思考、跨界解决问题的"数字伙伴"。该系统突破性实现三大功能：一键生成智能体集群、多智能体自主协作、灵活定制优化。核心技术突破包括动态Agent生成框架将开发周期压缩至分钟级，以及去中心化多智能体协同机制，支持数百个智能体像"数字团队"一样高效协作。由深圳深元人工智能科技自主研发，其团队依托中国科学技术大学专家资源，已快速成长为国家级高新技术企业。这一突破让AI真正成为能创造实际价值的"新生产力单元"。
领先OpenAI三个月，百度文库GenFlow领跑通用Agent领域，2.0版本8月上线

百度文库即将在8月发布GenFlow2.0版本，该版本具备更强大的多模态能力，支持生成多种内容形态，大幅缩短任务交付时间。相比OpenAI同日发布的ChatGPT+Agent，百度文库早在4月就已上线GenFlow1.0，实现全场景覆盖和全链路调度。GenFlow基于MoE架构，在成本、性能和效率上占优，能快速生成PPT、研报等多样化内容，且依托百度14亿专业文档资源，内容质量更可靠。此外，GenFlow还能调用用户个人数据实现个性化定制，并提供内容后期编辑功能，灵活性更高。
聚焦AI Agent营销新局，明略科技主办第六届媒介力学论坛圆满落幕

7月17日，第六届媒介力学论坛在上海举办，聚焦AI时代营销新范式。论坛由秒针系统主办，以"营销新范式·媒介新主张"为主题，探讨AI Agent对营销触达力、内容力和触动力三大核心能力的赋能。与会专家指出，AI正重塑营销全链路，品牌需构建"面向AI的营销"体系，通过数据驱动和情感互动实现深度心智认同。秒针系统发布《2025品牌增长潜力榜》等三大报告，为行

媒介力学论坛 AI Agent
最强Agent？3分钟看懂Kimi K2真的好用吗？

Moonshot AI于2025年7月11日发布开源大模型Kimi K2，主打代码编写、数学推理和Agent工具调用功能。该模型采用MoE架构（1T参数，激活32B），在SWE-Bench等测试中表现优异，数学推理得分达97.4。支持128k上下文、工具调用和API集成，定价为输入4元/百万tokens、输出16元/百万tokens。相比闭源模型，Kimi K2具有开源免费、成本低等优势，适合开发者和企业使用。同时推荐AIbase平台，可系统比较�
荐AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型上线；亚马逊推AI代码编辑器 Kiro

【AI日报】今日AI领域重要动态：1)美图推出RoboNeo，通过自然语言指令实现图片精修、品牌设计等全能影像处理；2)Unsloth AI将Kimi K2模型量化至1.8bit，体积缩减78%保持性能；3)谷歌Gemini嵌入模型登顶MTEB榜单，超越OpenAI；4)亚马逊发布免费AI代码编辑器Kiro，集成Claude模型；5)Claude新增应用工具目录功能提升工作效率；6)MiniMax完成近3亿美元融资，估值超40亿美元；7)UTCP新协议让AI代理直

今日大家都在搜的词：

热文

3 天
7天

ART框架发布！用Python一键训练AI Agent，邮件搜索到游戏操控全能搞定！

OpenAI发布ChatGPT Agent智能体：支持写代码、做PPT、分析金融

荐刚刚，OpenAI通用智能体ChatGPT Agent正式登场

专为企业打造的智能体中台来了！迈富时AI-Agentforce 2.0让Agent正式走向工作岗位

ZEGO AI Agent：支持一张图生成数字人

荐A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布ChatGPT Agent；Suno推人声替换功能

MasterAgent颠覆性上线：一键式生成智能体集群，分钟级构建专属AI协作网络

领先OpenAI三个月，百度文库GenFlow领跑通用Agent领域，2.0版本8月上线

聚焦AI Agent营销新局，明略科技主办第六届媒介力学论坛圆满落幕

最强Agent？3分钟看懂Kimi K2真的好用吗？

荐AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型上线；亚马逊推AI代码编辑器 Kiro

今日大家都在搜的词：

热文

理想小米同一个地方开发布会：理想i8发布会定于首都国际会议中

贾跃亭旗下FF获1.05亿美元融资将加速FX Super One生产交付

华为鸿蒙智行：尊界S800上市50天大定破8000台

华为MatePad Pro 12.2开启预约预计7月24日正式发布

A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布Chat

理想i8开启预定：7月29日上市预售价35-40万元

小米深圳大厦开园：卢伟冰现场喝小米粥

小米骨传导耳机2发布：699元 7月21日开售

尾号“8个7”手机号拍出320万元溢价率高达146%

AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型

A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0

淘宝闪购：日订单量再次突破8000万创新高

王化在小米履职10年雷军：谢谢这十年辛苦的工作和贡献

理想小米同一个地方开发布会：理想i8发布会定于首都国际会议中

黄仁勋与雷军合影上热搜一旁小米SU7 Ultra见证科技双雄会

黄仁勋称想买一辆小米汽车英伟达在多方面与小米开展合作

贾跃亭旗下FF获1.05亿美元融资将加速FX Super One生产交付

抖音：“抖音会议”App是诈骗软件会直接控制用户手机

站长商机