京东重磅开源JoyAgent-JDGenie！GAIA准确率75.15%领跑多智能体系统

2025-07-21 15:55 · 来源： AIbase基地

近日，AIbase从网络信息获悉，京东正式开源了一款产品级端到端通用多智能体系统JoyAgent-JDGenie，在GAIA基准测试中以75.15%的准确率超越OWL、OpenManus等竞品，位居行业前列。这款开源框架以其强大的多智能体协作能力和开箱即用的特性，为开发者提供了快速构建AI应用的利器。

GAIA基准领跑，性能卓越

JoyAgent-JDGenie在GAIA基准测试中表现亮眼，以75.15%的总体准确率刷新了多智能体系统的性能纪录。根据GAIA基准的评估标准，该系统在难度分级的任务中展现了优异的能力:Level1任务准确率达85%以上，Level2任务接近78%，而在最复杂的Level3任务中也取得了55%的出色成绩，显著超越其他开源框架如OWL（约65%）和OpenManus(约65%)。AIbase注意到，GAIA基准以其强调真实世界任务(如多模态处理、工具使用和复杂推理)的设计，成为评估AI智能体能力的“金标准”，而JoyAgent-JDGenie的高分表现彰显了其在通用场景下的强大潜力。

端到端多智能体框架，开箱即用

JoyAgent-JDGenie是一款完整的端到端多智能体系统，支持用户通过简单查询或任务输入直接获得答案或解决方案。该框架集成了前端、后端、核心引擎以及多个子智能体模块，包括报告生成智能体、代码智能体、PPT智能体和文件智能体，覆盖了从文档处理到代码生成、演示文稿制作等多样化场景。AIbase了解到，开发者可通过挂载自定义子智能体或外部工具（如Web搜索API或Python解释器）进一步扩展功能，满足特定业务需求。

与传统单一智能体系统不同，JoyAgent-JDGenie采用多层级协作设计，通过任务分解和智能体协同，高效处理复杂任务。例如，用户输入“生成一份关于2025年AI趋势的PPT”，系统会自动分配任务给PPT智能体和数据分析智能体，生成包含图表和内容的演示文稿。这种开箱即用的特性极大降低了开发门槛，适合企业快速部署AI应用。

多模态与记忆优化，智能更进一步

JoyAgent-JDGenie的多模态与记忆设计是其核心亮点。系统支持文本、图像、代码等多种输入和输出形式，能够处理GAIA基准中的多模态任务，如解析PDF文件、分析图像内容或处理音频数据。此外，框架引入了跨任务级别的相似任务记忆机制，允许系统根据历史任务记录优化当前任务的处理效率。例如，在重复生成类似报告时，系统可调用历史数据，减少重复计算，提升响应速度。

AIbase从社区反馈中获悉，JoyAgent-JDGenie的多模态能力在处理复杂任务时表现出色。例如，在GAIA Level3任务中，系统能够通过链式推理（Chain-of-Thought）结合外部工具，准确回答涉及多源数据整合的问题，如“根据某幅画作和历史记录提取特定信息”。这种能力使其在数据分析、内容创作和自动化工作流中具有广泛应用前景。

开源生态，助力开发者创新

JoyAgent-JDGenie的完全开源（Apache2.0许可证）为开发者提供了极大的灵活性。AIbase了解到，该项目公开了前端、后端、框架、引擎以及核心子智能体的完整代码，开发者可基于此进行二次开发或直接部署。项目还提供了详细的文档和快速入门指南，支持在Windows、Linux等多个平台上运行，兼容主流硬件环境。

社区反馈显示，JoyAgent-JDGenie的模块化设计便于扩展。例如，开发者可通过添加新的子智能体（如专用于金融分析或医疗数据处理的智能体）快速定制系统。此外，京东团队表示将持续优化框架，计划引入本地化LLM支持和更高效的推理加速技术，以降低对云端API的依赖，进一步提升性能和成本效益。

多智能体系统的未来风向

JoyAgent-JDGenie的发布标志着多智能体系统在开源领域的重大突破。其在GAIA基准中的领先表现，不仅体现了京东在AI技术领域的深厚积累，也为企业级AI应用的快速落地提供了范例。AIbase认为，随着多智能体系统在任务协作、工具整合和多模态处理能力的持续提升，类似JoyAgent-JDGenie的框架将成为推动AI普及化的重要力量。

对于希望尝试JoyAgent-JDGenie的开发者，只需访问其GitHub仓库获取源码，按照指引配置环境即可快速部署。无论是构建智能客服、自动化报告生成还是复杂数据分析工具，这款框架都值得一试。

项目地址：https://github.com/jd-opensource/joyagent-jdgenie

相关推荐

荐A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉”数字人平台启动封测；京东重磅开源JoyAgent-JDGenie

AI日报栏目精选了人工智能领域最新动态：1)Stability AI推出0.7秒单图3D重建模型SPAR3D；2)GitHub热门开源AI协作框架CrewAI获3.4万星；3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议；4)ComfyUI-C opilot工具简化AI工作流创建；5)CNNIC报告显示我国346款生成式AI完成备案；6)提示词管理工具AI Gist上线；7)开源语言学习工具WordPecker支持多语言学习；8)斯坦福推出多工具协作AI Agent OctoTools；9)Ope
专为企业打造的智能体中台来了！迈富时AI-Agentforce 2.0让Agent正式走向工作岗位

Gartner预测到2028年，15%的日常工作决策将由自主智能代理完成。迈富时最新发布的AI-Agentforce2.0作为企业级智能体中台，采用"技术赋能+场景落地"双轴驱动模式，重新定义企业智能化转型路径。该平台通过"模型-应用-开发平台"三位一体架构，提供从底层能力到上层应用的完整闭环，包含五大技术模块：模型管理、知识引擎、工具生态、流程编排和企业级基座。相比传统开发方式，该平台将Agent开发周期从3-6个月缩短至2分钟-2周，并已在金融、零售、供应链等行业实现规模化落地，典型应用包括智能导购、财务审批等场景。
荐刚刚，OpenAI通用智能体ChatGPT Agent正式登场

Agent AI 时代，比我们想象中来得要早一些。北京时间周五凌晨，OpenAI 突然开启了新产品直播。本次发布的是全新的 ChatGPT Agent，它实现了通用智能体（Agent）能力的关键升级。
领先OpenAI三个月，百度文库GenFlow领跑通用Agent领域，2.0版本8月上线

百度文库即将在8月发布GenFlow2.0版本，该版本具备更强大的多模态能力，支持生成多种内容形态，大幅缩短任务交付时间。相比OpenAI同日发布的ChatGPT+Agent，百度文库早在4月就已上线GenFlow1.0，实现全场景覆盖和全链路调度。GenFlow基于MoE架构，在成本、性能和效率上占优，能快速生成PPT、研报等多样化内容，且依托百度14亿专业文档资源，内容质量更可靠。此外，GenFlow还能调用用户个人数据实现个性化定制，并提供内容后期编辑功能，灵活性更高。
OpenAI发布ChatGPT Agent智能体：支持写代码、做PPT、分析金融

OpenAI推出ChatGPT智能体，整合网页交互、数据搜索与多模态协作功能，可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放，Pro版近乎无限使用，其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限，并

OpenAI ChatGPT智能体人工智能
MasterAgent颠覆性上线：一键式生成智能体集群，分钟级构建专属AI协作网络

全球首个L4+级智能体母系统MasterAgent在深圳发布，标志着AI从"被动执行工具"升级为能主动思考、跨界解决问题的"数字伙伴"。该系统突破性实现三大功能：一键生成智能体集群、多智能体自主协作、灵活定制优化。核心技术突破包括动态Agent生成框架将开发周期压缩至分钟级，以及去中心化多智能体协同机制，支持数百个智能体像"数字团队"一样高效协作。由深圳深元人工智能科技自主研发，其团队依托中国科学技术大学专家资源，已快速成长为国家级高新技术企业。这一突破让AI真正成为能创造实际价值的"新生产力单元"。
ZEGO AI Agent：支持一张图生成数字人

即构科技推出AI Agent2.4，用户只需上传一张正面照即可生成1080P高清数字人，支持实时互动对话。该技术具备400ms超低延迟、2秒内完成自然交互响应，唇形同步准确，支持文本/音频/语音流驱动。适用于教育、客服等场景，提供API灵活定制，实现低成本批量生成。核心技术融合照片驱动与实时AI交互引擎，在生成效率、拟真度方面显著提升，带来低门槛、高沉浸的数字人互动体验。
准确率92%！苹果新模型可通过行为模式预测怀孕

据媒体报道，苹果公司联合美国心脏协会和哈佛医学院布莱根妇女医院，在健康预测领域取得重大突破，推出基于行为数据的可穿戴模型WBM（Wearable Behavior Model）。这项研究标志着健康监测从传统生物指标（如心率、血氧）向行为数据分析的拓展，为疾病预测提供了全新视角。研究团队利用超过25亿小时的可穿戴设备数据训练WBM模型，使其能够从步数、活动能力等高层次行为
荐A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布ChatGPT Agent；Suno推人声替换功能

【AI日报】汇总了近期AI领域重要进展：1)月之暗面推出Kimi Playground平台，实现从对话助手到智能助理的转变；2)OpenAI发布ChatGPT Agent，支持自主执行浏览、购物等任务；3)Suno发布v4.5+版本，新增人声替换等音乐创作功能；4)谷歌Veo3视频生成模型上线，支持文本转视频；5)全球首个直播流扩散模型MirageLSD发布，实现实时视频转换；6)VSCode编程助手Traycer提升大型代码库处理效率；7)ART框架支持Python一键训练AI Agent；8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低；9)Mistral AI推出Le Chat挑战ChatGPT；10)百度小度上线首个支持物理交互的MCP Server；11)Lightricks的LTXV模型实现60秒高质量视频生成；12)开源模型LTX-Video13B支持30倍速高清视频生成。
最强Agent？3分钟看懂Kimi K2真的好用吗？

Moonshot AI于2025年7月11日发布开源大模型Kimi K2，主打代码编写、数学推理和Agent工具调用功能。该模型采用MoE架构（1T参数，激活32B），在SWE-Bench等测试中表现优异，数学推理得分达97.4。支持128k上下文、工具调用和API集成，定价为输入4元/百万tokens、输出16元/百万tokens。相比闭源模型，Kimi K2具有开源免费、成本低等优势，适合开发者和企业使用。同时推荐AIbase平台，可系统比较�

今日大家都在搜的词：

热文

3 天
7天

京东重磅开源JoyAgent-JDGenie！GAIA准确率75.15%领跑多智能体系统

荐A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉”数字人平台启动封测；京东重磅开源JoyAgent-JDGenie

专为企业打造的智能体中台来了！迈富时AI-Agentforce 2.0让Agent正式走向工作岗位

荐刚刚，OpenAI通用智能体ChatGPT Agent正式登场

领先OpenAI三个月，百度文库GenFlow领跑通用Agent领域，2.0版本8月上线

OpenAI发布ChatGPT Agent智能体：支持写代码、做PPT、分析金融

MasterAgent颠覆性上线：一键式生成智能体集群，分钟级构建专属AI协作网络

ZEGO AI Agent：支持一张图生成数字人

准确率92%！苹果新模型可通过行为模式预测怀孕

荐A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布ChatGPT Agent；Suno推人声替换功能

最强Agent？3分钟看懂Kimi K2真的好用吗？

今日大家都在搜的词：

热文

华为 MatePad Pro 12.2 英寸 2025 官宣 7 月 24 日发布

黄仁勋：总感觉公司快倒闭了任CEO没有趣味每一秒都有压力

A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉

苹果iOS 26公测版本周发布：预计7月23日亮相

华为Pura 80标准版7月23日开启预售

特斯拉Model3全球销量达300万辆夏日福利大放送

A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布Chat

理想小米同一个地方开发布会：理想i8发布会定于首都国际会议中

华为鸿蒙智行：尊界S800上市50天大定破8000台

贾跃亭旗下FF获1.05亿美元融资将加速FX Super One生产交付

华为MatePad Pro 12.2开启预约预计7月24日正式发布

小米深圳大厦开园：卢伟冰现场喝小米粥

理想i8开启预定：7月29日上市预售价35-40万元

小米骨传导耳机2发布：699元 7月21日开售

华为 MatePad Pro 12.2 英寸 2025 官宣 7 月 24 日发布

黄仁勋：总感觉公司快倒闭了任CEO没有趣味每一秒都有压力

站长商机