首页 > 业界 > 关键词  > AgentTuning最新资讯  > 正文

AgentTuning:通过多智能体任务调整语言模型

2023-10-26 10:44 · 稿源:站长之家

站长之家(ChinaZ.com)10月26日 消息:最近,研究人员在 GitHub 上开源了一个名为 AgentTuning 的项目。该项目提供了一种新的方法来调整语言模型,通过多个智能体任务中的交互轨迹来训练和调整语言模型,以更好地适应不同的任务和场景。

这种方法可以提高语言模型的效果和泛化能力,同时减少手动调整的工作量。AgentTuning 已经在对话生成、问答系统、摘要生成等多个自然语言处理任务中得到了验证。需要注意的是,这种方法不仅适用于语言模型,也适用于其他类型的模型。

image.png

项目地址:https://github.com/THUDM/AgentTuning

主要功能:

AgentInstruct数据集:AgentInstruct是一个经过精心筛选的数据集,包括1,866个高质量互动场景,旨在提升AI代理在6个不同的现实世界任务中的性能。这些场景覆盖了从日常家庭事务到数据库操作的6个不同领域,具有5到35个平均回合数,确保了多样性和复杂性。

AgentLM模型:AgentLM模型是通过对AgentInstruct数据集和Llama2-chat系列的ShareGPT数据集进行混合训练而创建的。这些模型遵循Llama-2-chat的对话格式,其中系统提示已固定为“您是一个有帮助、尊重和诚实的助手”。AgentLM提供了7B、13B和70B模型,可以在Huggingface模型库上获取。

快速部署:AgentTuning使用文本生成推理技术加速评估过程,用户可以轻松地启动AgentLM-70B实例,并在端口30070上访问客户端。这使得用户能够快速生成文本响应。

全面的评估:AgentTuning提供了6个“持有”任务和6个“持有外”任务的详细评估信息,以验证AgentLM的性能。这些任务来自不同的框架,包括SciWorld、MiniWoB++、HotpotQA、ReWOO、WebArena和数字卡牌游戏,涵盖了各种任务类型。

引用支持:如果用户发现AgentTuning的工作对他们有用,他们可以引用相关论文,为团队的努力提供支持。

总的来说,AgentTuning是一个具有巨大潜力的项目,为改善LLMs的通用智能能力提供了重要的工具和资源。通过AgentInstruct数据集和AgentLM模型,用户可以在各种现实世界任务中获得更强大的AI代理,同时保持良好的通用语言能力。

举报

  • 相关推荐
  • 谷歌开源发布A2A协议 Agent2Agent智能体交互协议详细介绍

    在GoogleCloudNext25大会上,谷歌宣布开源了首个标准智能体交互协议——Agent2AgentProtocol,这一举措有望彻底改变智能体之间的交互方式,打破系统孤岛,对智能体的能力、跨平台协作以及执行效率产生质的飞跃。A2A协议是一种开放标准,旨在为智能体提供一种通用的交互方式,使它们能够在不同的底层框架和供应商之间无缝协作。每个部分都有指定的内容类型,这使得客户端和远程智能体能够协商所需的正确格式,并且明确包括用户界面能力的协商,比如iframe、视频、网络表单等,从根据用户的需求和设备的能力,提供最佳的用户体验。

  • AI Agent大变天!谷歌开源A2A,一夜改变智能体交互

    谷歌在GoogleCloudNext25大会上,开源了首个标准智能体交互协议——Agent2AgentProtocol。A2A将彻底打破系统孤岛,对智能体的能力、跨平台、执行效率产生质的改变,支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企业应用平台。通过A2A协议,MongoDB可以使其数据库服务与智能Agent相结合,实现更高效的数据管理和自动化数据处理。

  • AI日报:阿里通义万相首尾帧生视频模型;豆包开源Seed智能体模型UI-TARS-1.5;OpenAI首发“智能体实践指南”

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义万相首尾帧生视频模型Wan2.1-FLF2V-14B开源阿里巴巴的通义实验室在Hugging Face和GitHub上开源了Wan2.1-FLF2V-14B模型,标志着AI视频生成技术的重大进步。该模型支持高清视频生成

  • Aloudata Agent公测开启:NoETL+大模型=好数据驱动真智能,让“万数皆可问”

    4月22日,Aloudata大应科技推出自研的Aloudata Agent,这是一款基于NoETL明细语义层的分析决策智能体,旨在通过自然语言实现数据查询、归因诊断、报告生成等功能。该产品解决了企业数据分析面临的五大挑战:语义鸿沟、口径一致性、场景覆盖度、性能优化和数据权限管控。Aloudata Agent采用NL2MQL2SQL技术路径,通过指标语义层实现业务语言与数据语言的精准对齐,显著提升查询准�

  • 九为健康联合华为云发布神农中医大模型智能体,解码如何用大模型重构“望闻问切”

    2025 年 4 月 11 日,在华为云生态大会上,浙江九为健康科技股份有限公司(以下简称"九为健康")正式发布基于华为云盘古大模型的"九为神农中医大模型智能体"。该解决方案依托AI技术,系统性攻克中医药研发周期长、作用机制解析困难、个性化方案制定复杂等产业难题,通过智能化手段推动中医药现代化进程,为医药全产业链提供覆盖研发、诊疗及健康管理的全流程智能服�

  • 数势科技SwiftAgent 3.0发布 从智能分析到智能决策

    在全球数字化转型浪潮中,企业数据价值挖掘的瓶颈日益凸显:数据口径混乱、分析门槛高、决策链路长等问题导致大量数据资产“沉睡”。数势科技于今日正式发布SwiftAgent 3.0,基于DeepSeek R1/V3 大模型与行业领先的智能引擎,重构企业数据分析与决策范式,实现从“数据可视化”到“决策自动化”的跨越式升级。企业数据分析的三大核心痛点:数据孤岛与语义鸿沟跨部门数据

  • 谷歌A2A协议是什么? MCP 和 Agent2Agent 有什么区别?

    4月10日,在GoogleCloudNext大会上,谷歌宣布开源Agent2Agent协议,这一协议被业界视为智能体交互领域的“通用语言”,旨在突破跨平台、多模态协作及安全保障等核心技术瓶颈,并联合全球50余家科技企业共同构建新一代智能生态。本文从技术实现与行业变革两个维度,深度解析A2A协议的核心价值。这一协议的推出,标志着智能体协作模式从封闭系统向开放生态的范式转变,为产业数字化转型注入新动能。

  • 1445元起!一图读懂联想moto edge 60系列:搭载天禧个人超级智能体

    值得注意的是,moto edge 60系列搭载全新的天禧个人超级智能体,它能根据输入上下文并结合用户个人特点,理解用户复杂意图,不仅能针对有多种涵义的专有名词缩写,给出最符合用户职业属性的解读,还能利用端云协同的计算与学习技术,将存在不同个人设备

  • 智邦国际一化ERP:企业一智能体成型,重塑企业未来

    近期制造业、轻工业、电子凭证、人工智能等领域密集出台政策,推动企业全方位数智化转型。智邦国际推出"企业一体化+"数智生态体系,以ERP为核心构建全维一体化管理平台,覆盖企业全生命周期各环节。其一体化ERP系统支持30多套软件灵活组合,并集成AI获客、智能客服等创新应用,帮助企业打通内外数据孤岛,实现从数字化向智能化的跃升。该方案通过一站式的数据互通和智能协同,正在成为企业降本增效的新引擎,引领万物互联时代的数智化转型浪潮。

  • 易鑫宣布年内推出汽车金融行业首个Agentic大模型

    4 月15日,易鑫(02858.HK)在香港举行的“2 025 世界互联网大会亚太峰会”上宣布,将于年内推出汽车金融行业首个Agentic大模型。该模型通过自主决策智能体深度结合汽车金融场景需求,有望从根本上解决行业中长期存在的效率瓶颈和痛点。易鑫首席AI科学家、高级副总裁张磊现场演讲易鑫首席AI科学家、高级副总裁张磊在大会“人工智能大模型论坛”做主题演讲时,发布了这�