AgentTuning：通过多智能体任务调整语言模型

2023-10-26 10:44 · 稿源：站长之家

站长之家（ChinaZ.com）10月26日消息:最近，研究人员在 GitHub 上开源了一个名为 AgentTuning 的项目。该项目提供了一种新的方法来调整语言模型，通过多个智能体任务中的交互轨迹来训练和调整语言模型，以更好地适应不同的任务和场景。

这种方法可以提高语言模型的效果和泛化能力，同时减少手动调整的工作量。AgentTuning 已经在对话生成、问答系统、摘要生成等多个自然语言处理任务中得到了验证。需要注意的是，这种方法不仅适用于语言模型，也适用于其他类型的模型。

项目地址:https://github.com/THUDM/AgentTuning

主要功能:

AgentInstruct数据集:AgentInstruct是一个经过精心筛选的数据集，包括1，866个高质量互动场景，旨在提升AI代理在6个不同的现实世界任务中的性能。这些场景覆盖了从日常家庭事务到数据库操作的6个不同领域，具有5到35个平均回合数，确保了多样性和复杂性。

AgentLM模型:AgentLM模型是通过对AgentInstruct数据集和Llama2-chat系列的ShareGPT数据集进行混合训练而创建的。这些模型遵循Llama-2-chat的对话格式，其中系统提示已固定为“您是一个有帮助、尊重和诚实的助手”。AgentLM提供了7B、13B和70B模型，可以在Huggingface模型库上获取。

快速部署:AgentTuning使用文本生成推理技术加速评估过程，用户可以轻松地启动AgentLM-70B实例，并在端口30070上访问客户端。这使得用户能够快速生成文本响应。

全面的评估:AgentTuning提供了6个“持有”任务和6个“持有外”任务的详细评估信息，以验证AgentLM的性能。这些任务来自不同的框架，包括SciWorld、MiniWoB++、HotpotQA、ReWOO、WebArena和数字卡牌游戏，涵盖了各种任务类型。

引用支持:如果用户发现AgentTuning的工作对他们有用，他们可以引用相关论文，为团队的努力提供支持。

总的来说，AgentTuning是一个具有巨大潜力的项目，为改善LLMs的通用智能能力提供了重要的工具和资源。通过AgentInstruct数据集和AgentLM模型，用户可以在各种现实世界任务中获得更强大的AI代理，同时保持良好的通用语言能力。

（举报）

相关推荐
大家在看

关键词：

AgentTuning

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
戴尔Precision工作站：助力客户更有效地使用GenAI大语言模型

如何配置个人电脑才能更有效地使用生成式AI大语言模型生成式人工智能彻底改变了计算世界，戴尔科技的用户都开始考虑借助大语言模型去开发能够提升其公司生产力、效率和创新力的新功能。戴尔科技拥有全球最丰富的AI基础设施产品组合，从云到客户端设备一应俱全[1]，因此能够为用户提供满足其一切AI需求的端到端AI解决方案和服务。[1]基于戴尔科技集团的内部分析，2023年8月。

生成式AI 大语言模型戴尔科技
Hume AI EVI对话人工智能体验入口情感大语言模型eLLM使用地址

Hume.AI专注于开发能够理解人类情感和表情的技术，提供表情测量API和自定义模型API，以预测和改善人类福祉。近日发布的EVI是一款具有情感感知能力的对话AI，采用了情感大语言模型技术。如果您是研究人员、开发者或企业，不妨尝试Hume.AI提供的技术，探索其在情感计算领域的应用和潜力。

Hume.AI
Meta 推出 LayerSkip：提升大语言模型推理速度

Meta公司最新发布了LayerSkip，这是一款端到端的解决方案，专门设计用于提升大型语言模型的推理速度。这一技术在不同规模的Llama模型上经过了广泛的训练实验，并在多个任务上展现了显著的性能提升。未来展望:随着LayerSkip技术的不断完善和应用，预计将为大语言模型的部署和使用带来更多可能性，特别是在需要快速处理大量语言数据的场合。

LayerSkip
第一届 AI Agent智能体现场开发大赛报名开启！8月上旬火热开赛

由联想拯救者、AIGC开放社区、英特尔携手主办的“AI生成未来·第二届拯救者杯OPENAIGC开发者大赛”已经正式启动，“2024AIAgent极限挑战赛”作为特设专项赛道，也将同步于8月上旬开赛，参赛者将在更加紧张刺激的现场比赛中展现其技术与创造力。本届AIAgent极限挑战赛事将采用现场公布赛题的方式进行，2人一组，参赛队伍需在规定时间内现场完成一个大模型Agent智能体应用的开发工作，赛题涉及AI大模型流程编排、结构化提示词调优、多模态能力应用等几个方向的考核。更多关于挑战赛的信息，请访问大赛官方网站。

AI生成未来拯救者杯开放社区英特尔合作
百度灵境矩阵升级文心智能体平台，人人都是智能体开发者

4月16日，Create2024百度AI开发者大会在深圳举行。百度创始人、董事长兼首席执行官李彦宏发表主题为「人人都是开发者」的演讲，现场展示了「组团出道」的文心大模型系列以及AgentBuilder、AppBuilder、ModelBuilder三大开发神器。对于AI时代和每个个体来说，百度文心智能体平台正像阿基米德的支点、纳瓦尔的杠杆，给予每个人机会，让每个人有可能成为「超级个体」。

Create2024 百度 AI开发者大会
谷歌AI研究人员提出噪声感知训练方法（NAT）用于布局感知语言模型

在文档处理中，特别是在视觉丰富的文档中，高效信息提取的需求变得越来越关键。VRDs，如发票、水电费单和保险报价，在业务工作流中随处可见，通常以不同的布局和格式呈现类似信息。他们的研究为使普通用户能够访问先进的文档处理功能铺平了道路，标志着该领域迈出了重要的一步。

AI 语言模型 AI头条
苹果开发设备内运行的大型语言模型优先考虑速度和隐私

苹果公司正在开发自己的大型语言模型。这款模型将能够在设备上本地运行，从优先考虑速度和隐私保护。苹果更广泛的人工智能战略预计将在6月份的WWDC上与主要软件更新预览一起公布。
于海：联想小天个人智能体，最懂你的个人AI伙伴

4月18日，在2024联想创新科技大会现场，一场独特的演示吸引了众多目光。联想集团高级副总裁、IDG商用产品中心及全球中小企业业务总经理于海使用最新发布的联想AIPC新品，在无网络环境下，仅数秒就将十几页的英文科研论文精准总结成中文摘要。作为推动AI普惠的第一终端，联想的AIPC在注入“联想小天”这一灵魂之后，不仅将实现从工具到个人AI伙伴的跃升，也将成为新质生产力的AI伙伴。

联想创新科技大会联想AI PC
Gnomic智能体基础模型能力全面升级，多功能焕新上线！

hi，超懂你的一站式AI智能体平台，又开始了一轮小“更新”!简单对齐一下颗粒度，不仅增加了文档解析、查看历史对话等功能可以创建Agent元宇宙，可以邀请自己的的粉丝，一起群聊了~Agent元宇宙，焕新上线那下面就来一起了解下“Agent元宇宙”。step1:点击创建Agent元宇宙，目前仅支持邀请「关注自己的粉丝」，邀请完成即可开始元宇宙聊天。添加完成后就可以回答知识库内独

Gnomic智能体 Agent元宇宙 ai头条
Mini-Gemini:简单有效的AI框架，增强多模态视觉语言模型

中国香港中文大学和SmartMore的研究人员推出了一种名为Mini-Gemini的新颖框架，通过增强多模态输入处理来推动VLMs的发展。Mini-Gemini采用了双编码器系统和一种新颖的补丁信息挖掘技术，结合一个特别策划的高质量数据集，使其能够有效处理高分辨率图像并生成内容丰富的视觉和文本内容，从使其脱颖出。正如研究人员所承认的那样，Mini-Gemini在视觉理解和推理能力方面仍有改进�

Gemini Mini-Gemini AI头条

今日大家都在搜的词：

热文

3 天
7天

AgentTuning：通过多智能体任务调整语言模型

今日大家都在搜的词：

热文

站长商机