AgentTuning：通过多智能体任务调整语言模型

2023-10-26 10:44 · 稿源：站长之家

站长之家（ChinaZ.com）10月26日消息:最近，研究人员在 GitHub 上开源了一个名为 AgentTuning 的项目。该项目提供了一种新的方法来调整语言模型，通过多个智能体任务中的交互轨迹来训练和调整语言模型，以更好地适应不同的任务和场景。

这种方法可以提高语言模型的效果和泛化能力，同时减少手动调整的工作量。AgentTuning 已经在对话生成、问答系统、摘要生成等多个自然语言处理任务中得到了验证。需要注意的是，这种方法不仅适用于语言模型，也适用于其他类型的模型。

项目地址:https://github.com/THUDM/AgentTuning

主要功能:

AgentInstruct数据集:AgentInstruct是一个经过精心筛选的数据集，包括1，866个高质量互动场景，旨在提升AI代理在6个不同的现实世界任务中的性能。这些场景覆盖了从日常家庭事务到数据库操作的6个不同领域，具有5到35个平均回合数，确保了多样性和复杂性。

AgentLM模型:AgentLM模型是通过对AgentInstruct数据集和Llama2-chat系列的ShareGPT数据集进行混合训练而创建的。这些模型遵循Llama-2-chat的对话格式，其中系统提示已固定为“您是一个有帮助、尊重和诚实的助手”。AgentLM提供了7B、13B和70B模型，可以在Huggingface模型库上获取。

快速部署:AgentTuning使用文本生成推理技术加速评估过程，用户可以轻松地启动AgentLM-70B实例，并在端口30070上访问客户端。这使得用户能够快速生成文本响应。

全面的评估:AgentTuning提供了6个“持有”任务和6个“持有外”任务的详细评估信息，以验证AgentLM的性能。这些任务来自不同的框架，包括SciWorld、MiniWoB++、HotpotQA、ReWOO、WebArena和数字卡牌游戏，涵盖了各种任务类型。

引用支持:如果用户发现AgentTuning的工作对他们有用，他们可以引用相关论文，为团队的努力提供支持。

总的来说，AgentTuning是一个具有巨大潜力的项目，为改善LLMs的通用智能能力提供了重要的工具和资源。通过AgentInstruct数据集和AgentLM模型，用户可以在各种现实世界任务中获得更强大的AI代理，同时保持良好的通用语言能力。

（举报）

相关推荐

关键词：

AgentTuning

美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

也有线上体验地址:https://longcat.ai 我自己去体验了一下，整体模型能力，中规中矩，但是快，是真的快，能把560B的模型，在推理的时候搞得这么快，是真的有点牛逼的。我直接录了个屏给大家看一下。这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度，他俩都是MoE架构，而且总参数量差不太多。为了更公平的竞争，用了同一个问题，并关闭了联网搜索来避免搜索干扰�

美团 AI模型开源
Claude 用不了？蓝耘 Coding Agent 提供原生替代方案，更轻量、高性价比的替代选择

Anthropic宣布停止向中国资本控股企业提供Claude服务，蓝耘Coding Agent凭借强代码能力、灵活适配性及高性价比成为可靠替代选择。支持多模型切换、低迁移成本，提供可视化控制台和本地化服务，助力开发者无缝衔接开发流程，确保工作连续性。

文章搜索核心标签 Claude服务
安卓最强Soc 曝高通骁龙8 Elite Gen5极限跑分接近440万：小米16首发

博主数码闲聊站爆料，高通骁龙8 Elite Gen5安兔兔V11版本的极限性能跑分在420万-440万分之间，这是安卓史上跑分最高的旗舰芯片。据悉，骁龙8 Elite Gen5采用自研的Oryon CPU，基于台积电3nm工艺制造，制程节点升级到了N3P，并集成Adreno 840 GPU，GPU独立缓存升级到16MB。

高通骁龙8 Elite Gen5
高通骁龙峰会定档9月24日：将发布骁龙8 Elite Gen5

今日，高通正式官宣，2025骁龙峰会中国专场定于9月24日 -25日举行，时间与海外同步（夏威夷时间为9月23日，比北京时间慢18小时），此次专门为国内开设专场，引发行业高度关注。此次发布会，新一代旗舰手机 SoC 骁龙8Elite Gen5无疑是最受普通用户瞩目的焦点。此前，外界普遍猜测新产品会命名为骁龙8Elite2，然而随着越来越多爆料出现，指向骁龙8Elite Gen5这一名称，高通此番�

高通骁龙8Elite Gen5
瓴羊发布企业级分析Agent，让人人都可拥有超级数据分析师

阿里巴巴旗下瓴羊发布首个数据分析Agent“智能小Q”，升级为“超级数据分析师”，由问数、解读和报告三大核心Agent组成。该工具能快速获取数据、解读数据并输出洞察报告，将原本需数小时的数据处理时间缩短至最快10秒，专业报告生成仅需20分钟。通过三重技术体系提升企业级数据分析可靠性，覆盖近20个细分行业，支持用户自定义需求。目前已有瑞幸咖啡、牧原食品等百余家企业客户使用，9月9日起全面开放给所有企业用户。

数据分析Agent 瓴羊 Quick
不叫骁龙8 Elite 2！曝高通新一代Soc命名为骁龙8 Elite Gen5

高通下一代旗舰Soc不叫骁龙8 Elite 2，暂定命名为骁龙8 Elite Gen5，型号为SM8850。如果命名属实的话，这颗Soc的中文名字可能会叫第五代骁龙8至尊版”，高通这次从第一代直接跳到了第五代。

高通骁龙8 Elite
全球首款骁龙8 Elite Gen5旗舰！卢伟冰喜提小米16

今天下午，小米集团总裁卢伟冰使用小米新机发了一条微博，引发关注。不出意外，这款新机就是即将登场的小米16，新品已经获得入网许可，就等官宣了。据悉，小米16系列共有3款，型号分别是25098PN5AC、2509FPN0BC、25113PN0EC，预计分别命名为小米16、小米16 Pro和小米16 Pro Max。该机全球首发骁龙8 Elite Gen5平台，这颗芯片由2*4.61GHz超大核 6*3.63GHz大核组成，并集成Adreno 840 GPU，GPU�

小米16 骁龙8 Elite
曝高通新旗舰Soc命名为骁龙8 Elite Gen5 网友称名字太长了

有网友问，高通新旗舰Soc命名很长，还能改名吗？博主数码闲聊站表示，高通骁龙8 Elite Gen5命名应该已经定下了，名字确实很长。他还爆料，骁龙8 Elite Gen5目前最新样机实测下来游戏帧率表现更好，功耗均低于骁龙8 Elite，某些超高负载手游能再低1W，目标是所有超高负载手游压进5W。据悉，骁龙8 Elite Gen5采用自研的Oryon CPU，基于台积电3nm工艺制造，制程节点升级到了N3P，并�

高通骁龙8 Elite Gen5
首批骁龙8 Elite Gen5/天玑9500旗舰已备案：10月机圈大战

首批骁龙8 Elite Gen5、天玑9500旗舰已经备案，包括小米16系列、荣耀Magic8系列、vivo X300系列和OPPO Find X9系列。据悉，前两款旗舰搭载高通骁龙8 Elite Gen5平台，后两款旗舰搭载联发科天玑9500平台，除了小米16系列会在9月亮相之外，其它迭代旗舰都会集中到10月发布，10月份将迎来机圈大混战。

骁龙8 Elite Gen5
荐AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯开源智能体框架Youtu-agent

本期AI日报聚焦多项技术突破：字节跳动发布OmniHuman-1.5实现图像音频秒变超真视频；爱诗科技PixVerse V5全球上线支持多场景创作；腾讯开源Youtu-agent框架提升AI开发效率；百度智能云发布百舸AI计算平台5.0；OpenAI将推出家长监控功能应对安全风险。同时涵盖硬件创新、市场预测及中国团队在全球AI应用领域的突出表现，展现人工智能领域快速发展的技术迭代与生态建设。

AI视频生成 OmniHuman-1.5 字节跳动

今日大家都在搜的词：

热文

3 天
7天

AgentTuning：通过多智能体任务调整语言模型

美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

Claude 用不了？蓝耘 Coding Agent 提供原生替代方案，更轻量、高性价比的替代选择

安卓最强Soc 曝高通骁龙8 Elite Gen5极限跑分接近440万：小米16首发

高通骁龙峰会定档9月24日：将发布骁龙8 Elite Gen5

瓴羊发布企业级分析Agent，让人人都可拥有超级数据分析师

不叫骁龙8 Elite 2！曝高通新一代Soc命名为骁龙8 Elite Gen5

全球首款骁龙8 Elite Gen5旗舰！卢伟冰喜提小米16

曝高通新旗舰Soc命名为骁龙8 Elite Gen5 网友称名字太长了

首批骁龙8 Elite Gen5/天玑9500旗舰已备案：10月机圈大战

荐AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯开源智能体框架Youtu-agent

今日大家都在搜的词：

热文

苹果发布会前瞻：最大看点iPhone Air iPhone17或成国内首款无卡

为什么微信上那么多人住在安道尔上热搜：这些因素导致

iPhone 17系列今晚发布：苹果发布会新品揭晓

小米智能音箱多彩版发布：售价199元

库克称最爱橙色新iPhone：17 Pro是迄今最先进iPhone

苹果推出手机斜挎挂绳售价479元：10种配色可选

小米王腾因泄密被辞退曾单独签署保密协议

王腾否认被将入职魅族担任副总：系谣言

iPhone首现2TB内存！iPhone17系列价格公布

AI日报：生数科技上线Vidu Q1参考生图；字节跳动发布Seedream4

苹果发布会前瞻：最大看点iPhone Air iPhone17或成国内首款无卡

为什么微信上那么多人住在安道尔上热搜：这些因素导致

iPhone 17系列今晚发布：苹果发布会新品揭晓

小米智能音箱多彩版发布：售价199元

库克称最爱橙色新iPhone：17 Pro是迄今最先进iPhone

苹果推出手机斜挎挂绳售价479元：10种配色可选

AI日报：国产版Nano Banana？即梦图片4.0发布；阿里巴巴发布 Q

魅族22官宣9月15日发布：外观、配置公布

雷军第90次健身房打卡距离健身目标仅剩10次

小米王腾因泄密被辞退曾单独签署保密协议

站长商机