华盛顿大学推高效大模型调优方法“代理调优”

2024-01-24 09:11 · 稿源：站长之家

要点:
1、代理调优方法无需接触模型的内部权重。
2、通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测。
3、代理调优方法能够在解码时更好地保留训练知识。

站长之家（ChinaZ.com）1月24日消息:华盛顿大学推出更高效的大模型调优方法“代理调优”，该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测，实现对模型的调优而无需接触模型的内部权重。

随着ChatGPT等生成式AI产品的发展，基础模型的参数不断增加，因此进行权重调优需要耗费大量时间和算力。为提升调优效率，该方法可以在解码时更好地保留训练知识，同时保留更大规模预训练的优势。研究人员对LlAMA-2的13B、70B原始模型进行了微调，结果显示代理调优的性能比直接调优的模型更高。

论文地址:https://arxiv.org/pdf/2401.08565.pdf

该方法需要准备一个小型的预训练语言模型M-，与基础模型M共享相同的词汇表，然后使用训练数据对M-进行调优得到调优模型M+。

在解码时，通过对比基础模型M的输出预测分布和调优模型M+的输出预测分布之间的差异，来引导基础模型的预测，最后将预测差异应用于基础模型的预测结果，以引导基础模型的预测朝向调优模型的预测方向移动。这一方法与大模型中的“蒸馏”技术恰恰相反，是一种创新性的调优方法。

代理调优方法的推出，为大模型的调优提供了更高效的解决方案，同时也可以在解码时更好地保留训练知识，使得模型的性能更高。这一方法的推出将为AI领域的发展带来新的启示，值得进一步深入研究和应用。

（举报）

相关推荐
大家在看

关键词：

大模型

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
开源大模型食用指南官网地址入口详细环境配置、模型部署、高效微调方法教程

开源大模型食用指南是一个旨在帮助用户学习和应用开源大模型的全流程指导教程。它提供了详细的环境配置、模型部署、高效微调等方法，以简化开源大模型的使用和应用，让更多普通学习者能够轻松上手。要获取更多详细信息并开始您的开源大模型之旅，请访问开源大模型食用指南官网。

开源大模型食用指南
荐开源大模型AI代理操作系统：像Windos一样，操控AI代理

AutoGPT的出现让我们见识到了AI代理强大的自动化能力，并开创了一个全新的AI代理赛道。但在子任务调度、资源分配以及AI之间协作还有不少的难题。AIOS会引入更复杂的内存共享机制和层级缓存策略，以进一步优化AI代理的整体性能。

AI代理 AI代理大模型
抗衰界的“新宠”NAD+是什么？如何补充更高效？

随着科学家发现NAD与抗衰老的关系，NAD的补充剂逐渐成为广受科研界、富豪圈、投资界追捧的最新一代抗衰品，被《nature》、《cell》等世界级科研期刊追踪报道，NASA用NAD的补充剂来保护宇航员免受太空辐射、修复DNA，哈佛大学医学院教授大卫·辛克莱、李嘉诚、潘石屹等精英富豪则长期服用NAD的补充剂用于抗衰延寿。尽管NAD成为上层人士抗衰老的新宠，但仍有不少人对NAD是什么表示疑惑。除了可以服用专门的NAD补充剂之外可通过健康饮食、定期锻炼和保持良好睡眠的方式，来保持体内一定的NAD水平，达到保持身体健康年轻的目的。

NAD+ 抗衰老补充剂
从科易星®应用案例看智能拍摄：高效、精准、创新

随着科技的不断进步，智能拍摄已经成为推动会议行业创新的重要力量。从传统的手动拍摄到现代的无人化、自动化、智能化拍摄，智能拍摄的发展不仅改变了我们记录和分享会议内容的方式，更为会议的组织者、参与者和观众带来了全新的体验。2024中关村论坛年会创新地应用了智能拍摄，再次以科技力量加码论坛“创新:建设更加美好的世界”的主题。智能拍摄不仅通过无人

智能拍摄会议行业创新无人化技术
新视频分割技术SAM 可高效识别移动物体

在视频分割领域，SegmentAnything模型被用于探索新的视频对象分割技术。研究团队测试了两种不同的模型，旨在结合SAM的分割能力和光流技术的优势，以提高视频分割的性能。具体的技术细节、模型性能指标以及未来的研究方向尚未详细公布，但这些初步的研究成果已经为视频分割技术的发展提供了新的方向和可能性。

SAM
中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR

中山大学HCP实验室联合SeaAILab和哈佛大学等单位开展的一项研究，成功地让大型人工智能模型通过讲笑话的方式，探索多模态大模型的创造力，并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。这项研究的关键在于使用来自日本的“大喜利”创新响应游戏作为数据源。此次研究的成功，不仅展示了该实验室在AI领域的创新能力，也为未来的人工智能研究提供了新的

大模型梗王 AI头条
绘威集团耗材科普：如何选择适合的硒鼓与墨盒才能实现更高效打印

打印机已成为我们日常工作不可或缺的重要工具硒鼓和墨盒作为打印机的核心耗材，其选择和使用直接关系到打印效果和成本。如何选择适合的硒鼓和墨盒呢?本文将为您科普。选择适合的硒鼓和墨盒是确保打印机高效稳定运行的关键，绘威集团作为国内知名的耗材品牌，凭借其优质的产品和服务赢得了广大用户的认可。

打印机硒鼓墨盒
荐挑战拯救痴心“舔狗”，我和大模型都尽力了

大模型化身为“痴情男大”，等待人类玩家的拯救。一款名为“拯救舔狗”的大模型原生小游戏出现了。大模型在学习这个世界，也在创造一个AINative的世界，无论是大模型原生小游戏是功能越来越全的大模型对话，都在展现世界内容的互动变革，随着尺度规律的不断发展，下一步会怎样?在这次技术交流日上，商汤最后放出了一段文生视频，一起来看看。

大模型
荐巨头狂卷代码大模型

让AI写代码正在越来越流行。今天蚂蚁集团智能研发平台CodeFuse推出了“图生代码”技术，这一技术集成在CodeFuse上，可将网页、App等设计图一键转化成前端代码。

大模型
智能、便捷 | SW-RDMS 助力企业实现更高效、优质的成果产出

医药行业是一个高度专业化、技术密集型的行业，其研发活动的质量和效率直接影响到企业的生存和发展。然而，随着新药审评审批难度的增大以及新技术在医药行业的应用，医药企业的研发管理面临着许多挑战，传统的新药研发管理模式已经无法满足现代医药企业的需求，医药研发信息化建设迫在眉睫。一、医药企业研发管理的现状与问题目前，医药企业的研发管理主要存�

今日大家都在搜的词：

热文

3 天
7天

华盛顿大学推高效大模型调优方法“代理调优”

今日大家都在搜的词：

热文

站长商机