首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

华盛顿大学推高效大模型调优方法“代理调优”

2024-01-24 09:11 · 稿源:站长之家

要点:

1、代理调优方法无需接触模型的内部权重。

2、通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测。

3、代理调优方法能够在解码时更好地保留训练知识。

站长之家(ChinaZ.com)1月24日 消息:华盛顿大学推出更高效的大模型调优方法“代理调优”,该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测,实现对模型的调优而无需接触模型的内部权重。

随着ChatGPT等生成式AI产品的发展,基础模型的参数不断增加,因此进行权重调优需要耗费大量时间和算力。为提升调优效率,该方法可以在解码时更好地保留训练知识,同时保留更大规模预训练的优势。研究人员对LlAMA-2的13B、70B原始模型进行了微调,结果显示代理调优的性能比直接调优的模型更高。

image.png

论文地址:https://arxiv.org/pdf/2401.08565.pdf

该方法需要准备一个小型的预训练语言模型M-,与基础模型M共享相同的词汇表,然后使用训练数据对M-进行调优得到调优模型M+。

在解码时,通过对比基础模型M的输出预测分布和调优模型M+的输出预测分布之间的差异,来引导基础模型的预测,最后将预测差异应用于基础模型的预测结果,以引导基础模型的预测朝向调优模型的预测方向移动。这一方法与大模型中的“蒸馏”技术恰恰相反,是一种创新性的调优方法。

代理调优方法的推出,为大模型的调优提供了更高效的解决方案,同时也可以在解码时更好地保留训练知识,使得模型的性能更高。这一方法的推出将为AI领域的发展带来新的启示,值得进一步深入研究和应用。

举报

  • 相关推荐
  • 调优货盘实现直播间爆量,快手新秀达人佳佳单场GMV破百万

    快手达人佳佳护肤导师在618购物节期间,通过长达3个月的筹备期,成功打造单场GMV近137万的护肤专场直播。其核心策略包括:1)深度预热种草,通过专业护肤短视频提前锁定精准人群;2)大胆调整货盘,引入高客单价新品刺激消费;3)主推爆款产品配合平台流量扶持,实现公私域流量联动。直播中重点突出产品功效与福利机制,5月17日专场最终带动慕特博士(90万GMV)、野兽代码(20万GMV)等新锐品牌实现销售突破。佳佳特别强调"重效不重利"的选品理念,专注抗衰需求旺盛的中年群体,通过私域运营建立强信任关系。未来计划6月推出混合护肤专场,持续以用户需求为导向完善货盘。

  • 如何高效孵化新人主播?YY给行业带来新解法

    娱乐直播行业也有了自己的“创造营101”。 今年4月,YY重磅推出新主播赛事IP——《星耀直播营》。这是YY首次以“老带新”的模式为核心,集结顶级资源、线上线下联动赋能,从而助力潜力新人快速成长的全新赛事活动。 100位新人主播,五个赛段“阶梯式”成长体系,“YY十大新人主播”......历经30天的激烈角逐,5名新主播升级成为平台头部主播,近80名主播升级成为平台�

  • 听脑AI:智能工具助力高效沟通,赋能职场与生活

    听脑AI是一款专注于语音/视频转文本的智能工具,通过技术创新解决现代职场与生活中的信息记录痛点。核心功能包括:1)多场景语音转写,支持中英日韩等多语言识别;2)AI智能总结,自动提炼会议纪要、待办事项;3)行业模板库,适配政务、医疗、教育等专业场景;4)在线视频解析,快速提取课程/行业知识要点。产品优势在于实现从记录到管理的全流程解决方案,可提�

  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • 数字金融时代,还呗怎么让投诉更高效?智能矩阵守护用户体验

    文章介绍了创业者在办理还呗贷款业务遇到问题时,可通过三种可靠途径寻求帮助:1)拨打官方客服热线4006816666;2)通过官网在线客服或微信公众号咨询;3)使用官方App在线客服功能。同时强调投诉时需提供准确信息以便快速解决问题。还呗平台通过构建智能客服矩阵,运用AI客服机器人、RPA自动化流程等技术提升服务效率,确保用户随时获得专业帮助。未来将持续优化用户体验,为创业梦想和日常金融需求提供更有温度的支持。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 六大国产大模型高考作文实测:讯飞星火夺冠

    2025年高考全国一卷作文题引发热议,题目以老舍、艾青、穆旦三位作家的作品为素材,要求考生探讨个体在困境中的表达方式。

  • 智能体时代,还得看豆包大模型

    火山引擎,又有大动作了。 2025年6月11日,火山引擎Force原动力大会发布豆包大模型1.6、视频生成模型Seedance1.0pro等重磅新模型,以及迭代了一站式AI云原生全栈服务。 对此,字节跳动CEO梁汝波表示:“做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新�

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 贝锐蒲公英组网方案:低投入高回报,助力包装设备企业高效远程运维

    本文探讨了智能包装设备在食品饮料行业中的核心作用及远程运维解决方案。国内企业通过多年技术积累,已掌握从灌装到贴标的完整自动化包装技术,产品远销全球。然而设备调试阶段常面临计量不准、定位偏差等问题,传统现场维护模式响应慢、成本高。贝锐蒲公英基于SD-WAN技术推出远程运维方案,通过工业级路由器R300+快速组网,实现设备远程访问与调试,解决工厂网络隔离、跨国连接等难题。方案具备四大优势:1)突破工厂网络隔离限制;2)全球智能链路保障跨国稳定连接;3)全面支持工业协议;4)多层次数据安全防护。该方案显著提升设备交付效率,降低运维成本,助力企业数字化转型,2024年市场份额居全国首位。