首页 > AI头条  > 正文

新型AI模型Transformer²:像章鱼一样灵活,动态调整权重,自我适应环境

2025-01-15 15:40 · 来源: AIbase基地

传统的大型语言模型(LLM)微调方法通常计算密集,且在处理多样化任务时显得静态。为了解决这些挑战,Sakana AI 推出了一种名为 Transformer² 的新型自适应框架。Transformer² 能够在推理过程中实时调整LLM的权重,使其能够适应各种未知的任务,就像章鱼一样灵活。

Transformer² 的核心在于一个两阶段机制:

第一阶段,一个调度系统会分析用户的查询,识别任务的属性。

第二阶段,系统会动态混合多个“专家”向量。这些向量是使用强化学习训练出来的,每个向量都专注于特定类型的任务,从而针对当前任务生成定制化的模型行为。

image.png

这种方法与传统的微调方法(如LoRA)相比,使用更少的参数,效率更高。Transformer² 在不同的LLM架构和模态(包括视觉语言任务)中都展现出了强大的适应性。

Transformer² 的关键技术

奇异值微调(SVF):这是一种新颖的参数高效微调方法,它通过提取和调整模型权重矩阵中的奇异值来实现。这种方法降低了过拟合的风险,减少了计算需求,并允许固有的组合性。通过在狭窄的数据集上使用强化学习训练,可以获得一组有效的特定领域“专家”向量,从而直接优化各个主题的任务表现。

image.png

自适应策略:在推理阶段,Transformer² 采用三种不同的自适应策略来组合SVF训练的专家向量。这些策略可以根据测试时的条件,动态调整LLM的权重,从而实现自我适应。

Transformer² 的优势

动态适应性:Transformer² 能够根据操作环境或内部状态的变化来评估和修改自身的行为,无需外部干预。

参数高效:与LoRA等方法相比,SVF 使用的参数更少,但性能更高。

模块化能力:专家向量提供了模块化的能力,而自适应策略则可以动态确定并组合最合适的向量来处理输入任务。

强化学习优化:通过强化学习,可以直接优化任务表现,而无需依赖昂贵的微调程序和大型数据集。

跨模型兼容性:SVF 专家向量可以在不同的LLM模型之间进行迁移,这得益于其固有的排序结构。

实验结果

在多个LLM和任务上进行的实验表明,SVF 的性能始终优于传统的微调策略(如LoRA)。

Transformer² 的自适应策略在各种未知的任务中都表现出了显著的改进。

使用分类专家进行任务分类比直接使用提示工程的分类精度更高。

在不同的模型和任务组合中,自适应系数(αk)的贡献是不均匀的。

未来展望

Transformer² 虽然取得了显著的进展,但仍有进一步改进的空间。未来的研究可以探索模型合并技术,将不同的专业模型合并为一个更强大的模型。此外,还可以研究如何扩展CEM方法,以应对更多的专业领域。

总而言之,Transformer² 代表了自适应LLM领域的一大飞跃,为构建真正动态、自我组织的AI系统铺平了道路。

论文地址:https://arxiv.org/pdf/2501.06252

  • 相关推荐
  • ​Soul 兴趣主理人:在世界的褶皱中寻找自我

    文章通过李升和Ada两位旅行者的故事,探讨旅行如何从消遣转变为生活方式。李升从18岁开始冒险穷游,深入中东等地,通过镜头记录真实世界,获得自我认同;Ada则以理性规划旅行,制作详尽路书,享受掌控与意外插曲的温暖。他们在Soul App记录旅途,展现不同风格:李升追求野性冒险,Ada注重精致体验。文章强调,真正的兴趣能打开更多可能性,重塑人与自我、世界的关系,实现更真实的自我。

  • 什么样的内容最容易被AI引用?GEO(生成引擎优化)时代的核心命题

    随着AI问答时代到来,用户从“搜索”转向直接向AI“提问”,生成引擎优化(GEO)应运而生。文章指出,易被AI引用的内容需具备权威性、准确性、结构清晰且被广泛认可,并介绍了AIBase的GEO排名查询工具。该工具支持多平台检测,通过模拟真实用户提问,提供品牌在AI回答中的曝光度、排名等数据分析及优化建议,帮助品牌提升AI可见度,抢占智能问答时代先机。

  • 从纠结到笃定,问界新M5 Ultra更适合年轻用户

    本文对比特斯拉Model Y与问界新M5 Ultra在辅助驾驶、安全配置及购车权益方面的差异。Model Y在高速路段表现稳定,但高阶功能需额外付费;问界新M5 Ultra搭载华为ADS系统,通过多传感器融合实现精准预判和柔顺控制,有效应对复杂路况。安全方面,问界采用高强度车身结构和全向防碰撞系统,获权威安全认证。购车权益上,问界提供包含高阶智驾的综合礼遇,性价比更优。两款�

  • 李杰公布一加15全方位配置:行业第一部性能Ultra产品

    一加15将于10月27日发布,被官方称为行业首款性能Ultra产品。搭载最新第五代骁龙8至尊版处理器、LPDDR5X内存和全新游戏内核,支持165Hz超高帧游戏体验。配备7300mAh电池与120W快充+50W无线充电,采用第三代东方屏和OPPO自研LUMO影像系统。散热方面首发超薄手撕钢VC技术,并具备IP69K防水等级。触控、陀螺仪等核心配置全面升级,带来旗舰级综合体验。

  • GEO 长尾关键词实战策略:在生成式 AI 环境下抢占用户提问入口

    在生成式AI搜索环境下,长尾关键词策略比传统SEO更为重要。用户倾向于使用自然完整的提问句式,因此长尾关键词/提问式短语的覆盖率成为关键。文章指出,GEO优化需构建“提问式+语义覆盖+实体关联+结构化摘要”的方法体系,包括:通过AI平台模拟提问、分析用户问答社区获取真实查询句式;优先布局高潜力长尾问题;为每条长尾设计包含核心解答、结构化分段、语义扩展的内容模板;配合Schema标记等技术适配。最终通过AIBase等工具持续监控内容在AI搜索结果中的可见性,形成“发现-筛选-创作-监控”的闭环优化体系。

  • iQOO 15 Ultra已在路上:配置最激进的iQOO旗舰

    iQOO产品副总裁罗锋在接受媒体专访时透露,iQOO 15系列还有一款高配版本,目前正在打磨中,面向特定群体,是游戏生产力工具”。 此前博主数码闲聊站爆料,iQOO 15 Ultra采用2K LIPO直屏,搭载高通第五代骁龙8至尊版平台,配备潜望长焦,支持无线快充,该机还测试了肩键以及主动散热风扇,支持IP68级防尘防水。 对比iQOO 15,iQOO 15的堆料

  • 华为HarmonyOS 6智能体验升级:实况窗信息更丰富 卡片直达应用各种功能

    华为今天正式发布全新的HarmonyOS 6,跨设备协作更简单自然,实况窗信息更丰富。 据介绍,HarmonyOS 6的跨设备协作能力让用户的联动操作更智能无感。 手眼同行”功能可自动在多设备间切换键鼠焦点;应用接续”支持超过120款应用,让阅读、观影等任务在设备间无缝流转; 碰一碰”分享也得到增强,支持手机一碰多分享、一碰多游戏组队,手机和电脑碰一碰,60 应用支持碰一

  • 旅行何必带相机!用三星 Galaxy S25 Ultra 记录秋日光影

    三星Galaxy S25 Ultra以专业级全焦段影像系统与Galaxy AI深度融合,让秋日旅行记录更轻松。2亿像素主摄精准捕捉枫叶渐变层次,超广角镜头细节表现提升4倍,双长焦系统支持3倍至100倍变焦。AI功能智能优化逆光色彩、一键消除路人干扰,支持Log模式与10-bit HDR视频,虚化效果媲美专业设备。全焦段流畅切换让创作无需等待,真正实现“一机走天下”。

  • 专家解读多地天空现密集鸟群:生态环境逐渐改善

    ​近期,河北、河南、四川等多地出现了密集鸟群现象,引发了广泛关注。结合专家解读与官方回应,这一自然现象的成因逐渐明晰,成为自然行为集中体现的又一例证。 当前正值秋季候鸟南迁的高峰期,每年11月至次年2月,大批候鸟如大雁、丝光椋鸟等会为了避寒而大规模集群飞行,形成壮观的“鸟浪”现象。河北蔚县、张家口等地往年同期均观测到类似情况,而今年这一

  • 携手Josh Rowledge登上季军奖台,WeTrade 8号赛车闪耀新加坡赛道

    亚洲保时捷卡雷拉杯重返新加坡滨海湾街道赛道,年轻车手Josh Rowledge驾驶WeTrade 8号赛车凭借稳定果敢表现登上领奖台,并以优异积分摘得2025年Street Cup年度季军。文章强调赛车与金融交易的核心共性:精准判断、稳健执行与持续突破。WeTrade通过赛事赞助传递"专业、稳健、精进"的品牌精神,展现速度与纪律的完美平衡,助力每位交易者在属于自身的赛道上赢得更稳更远。

今日大家都在搜的词: