首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta引入全新注意力机制Sytem 2 Attention 提升Transformer架构推理能力

2023-11-24 14:25 · 稿源:站长之家

要点:

1. Meta的研究者在论文《System2Attention (is something you might need too)》中提出了一种新的注意力机制(System2Attention),旨在提高大型语言模型(LLM)的推理能力,解决其在处理复杂任务时可能出现的错误。

2. 传统的Transformer架构中的软注意力机制容易受到不相关上下文或输入提示的影响,导致模型出现阿谀奉承等问题。System2Attention通过将LLM用作自然语言推理器,利用指令调整LLM的注意力,使其关注相关上下文,从而提升推理质量。

3. 实验证明,相比基于标准注意力的LLM,System2Attention在事实问答、长论点生成以及解决数学应用题等任务中表现更佳,减少了固执己见和阿谀奉承的情况。研究得到了Yann LeCun的认可。

站长之家(ChinaZ.com)11月24日 消息:近期,Meta的研究者发表了一项关于Transformer架构的新研究,提出了一种名为System2Attention(S2A)的全新注意力机制。该研究旨在解决大型语言模型(LLM)在推理能力上的不足,特别是在处理复杂任务时可能出现的错误。

传统的Transformer架构中的软注意力机制存在偏好和容易受到不相关上下文影响的问题,被称为“阿谀奉承”。

image.png

论文地址:https://arxiv.org/pdf/2311.11829.pdf

S2A的核心思想是将LLM作为自然语言推理器,通过给予指令调整其注意力,使其更加专注于与推理相关的上下文,从而提高推理的准确性。研究者将这一过程比喻为人类的System2推理,即在需要关注特定任务且System1可能出错时,System2会投入更多脑力活动来进行深入推理。

实验证明,S2A在不同任务上相比传统的LLM表现更为出色。在事实问答任务中,S2A的准确率达到80.3%,相较于基线有显著提高。在长论点生成任务中,S2A同样取得了高质量的评估结果,减少了固执己见和阿谀奉承的情况。此外,在解决数学应用题时,S2A的准确率也明显优于传统的LLM。

这一研究得到了深度学习领域的重要人物Yann LeCun的推荐,为改进注意力机制、提升推理能力的方向提供了新的思路。总体而言,S2A的引入为解决当前LLM推理能力不足的问题提供了一种创新性的解决方案。

举报

  • 相关推荐
  • Meta雷朋第三代智能眼镜亮相在即,三星/微美全息领航消费级XR助推行业增长!

    Meta与雷朋合作的第三代智能眼镜渲染图曝光,预计今年发布,定价300-500美元。新一代眼镜强调AI功能升级,支持实时物体识别与场景理解。Meta还将在9月Connect大会推出首款带显示屏的智能眼镜Hypernova,售价约800美元,并配套手势控制腕带。与此同时,三星确认将于9月推出XR头显Project Infinite,售价约1800-2900美元。智能眼镜市场正迎来爆发期,2025年Q1全球出货量激增82.3%,中国增长116.1%。微美全息等企业加速布局,行业期待未来2-3年迎来真正拐点。

  • Lamett乐迈石晶产品硬核测评:零醛、防水、防霉三大指标重新定义健康家

    北京楼市新政落地,市场活力提升,新房装修需求升温。文章重点指出选购健康安全建材的关键指标:甲醛释放量少、防水防潮性强、防霉防蛀能力过硬。通过高温甲醛实验、防水实验和防霉防蛀实验,对比测试了乐迈石晶板等主流建材,结果显示其具有零甲醛释放、滴水不侵、无惧虫霉的优异性能,重新定义了健康建材的标准。

  • Lamett乐迈石晶快装秘籍!让武汉20年老宅“一键焕新”

    武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板,解决潮湿问题,提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化,厨房岛台增进家人互动。全屋原木色调营造温馨氛围,兼顾健康与美学,为五口之家打造安全舒适的生活环境。

  • 7年来首次!苹果罕见发布iOS 26 Beta 9更新

    今日,苹果发布iOS 26开发者预览版Beta 9更新,内部版本号23A5336a。 值得注意的是,这是继2018年iOS 12之后,苹果首次推出第9个测试版更新。 据悉,从iOS 13到iOS 18,苹果在正式版发布前最多只会推出8个测试版,更新节奏一向稳定。 而iOS 12则因频繁修复弹窗问题,一度创下12个测试版的纪录。 根据往年发布节奏,苹果预计将在9月10日发布iOS 26 RC版(准正式版)更新,9月16日发�

  • 带猫环游世界的@不撸猫HaiTang 如何吸引1亿点赞?

    当打工人还在幻想诗和远方,@不撸猫HaiTang 已经带着他的两只狸花猫开始环游世界了! 视频里,这只名为海棠的狸花猫,在菲律宾的划艇上悠闲地打量着海洋;另一段视频中,它又出现在日本北海道的雪景里,好奇地从主人的背包里探出小脑袋。

  • 小米14无缘澎湃OS 3首批Beta版:张国全解释原因

    小米软件部张国全发文表示,澎湃OS 3 Beta版第二版今天已经外发,欢迎大家升级体验,如果没有重大问题,8款机型第二批Beta版明天逐步外发。 值得注意的是,12306行程助手明天开始外发(澎湃OS 2/OS 3同时外发),NFC上岛/秒表上岛,第一版开始外发,大家升级试用后有问题随时反馈。 张国全还提到了小米14系列Beta版计划,称去年在规划澎湃OS 3 Beta版的时候,怕大家觉得不公�

  • 小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

    今日,小米正式向旗下8款机型推送了澎湃OS3的首批Beta版升级,涵盖小米15、小米15Pro、小米15S Pro、小米15Ultra、REDMI K80Pro、REDMI K80至尊版、小米平板7Pro以及小米平板7S Pro12.5。此次更新不仅修复了用户反馈的多项系统问题,还新增了实用功能,并对相机稳定性进行了优化。 在系统层面,小米澎湃OS3解决了部分场景下多应用音量调节异常、应用双开时无法切换输入法、点击消息�

  • 澎湃OS 3第二批Beta来了!小米回应推送时间

    小米澎湃OS3首批Beta版内测已于8月29日开启推送。 今日,小米澎湃OS官方就大家关心的第二批Beta版(首批Beta版机型)推送时间作出回应。 官方表示,即使推送Beta版本也极为重视交付质量,为了给参与Beta招募的用户提供良好可靠的使用体验,小米社区会按照用户提交招募申请的先后顺序,分两批逐步放量推送,这一举措将提供更充分的质量保障。 当前,由于用户报名热情,�

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • 知名互联网meme原型狗 柴犬PON去世 表情包你用过吗

    日前,网络热门表情包不可以色色”的原型柴犬Pon”被其主人在Instagram上宣布离世,享年17岁。 其主人在ins上用Pon的口吻表示:大家好!非常感谢你们给我的爱,明天11点我将穿过彩虹桥,虽然有点难过,但我的心里充满了幸福,我会带着大家笑容的记忆,踏上全新的旅程你们的邻里偶像PON。” 据了解,PON是一只出生于2008年1月6日的日本埼玉北部柴犬。

今日大家都在搜的词: