首页 > 业界 > 关键词  > RingAttention最新资讯  > 正文

RingAttention:一种降低Transformer内存需求的新AI技术

2023-10-20 14:07 · 稿源:站长之家

划重点:

1. Transformer模型在处理长序列时面临的内存需求挑战,UC伯克利研究人员提出的RingAttention方法。

2. RingAttention通过将自注意力和前馈网络计算块块地分布在多个设备上,实现了内存高效,允许训练超过500倍长度的序列。

3. RingAttention的潜在应用领域,包括大型视频-音频-语言模型和理解科学数据。

站长之家(ChinaZ.com)10月20日 消息:UC伯克利的研究人员提出了一项名为RingAttention的新方法,以解决深度学习模型中内存需求的挑战。在最新的研究中,研究人员探讨了Transformer模型在处理长序列时面临的问题,特别是由于自注意力机制引发的内存需求。这一问题已经成为了在人工智能领域中提高模型性能的一个重要挑战。

Transformer模型是一种在自然语言处理等领域取得了重大突破的深度学习架构。它基于自注意力机制,可以在进行预测时权衡输入序列的不同部分的重要性。然而,随着输入序列长度的增加,内存需求呈二次增长,这导致了在处理长序列时的挑战。

UC伯克利的研究人员提出了RingAttention方法,通过将自注意力和前馈网络计算分块进行,可以将输入序列分布到多个设备上,从而实现内存高效。这一方法的关键思想是将计算块块块地分布在多个设备上,同时保持内存消耗与块大小成比例。这意味着每个设备的内存需求与原始输入序列长度无关,从而消除了设备内存的限制。

image.png

研究人员的实验证明,RingAttention可以将Transformer模型的内存需求降低,使其能够训练比以前的内存高效方法长500倍以上的序列,而不需要对注意力机制进行近似。此外,RingAttention还允许处理长度超过1亿的序列,为处理大规模数据提供了可能性。

尽管这项研究仅涉及方法的有效性评估,而未进行大规模训练模型,但这一方法的性能取决于设备数量,因此还需要进一步的优化。研究人员表示,他们将来计划在最大序列长度和最大计算性能方面进行更多研究,这将为大型视频-音频-语言模型、利用扩展反馈和试验错误学习、代码生成和理解科学数据等领域提供激动人心的机会。

论文网址:https://arxiv.org/abs/2310.01889

举报

  • 相关推荐
  • 突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型

    今天凌晨3点,全球社交巨头Meta分享了一个创新研究——Memorylayers。Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。这样的设计既简化了维护流程,又提高了系统的灵活性和适应性。

  • 激进架构,400万上下文,彻底开源:MiniMax-01有点“Transformer时刻”的味道了

    “MoE”加上“前所未有大规模投入生产环境的LightningAttention”,再加上“从框架到CUDA层面的如软件和工程重构”,会得到什么?一个追平了顶级模型能力、且把上下文长度提升到400万token级别的新模型。这显然是巨大的野心,但在如今人们都在关注大模型接下来往哪儿走的时候,非常需要这样的野心,非常需要一个或者更多个“Transformer时刻”——在一个自己相信的路线上做到极致,把看似所有人都知道的配方,最终兑现出来,展示给技术社区里的人们,让它变成某个决定性的时刻,给AI的前进再添把火。

  • FinPros富诺携手Trading Central,开启金融服务创新发展范式

    在2024年11月底和12月初于青岛举办的全球三对三足球冠军赛上,Finpros富诺集团旗下富诺企业服务作为活动的官方顾问单位,助力活动圆满举行,为球迷带来一场足球盛宴,并邀请足球巨星参加公益活动,获得广泛认可。全球三对三足球冠军赛是重要的文化交流平台。FinPros富诺集团将继续以开放的视野和务实的行动,与合作伙伴共创美好明天。

  • TikTok难民涌入,带火了AI手机

    最近这几天,中外网民属实有点聊嗨了。从自动缴猫税,到帮忙做作业,再到玩梗斗图,外国友人的迭代与进化过程中,离不开机翻闹出来的各种笑话,国内原住民在搭腔与热情接待时,也首次深刻体验到了AI手机的魅力。或许也意味着,AI手机正在迎来真正属于自己,一个最好的时代。

  • 公链平台开发新时代:Statter(STT)运用AI技术实现公链发行智能化

    过去两年AI热潮从传统芯片制造到各类大模型的推出,再到加密行业,几乎贯穿了各行各业。届时StatterNetwork的发链创新将不仅限于拖拽式生成公链将开启公链智能化、自动化的新时代,为开发者提供更加智能、高效的开发工具和全方位服务。

  • 春节后的第一款Ultra旗舰!华硕Zenfone 12 Ultra来了

    华硕宣布将于2月6日发布年度旗舰Zenfone12Ultra,这是春节后推出的第一款Ultra机型。根据Geekbench6跑分网站公布的信息,华硕Zenfone12Ultra型号是ASUSAI2501H,搭载高通骁龙8Elite处理器,配备16GB内存,预装Android15操作系统,单核成绩是3036,多核成绩是9656,是史上最强悍的华硕手机。华硕Zenfone12Ultra内置丰富的AI功能,包括AI语音降噪、AI即时通话翻译、AI录音笔记等等,大大提升用户的工作效率。

  • CapCutTikTok停止服务:Meta火速推新应用抢市场!

    随着TikTok在美国的业务面临不确定性,字节跳动旗下的剪映国际版CapCut等多款应用日前也向美国用户推送了停止服务的通知。在此背景下Meta迅速出击,Instagram主管AdamMosseri宣布推出一款名为Edits的视频编辑应用,旨在填补CapCut下线后的市场空白。Edits将于2025年3月13日正式上线,目前已经在iOS应用商店开放预购,虽然Mosseri没有透露更多,但目的很明显是为了让人们记住这款应用程序。

  • 麒麟影像之王!华为Pura 80 Ultra堆料前所未有 全自研技术落地

    进入2025年后,一大波超大杯影像旗舰将陆续登场,其中,最受关注的自然是华为Pura80Ultra。数码博主数码闲聊站”爆料称,华为Pura80Ultra不仅拥有前所未有的豪华硬件堆料搭载了不少自研的新技术。华为Pura80Ultra预计将搭载麒麟9020芯片,支持双卫星通信,并配备新一代玄武钢化昆仑玻璃等,搭载最新鸿蒙系统,新机将在今年第二季度发布。

  • Intel突然上线酷睿Ultra 3 205:然后又删了

    Intel月初发布的酷睿Ultra200S桌面系列主流版,最低型号是酷睿Ultra5225F,并没有此前曝光的更入门的酷睿Ultra3系列,但是现在,诡异的事情出现了。IntelARK数据库里悄然出现了酷睿Ultra3205”,配备4大4小8核心8线程,其中大核频率3.8-4.9GHz、小核频率3.52-4.4GHz,加速频率和曝料一致,另外二级缓存16MB,三级缓存15MB。之前传闻还有一款酷睿Ultra3215,自然频率更高一些,但尚未看到。

  • 新晋卡皇 ROG ASTRAL RTX5090D夜神显卡登场!

    ROGASTRALRTX5090D夜神作为ROG全新的旗舰显卡,拥有600W的顶级性能释放能力,配备强大的3.8槽四风扇散热系统,拥有全新打造、霸气十足、坚固无比的旗舰外观,是专为发烧级玩家和高端设计师用户打造的信仰级卡皇!搭配第5代TensorCore的GeForceRTX50系列GPU,采用Blackewell架构,为玩家和创意工作者带来了一系列基于AI技术的新功能,可以令AI处理性能提升高达2.5倍,不仅能生成更多帧可提供更加流畅顺滑的游戏体验!2025年1月30日22:00,ROGASTRAL夜神5080显卡首发必购活动来袭!