首页 > 业界 > 关键词  > EAGLE最新资讯  > 正文

北京大学发布EAGLE 大模型推理效率无损提升3倍

2023-12-14 16:22 · 稿源:站长之家

要点:

  • EAGLE由滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布,将大模型推理效率提升3倍。

  • EAGLE采用外推大语言模型的第二顶层特征向量的方法,相较于普通自回归解码,其推理速度提升明显,比普通自回归解码快3倍,比Lookahead解码快2倍,比Medusa解码快1.6倍。

  • EAGLE使用投机采样方法,通过轻量级的自回归头和冻结的分类头相结合,利用大语言模型提取的上下文特征进行外推,从而更高效地生成文本。

站长之家(ChinaZ.com)12月14日 消息:近年来,大语言模型在各领域应用广泛,但其文本生成过程昂贵且缓慢。为解决这一问题,滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布了EAGLE。EAGLE的目标是提升大语言模型的推理速度,同时确保输出文本的分布一致性。通过外推大语言模型的第二顶层特征向量,EAGLE成功实现了大模型推理效率的无损提升,比普通自回归解码快3倍,比Lookahead解码快2倍,比Medusa解码快1.6倍。

image.png

代码地址:https://github.com/SafeAILab/EAGLE

为了加速自回归解码,EAGLE采用了投机采样方法,使用一个轻量级的自回归头和冻结的分类头相结合。与传统投机采样方法不同,EAGLE的输入包括了抽样结果的词嵌入,使得输入和输出之间更具一致性。这种创新的方法有效地处理了抽样过程中的随机性,提高了生成文本的准确性。

EAGLE的工作原理基于特征向量的可压缩性,通过训练一个轻量级插件,即自回归头,从原始模型的第二顶层预测下一个特征,然后使用原始LLM的冻结分类头预测下一个词。这种外推特征向量的方法使得EAGLE在生成文本的同时保持了与普通解码一致的分布。

总体而言,EAGLE的发布标志着大语言模型推理效率的重大突破,为大规模文本生成任务提供了更加高效的解决方案,将在各领域推动语言模型的应用和发展。

举报

  • 相关推荐
  • RedEagles粉丝狂欢节,等你来躁!

    RedEagles作为一款跨境直播社交平台,凭借在跨国社交领域积累多年的运营经验,开辟多个外语市场,深挖当地网络艺人,给予专业的培训以及大量的资源扶持,旨在以最优质的内容,满足国内用户对直播场景多样化的需求,为用户提供耳目一新的“看播”体验。近期,RedEagles将于线下举办一场汇集海内外主播的粉丝狂欢节,而本次选择的举办地-郑州,作为中原经济区核心城市,不仅有强大的文化底蕴,其本身更是全国的综合交通枢纽,长期保持?

  • Fire Eagle(火鹰):雅虎的基于地理位置的共享平台

    博客地图在国内已经不是新鲜事了,我们在博客上标注自己的地理位置,Google Picasa Web Albums 还允许你为照片标注地理位置。2008年8月13日雅虎Brickhouse实验室正式发布了代号为”Fire Eagle“的地理位置数据平台,为用户提供本地化的信息共享服务。

  • 飞豹Eeagle运动版开箱测评:手表操作 智能跟拍

    随着技术的进步消费级无人机的种类越发繁多,最近我们了解到一款名为飞豹的XEagle无人机,它不仅能够实现壁障飞行,还能够实现能智能跟随,同时还能通过佩戴在手上的智能手表实现操控,这款集智能穿戴与无人机于一体的产品表现如何呢?我们来一探究竟。开箱与配件黑色的硬质纸箱包装,上面印有XEagle无人机的图案,让人一目了然里面的产品。下面一行显示这款无人机能够自动跟踪、手表控制、故障保护和智能跟拍等功能。包装中附送?

  • EAGLE闪耀亚太影展 以创新科技重塑影视产业未来

    第62届亚太影展暨2025亚太国际电影节于7月9日在香港嘉里酒店圆满落幕。这场汇聚全球30余国、超千名电影精英的盛会,见证了亚太电影的辉煌成就,更成为科技与艺术融合的前沿舞台。EAGLE作为构建下一代影视+裸眼3D技术的领军企业,受邀出席闭幕典礼,展示其推动现实与数字世界价值连接的革命性技术。陶明喜执导的《云上有山》斩获年度最佳主旋律电影奖,杨骐荣获"年度最佳男演员"。吕良伟获颁"华语电影常青树大奖",表彰其跨越半个世纪仍保持巅峰表演状态的卓越成就。影展以"跨越边界·光影共生"为主题,与EAGLE的3D影视系统愿景深度契合,重点展示了虹膜加密、裸眼3D显示和MR智能眼镜三大颠覆性技术矩阵。EAGLE致力于构建全球裸眼3D影视生态系统,计划通过内容驱动、技术创新、硬件部署和"新基建"融合,重新定义人们的娱乐方式,为亚太影视产业数字化转型提供核心驱动力。

  • 四个著名的美丽星云大图欣赏:Eagle,Omega Nebula,Trifid和Lagoon

    这四个星云以其令人惊叹的美丽而闻名:鹰状星云(包含创世之柱),欧米茄星云,三叶星云,以及泻湖星云。在20世纪50年代,一个天文学家小组对这些星云中的一些恒星进行了粗略的距离测量,并能够推断出人马座臂的存在,他们的工作为我们银河系的螺旋结构提供了一些最早的证据。在一项新的研究中,天文学家们表明,这些星云是人马臂内一个子结构的一部分,其角度与人马臂的其他部分不同。旋臂的一个关键属性是它们如何紧密地缠绕着一

  • 程序员福音:AI提效神器Eagle DevAgent正式发布,代码难题迎刃而解

    欢迎进入Eagle的世界,让对于代码的探索拥有无限的可能。

  • NVIDIA RTX 3060 Ti 真卡图像首次泄露 来自技嘉Eagle OC

    最近我们看到了大量的所谓泄露和围绕RTX3060Ti的传闻,但一直没有该卡本身的图片。不过现在,网上出现了几张号称是3060Ti的最新图片。真机照片来自VideoCardz,图像显示技嘉的RTX3060Ti上的一个型号。顾名思义,Eagle OC是一个超频型号,虽然我们不知道确切的时钟速度规格。这款显卡包含双风扇冷却器和一个独立的8针电源连接器,该卡的TDP预计在200W左右。预计RTX3060Ti将是RTX3070中的GA104GPU的削减版本,并拥有相同的8GB GDDR6?

  • RNN模型挑战Transformer统治地位 Eagle 7B模型登顶多语言基准测试

    随着大模型的崛起,RNN模型Eagle7B挑战了Transformer的霸主地位。该模型在多语言基准测试中表现卓越,同时推理成本降低数十倍。通过不断探索和创新,人工智能技术将更好地为人类社会和个体提供服务。

  • ​Eagle7B: 基于RWKV-v5架构、跨足100多种语言的7.52B参数AI模型

    随着人工智能的发展,大型语言模型在各个领域开始受到广泛关注和应用。这些模型在数十亿级别的数据规模上进行训练,涵盖了健康、金融、教育、娱乐等多个领域,从自然语言处理和翻译到其他任务都发挥着重要作用。它突显了RWKV-v5架构的可扩展性,显示线性变换器可以达到与传统变换器相媲美的性能水平。

  • 聚焦交易能力提升!EagleTrader 模拟交易系统打造交易成长新路径

    在全球市场波动加剧的背景下,交易者面临的挑战已不仅限于技术分析层面。许多交易者在实盘操作中常因情绪干扰导致决策变形,如何构建科学的交易心理与风险控制体系成为行业关注焦点。EagleTrader的考试,也为交易员提供了一条不一样的职业进阶之路。

今日大家都在搜的词: