首页 > 业界 > 关键词  > 正文

UltraFastBERT:推理过程仅用0.3%神经元,性能与类似的BERT模型相当

2023-11-28 09:55 · 稿源:站长之家

**划重点:**

1. 🧠 **创新介绍:** ETH Zurich研究人员成功开发了UltraFastBERT,通过使用快速前馈网络(FFFs)在推理过程中仅使用0.3%的神经元,实现了与其他模型相当的性能水平。

2. 🚄 **性能提升:** 通过简化的FFFs替代传统模型的前馈网络,UltraFastBERT在保持高效语言建模的同时,取得了显著的速度提升,甚至达到48倍到78倍的CPU上的推理速度提升。

3. 🛠 **潜在应用:** 该研究不仅提供了高水平的CPU和PyTorch实现,还建议通过混合稀疏张量和设备特定优化,以及通过多个FFF树的联合计算,进一步加速大型语言模型,如GPT-3。

站长之家(ChinaZ.com)11月28日 消息:近日,ETH Zurich的研究人员成功推出了一项创新性的技术——UltraFastBERT,该技术通过在推理过程中仅使用0.3%的神经元,实现了与其他类似BERT模型相当的性能水平。这一创新主要通过引入快速前馈网络(FFFs)来解决在推理过程中减少神经元数量的问题,相较于基准实现,取得了显著的速度提升。

image.png

研究人员提供了代码、基准设置以及模型权重,支持了这一方法的有效性。他们建议进一步探索通过混合稀疏张量和设备特定优化,以及在大型语言模型中应用多个FFF树的潜在性能提升。

UltraFastBERT在推理过程中展现了高效的语言建模,通过将传统模型的前馈网络替换为简化的FFFs,使用一致的激活函数和所有节点输出权重,同时消除了偏差。多个FFF树协同计算中间层输出,允许多样化的架构。所提供的高水平CPU和PyTorch实现显著提升了速度,而研究还探讨了通过多个FFF树和替换大型语言模型前馈网络为FFFs,实现潜在加速的可能性。为设备特定优化,建议使用Intel MKL和NVIDIA cuBLAS。

UltraFastBERT不仅在推理中仅使用0.3%的神经元的情况下实现了与BERT-base相当的性能,而且在仅使用单个GPU进行一天训练的情况下,仍保持至少96.0%的GLUE预测性能。研究还展示了通过快速前馈层实现显著的速度提升,达到48倍到78倍的CPU上的即时推理速度提升,以及GPU上的3.15倍速度提升,表明在替换大型模型方面存在潜在可能性。

总体而言,UltraFastBERT是对BERT的修改,实现了在推理过程中仅使用少量神经元的高效语言建模。该模型通过FFFs实现了显著的速度提升,提供的CPU和PyTorch实现分别实现了78倍和40倍的速度提升。研究建议通过实现有条件神经执行的基元,进一步加速语言建模。尽管仅使用0.3%的神经元,UltraFastBERT的最佳模型与BERT-base的性能相当,展示了高效语言建模的潜力。UltraFastBERT展示了高效语言建模的潜在进展,为未来更快、资源友好的模型铺平了道路。

未来研究的建议包括使用混合向量级稀疏张量和设备特定优化实现高效的FFF推理,探索有条件神经执行加速语言建模的全部潜力,以及通过将前馈网络替换为FFFs优化大型语言模型的潜在性。未来的工作可能着重于在流行框架如PyTorch或TensorFlow中实现可重现的模型,并进行广泛的基准测试,以评估UltraFastBERT及类似高效语言模型的性能和实际影响。

论文地址:https://arxiv.org/abs/2311.10770

举报

  • 相关推荐
  • 从价格混战到价值重塑——科龙静省电Ultra背后的行业转型思考

    2025年空调行业竞争加剧,价格战激烈、产品同质化严重,库存高达6000万套。科龙凭借41年技术积累,以“反内卷”思路推出静省电Ultra系列,通过美芝压缩机、双排7mm紫铜管等核心升级,APF值达6.26,结合AI节能技术再省电45%。产品定位2000-3000元主流区间,以“技术普惠”打破高能效必高价的认知,兼顾用户利益与社会责任,推动行业从价格竞争转向价值创造。

  • 小米17 Ultra外观曝光:没有背屏 Pro版独占

    小米17系列新品爆料:Ultra版主打专业影像,无背屏设计;Pro系列独享定制化背屏,可同步打车、外卖等实时信息。小米总裁卢伟冰称背屏斥资10亿打造,友商难跟进。Ultra版升级三摄,采用大R角直屏、极窄边框,搭载骁龙8 Gen5平台,支持UWB技术,预计春节前发布。小米与徕卡合作深化,将通过光学、芯片、算法提升移动影像体验。

  • 小米最强旗舰!小米17 Ultra入网

    小米新旗舰型号2512BPNDAC获入网许可,支持UWB技术但不支持卫星通信。该机被猜测为小米17 Ultra,将升级前摄、主摄和长焦,采用大R角直屏和极窄边框,搭载骁龙8 Elite Gen5平台,标配无线/有线快充、防水和大容量电池。预计春节前发布,将成为小米最强影像旗舰,值得期待。

  • 业内独家无孔真全面屏!努比亚Z80 Ultra获认证:支持90W快充

    努比亚Z80+ Ultra将于10月亮相,搭载第五代骁龙8至尊版移动平台,采用台积电3nm工艺,性能提升20%,功耗降低5%。配备1.5K无孔全面屏,屏占比超95%,支持90W快充。影像方面回归三主摄方案,配备超大底超广角镜头,传感器尺寸1/1.55,拥有1μm大像素。官方称针对游戏进行深度优化,带来前所未有的游戏体验。

  • 小米SU7 Ultra原型车1:43合金车模发布:售价149元

    小米汽车于9月23日推出SU7 Ultra原型车1:43比例合金车模,售价149元,9月25日18:00线上开售。车模严格还原原型车设计,包括U型风刀、大尺寸前铲、水滴形大灯及碳纤维后视镜等细节,提供闪电黄和太空银两款配色,分别致敬纽北赛道传奇赛车与首台测试车。材质采用锌合金搭配复合塑料,兼顾强度与轻量化,尺寸122×50×33mm,适合陈列或车载装饰。行业观察认为,小米将高端赛车模型价格下探至百元级,可能引发收藏领域新一轮关注。

  • 都市精英购车指南,问界新M5 Ultra对比小米YU7

    本文聚焦20-30万元区间新能源车市场竞争,通过对比问界新M5 Ultra与小米YU7,强调购车应关注实际体验而非参数堆砌。问界在感知硬件、辅助驾驶算法及主被动安全方面更具优势,搭载华为ADS系统,提供更精准可靠的智能出行体验。目前问界还提供高达3.7万元的购车权益,建议消费者亲身体验后再做选择。

  • 雷军曝 SU7 Ultra 纽北秘辛:连发21封邮件求机会 还被反问 “中国手机厂商为何要来这里”

    2025年雷军演讲提及小米SU7 Ultra冲击纽北赛道的历程。该项目于2021年12月立项,对标保时捷与特斯拉,后因资源集中暂停,2022年5月重启。团队为争取测试资格,向纽北官方连发21封邮件未获回复,最终通过线下会议打动对方。2022年10月原型车仅获一圈测试机会并创下纪录。2024年4月量产版正式挑战纽北,仅用四圈测试便拿下两项成绩,表现远超原型车,展现小米打造顶级纯电性能车的雄心与技术积累。

  • 影院级视听体验,海信激光电视探索X1 Ultra亮相青博会

    2025年青岛国际消费电子博览会以“智联万物+AI赋未来”为主题,海信激光电视探索X1 Ultra惊艳亮相。该产品采用IMAX影院同源技术,实现110% BT.2020色域和ΔE<0.6的专业色准,配备1000nits纳米光选屏Pro,支持9.1.4声道音响系统,通过德国莱茵护眼认证。创新可卷曲屏幕设计解决大屏入户难题,全球市场份额达65.8%,重新定义家庭影院标准。

  • 小米最强影像旗舰!小米17系列还有Ultra版

    小米集团总裁卢伟冰在直播中透露,小米17系列将推出Pro+Max和Ultra版本。Ultra版将搭载连续光学变焦技术,配备2亿像素大底,实现更顺滑的变焦体验,避免传统变焦系统的跳变、白平衡偏移等问题。爆料称小米17+Ultra或将在春节前发布,比往年提前,标准版和Pro版也将在9月底发布。

  • 海信G7 Ultra显示器参数公布:1152分区+2000nits亮度,黑曜屏加持领跑3K档

    海信G7 Ultra显示器于9月22日开启预约,定位三千元价位段,主打3A游戏画质体验。搭载1152分区Mini-LED背光,峰值亮度达2000nits,支持99% DCI-P3色域和DP2.1接口,实现4K@160Hz与FHD@320Hz双模切换。采用黑曜屏抗反光技术,结合低蓝光护眼功能,兼顾高对比度与舒适视觉。产品旨在突破电竞显示器画质瓶颈,最终售价将于9月26日发布会公布。

今日大家都在搜的词: