首页 > 业界 > 关键词  > Transformer最新资讯  > 正文

比Transformer更好的模型架构?Monarch Mixer更低成本取得更优表现

2023-10-30 09:19 · 稿源:站长之家

要点:

1. Monarch Mixer (M2) 是一种新的模型架构,与传统的Transformer不同,它通过使用Monarch矩阵替代注意力和MLP,使之在语言和图像实验中以更低的成本取得了更优的表现。

2. Monarch Mixer 的关键创新点在于其次二次的复杂度,使其能够处理更长的序列和更高维度的表征,同时保持计算效率。

3. 实验证明,M2在各种任务上,包括语言建模和图像分类,能够与传统Transformer媲美,同时具有更高的硬件效率和更少的参数。

站长之家(ChinaZ.com)10月30日 消息:近年来,Transformer模型在自然语言处理和计算机视觉领域取得了巨大成功,但它的高成本、复杂性以及依赖于注意力机制和多层感知机(MLP)等组件使得人们开始寻求替代方案。论文介绍了一种名为Monarch Mixer(M2)的全新模型架构,这个架构在序列长度和模型维度上都表现出次二次复杂度的特点,同时在现代硬件加速器上具有出色的性能。

image.png

论文地址:https://arxiv.org/abs/2310.12109

代码地址:https://github.com/HazyResearch/m2

Monarch Mixer(M2)的主要创新点在于它采用了Monarch矩阵,将传统Transformer中的注意力机制和MLP替代为更高性能的结构。Monarch矩阵是一种次二次结构化矩阵,能够支持更长的序列和更高维度的表示,同时保持计算效率。这个矩阵可以通过分块对角矩阵的积进行参数化,其计算复杂度与输入长度呈次二次增长关系,这使得M2能够在处理大规模数据时具有出色的性能。

实验结果表明,M2在多个任务上都能够媲美传统Transformer模型,包括非因果语言建模、图像分类和因果语言建模。与传统Transformer相比,M2不仅能够节省大量参数,还具有更高的硬件效率,这使得它成为一个有潜力的替代选择。

斯坦福大学和纽约州立大学布法罗分校的研究团队的工作为机器学习领域带来了新的思路,挑战了传统Transformer模型的优越性。他们的研究不仅探索了Monarch Mixer的理论基础,还进行了一系列实验来验证其性能。这篇文章的发表为机器学习社区提供了一个全新的研究方向,也让人们重新思考了在自然语言处理和计算机视觉任务中的模型选择。

总的来说,Monarch Mixer(M2)是一种具有次二次复杂度的新型模型架构,能够在不使用传统Transformer中的注意力和MLP的情况下,在自然语言处理和计算机视觉任务中表现出色。它的硬件效率和参数效率使其成为一个有望取代传统Transformer的新选择,为深度学习研究领域带来了新的思考。

举报

  • 相关推荐
  • 卢伟冰喜提小米17 Ultra 米粉:用起来怎么样

    小米集团总裁卢伟冰换上了新手机,微博尾巴由之前的小米17 Pro Max变成了小米手机。 不出意外,卢伟冰正在使用的新机应该就是即将发布的小米17 Ultra。不少米粉在评论区问卢总:17 Ultra用起来怎么样?

  • 华为nova 15/Pro/Ultra上架华为商城官网

    华为nova 15系列将于12月22日14:30发布,包括nova 15、nova 15 Pro和nova 15 Ultra三款机型。nova 15延续上代设计,采用单挖孔屏;Pro和Ultra则首次采用横向大矩阵模组设计,预计搭载红枫原色镜头,提升辨识度与摄影体验。存储方面,nova 15和Pro提供12GB+256GB/512GB版本,Ultra额外增加12GB+1TB超大存储。四款时尚配色满足个性化需求,引发消费者期待。

  • 坚果N5 Ultra Max和当贝S7 Ultra Pro怎么选?实测告诉你

    本文对比评测坚果N5 Ultra+Max、当贝S7 Ultra+Pro、极米RS20 Ultra+Max三款国产旗舰智能投影仪。从画质、核心参数、游戏表现、音效、使用体验及护眼功能六大维度进行全方位分析。结果显示,当贝S7 Ultra+Pro在画质色彩还原、暗部细节、系统流畅度方面表现最佳,综合体验最优;极米RS20 Ultra+Max画面锐化明显,适合文字内容观看;坚果N5 Ultra+Max投射画面最大,但存在色彩偏黄、高光过曝等问题。消费者可根据自身对画质、画面大小及使用场景的不同需求进行选择。

  • 冬日驾驭新境:问界新M5 Ultra用硬核实力守护全场景出行

    文章探讨了问界新M5 Ultra如何通过全面产品力重塑冬季出行体验。其华为ADS高阶辅助驾驶系统凭借192线激光雷达等硬件,构建360度无死角探测网络,在浓雾中仍能清晰感知路况,被车主誉为“雾中可靠的眼睛”。车辆配备的“舒适制动”功能优化制动曲线,实现平顺减速,大幅提升乘坐舒适性。全系标配的舒云座椅加热功能,配合快速升温的空调系统,有效消除冬季用车寒意。此外,其主动安全系统与高强度笼式车身结构,提供了全方位的安全保障。文章指出,问界新M5 Ultra是针对冬季出行痛点的系统性解决方案,当前购车可享至高价值权益。

  • 华为nova 15 Ultra四色全家福亮相:金属中框 绿、紫光栅条纹吸睛

    华为nova 15系列将于12月22日发布,新机外观已经公布。 据了解,华为nova15 Ultra将提供带感绿、好搭紫、零度白和幻夜黑四款配色,其中带感绿与好搭紫采用光栅条纹后盖设计,视觉效果更为醒目。 从官方海报展示的边框质感来看,nova15 Ultra有望搭载用户期待已久的金属中框,整体质感进一步提升。 设计方面,nova15 Ultra采用横向立体双圆环影像模组,打破nova系列以往的设计�

  • 小米17 Ultra下周一官宣!预计12月25日发布

    小米14 Ultra预计12月25日发布,将搭载豪威OV50X一英寸主摄,支持双模拟增益HDR和16EV动态范围。正面采用直屏设计,配备超像素技术屏幕,功耗低于1.5K但清晰度超越传统2K。内置近7000mAh电池,支持100W有线与80W无线快充,保留IP68防尘防水。此外,小米NAS有望同台亮相,主打家庭存储,连接手机、电视等多设备,持续完善手机扩容与AI相册功能。

  • 技嘉 X870E AORUS XTREME X3D AI TOP

    技嘉科技宣布其旗舰级X870E AORUS XTREME X3D AI TOP主板正式上市。该主板专为AMD Ryzen X3D处理器打造,搭载X3D Turbo Mode 2.0技术,通过动态AI超频模型与AI芯片,显著提升处理器性能,游戏与多任务场景下最高可提升25%。同时结合独家AI D5黑科技2.0,全面释放DDR5内存性能,最高可达9000+ MT/s。主板采用极致散热方案,包括CPU Thermal Matrix、DDR Wind Blade XTREME和M.2 Thermal Guard XTREME,有效降低关键部件温度。此外,配备多项EZ-DIY人性化设计,如PCIe EZ-Latch Plus Duo和M.2 EZ-Latch Plus,简化安装流程。产品包装采用环保可重复利用设计,兼具质感与收藏价值。

  • 小米17 Ultra开启线下盲定:本月发布实锤!国产一英寸旗舰

    之前就有不少爆料称,小米17 Ultra将于本月发布,如今终于迎来官方确认。 据多位网友反馈,小米之家线下员工已经开始邀请参与盲定活动,称预计小米17 Ultra本月发布。 小米17 Ultra是第一台影像超大杯新机,也是唯一的一台第五代骁龙8至尊版一英寸旗舰。

  • 小米全家桶春节前发布 小米17 Ultra、平板、耳机全都有

    临近年底,小米一大波新品正在路上,种类丰富,可谓小米全家桶”。 今日,数码博主数码闲聊站”发文透露,新品包括第五代骁龙8至尊版影像旗舰、天玑8系芯片中端机、天玑9系芯片中端机、全智能手表、两副耳机,中端平板,还有一些IoT产品,确定在春节前登场。 其中,影像旗舰为小米17 Ultra,有望在下周官宣,本月发布。

  • 小米17 Ultra下周官宣:首发全新徕卡1英寸主摄

    今年的小米数字系列首次开辟了Pro Max产品线,同时推出了小米17、小米17 Pro和小米17 Pro Max三款机型。 小米集团总裁卢伟冰很早就透露,小米数字系列还会有Ultra版。目前该机已经获得入网许可,距离正式发布不远了。 根据小米销售在微信朋友圈发布的消息,小米年度影像旗舰已经开启盲订,支付100元就能锁定专属权益。

今日大家都在搜的词: