首页 > 业界 > 关键词  > StripedHyena-7B最新资讯  > 正文

Together AI发布AI模型StripedHyena-7B 性能超越Llama-27B

2023-12-13 17:51 · 稿源:站长之家

划重点:

1. 🌐 StripedHyena-7B引领人工智能领域,提供计算效率和性能升级的替代选择。

2. 🚀 采用独特混合结构,StripedHyena在训练、微调和生成长序列时表现出色。

3. 💡 未来研究重点:构建更大的模型、引入多模态支持、提高StripedHyena模型的性能。

站长之家(ChinaZ.com)12月13日 消息:Together AI最新发布了StripedHyena-7B,这一人工智能模型领域的创新力量引起了广泛关注。该模型的基础版本为StripedHyena-Hessian-7B(SH7B),同时还推出了聊天模型StripedHyena-Nous-7B(SH-N7B)。StripedHyena基于上一年创建的一系列有效的序列建模架构(如H3、Hyena、HyenaDNA和Monarch Mixer)的重要经验教训。

image.png

研究人员强调,StripedHyena在训练、微调和生成长序列过程中处理效率更高,具备更快的速度和更高的内存效率。通过采用独特的混合技术,StripedHyena将门控卷积和注意力结合成了所谓的Hyena运算符。在短序列任务中,包括OpenLLM排行榜任务,StripedHyena在性能上超越了Llama-27B、Yi7B以及最强大的Transformer替代品,如RWKV14B。

image.png

image.png

该模型在处理短序列任务和处理长提示的各种基准测试中都进行了评估。通过对Project Gutenberg书籍进行的困惑度缩放实验显示,困惑度在32k处饱和,或在此点以下减少,表明该模型能够从更长的提示中吸收信息。

StripedHyena通过将注意力和门控卷积组合成Hyena运算符的独特混合结构实现了高效性。研究人员采用创新的嫁接技术对这种混合设计进行了优化,使其在训练过程中能够进行体系结构修改。

研究人员强调StripedHyena的关键优势之一是其在训练、微调和生成长序列等各种任务中的提速和内存效率。在端到端训练的32k、64k和128k行上,StripedHyena相对于优化的Transformer基线(使用FlashAttention v2和自定义内核)分别提高了30%、50%和100%

未来,研究人员希望在StripedHyena模型的多个领域取得重大进展。他们计划构建更大的模型,以处理更长的上下文,拓展信息理解的界限。此外,他们计划引入多模态支持,通过允许模型处理和理解来自文本和图像等各种来源的数据,提高模型的适应性。

StripedHyena模型有望通过引入额外的计算(例如在门控卷积中使用多个头部)在性能上超越Transformer模型。这种受线性注意力启发的方法在H3和MultiHyena等架构中被证明在训练期间提高模型质量,并为推断效率提供优势。读者可以查看该项目的博客和项目详细信息,对此研究给予所有研究人员应有的赞誉。

项目网址:https://huggingface.co/togethercomputer/StripedHyena-Hessian-7B

博客:https://www.together.ai/blog/stripedhyena-7b

举报

  • 相关推荐
  • 科普 | 读懂HBM和DRAM,才懂AI算力未来

    在AI算力需求激增的背景下,存储芯片成为决定计算性能的关键。文章重点分析了三大易失性存储技术:SRAM凭借高速读写特性在CPU缓存中不可替代;DRAM作为数字世界的“主内存”,在容量与速度间实现平衡;HBM则通过3D堆叠架构革命性提升带宽,突破AI训练中的“内存墙”瓶颈。当前HBM需求爆发式增长,预计2025年市场规模将达340亿美元。中国企业在DRAM领域逐步突破,并开始布局HBM技术,正通过持续技术积累提升在全球半导体生态中的地位。

  • 史上最薄Mate!华为Mate 70 Air要用等深四曲屏、最高16GB内存

    华为Mate 70 Air预计将于本月登场,该机将是史上最薄Mate。 今日,数码博主定焦数码”曝光了一台又薄又大的机器”,从微博内容和网友评论来看,该机正是华为Mate 70 Air。 该博主透露,华为Mate 70 Air将采用等深四曲屏设计,最高提供16GB运行内存版本,出厂预装鸿蒙OS 5.1操作系统,支持升级最新的鸿蒙OS 6。

  • 小米17 Ultra取消2K屏:用Pro Max同款超级像素

    小米17 Ultra并没有开案2K屏,依然是全RGB无损排列,也就是会采用小米17 Pro Max同款的超级像素屏幕。 超级像素技术主要是排列方式上与以往的OLED有明显区别,经由全RGB像素独立排布,在OLED领域首次克服了高ppi与低良率之间的难题,彻底告别像素公摊”问题,每一颗子像素都能精准发光。

  • 华为Mate70 Air官宣今日开启预售

    华为Mate70 Air于11月6日正式发布,10:08开启预售。该机主打轻薄设计,机身厚度仅6.x毫米,为Mate系列最薄直板机。配备居中大圆镜头模组,后置四摄包括5000万主摄、800万超广角微距、1200万长焦防抖及150万光谱镜头,支持多种拍摄场景。屏幕采用7英寸临境大屏,分辨率2760*1320,支持AI+HDR显示。通信方面支持双向北斗消息、Wi-Fi7等功能,搭载麒麟9020系列处理器,提供流畅性能。拥有曜金黑、羽衣白、金丝银锦三款配色,保留实体SIM卡槽,预计将引发市场热潮。

  • 华为Mate 70 Air配置价格公布:可选CPU 售价4199起

    华为Mate70 Air于11月6日10:08开启预售,提供麒麟9020B和9020A两款CPU版本,价格从4199元至5199元。机身仅6.6mm厚、208g重,配备7英寸OLED临境大屏,支持120Hz刷新率。影像系统包括后置四摄组合与前置1070万超广角镜头,内置6500mAh电池与66W快充。支持双向北斗卫星消息、Wi-Fi7,预装HarmonyOS 5.1系统。凭借轻薄设计、可选CPU及全面配置,有望引发市场关注。

  • Mini LED时代即将终结!MacBook Pro将升级为OLED屏

    苹果爆料人Mark Gurman透露,MacBook Pro会率先升级OLED,时间是明年下半年,然后MacBook Air再跟进OLED,时间是2028年,届时MacBook Pro和MacBook Air都将全面迈入OLED时代。 Mark Gurman指出,苹果旗下的iPad系列、MacBook机型全部都将启用OLED屏幕,包括iPad mini、MacBook Pro、iPad Air和MacBook Air,且大概率会按此顺序推进。PS:入门款iPad暂无搭载OLED的计划。 值得注意的是,MacBo

  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

  • 小米17 Ultra蓄势待发:直屏+大圆镜头 没有背屏

    据爆料,小米17+Ultra将在春节前发布,主打影像功能,配备1英寸超大底主摄和2亿像素潜望长焦,支持外挂镜头。荣耀Magic8+Ultra也可能节前亮相,而OPPO、vivo超大杯旗舰则安排在节后。小米17+Ultra正面为直屏,背部采用大圆镜头设计,无副屏,是其与Pro系列最大差异。此外,小米15+Ultra预计配备新国屏,搭载骁龙8 Gen5平台,顶配版支持双卫星通信。

  • 享受专属赛道体验服务!雷军:小米Ultra Club对所有Ultra车主开放

    小米汽车今日宣布,小米Ultra Club面向所有Ultra车主开放入会。 车主入会后可享:赛道服务、赛道专场体验、官方专属活动及专属顾问1对1服务。目前赛道服务已覆盖12个城市,车主们可结合自身需求选择加入。

  • 小米推出REDMI显示器A27Q Type-C版2026:899元支持一线通

    小米商城最新上架了一款REDMI显示器A27Q Type-C版2026”,售价899元。 27英寸IPS面板,分辨率25601440(2K),16:9显示比例,静态对比度1300:1,典型亮度300nits,响应时间6ms,支持120Hz高刷新率与178广视角。

今日大家都在搜的词: