首页 > 业界 > 关键词  > StripedHyena-7B最新资讯  > 正文

Together AI发布AI模型StripedHyena-7B 性能超越Llama-27B

2023-12-13 17:51 · 稿源:站长之家

划重点:

1. 🌐 StripedHyena-7B引领人工智能领域,提供计算效率和性能升级的替代选择。

2. 🚀 采用独特混合结构,StripedHyena在训练、微调和生成长序列时表现出色。

3. 💡 未来研究重点:构建更大的模型、引入多模态支持、提高StripedHyena模型的性能。

站长之家(ChinaZ.com)12月13日 消息:Together AI最新发布了StripedHyena-7B,这一人工智能模型领域的创新力量引起了广泛关注。该模型的基础版本为StripedHyena-Hessian-7B(SH7B),同时还推出了聊天模型StripedHyena-Nous-7B(SH-N7B)。StripedHyena基于上一年创建的一系列有效的序列建模架构(如H3、Hyena、HyenaDNA和Monarch Mixer)的重要经验教训。

image.png

研究人员强调,StripedHyena在训练、微调和生成长序列过程中处理效率更高,具备更快的速度和更高的内存效率。通过采用独特的混合技术,StripedHyena将门控卷积和注意力结合成了所谓的Hyena运算符。在短序列任务中,包括OpenLLM排行榜任务,StripedHyena在性能上超越了Llama-27B、Yi7B以及最强大的Transformer替代品,如RWKV14B。

image.png

image.png

该模型在处理短序列任务和处理长提示的各种基准测试中都进行了评估。通过对Project Gutenberg书籍进行的困惑度缩放实验显示,困惑度在32k处饱和,或在此点以下减少,表明该模型能够从更长的提示中吸收信息。

StripedHyena通过将注意力和门控卷积组合成Hyena运算符的独特混合结构实现了高效性。研究人员采用创新的嫁接技术对这种混合设计进行了优化,使其在训练过程中能够进行体系结构修改。

研究人员强调StripedHyena的关键优势之一是其在训练、微调和生成长序列等各种任务中的提速和内存效率。在端到端训练的32k、64k和128k行上,StripedHyena相对于优化的Transformer基线(使用FlashAttention v2和自定义内核)分别提高了30%、50%和100%

未来,研究人员希望在StripedHyena模型的多个领域取得重大进展。他们计划构建更大的模型,以处理更长的上下文,拓展信息理解的界限。此外,他们计划引入多模态支持,通过允许模型处理和理解来自文本和图像等各种来源的数据,提高模型的适应性。

StripedHyena模型有望通过引入额外的计算(例如在门控卷积中使用多个头部)在性能上超越Transformer模型。这种受线性注意力启发的方法在H3和MultiHyena等架构中被证明在训练期间提高模型质量,并为推断效率提供优势。读者可以查看该项目的博客和项目详细信息,对此研究给予所有研究人员应有的赞誉。

项目网址:https://huggingface.co/togethercomputer/StripedHyena-Hessian-7B

博客:https://www.together.ai/blog/stripedhyena-7b

举报

  • 相关推荐
  • 华为Mate X7首发定制20GB内存:本月见

    博主定焦数码爆料,华为Mate X7将会首发定制20GB超大内存,这是华为史上内存最大的折叠屏旗舰。 在AI时代,AI手机需要充足的运行内存,运行内存可以随时读写,其响应速度比硬盘等长期存储介质快得多。因此,若想实现手机快速调用AI功能的效果,最高效的方法是让AI模型一直在运行内存中加载,即时刻准备着”。 这次华为Mate X7配备了20GB超大内存,比安卓阵营普遍采用的1

  • 华为Mate 80系列、Mate X7定档11月25日发布

    华为将于11月25日14:30举行新品发布会,推出Mate80系列和Mate X7折叠旗舰。Mate80系列包括四款机型,搭载全新麒麟9030处理器和鸿蒙OS6系统,性能与流畅度显著提升,并提供多样配色。Mate X7配备7.95英寸2K内屏,采用UTG超薄柔性玻璃,搭载麒麟9030处理器,电池容量更大,影像能力升级,拥有五款时尚配色。新品引发科技圈和消费者高度期待。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 华为年度机皇!Mate 80 RS非凡大师亮相:首发20GB内存、双潜望长焦镜头

    今日,华为Mate 80系列宣布定档11月25日发布,目前已在华为商城上架,将于今天中午12:08开启预订。 华为商城显示,作为华为最顶级的高端旗舰,华为Mate 80 RS非凡大师首发20GB内存,这是华为内存最大的旗舰手机,比安卓阵营普遍采用的16GB内存更大。

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • 微星B850 GAMING PLUS WIFI PZ背插主板上市,畅享AM5平台

    微星11月中旬发布B850GAMING PLUS WIFI PZ背插主板,采用纯白PCB搭配蓝色氛围灯条,支持AMD AM5平台,首发价1699元。主板配备12+2+1相供电与双8Pin接口,支持DDR5内存超频至8200MT/s,搭载PCIe 5.0显卡插槽和3组M.2接口(含Gen5)。具备Wi-Fi7与5G有线网卡,通过背插设计隐藏线材,适合打造白色主题主机。在保留核心性能的同时,为主流用户提供了兼顾美观与性价比的AM5平台装机选择。

  • 你听歌用哪个App!腾讯音乐发财报:净利润大增超27% 付费用户越来越多

    腾讯音乐发布了今年第三季度的财报,营收和净利润又大增。 按照官方公布的数据,2025年第三季度,腾讯音乐总收入为84.6亿元,同比增长20.6%,调整后净利润为24.8亿元,同比增长27.7%。 其中,在线音乐业务持续驱动腾讯音乐增长,第三季度,在线音乐服务收入同比增长27.2%至69.7亿元,单个付费用户月均收入从2024年同期的10.8元增长至11.9元。 取得如此成绩,腾讯音乐表示,�

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • 华为Mate X7开启预订:全系配色、存储方案公布

    华为新一代折叠屏旗舰Mate X7今日开启预订,11月25日正式发布。提供曜石黑、云锦蓝等五款配色,存储含标准版(12GB+256GB/512GB)与典藏版(16GB+512GB/1TB)。影像系统搭载第二代红枫技术,配备5000万像素三摄模组。核心采用麒麟9030系列芯片,典藏版升级至9030 Pro。全新折叠架构支持IP58/59防护,实现抗跌落、抗冲击等全面升级,重新定义折叠旗舰标准。

  • 华为Mate X7外观公布 搭载全新折叠玄武架构

    华为Mate X7折叠屏手机正式亮相,搭载全新超可靠折叠玄武架构,通过80℃热水喷淋、铁球冲击及弯折测试等极限可靠性检测,抗跌落、抗冲击及抗热水性能全面升级。支持IP58/IP59级别防尘抗水,典藏版外屏采用第二代玄武钢化昆仑玻璃,抗摔性能更出色。延续后置四摄与闪光灯布局,影像系统升级至5000万像素可变光圈主摄和潜望长焦镜头,硬件配置麒麟9030芯片,提供12GB/16GB/20GB多种内存版本,满足不同使用需求。

今日大家都在搜的词: