首页 > 业界 > 关键词  > StripedHyena-7B最新资讯  > 正文

Together AI发布AI模型StripedHyena-7B 性能超越Llama-27B

2023-12-13 17:51 · 稿源:站长之家

划重点:

1. 🌐 StripedHyena-7B引领人工智能领域,提供计算效率和性能升级的替代选择。

2. 🚀 采用独特混合结构,StripedHyena在训练、微调和生成长序列时表现出色。

3. 💡 未来研究重点:构建更大的模型、引入多模态支持、提高StripedHyena模型的性能。

站长之家(ChinaZ.com)12月13日 消息:Together AI最新发布了StripedHyena-7B,这一人工智能模型领域的创新力量引起了广泛关注。该模型的基础版本为StripedHyena-Hessian-7B(SH7B),同时还推出了聊天模型StripedHyena-Nous-7B(SH-N7B)。StripedHyena基于上一年创建的一系列有效的序列建模架构(如H3、Hyena、HyenaDNA和Monarch Mixer)的重要经验教训。

image.png

研究人员强调,StripedHyena在训练、微调和生成长序列过程中处理效率更高,具备更快的速度和更高的内存效率。通过采用独特的混合技术,StripedHyena将门控卷积和注意力结合成了所谓的Hyena运算符。在短序列任务中,包括OpenLLM排行榜任务,StripedHyena在性能上超越了Llama-27B、Yi7B以及最强大的Transformer替代品,如RWKV14B。

image.png

image.png

该模型在处理短序列任务和处理长提示的各种基准测试中都进行了评估。通过对Project Gutenberg书籍进行的困惑度缩放实验显示,困惑度在32k处饱和,或在此点以下减少,表明该模型能够从更长的提示中吸收信息。

StripedHyena通过将注意力和门控卷积组合成Hyena运算符的独特混合结构实现了高效性。研究人员采用创新的嫁接技术对这种混合设计进行了优化,使其在训练过程中能够进行体系结构修改。

研究人员强调StripedHyena的关键优势之一是其在训练、微调和生成长序列等各种任务中的提速和内存效率。在端到端训练的32k、64k和128k行上,StripedHyena相对于优化的Transformer基线(使用FlashAttention v2和自定义内核)分别提高了30%、50%和100%

未来,研究人员希望在StripedHyena模型的多个领域取得重大进展。他们计划构建更大的模型,以处理更长的上下文,拓展信息理解的界限。此外,他们计划引入多模态支持,通过允许模型处理和理解来自文本和图像等各种来源的数据,提高模型的适应性。

StripedHyena模型有望通过引入额外的计算(例如在门控卷积中使用多个头部)在性能上超越Transformer模型。这种受线性注意力启发的方法在H3和MultiHyena等架构中被证明在训练期间提高模型质量,并为推断效率提供优势。读者可以查看该项目的博客和项目详细信息,对此研究给予所有研究人员应有的赞誉。

项目网址:https://huggingface.co/togethercomputer/StripedHyena-Hessian-7B

博客:https://www.together.ai/blog/stripedhyena-7b

举报

  • 相关推荐
  • 纯白电竞房最后一块拼图,技嘉M27UP ICE与M27Q2 QD ICE显示器来袭

    技嘉推出两款纯白电竞显示器:M27UP+ ICE支持4K/160Hz与1080P/320Hz自由切换,兼顾游戏与办公;M27Q2QD+ ICE采用量子点技术,色彩表现接近OLED,支持2K/210Hz刷新率。两款均配备战术键、智能OD、黑平衡2.0等电竞功能,提供丰富接口与KVM切换,适合追求高颜值、高性能的电竞玩家与创作者。

  • 小米开启澎湃OS 3 Beta版最新招募:支持小米14、K70等机型

    小米澎湃OS 3 Beta版于9月24日启动招募,覆盖MIX Fold 4、MIX Flip、小米14 Ultra、14 Pro及钛金属版(卫星通讯)、小米14、Redmi K70系列四款机型和小米平板6S Pro 12.4共12款设备。招募采用分批推送机制,每机型设两批次,首批满员后启动第二批,入选用户优先获得更新。正式版将于10月15日推送,逐步扩大覆盖。该系统基于自研底层内核,通过深度优化微架构流水线,精准识别CPU空转,配合一体化调频技术,整体任务执行效率提升19%,带来更流畅体验。此次招募既为用户提供抢先体验机会,也通过反馈助力系统优化,强化小米生态竞争力。

  • 小米17 Pro Max首发超级像素!官方晒对比:屏幕清晰度碾压iPhone 17 Pro Max

    小米17 Pro Max屏幕技术实现重大突破:首发超级像素技术,在1.5K功耗下达到2K级清晰度,功耗降低26%。采用全新M10发光技术及国产红色发光材料,发光效率达全球顶尖水平。与iPhone 17 Pro Max对比显示,字体更清晰锐利,红色像素亮度和白色色温表现更优。该技术由小米与卢米蓝联合研发,通过独立RGB子像素设计,实现938万子像素量。这是双方OLED联合实验室的首个落地成果,标志着国产屏幕技术的重要进步。

  • 雷军:小米17 Pro Max屏幕采用超级像素技术 功耗降低26%

    小米创始人雷军近日揭晓了小米17 Pro Max在屏幕技术上的重大突破——革命性的“超级像素”技术。该技术首次在每个像素点集成RGB三个子像素,使屏幕清晰度媲美传统2K屏,同时功耗降低26%,显示效果更出色。此外,小米17系列还标配全新M10屏幕发光技术,采用国产新型红色发光主材,发光效率达全球顶尖水平。全系采用直屏设计,边框窄至1.18mm,视觉体验更出众。小米17系列将于9月25日正式亮相,雷军还将分享小米玄戒芯片和小米汽车背后的故事,引发市场期待。

  • 订单激增27%!海尔郑州热水器工厂树立智造新标杆

    热水器行业竞争日趋白热化,海尔热水器凭借压倒性优势持续领跑。2025年上半年,其零售量、零售额均稳居行业第一,零售额份额达31.4%,领先第二名近两倍,实现“断层式领先”。郑州工厂每24秒下线一台热水器,效率领先行业,订单同比增长27%,排产计划已覆盖全年。这得益于工厂全面智能化升级,通过5G云、人工智能等技术,生产效率提升39%,实现从研发到交付、从能源管理到供应链协同的全流程升级。工厂首创行业技术融合应用63项,其中工业4.0技术20项、先进制造技术43项,智能制造水平行业引领。这座“灯塔”正照亮制造业转型路径,为新型工业化注入澎湃动能。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 小米17、小米17 Pro、小米17 Pro Max官图正式公布:全系直屏 1.18mm超窄边

    小米17系列将于9月25日晚7点发布,包括标准版、Pro和Pro Max三款机型。新机采用超椭圆R角设计,边框窄至1.18mm,新增森野绿与冷烟紫配色。标准版主打轻薄质感,Pro系列首搭妙享背屏,主打科技影像,搭载新一代屏幕技术。全系标配骁龙8E5处理器,256GB起,售价从4.5K起,Pro Max定位6K+市场,后续Ultra版或探至7K档。

  • 三年内被父母安排20多次相亲 27岁小伙患上“惊恐障碍”

    27 岁的淮安男子,因父母三年间密集安排的 20 余次相亲,被催婚焦虑”压垮,患上惊恐障碍”,如今正在当地医院接受正规治疗。 据报道,作为家中独子,男子成长中一直受父母强势管教。中专毕业后,他没走父母期待的安稳路,而是和朋友合伙做生意,自食其力。 然而,在父母看来,27 岁的他成家”才是头等大事。 三年前,父母未与男子多商量,便托亲朋好友四处打听�

  • iPhone 17首销调研:Pro机型与512GB存储占主流,京东首销日送达超3万台

    iPhone17系列发布引发市场热潮,Pro机型与512GB存储成主流选择,超六成用户倾向高端配置。京东平台凭借现货充足与极速配送优势,占据72.83%线上份额,成为核心购机渠道。用户换机主要动力为苹果生态体验(30.68%)与新功能升级(28.36%),消费行为更趋理性,注重价格对比与实测评价。“加量不加价”策略有效刺激需求,AI功能期待度高涨。首日超3万用户签收,以旧换新量达去年同期4倍。

  • 雷军调查小米17系列哪款最受关注:小米17 Pro Max遥遥领先

    小米17系列将于9月25日雷军年度演讲上发布,首次同时推出三款机型:小米17、小米17 Pro和小米17 Pro Max。其中,小米17为小米15的正统迭代,小米17 Pro为新增型号,配备6.3英寸小直屏但配置全面Pro化;小米17 Pro Max则在Pro基础上进一步强化影像和续航。三款机型均配备妙享背屏,支持倒计时、音乐控制等丰富交互功能。雷军投票显示,大屏版小米17 Pro Max最受关注。购买建议:标准版适合注重手感用户,Pro版适合追求旗舰体验的小屏用户,Pro Max则适合想要极致科技体验的大屏爱好者。

今日大家都在搜的词: