首页 > 业界 > 关键词  > Jamba最新资讯  > 正文

AI21发布世界首个Mamba的生产级模型Jamba 支持256K上下文长度

2024-03-29 09:40 · 稿源:站长之家

站长之家(ChinaZ.com) 3月29日 消息:AI21发布了世界首个Mamba的生产级模型:Jamba。这个模型采用了开创性的SSM-Transformer架构,具有52B参数,其中12B在生成时处于活动状态。Jamba结合了Joint Attention和Mamba技术,支持256K上下文长度。单个A10080GB最多可容纳140K上下文。与Mixtral8x7B相比,长上下文的吞吐量提高了3倍。

image.png

官网:https://top.aibase.com/tool/jamba

模型地址:https://huggingface.co/ai21labs/Jamba-v0.1

Jamba代表了在模型设计上的一大创新。它结合了Mamba结构化状态空间(SSM)技术和传统的Transformer架构的元素,弥补了纯SSM模型固有的局限。Mamba是一种结构化状态空间模型(Structured State Space Model, SSM),这是一种用于捕捉和处理数据随时间变化的模型,特别适合处理序列数据,如文本或时间序列数据。SSM模型的一个关键优势是其能够高效地处理长序列数据,但它在处理复杂模式和依赖时可能不如其他模型强大。

而Transformer架构是近年来人工智能领域最为成功的模型之一,特别是在自然语言处理(NLP)任务中。它能够非常有效地处理和理解语言数据,捕捉长距离的依赖关系,但处理长序列数据时会遇到计算效率和内存消耗的问题。

Jamba模型将Mamba的SSM技术和Transformer架构的元素结合起来,旨在发挥两者的优势,同时克服它们各自的局限。通过这种结合,Jamba不仅能够高效处理长序列数据(这是Mamba的强项),还能保持对复杂语言模式和依赖关系的高度理解(这是Transformer的优势)。这意味着Jamba模型在处理需要理解大量文本和复杂依赖关系的任务时,既能保持高效率,又不会牺牲性能或精度。

举报

  • 相关推荐
  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • 当折叠屏遇上AI 探秘开发Samsung One UI 8的幕后故事

    三星One UI 8与Galaxy Z Fold7/Flip7同步亮相,深度融合折叠形态与AI技术,带来全新交互体验。通过与谷歌紧密合作,新系统首批预装Android 16,用户可提前体验最新功能。系统聚焦多模态AI、折叠屏优化UX及个性化设计,并强化安全防护。开发团队透露,三星与谷歌从早期规划便协同开发,实现高效多任务处理与创新功能,未来将继续深化AI生态合作。

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • vampir吸血鬼身份验证教程 vampir吸血鬼怎么身份验证?

    《Vampir吸血鬼》将于2025年8月26日登陆韩服开启公测,支持PC与移动端跨平台互通。本文提供详细身份验证教程:使用加速器优化网络后,通过官网注册账号,选择Netmarble ID登录,完成邮箱验证流程,输入验证码即可完成认证,助您畅享黑暗冒险之旅。

  • 泡泡玛特不止一个LABUBU

    不可否认,在本周举办的泡泡玛特中期业绩发布会上,LABUBU依然是最引人瞩目的话题中心。THE MONSTERS系列2025H1收入达到48.1亿元,同比增长668%,新品MINI LABUBU即将发售的消息也在海内外社媒引发巨大反响。 尽管位列所有IP第一,THE MONSTERS系列在总收入中的占比也刚刚接近35%。2025年H1,泡泡玛特自有IP中有5个收入超10亿,收入过亿的IP更是达到13个,这其中有MOLLY这样历经十数年的�

  • 打造高性能“AI双子星”?一月内中科曙光连发两款Nebula集群新品

    中科曙光将在2025重庆智博会发布Nebula系列AI超集群产品,基于开放架构实现算存网电冷一体化高密度设计,突破性能、密度、兼容性等瓶颈。这是继8月发布国内首个标准化超智融合算力平台Nebula800后,一月内第二次发布高性能产品。新产品将支撑大模型前沿技术创新,推动国内AI基础设施向融合化、标准化迈进,助力国家智能算力统筹部署。

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 流放之路2新赛季上线,详细steam锁国区下载体验教程

    《流放之路2》第三赛季“第三法令”将于8月29日上线,带来全新剧情探索卡鲁伊部落家园恩加玛卡努伊群岛,支持八大岛屿任意顺序挑战。新增10多个新Boss和百余种新怪物,移除“残酷难度”,角色翻滚后可进入冲刺状态,适用所有职业。宝石系统改善,可无限同类叠加和多等级升级;新增职业且职业技能全面增强。2025年8月30日至9月2日开启国际服免费畅玩活动,进度可继承�

  • AIbase资讯:每天五分钟,全面掌握AI技术变革与工具动态

    AIbase资讯平台致力于为AI从业者、创业者和技术爱好者提供全面准确的全球AI动态。平台实时监控数百个AI新闻源,覆盖技术论文、产业政策、产品更新和行业事件,确保信息跨学术、应用、技术、市场等多维度。通过专业整合和实时更新,帮助用户快速掌握大语言模型、生成式AI、计算机视觉、智能体开发等关键赛道进展。平台还提供强大的AI工具导航功能,收录大量国内外工具与应用,覆盖文本生成、图像处理、代码开发等多个类别。每日五分钟,全面了解AI动态,掌握行业关键信息。

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

今日大家都在搜的词: