首页 > 业界 > 关键词  > Jamba最新资讯  > 正文

AI21发布世界首个Mamba的生产级模型Jamba 支持256K上下文长度

2024-03-29 09:40 · 稿源:站长之家

站长之家(ChinaZ.com) 3月29日 消息:AI21发布了世界首个Mamba的生产级模型:Jamba。这个模型采用了开创性的SSM-Transformer架构,具有52B参数,其中12B在生成时处于活动状态。Jamba结合了Joint Attention和Mamba技术,支持256K上下文长度。单个A10080GB最多可容纳140K上下文。与Mixtral8x7B相比,长上下文的吞吐量提高了3倍。

image.png

官网:https://top.aibase.com/tool/jamba

模型地址:https://huggingface.co/ai21labs/Jamba-v0.1

Jamba代表了在模型设计上的一大创新。它结合了Mamba结构化状态空间(SSM)技术和传统的Transformer架构的元素,弥补了纯SSM模型固有的局限。Mamba是一种结构化状态空间模型(Structured State Space Model, SSM),这是一种用于捕捉和处理数据随时间变化的模型,特别适合处理序列数据,如文本或时间序列数据。SSM模型的一个关键优势是其能够高效地处理长序列数据,但它在处理复杂模式和依赖时可能不如其他模型强大。

而Transformer架构是近年来人工智能领域最为成功的模型之一,特别是在自然语言处理(NLP)任务中。它能够非常有效地处理和理解语言数据,捕捉长距离的依赖关系,但处理长序列数据时会遇到计算效率和内存消耗的问题。

Jamba模型将Mamba的SSM技术和Transformer架构的元素结合起来,旨在发挥两者的优势,同时克服它们各自的局限。通过这种结合,Jamba不仅能够高效处理长序列数据(这是Mamba的强项),还能保持对复杂语言模式和依赖关系的高度理解(这是Transformer的优势)。这意味着Jamba模型在处理需要理解大量文本和复杂依赖关系的任务时,既能保持高效率,又不会牺牲性能或精度。

举报

  • 相关推荐
  • 你多少级了!全球首位QQ 256级用户诞生 腾讯公关总监:我自愧弗如

    今天腾讯官方公众号发布消息表示,QQ昵称为爱芥末”的用户,成为了全球拥有时光企鹅”等级图标的第一人。据悉,这是全球首位QQ 256级用户。 腾讯表示,为感谢这一路的深情陪伴,将给@爱芥末送出限量版专属神秘惊喜、终身SVIP会员、多款专属个性化装扮等礼物作为纪念礼物。 随后,这个消息就登上了热搜,不少网友纷纷送上了祝贺,而大家也开始晒出了自己的QQ等级,�

  • 行业首个!海尔智家ESG实践成复旦MBA研究课题

    6月17日,复旦MBA iLab项目举行终期汇报,28个项目涵盖科创管理、ESG等四大领域。海尔智家作为家电行业首个入选案例,其ESG实践获师生高度评价。海尔通过绿色产品创新、全球公益联动和投资者沟通等举措,连续四年稳居《财富》中国ESG影响力行业榜首。未来,海尔将持续深化ESG战略,推动行业可持续发展。

  • 模型驱动AI赋能:慧点科技2025用户大会成功举办

    2025年6月20日,慧点科技在中国电科太极信息科技产业园成功举办年度用户大会。大会以"模型驱动,AI赋能"为主题,探讨人工智能在企业管理和数字化转型中的应用。太极股份副总裁韩建国分析了数据要素在数字经济发展中的关键作用,多位专家分享了AI在审计、办公等领域的创新实践。慧点科技推出"慧珠"信创私域智能体平台,覆盖OA、风控等核心场景,助力企业构建智能化运营生态。会议还设置专题培训,深入讲解大模型技术、数字员工构建等前沿话题,为政企客户提供从理论到实践的数字化转型路径参考。

  • 2025年高考数学新一卷上热搜:6个AI大模型宣布挑战 谁更强?

    近日,随着高考的落幕,一场别样的“高考”也在各大AI大模型之间展开。此次测试邀请了多家知名科技公司的大模型,参与2025年数学新课标Ⅰ卷中的14道客观题测试,以此检验它们在逻辑推理和数学能力上的表现。测试题目包括8道单选题、3道多选题和3道填空题,满分73分,测试过程严格遵循高考判分原则。 测试结果显示,字节跳动的豆包和腾讯的元宝(T1)以68分的总成绩�

  • vivo WATCH 5 eSIM版6月25日发布:支持独立通信

    今日,vivo正式宣布其智能手表系列的新成员——vivo WATCH5eSIM版将于6月25日正式发布。该版本在原有vivo WATCH5的基础上进行了功能升级,新增了eSIM通信功能,让用户在户外运动时无需携带手机,即可实现独立接打电话和联网操作。 除了独立通信功能外,vivo WATCH5eSIM版还特别加入了专业网球模式。这一模式不仅提供上挥拍指导,还能对用户的球风进行鉴定,并统计专业数

  • 拼多多发布2025Q1财报:营收956.7亿元 经调后净利润169.2亿元

    拼多多2025年Q1财报显示:营收956.7亿元,同比增长10%;调整后净利润169.2亿元。平台推出"千亿扶持"新战略,通过"百亿减免"等举措降低商家成本,推动产业转型。成立"商家权益保护委员会",建立常态化交流机制和违规预警功能。同时探索"平台直补"创新模式,通过价格补贴普惠消费者,助力商家提升市场竞争力。CEO陈磊表示,短期投资虽影响盈利,但为商家和消费者创造长期价值,实现平台健康发展。

  • MAXHUB亮相2025MWC上海,多场景打造行业数字化新应用

    2025年6月18日,MWC上海世界移动通信大会开幕。MAXHUB与中国移动合作推出云视讯智慧屏,集成书写、展示、远程通讯与AI会议等功能,支持高清视频会议、软终端接入等多种通信形式,采用双重加密保障数据安全。同时展示全系列云电脑终端产品,覆盖教育、金融等多场景需求。在教育领域推出智慧教育解决方案,通过"小屏控大屏"功能增强课堂互动性。MAXHUB将持续深化与运营商合作,围绕AI、云计算等技术,开发适配政务、企业、教育等行业的数字化解决方案,助力构建更丰富的数智化生态。

  • 6个AI大模型大战2025年高考数学新一卷:数学题推理能力均显著提升

    ​近日,随着高考的圆满结束,一场别开生面的“数学擂台赛”在各大AI大模型间悄然展开。多家知名科技公司的大模型被邀请参与2025年数学新课标Ⅰ卷中的14道客观题测试,以此检验它们在逻辑推理和数学能力上的实力。此次测试题目包含8道单选题、3道多选题以及3道填空题,满分设定为73分,且测试过程严格遵循高考判分原则,确保结果的公正性与准确性。 测试成绩揭晓�

  • vivo X Fold 5大折叠官宣6月25日发布

    今日,vivo官方微博正式宣布,将于6月25日举办新品发布会。此次发布会,vivo将带来两款备受关注的新品——折叠屏旗舰vivo X Fold5以及半入耳降噪耳机vivo TWS Air3Pro。 而作为此次发布会的重头戏之一,vivo X Fold5折叠屏手机备受瞩目。其宣传语为“更轻了,更强了”,预示着这款新机将在轻薄与性能方面实现新的突破。据悉,vivo X Fold5将打破此前X Fold3保持的219g全球最轻大折叠手�

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。