首页 > 业界 > 关键词  > Jamba最新资讯  > 正文

AI21发布世界首个Mamba的生产级模型Jamba 支持256K上下文长度

2024-03-29 09:40 · 稿源:站长之家

站长之家(ChinaZ.com) 3月29日 消息:AI21发布了世界首个Mamba的生产级模型:Jamba。这个模型采用了开创性的SSM-Transformer架构,具有52B参数,其中12B在生成时处于活动状态。Jamba结合了Joint Attention和Mamba技术,支持256K上下文长度。单个A10080GB最多可容纳140K上下文。与Mixtral8x7B相比,长上下文的吞吐量提高了3倍。

image.png

官网:https://top.aibase.com/tool/jamba

模型地址:https://huggingface.co/ai21labs/Jamba-v0.1

Jamba代表了在模型设计上的一大创新。它结合了Mamba结构化状态空间(SSM)技术和传统的Transformer架构的元素,弥补了纯SSM模型固有的局限。Mamba是一种结构化状态空间模型(Structured State Space Model, SSM),这是一种用于捕捉和处理数据随时间变化的模型,特别适合处理序列数据,如文本或时间序列数据。SSM模型的一个关键优势是其能够高效地处理长序列数据,但它在处理复杂模式和依赖时可能不如其他模型强大。

而Transformer架构是近年来人工智能领域最为成功的模型之一,特别是在自然语言处理(NLP)任务中。它能够非常有效地处理和理解语言数据,捕捉长距离的依赖关系,但处理长序列数据时会遇到计算效率和内存消耗的问题。

Jamba模型将Mamba的SSM技术和Transformer架构的元素结合起来,旨在发挥两者的优势,同时克服它们各自的局限。通过这种结合,Jamba不仅能够高效处理长序列数据(这是Mamba的强项),还能保持对复杂语言模式和依赖关系的高度理解(这是Transformer的优势)。这意味着Jamba模型在处理需要理解大量文本和复杂依赖关系的任务时,既能保持高效率,又不会牺牲性能或精度。

举报

  • 相关推荐
  • AMD去年营收346亿美元创纪录!苏姿丰:我们卖爆了

    AMD公司公布2025年第四季度及全年财务报告,双双创下历史新高。 财报显示,该公司2025年第四季度营收103亿美元创纪录,同比增长34%;2025年全年,AMD实现创纪录的346亿美元营收,同比增长34%。 本季度,AMD的毛利率为54%,净利润为15亿美元。全年来看,AMD的非GAAP毛利率为52%,净利润为68亿美元。 该公司预计2026年第一季度营收约为98亿美元,上下浮动3亿美元。 AMD的数据中心业

  • ​先摆猫,再出牌:《风水喵将》现已上线Steam,首发优惠仅需22.49元

    《风水喵将》是一款以猫咪表情包为灵感的肉鸽策略卡牌游戏,现已上线Steam,售价24.99元,首发优惠价22.49元。游戏融合麻将框架、肉鸽策略与猫咪元素,玩家需在有限手牌、宝物与随机选项中权衡调整,构建不同打法思路。游戏画风抽象温馨,加入“天命肉鸽”等机制增强趣味性,无论麻将新手或老手都能快速上手,体验构筑成型与分数翻倍的爽感。

  • 拉烤签打鼠鼠,《别拽了!烤串师傅》正式上线Steam,首发仅 17.99 元

    《别拽了!烤串师傅》是一款融合塔防与自走棋养成的休闲游戏,玩家扮演烤串师傅,通过实时拖动烤签、摆放食材和调料来抵御“不速之鼠”。游戏强调即时操作与策略,食材可成长互动,随机机制增加变数。目前已在Steam上线,首周折后17.99元,支持键鼠和手柄操作,包含无尽模式。画风可爱,节奏轻快,适合寻求操作与策略结合的塔防爱好者。

  • 酷哇发布 WAM 2.0 世界模型,加速构建“自动驾驶+机器人”RoboCity 新基建

    酷哇科技发布通用世界模型底座Coowa WAM2.0,并率先实现年度EBITDA回正。公司已完成从“单点技术”向“城市通用智能”的战略跃迁,构建起“技术底座+商业规模”双轮驱动体系,开启万台级“城市新基建”规模化部署。依托三大业务矩阵(智慧出行、智慧物业、智慧城市管家),酷哇已在全球超50个城市实现商业化落地,累计安全运营里程突破500万公里。其规模化订单市场占有率约80%,一线城市业务占比从2022年的不足2%跃升至2025年的25%,客户长期价值认可度持续提升。

  • 钉钉AI群聊全面升级!每个群聊配备专属助理AI小钉

    2月6日,阿里钉钉发布8.2.10版本,宣布全面升级钉钉AI群聊。新版本为每个钉钉群配备专属AI助手“AI小钉”,实现全天候在线响应。AI小钉已上线三大功能:个性化资讯中枢、群动态智能管家、自然语言群管理。其中,群动态智能管家可定时汇总群内关键信息,自动生成日报/周报摘要,并智能识别未完成任务,定时定向提醒负责人跟进。用户只需在新建的钉钉内部群@AI小钉,即可通过自然语言对话查询聊天记录、管理任务、调整群设置等。存量钉钉内部群的群主和管理员可在群设置中添加配置AI小钉为群机器人,开启使用。

  • 打造一站式AI服务中心,这次淘宝用AI重构服务

    当一件三年前购买的冲锋衣被用户寄回,破损的口子,意味着一段户外旅程的终结。大多数商家看到的,或许是一笔需要计算的维修成本。但专业户外品牌拓路者看到了不同的东西——一个用服务兑现品牌承诺,将一次性的维修成本,转化为消费者终身信任的机会。 他们通过AI知识库匹配合适的面料批次,由老师傅修复如初,当衣服寄回时,用户留言:“我以为品牌承诺止于下

  • 闪极Loomos L1 AI拍摄眼镜:架构革新+全链路AI,助力智能穿戴升级

    闪极科技推出旗舰级Loomos L1 AI拍摄眼镜,以创新架构和前沿功能重新定义智能眼镜标准。其搭载全新凤凰架构,采用4纳米四核ARM主处理器与专业蓝牙Soc的双芯组合,解决了初代产品通话卡顿、画质不佳等问题。首创摄像头与前框解耦设计,将索尼1200万像素CMOS融入镜腿,兼顾卓越拍摄效果与美观。产品采用钛合金复合板材框架,鼻梁体感重量控制在20克以内,并提供多种时尚框型与配色。核心AI功能革新包括独家VAD主动人声识别算法,可实现全天候自动录音、拍照、录像,并实时上传云端分析,形成个人记忆库。此外,隐形镜头盖设计可一秒遮蔽摄像头,平衡拍摄便捷与隐私安全。配合多功能换电仓与降噪聚音旗等配件,满足不同场景需求。闪极L1以其极致佩戴体验和全链路AI赋能,成为内容创作者、生活记录者及办公协同者的智能伴侣。

  • 春节AI牌局,阿里跟注30亿

    互联网习惯了用短期让利换取用户行为迁移的打法,AI也染上了相似的毛病。 2月2日,阿里巴巴旗下千问APP宣布投入30亿启动春节攻势,全面接入淘宝闪购、大麦、飞猪、盒马等生态业务,以免单形式请全国用户在春节期间吃喝玩乐,并将在2月6日上线。

  • AI日报:字节发布超强视频模型Seedance2.0;小红书秘密研发AI剪辑器OpenStoryline;神秘AI模型“Pony Alpha”曝光

    本期AI日报聚焦多领域进展:字节跳动发布视频生成模型Seedance2.0,显著降低视频制作门槛;小红书研发AI视频剪辑工具OpenStoryline,支持对话式编辑;千问APP推出免单卡功能,便利年货采购;顶级域名AI.com以7000万美元成交,刷新历史纪录;神秘模型Pony Alpha因高性能免费引发关注,身份存疑;OpenAI首款AI硬件“Dime”智能耳机曝光,预计2026年发布;苹果CarPlay将支持第三方语音助手,提升交互体验;阿里新一代开源模型Qwen3.5代码现身,或为原生视觉语言模型,即将发布。

  • 千问AI购物订单9小时破1000万 创造AI购物新历史

    阿里千问APP推出春节30亿免单活动,上线9小时AI订单破千万,用户已发出超3000万次“帮我买”指令。该活动推动APP登顶苹果免费榜,形成“千元豆”格局。用户可通过AI下单奶茶、生鲜百货及年货,全国盒马门店陆续接入。此举刷新阿里春节投入纪录,成为AI春节大战中金额最大、AI含量最高的战略攻势,旨在培养全民AI使用习惯,开启AI生活购物新时代。

今日大家都在搜的词: