首页 > AI头条  > 正文

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K,混合注意力+MoE架构重塑长文本编程效率

2025-10-28 17:05 · 来源: AIbase基地

在AI大模型竞争白热化的当下,高效推理与长上下文处理已成为开发者痛点。近日,蚂蚁集团旗下百灵大模型团队正式开源Ring-flash-linear-2.0-128K,一款专为超长文本编程设计的创新模型。该模型以混合线性注意力机制和稀疏MoE架构为核心,激活仅6.1B参数即媲美40B密集模型,在代码生成、智能代理等领域实现SOTA(最优)表现。AIbase基于Hugging Face官方发布与技术报告独家解析其突破性亮点,助力开发者拥抱“高效AI编程”新时代。

image.png

 创新架构:线性+标准注意力混合,MoE优化平衡性能与效率

Ring-flash-linear-2.0-128K基于Ling-flash-base-2.0迭代升级,总参数规模达104B,但通过1/32专家激活比率和多任务处理层(MTP)等优化,仅激活6.1B参数(非嵌入4.8B),实现近线性时间复杂度和常量空间复杂度。核心亮点在于混合注意力机制:主干采用自研线性注意力融合模块,辅以少量标准注意力,专为长序列计算提效。相比传统模型,该架构在H20硬件上支持128K上下文下200+ token/s生成速度,日常使用提速3倍以上,完美适配资源受限场景。

 训练升级:1T令牌额外微调+RL稳定,复杂推理能力跃升SOTA

模型从Ling-flash-base-2.0转换而来,进一步在额外1T令牌高质量数据集上训练,结合稳定监督微调(SFT)和多阶段强化学习(RL),攻克MoE长链推理训练不稳定难题。得益于蚂蚁自研“棒冰(icepop)”算法,该模型在高难度任务中展现卓越稳定性:在AIME2025数学竞赛获86.98高分,CodeForces编程Elo达90.23,逻辑推理与创意写作v3均超40B以下密集模型(如Qwen3-32B)。基准测试显示,它不仅匹敌标准注意力模型(如Ring-flash-2.0),还在多项开源MoE/Dense模型中拔得头筹。

image.png

 长上下文黑科技:原生128K+YaRN扩展至512K,长输入输出零卡顿

针对编程痛点,Ring-flash-linear-2.0-128K原生支持128K上下文窗口,开发者可通过YaRN外推技术轻松扩展至512K。在长形式输入/输出场景中,预填充(Prefill)阶段吞吐量较Qwen3-32B提升近5倍,解码(Decode)阶段达10倍加速。实测显示,在32K+上下文编程任务中,模型保持高精确度,无“穿模”或漂浮感问题,特别适用于前端开发、结构化代码生成和代理模拟等复杂场景。

 开源即用:Hugging Face+ModelScope双平台部署,零门槛上手指南

为加速社区落地,百灵团队已将模型权重同步开源至Hugging Face与ModelScope,支持BF16/FP8格式。安装依赖后,即可通过Transformers、SGLang或vLLM框架一键加载:  

- Hugging Face示例:pip install flash-linear-attention==0.3.2transformers==4.56.1,加载后直接generate长代码提示。  

- vLLM在线推理:tensor-parallel-size4下,GPU利用率90%,支持API调用。  

技术报告详见arXiv(https://arxiv.org/abs/2510.19338),开发者可立即下载体验。

 MoE线性注意力时代开启,蚂蚁百灵领跑高效编程AI

此次开源标志着蚂蚁百灵在“MoE+长思维链+RL”路线上的新突破,从Ling2.0系列到Ring-linear,效率提升7倍不止。AIbase认为,在成本仅1/10的长文本推理浪潮中,该模型将重塑开发者生态:编程小白可秒生复杂脚本,代理系统更智能,企业级应用零门槛部署。未来,随着Ring-1T万亿级旗舰跟进,国产MoE或将主导全球高效AI赛道。

结语  

Ring-flash-linear-2.0-128K以“小激活大性能”诠释AI开源新范式,为超长编程注入强劲引擎。开发者们,速上Hugging Face/ModelScope试水吧!AIbase将追踪其社区迭代动态。

  • 相关推荐
  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 豆包语音合成模型 2.0 重磅升级,语义理解 + 情感演绎双突破

    10月16日,火山引擎升级豆包语音合成模型2.0与声音复刻模型2.0。新模型基于大语言模型架构,具备深度语义理解能力,实现从文本朗读到情感表达的进化。对话式合成支持多轮交互,声音复刻仅需5秒即可还原音色。针对教育场景优化,复杂公式符号朗读准确率达90%,覆盖数学、化学等全学科。目前模型已在火山引擎语音平台上线,为OPPO、Keep等客户提供多场景语音服务。

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • 唯卓仕发布 EVO 系列 85mm F2.0 镜头:在画质、便携与价格三重维度重塑基础

    唯卓仕于2025年10月20日发布EVO系列首款镜头AF85mm F2.0 EVO,主打"本质进化"理念,旨在平衡画质与便携性。该镜头以1299元定价直面竞争激烈的85mm人像市场,通过F2.0全开即锐的光学性能、420g超轻量化设计、卓越的色散控制三大核心优势,实现与同级产品的差异化竞争。配合同步亮相的AF50mm F1.4 Pro,形成"Pro系列探索技术极限,EVO系列打磨基础体验"的双系列战略布局。

  • 卢伟冰:REDMI K90标准版12+512首销月直降300 售价2899元

    10月24日,小米集团总裁卢伟冰宣布Redmi K90标准版12GB+512GB版本首销月直降300元,售价调整为2899元。此次调价迅速引发行业关注,卢伟冰称源于对用户反馈的深度回应,尤其针对存储成本上涨压力。该机型搭载旗舰级屏幕、处理器及影像系统,配备7100mAh电池与100W快充,支持IP68/69防水等高阶配置,在3000元价位段形成显著竞争力。

  • 逗哥配音团队:以硬核技术铺就AI创作未来,重塑短视频创作生态

    逗哥配音平台凭借AI语音技术革新,为短视频创作者提供全方位赋能。平台集成上千款覆盖多年龄风格的真人声音资源,支持多语言合成,具备媲美真人的情感表达能力。其核心功能包括AI角色分配、5秒极速克隆及20项精细调节工具,结合去水印、字幕生成等实用功能,实现一站式创作。已获超百位大V推荐,用户量破千万,累计播放量达十万亿级,显著降低创作门槛,助力各领域内容生产。团队将持续优化技术,拓展功能生态。

  • 颠覆行业!欧税通上线LinkSafe,用AI重新定义跨境合规!

    欧税通推出业内首款AI智能合规检测工具LinkSafe,通过"一个链接"输入即可秒级检测产品在全球200多个国家地区的合规性。该工具融合全球合规数据库与AI技术,覆盖税务、知识产权等六大维度,精准识别10万+法规条文和50万+高风险关键词,可视化呈现风险图谱并提供整改建议,帮助跨境卖家从被动应对转向主动防范,显著降低合规成本与风险。

  • REDMI K90标准版12+512GB降价300元 小米回应:可退差价

    10月24日,Redmi K90系列手机正式发布,起售价2599元。其中12+512GB主力版本原价3199元,但小米合伙人卢伟冰次日宣布首销月限时优惠300元,调整后售价2899元。卢伟冰解释称,团队关注到用户对标准版定价的反馈,上游成本压力确实影响新品定价,但小米选择倾听用户声音,特别针对需求最大的12+512GB版本进行价格调整。线下用户需在24小时内完成价保申请,线上用户可通过电商平台直接申请价保服务。

今日大家都在搜的词: