蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K，混合注意力+MoE架构重塑长文本编程效率

2025-10-28 17:05 · 来源： AIbase基地

在AI大模型竞争白热化的当下，高效推理与长上下文处理已成为开发者痛点。近日，蚂蚁集团旗下百灵大模型团队正式开源Ring-flash-linear-2.0-128K，一款专为超长文本编程设计的创新模型。该模型以混合线性注意力机制和稀疏MoE架构为核心，激活仅6.1B参数即媲美40B密集模型，在代码生成、智能代理等领域实现SOTA（最优）表现。AIbase基于Hugging Face官方发布与技术报告独家解析其突破性亮点，助力开发者拥抱“高效AI编程”新时代。

创新架构:线性+标准注意力混合，MoE优化平衡性能与效率

Ring-flash-linear-2.0-128K基于Ling-flash-base-2.0迭代升级，总参数规模达104B，但通过1/32专家激活比率和多任务处理层（MTP）等优化，仅激活6.1B参数(非嵌入4.8B)，实现近线性时间复杂度和常量空间复杂度。核心亮点在于混合注意力机制:主干采用自研线性注意力融合模块，辅以少量标准注意力，专为长序列计算提效。相比传统模型，该架构在H20硬件上支持128K上下文下200+ token/s生成速度，日常使用提速3倍以上，完美适配资源受限场景。

训练升级:1T令牌额外微调+RL稳定，复杂推理能力跃升SOTA

模型从Ling-flash-base-2.0转换而来，进一步在额外1T令牌高质量数据集上训练，结合稳定监督微调（SFT）和多阶段强化学习(RL)，攻克MoE长链推理训练不稳定难题。得益于蚂蚁自研“棒冰(icepop)”算法，该模型在高难度任务中展现卓越稳定性:在AIME2025数学竞赛获86.98高分，CodeForces编程Elo达90.23，逻辑推理与创意写作v3均超40B以下密集模型(如Qwen3-32B)。基准测试显示，它不仅匹敌标准注意力模型(如Ring-flash-2.0)，还在多项开源MoE/Dense模型中拔得头筹。

长上下文黑科技:原生128K+YaRN扩展至512K，长输入输出零卡顿

针对编程痛点，Ring-flash-linear-2.0-128K原生支持128K上下文窗口，开发者可通过YaRN外推技术轻松扩展至512K。在长形式输入/输出场景中，预填充（Prefill）阶段吞吐量较Qwen3-32B提升近5倍，解码(Decode)阶段达10倍加速。实测显示，在32K+上下文编程任务中，模型保持高精确度，无“穿模”或漂浮感问题，特别适用于前端开发、结构化代码生成和代理模拟等复杂场景。

开源即用:Hugging Face+ModelScope双平台部署，零门槛上手指南

为加速社区落地，百灵团队已将模型权重同步开源至Hugging Face与ModelScope，支持BF16/FP8格式。安装依赖后，即可通过Transformers、SGLang或vLLM框架一键加载:

- Hugging Face示例:pip install flash-linear-attention==0.3.2transformers==4.56.1，加载后直接generate长代码提示。

- vLLM在线推理:tensor-parallel-size4下，GPU利用率90%，支持API调用。

技术报告详见arXiv（https://arxiv.org/abs/2510.19338），开发者可立即下载体验。

MoE线性注意力时代开启，蚂蚁百灵领跑高效编程AI

此次开源标志着蚂蚁百灵在“MoE+长思维链+RL”路线上的新突破，从Ling2.0系列到Ring-linear，效率提升7倍不止。AIbase认为，在成本仅1/10的长文本推理浪潮中，该模型将重塑开发者生态:编程小白可秒生复杂脚本，代理系统更智能，企业级应用零门槛部署。未来，随着Ring-1T万亿级旗舰跟进，国产MoE或将主导全球高效AI赛道。

结语

Ring-flash-linear-2.0-128K以“小激活大性能”诠释AI开源新范式，为超长编程注入强劲引擎。开发者们，速上Hugging Face/ModelScope试水吧!AIbase将追踪其社区迭代动态。

相关推荐

DeepSeek开源3B OCR模型：长文本识别达97%精度

DeepSeek在GitHub开源新一代OCR模型，采用创新光学二维映射压缩技术，在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌，较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率，显著优于同类模型。该技术路径为OCR系统小型化提供解决方案，其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

DeepSeek-OCR 光学二维映射压缩长文本识别
荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
豆包语音合成模型 2.0 重磅升级，语义理解 + 情感演绎双突破

10月16日，火山引擎升级豆包语音合成模型2.0与声音复刻模型2.0。新模型基于大语言模型架构，具备深度语义理解能力，实现从文本朗读到情感表达的进化。对话式合成支持多轮交互，声音复刻仅需5秒即可还原音色。针对教育场景优化，复杂公式符号朗读准确率达90%，覆盖数学、化学等全学科。目前模型已在火山引擎语音平台上线，为OPPO、Keep等客户提供多场景语音服务。

语音合成声音复刻语义理解
百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

10月28日，百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测（MTP）技术代码。该技术通过批量生成和集中验证机制，使模型解码吞吐量提升超2倍，突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配，并经过百度内部业务验证，开发者可"开箱即用"获得稳定可靠的推理加速能力。

百度智能云 DeepSeek-V3.2 MTP技术
唯卓仕发布 EVO 系列 85mm F2.0 镜头：在画质、便携与价格三重维度重塑基础

唯卓仕于2025年10月20日发布EVO系列首款镜头AF85mm F2.0 EVO，主打"本质进化"理念，旨在平衡画质与便携性。该镜头以1299元定价直面竞争激烈的85mm人像市场，通过F2.0全开即锐的光学性能、420g超轻量化设计、卓越的色散控制三大核心优势，实现与同级产品的差异化竞争。配合同步亮相的AF50mm F1.4 Pro，形成"Pro系列探索技术极限，EVO系列打磨基础体验"的双系列战略布局。

唯卓仕 AF85mm F2.0EVO
卢伟冰：REDMI K90标准版12+512首销月直降300 售价2899元

10月24日，小米集团总裁卢伟冰宣布Redmi K90标准版12GB+512GB版本首销月直降300元，售价调整为2899元。此次调价迅速引发行业关注，卢伟冰称源于对用户反馈的深度回应，尤其针对存储成本上涨压力。该机型搭载旗舰级屏幕、处理器及影像系统，配备7100mAh电池与100W快充，支持IP68/69防水等高阶配置，在3000元价位段形成显著竞争力。

小米 REDMI K90
逗哥配音团队：以硬核技术铺就AI创作未来，重塑短视频创作生态

逗哥配音平台凭借AI语音技术革新，为短视频创作者提供全方位赋能。平台集成上千款覆盖多年龄风格的真人声音资源，支持多语言合成，具备媲美真人的情感表达能力。其核心功能包括AI角色分配、5秒极速克隆及20项精细调节工具，结合去水印、字幕生成等实用功能，实现一站式创作。已获超百位大V推荐，用户量破千万，累计播放量达十万亿级，显著降低创作门槛，助力各领域内容生产。团队将持续优化技术，拓展功能生态。

AI配音内容创作语音合成
颠覆行业！欧税通上线LinkSafe，用AI重新定义跨境合规！

欧税通推出业内首款AI智能合规检测工具LinkSafe，通过"一个链接"输入即可秒级检测产品在全球200多个国家地区的合规性。该工具融合全球合规数据库与AI技术，覆盖税务、知识产权等六大维度，精准识别10万+法规条文和50万+高风险关键词，可视化呈现风险图谱并提供整改建议，帮助跨境卖家从被动应对转向主动防范，显著降低合规成本与风险。
REDMI K90标准版12+512GB降价300元小米回应：可退差价

10月24日，Redmi K90系列手机正式发布，起售价2599元。其中12+512GB主力版本原价3199元，但小米合伙人卢伟冰次日宣布首销月限时优惠300元，调整后售价2899元。卢伟冰解释称，团队关注到用户对标准版定价的反馈，上游成本压力确实影响新品定价，但小米选择倾听用户声音，特别针对需求最大的12+512GB版本进行价格调整。线下用户需在24小时内完成价保申请，线上用户可通过电商平台直接申请价保服务。

REDMI K90 手机降价

今日大家都在搜的词：

热文

3 天
7天

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K，混合注意力+MoE架构重塑长文本编程效率

DeepSeek开源3B OCR模型：长文本识别达97%精度

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

豆包语音合成模型 2.0 重磅升级，语义理解 + 情感演绎双突破

百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

唯卓仕发布 EVO 系列 85mm F2.0 镜头：在画质、便携与价格三重维度重塑基础

卢伟冰：REDMI K90标准版12+512首销月直降300 售价2899元

逗哥配音团队：以硬核技术铺就AI创作未来，重塑短视频创作生态

颠覆行业！欧税通上线LinkSafe，用AI重新定义跨境合规！

REDMI K90标准版12+512GB降价300元小米回应：可退差价

今日大家都在搜的词：

热文

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

华为MatePad Pro流金典藏版开卖：售价7799元

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

一加Ace 6开启预售：售价2599元起

华为MatePad Mini典藏版今日开售：售价5999元起

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

一加15今晚发布定位全能水桶机

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

REDMI K90标准版12+512GB降价300元小米回应：可退差价

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

小米汽车发布跨年购置税补贴方案至高不超15000元

站长商机