首页 > AI头条  > 正文

​硅基流动上线蚂蚁百灵团队 Ling-flash-2.0,推理速度再创新高

2025-09-18 10:55 · 来源: AIbase基地

近日,硅基流动大模型服务平台正式上线了蚂蚁集团百灵团队最新开源的 Ling-flash-2.0,这是该平台上线的第130个模型。

Ling-flash-2.0是一款基于 MoE 架构的大型语言模型,拥有100亿参数,并且在激活时仅使用6.1亿参数(非嵌入激活4.8亿)。经过20TB 以上高质量语料的预训练、监督微调和多阶段强化学习,该模型在激活6亿以上参数的情况下,展现出了媲美40亿参数 Dense 模型的卓越性能。

image.png

Ling-flash-2.0在复杂推理、代码生成和前端研发等领域表现出色,能够支持最大128K 的上下文长度,给用户提供更强大的文本处理能力。其定价也相对亲民,输入为每百万个 Token1元,输出为每百万个 Token4元。同时,国内和国际站的新用户可分别获得14元或1美元的使用体验赠金。

Ling-flash-2.0在性能上具有明显优势。与40亿参数以下的 Dense 模型(如 Qwen3-32B-Non-Thinking 和 Seed-OSS-36B-Instruct)以及更大激活参数的 MoE 模型(如 Hunyuan-A13B-Instruct 和 GPT-OSS-120B/low)相比,Ling-flash-2.0展现了更强的复杂推理能力。尤其在创作类任务中,该模型同样具有很强的竞争力。

此外,Ling-flash-2.0的架构经过精心设计,能够实现极速推理。在 Ling Scaling Laws 的指导下,Ling2.0采用了1/32激活比例的 MoE 架构,并在多个细节上进行了优化,这使得小激活的 MoE 模型能够获得相当于 Dense 架构的性能优势。通过 H20进行部署时,Ling-flash-2.0的输出速度可达到每秒200多个 Token,相比36B 的 Dense 模型提升了3倍以上的速度。

硅基流动平台致力于为开发者提供快速、经济、可靠的大模型 API 服务。除了 Ling-flash-2.0,平台上还汇聚了多种语言、图像、音频、视频等模型,满足开发者不同的需求。开发者可以在平台上自由对比和组合各类模型,轻松调用高效的 API,助力生成式 AI 应用的最佳实践。

国内站在线体验

https://cloud.siliconflow.cn/models

国际站在线体验

https://cloud.siliconflow.com/models

划重点:

🌟 Ling-flash-2.0是基于 MoE 架构的100亿参数语言模型,具备强大的复杂推理能力。

⚡ 模型支持最大128K 的上下文长度,提供极速推理体验,输出速度可达每秒200+Token。

💰 新用户可在国内和国际站获得使用体验赠金,硅基流动平台提供多种大模型服务,助力开发者创新。

  • 相关推荐
  • 小鹏汽车史上最强财报!单季度销量、营收、毛利率全创新高

    小鹏汽车2025年第三季度财报显示:营收203.8亿元,同比增101.8%;汽车销售收入180.5亿元,同比增105.3%。净亏损大幅收窄至3.8亿元,毛利率提升至20.1%。季度交付量达11.6万辆,同比增149.3%;年内累计交付35.5万辆,实现翻倍增长。现金储备增至483.3亿元。预计第四季度交付12.5-13.2万辆,同比增长36.6%-44.3%。

  • 海尔智家三季报业绩再创新高:数字化全流程与爆款双引擎驱动

    在“以旧换新”政策热度趋弱、行业普遍增长焦虑的背景下,海尔智家2025年前三季度营收与利润持续增长,创历史新高。其核心优势在于全流程数字化变革:通过数字库存模式提升周转效率,精准营销降低获客成本,智能制造快速响应需求。同时,海外市场多点开花,欧洲份额领先,东南亚增速超15%。数字化非选择题而是必选项,长期坚持变革助力企业在不确定中实现确定性增长。

  • Shure IntelliMix™ Room 会议套装正式入驻微软中国创新中心 Shure与微软开启声智体验之旅

    2025年11月11日,舒尔全新会议音频解决方案IntelliMix™ Room套件在微软北京创新中心完成安装并投入使用。该方案专为现代会议室设计,提供一站式高品质音频服务,集成卓越音质、简易设置及强大云管理能力。通过微软Teams认证,无缝接入MTR生态系统,支持端到端加密通信,确保会议安全。用户可远程管理系统,降低运维成本。舒尔与微软合作,共同提升企业协作效率,首批体验用户反馈语音清晰流畅,显著优化沟通质量。

  • AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归

    本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。

  • 从繁琐交互中解放 AI赋能的三星Galaxy Z Flip7带来高效便捷体验

    三星Galaxy Z Flip7以纵向折叠形态结合AI技术,打造便捷交互体验。其4.1英寸智能外屏可显示音乐、导航等信息,支持语音唤醒Bixby实现快速查询。内置AI功能涵盖即时翻译、智能收藏及内容创作辅助,如自动规划旅行路线、跨应用翻译和文档编辑。通过深度理解用户需求,这款设备以小巧机身承载智慧科技,提升生活效率与品质。

  • 超第二名2倍!海尔洗衣机三季报:份额47.1%创新高

    海尔智家2025年三季报显示,前三季度营收2340.5亿元,同比增长10%;归母净利润173.7亿元,增长14.7%,创历史新高。其中,洗衣机市场份额升至47.1%,领先行业第二名两倍,巩固领先地位。这得益于以用户为中心的系统化创新能力,如全球首创四筒洗衣机解决分类洗涤痛点。公司在科技、研发与制造上系统布局,拥有行业最多的发明专利和标准制定参与度,驱动产品持续迭代,确保市场竞争力。

  • 蚂蚁也正式加入AI超级入口战场,他的名字,叫灵光。

    蚂蚁集团推出全新AI助手“灵光”,以极致用户体验为核心突破传统AI工具。其亮点包括:结构化排版回答、交互式图表生成、3D模型渲染(如越王勾践剑动态演示),并支持闪应应用——用户可通过自然语言指令快速生成定制化小程序(如人生计时器、财报分析工具)。结合支付宝生态潜力,未来或实现真实账单管理与订阅优化。产品通过优雅设计唤醒用户探索欲,重新定义�

  • 销量直追小米,影目INMO以中国式创新跑出智能眼镜新速度

    2025年智能眼镜行业竞争激烈,华为、小米等大厂密集入局。影目INMO凭借“一体式AI+AR”技术路线,在双11销量稳居行业第二。其产品矩阵清晰:AIR系列定位下一代移动终端,搭载自研波导显示技术;GO系列主打翻译等高频场景,以轻薄设计突破传统框架;X系列探索跨界生态合作。目前全系出货量超10万台,在翻译眼镜领域市占率达90%,并通过综艺营销加速破圈。影目正以长期主

  • 从创新到普及 三星以Galaxy AI推动智能手机进化

    智能手机行业竞争焦点正从硬件比拼转向体验创新,人工智能成为关键驱动力。三星通过Galaxy系列全线布局AI功能,在交互方式、影像处理、信息获取等环节实现智能化升级,让用户通过自然语音指令即可完成多步骤操作。调查显示近半数用户已将AI视为生活必备工具,Galaxy S25系列超70%用户主动使用AI功能。三星通过多层次产品线推动AI普及,在折叠屏与旗舰机型中深化多模态交互体验,同时将对象橡皮擦、表情优化等技术下放至A系列,构建覆盖不同用户需求的智能生态。

  • 成交均价39万力压BBA!鸿蒙智行10月交付68216台创新高

    鸿蒙智行10月销量创纪录:单月交付新车68216台,创历史新高;全系累计交付突破100万台,成为最快达成百万交付的新势力品牌。成交均价达39万元,超越宝马、奔驰等传统豪华品牌,位居中国主流品牌(月销过万)第一。旗下五款车型中,问界是绝对主力;智界S7/R7上市后竞争力大增;享界稳居30万以上豪华新能源销冠;尊界S800大定超1.5万台;尚界H5上市一小时订单破万,10月有望交付破万。问界M9连续多月蝉联国内50万级销冠。

今日大家都在搜的词: