阶跃星辰最新一代基础大模型 Step 3 正式开源

2025-08-01 08:20 · 来源： AIbase基地

阶跃星辰团队宣布其最新一代基础大模型 Step3正式开源。Step3是一款专为追求性能与成本极致均衡的企业和开发者设计的模型，旨在面向推理时代打造最适合应用的模型。该模型的开源地址包括 Github、Hugging Face 和魔搭 ModelScope，开发者可以自由下载体验。

Step3采用 MoE 架构，总参数量达到3210亿，激活参数量为380亿。它不仅拥有强大的视觉感知和复杂推理能力，还能准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析，以及日常生活中的各类视觉分析问题。通过 MFA（Multi-matrix Factorization Attention）和 AFD(Attention-FFN Disaggregation)的优化，Step3在各类芯片上的推理效率均大幅提升。此外，面向 AFD 场景的 StepMesh 通信库也已随模型一同开源，提供可跨硬件的标准部署接口，支持关键性能在实际服务中的稳定复现。

微信截图_20250801082013.png

Step3的核心结构采用自研 MFA 注意力机制，有效降低注意力计算中的 KV 缓存开销与算力消耗。在不牺牲模型能力的前提下，这一方案实现了资源利用与推理效率的平衡，使得模型可在8×48GB 显卡上完成大吞吐量推理，具备真实部署的可行性。多模态能力方面，Step3采用5B Vision Encoder，并通过双层2D 卷积对视觉特征进行降采样，将视觉 token 数量减少到原来的1/16，减轻上下文长度压力，提升推理效率。训练过程分为两个阶段:第一阶段强化 Encoder 感知，第二阶段冻结视觉编码器，仅优化主干与连接层，以减少梯度干扰。训练语料涵盖 Pair、Interleave 与多任务数据，在清洗环节中引入相似度过滤、重采样与任务比例控制，进一步提升图文协同质量与训练鲁棒性。

Step3在系统架构层重构了解码流程，重点解决 Attention 与 FFN 混合执行带来的推理瓶颈以及资源不匹配问题。为此，团队实现了高性能的 AFD 方案，将两类计算任务解耦成为两个子系统，并通过多级流水线并行调度，有效提升整体吞吐效率。由于解耦后的子系统之间对数据传输有极高要求，团队同时研发了面向 AFD 场景的 StepMesh 通信库，基于 GPU Direct RDMA 实现跨卡的低延迟和高带宽传输，同时兼备不占用 GPU 计算资源、适配多类异构硬件等优势。在50ms 解码的 SLA 前提下，Step3在 Hopper GPU 上的吞吐达到4039token/gpu/s，显著高于类似设置下的 DeepSeek V3（2324token/gpu/s），且该性能增益在特定硬件与长文场景会进一步放大至300%。

Step3在 MMMU、MathVision、SimpleVQA、AIME2025、GPQA-Diamond、LiveCodeBench （2024.08-2025.05）等评测集上进行了测试，在同类型开源模型中，Step3成绩行业领先。例如，在“安排商务宴座”的任务中，Step3能够识别图中结构，自动解析礼仪规则、角色关系与空间逻辑，再结合中文社交礼仪推理出完整12人角色分布逻辑，最终输出了角色明确、位置清晰、结构合理的“主宾-主陪”全局排座方案，并用表格+ASCII 图直观展示。在卡路里计算任务中，Step3能够看懂复杂的小票，把菜品归类、对上热量，最终估算出2人一顿饭总共吃了5710大卡，人均2855大卡，整个过程从原始数据到结论解释，逻辑清晰，一整个闭环。

Step3API 已上线阶跃星辰开放平台（platform.stepfun.com），开发者也可以在“阶跃 AI”官网(stepfun.com)和“阶跃 AI”App(应用商店搜索下载)进行体验。模型限时折扣中，所有请求均按最低价格计算，每百万 token 价格低至输入1.5元，输出4元。

Github:https://github.com/stepfun-ai/Step3

Hugging Face:https://huggingface.co/stepfun-ai/step3

魔搭ModelScope:

https://www.modelscope.cn/models/stepfun-ai/step3

https://www.modelscope.cn/models/stepfun-ai/step3-fp8

相关推荐

破解 AI “安全与性能” 难题！DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

9月18日，华为全联接大会2025在上海开幕。会上，华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出，对有害言论、敏感内容等14个维度的防御成功率近100%，同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作，推动AI安全技术与产业生态协同发展，为我国人工智能高质量发展提供支撑。

华为全联接大会 DeepSeek-R1-Safe 昇腾千卡算力平台
荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

AI日报今日聚焦多项技术突破：小米开源首个端到端语音大模型Xiaomi-MiMo-Audio；通义万相推出全新动作生成模型Wan2.2-Animate；Suno即将发布革命性音乐模型v5；生数科技获数亿融资，视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞，谷歌将Gemini集成至Chrome浏览器，Luma AI发布支持16位色的Ray3视频生成模型，法国Mistral推出开源推理模型Magistral Small 1.2，Notion发布AI智能体，腾讯混元3D Studio提升3D创作效率。

AI 语音大模型小米开源
新一代AI存储大幅提升训练效率，断点恢复速度提升

AI训练频繁中断是行业难题。华为OceanStor A系列存储通过TB级集群带宽和高速读写能力，显著优化断点续训性能。AI大模型集群部署该方案后，恢复时间从15分钟缩短至1分钟，保障GPU/NPU算力资源充分利用。华为强调，高性能存储正成为以“存”强“算”的关键基础架构。

AI训练存储优化算力效率
考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

9月28日，在成都举行的“2025天府人工智能产业生态大会”上，考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源，同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略，推动空间智能产业生态共建。BLM-1.0突破传统模型局限，具备跨空间、跨任务、跨本体的“三跨”统一能力，在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互，实现工业运维、安装巡检等场景的全程自动化与智能辅助，显著提升效率并降低成本。

人工智能开源大模型空间智能
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源33款、31款各类型大模型。这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域，而音频生成占比很小。

开源 AI社区音频生成
荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking；阿里开源Wan-Animate模型革新AI视频生成；字节跳动发布豆包翻译模型，支持28种语言互译；华为与浙大联合推出安全大模型DeepSeek-R1-Safe；阿里云即将发布跨模态模型Qwen3-Omni；xAI推出计算成本降低98%的Grok4Fast模型；YouTube发布多项AI创作辅助功能；IBM推出轻量级文档处理模型Granite-Docling-258M；中科院发布类脑大模型SpikingBrain实现百倍速度突破；OpenAI将推出仅限Pro用户的计算密集型新功能。

AI日报美团大模型 LongCat-Flash-Thinking
锁定30万级家用SUV销冠！全新一代问界M7上市：27.98万起

全新问界M7于9月23日上市，推出增程和纯电两种动力共6款车型，售价27.98-37.98万元。新车采用家族化鲲鹏展翼设计，轴距增至3030mm，空间表现更优。内饰升级16.1英寸3K中控屏、副驾娱乐屏及HUD抬头显示，配备零重力座椅和舒云座椅，支持一键放平。智能化方面搭载华为乾崑ADS 4.0辅助驾驶，配备激光雷达和34个传感器，支持全场景智能驾驶。安全上通过超标准碰撞测试，动力提供增程版综合续航1625公里，纯电版续航710公里，支持超快充。

问界M7 增程动力纯电动力
小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio，拥有12亿参数，在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力，通过创新预训练架构和超一亿小时训练数据，成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构，支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本，并在Github开源Tokenizer模型，为研究者和开发者提供完整工具链。

AI语音开源模型少样本学习
GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

随着AI大模型成为用户获取信息的主要入口，AIBase推出GEO排名查询工具，帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示，可精准分析品牌是否被推荐、出现频次及具体场景，为制定AI大模型排名优化策略提供数据支撑。在GEO时代，抢占AI回答推荐位意味着获得全新流量入口。

AI大模型 GEO排名查询生成引擎优化

今日大家都在搜的词：

热文

3 天
7天

阶跃星辰最新一代基础大模型 Step 3 正式开源

破解 AI “安全与性能” 难题！DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

新一代AI存储大幅提升训练效率，断点恢复速度提升

考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

没想到，音频大模型开源最彻底的，居然是小红书

荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

锁定30万级家用SUV销冠！全新一代问界M7上市：27.98万起

小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

今日大家都在搜的词：

热文

苹果iOS18.7.1正式版更新发布重要安全修复

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

罗永浩替小米说公道话：海报小字是行业陋习

苹果iOS 26.0.1正式版发布：修复iPhone 17系列Wi-Fi、拍照等Bu

腾讯QQ闪传功能上线支持单文件最大10GB传输

OPPO Find X9系列定档：10月16日发布

鸿蒙智行享界S9T上市13天大定破 15000 台

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

小米17系列开售5分钟破25年国产手机首销纪录

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

小米17/Pro/Pro Max今日首销：4499元起

iPhone调休闹钟上热搜苹果客服回应：需手动设置

站长商机