首页 > AI头条  > 正文

阶跃星辰最新一代基础大模型 Step 3 正式开源

2025-08-01 08:20 · 来源: AIbase基地

 阶跃星辰团队宣布其最新一代基础大模型 Step3正式开源。Step3是一款专为追求性能与成本极致均衡的企业和开发者设计的模型,旨在面向推理时代打造最适合应用的模型。该模型的开源地址包括 Github、Hugging Face 和魔搭 ModelScope,开发者可以自由下载体验。

Step3采用 MoE 架构,总参数量达到3210亿,激活参数量为380亿。它不仅拥有强大的视觉感知和复杂推理能力,还能准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。通过 MFA(Multi-matrix Factorization Attention)和 AFD(Attention-FFN Disaggregation)的优化,Step3在各类芯片上的推理效率均大幅提升。此外,面向 AFD 场景的 StepMesh 通信库也已随模型一同开源,提供可跨硬件的标准部署接口,支持关键性能在实际服务中的稳定复现。

微信截图_20250801082013.png

Step3的核心结构采用自研 MFA 注意力机制,有效降低注意力计算中的 KV 缓存开销与算力消耗。在不牺牲模型能力的前提下,这一方案实现了资源利用与推理效率的平衡,使得模型可在8×48GB 显卡上完成大吞吐量推理,具备真实部署的可行性。多模态能力方面,Step3采用5B Vision Encoder,并通过双层2D 卷积对视觉特征进行降采样,将视觉 token 数量减少到原来的1/16,减轻上下文长度压力,提升推理效率。训练过程分为两个阶段:第一阶段强化 Encoder 感知,第二阶段冻结视觉编码器,仅优化主干与连接层,以减少梯度干扰。训练语料涵盖 Pair、Interleave 与多任务数据,在清洗环节中引入相似度过滤、重采样与任务比例控制,进一步提升图文协同质量与训练鲁棒性。

Step3在系统架构层重构了解码流程,重点解决 Attention 与 FFN 混合执行带来的推理瓶颈以及资源不匹配问题。为此,团队实现了高性能的 AFD 方案,将两类计算任务解耦成为两个子系统,并通过多级流水线并行调度,有效提升整体吞吐效率。由于解耦后的子系统之间对数据传输有极高要求,团队同时研发了面向 AFD 场景的 StepMesh 通信库,基于 GPU Direct RDMA 实现跨卡的低延迟和高带宽传输,同时兼备不占用 GPU 计算资源、适配多类异构硬件等优势。在50ms 解码的 SLA 前提下,Step3在 Hopper GPU 上的吞吐达到4039token/gpu/s,显著高于类似设置下的 DeepSeek V3(2324token/gpu/s),且该性能增益在特定硬件与长文场景会进一步放大至300%。

Step3在 MMMU、MathVision、SimpleVQA、AIME2025、GPQA-Diamond、LiveCodeBench (2024.08-2025.05)等评测集上进行了测试,在同类型开源模型中,Step3成绩行业领先。例如,在“安排商务宴座”的任务中,Step3能够识别图中结构,自动解析礼仪规则、角色关系与空间逻辑,再结合中文社交礼仪推理出完整12人角色分布逻辑,最终输出了角色明确、位置清晰、结构合理的“主宾-主陪”全局排座方案,并用表格+ASCII 图直观展示。在卡路里计算任务中,Step3能够看懂复杂的小票,把菜品归类、对上热量,最终估算出2人一顿饭总共吃了5710大卡,人均2855大卡,整个过程从原始数据到结论解释,逻辑清晰,一整个闭环。

Step3API 已上线阶跃星辰开放平台(platform.stepfun.com),开发者也可以在“阶跃 AI”官网(stepfun.com)和“阶跃 AI”App(应用商店搜索下载)进行体验。模型限时折扣中,所有请求均按最低价格计算,每百万 token 价格低至输入1.5元,输出4元。

Github:https://github.com/stepfun-ai/Step3

Hugging Face:https://huggingface.co/stepfun-ai/step3

魔搭ModelScope:

https://www.modelscope.cn/models/stepfun-ai/step3

https://www.modelscope.cn/models/stepfun-ai/step3-fp8

  • 相关推荐
  • AI日报:智谱AI重磅发布GLM-4.5;阿里开源Wan2.2;阶跃星辰推全新模型Step3

    【AI日报】本期重点内容:1.智谱AI发布开源大模型GLM-4.5,在推理、编码和智能体能力方面达到SOTA水平;2.阿里开源视频生成模型Wan2.2,采用MoE架构提升计算效率;3.阶跃星辰推出AI研究助手"阶跃深研",支持金融医疗等专业领域研究;4.微软Edge浏览器新增Copilot模式,提供智能搜索体验;5.Anthropic对Claude用户实施使用限制引发争议;6.阶跃星辰发布321B参数大模型Step3;7.蚂�

  • 纯原创也能出好看的电车!全新一代小鹏P7预售:不会太便宜

    全新一代小鹏P7全球首秀,并开启预售,99元意向金可抵扣3000元购车款,该车将于本月内上市。 该车采用了赛博未来感十足的设计,车头配备一体式无断点的光翼贯穿日行灯、矩阵式LED大灯,且拥有纯平发光Logo,而在不发光时,车标为深色,相较于业界常见的白色更具精致感。 全新P7依旧定位纯电轿跑车,新车长宽高分别为5017/1970/1427mm,轴距为3008mm,定位于中大型轿车,提�

  • 必战小米SU7 全新一代小鹏P7内饰全曝光:中控屏能“点头”

    小米SU7的强力竞争对手来了,它就是全新一代小鹏P7。 该车定位纯电轿跑,采用了非常别致的设计语言,辨识度非常高,而主打的也是运动感,就在今天小鹏汽车发布了该车内饰官图,可以看到不少眼熟的元素在。 全新小鹏P7配备了运动仪表屏,看起来非常像是领克如今使用的窄条状,可支持多种模式切换,而从仪表盘上90%电量续航675km计算,该车满电续航750km。

  • AI日报:可灵发布灵动画布创意工作台;Coze Studio和Loop正式开源;WPS AI 3.0灵犀版本发布

    【AI日报】汇总了近期AI领域重要动态:1)字节跳动开源Coze两大核心项目,降低AI开发门槛;2)可灵AI发布"灵动画布"创意工作台,创作者突破4500万;3)Runway推出视频编辑模型Aleph,支持自然语言指令操作;4)金山办公发布WPS AI 3.0,实现智能文档创作;5)京东升级大模型品牌JoyAI;6)浦东设立20亿AI种子基金;7)阿里开源WebSailor框架提升信息检索效率;8)我国大模型数量突破1500个,居全球领先;9)蚂蚁数科联合发布金融大模型评测基准;10)腾讯开源混元3D世界模型,支持360°场景生成。

  • OpenAI发布2款开源模型:gpt-oss系列 能力接近o3和o4-mini

    OpenAI发布开源模型系列GPT-OSS,包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构,20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口,支持动态参数调节和任务微调优化,性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能,包括网页交互和Python代码执行,在标准化测试中表现优异。开源策略为开发者提供高性能替代方案,重新定义了AI模型的应用边界。

  • 三星新一代Galaxy Z系列 开启折叠屏主动交互新时代

    三星发布全新折叠屏旗舰Galaxy Z Fold7和Flip7,搭载升级版One UI8系统和多模态AI技术。新机采用更轻薄设计,配备智能分屏、拖放操作等折叠屏专属功能。Galaxy AI深度整合Bixby助手、即时翻译、AI解题等实用功能,提升办公创作效率。同步推出的Galaxy Watch8系列智能手表采用无表耳设计,新增抗氧化指数检测功能。三星通过硬件创新与AI赋能,重新定义移动设备交互体验,引领折叠屏生态发展。

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • 小米世界500强排名狂飙100位!雷军:向“全球新一代硬核科技引领者” 挺进

    今日,2025年《财富》世界500强发布。小米集团排名第297位,较上一年提高100位,创下2019年上榜以来的最大增幅。 对此,小米集团创始人、董事长兼CEO雷军表示,今年是小米创业第十五周年,小米人车家全生态” 战略正式闭环,手机、汽车、大家电三大增长曲线齐头并进,开启新一轮增长。 小米将始终以技术为本,向着 全球新一代硬核科技引领者” 挺进!

  • vivo以Rust语言自研的蓝河操作系统内核正式开源

    7月23日,2025开放原子开源生态大会召开。vivo宣布其自主研发的蓝河操作系统(BlueOS)内核正式开源。该系统采用Rust语言编写,具备智慧、流畅、安全三大特性,是行业首个从内核到框架全栈使用Rust的操作系统。蓝河内核内存占用仅13KB,兼容RISC-V、ARM等架构,支持POSIX接口标准,包含系统调度、内存管理等五大核心能力。vivo表示,此次开源将为国产操作系统发展提供新思路,推动行业迈向新高度。未来vivo将持续推进Rust语言在国内的普及,并举办第三届蓝河操作系统创新大赛。

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

今日大家都在搜的词:

热文

  • 3 天
  • 7天