MiniMax-M1开源：全球首个大规模混合架构推理模型

2025-06-17 09:10 · 来源： AIbase基地

近日，MiniMax公司宣布推出其全新模型MiniMax-M1，该模型作为世界上首个开源的大规模混合架构推理模型，在面向生产力的复杂场景中展现出了卓越性能，成为开源模型中的佼佼者。MiniMax-M1不仅超越了国内闭源模型，还接近了海外最领先模型的水平，同时保持着业内最高的性价比。

MiniMax-M1的一个显著特点是支持高达100万的上下文输入，与闭源模型Google Gemini2.5Pro相当，是DeepSeek R1的8倍，并且能够输出长达8万Token的推理结果。这一成就得益于MiniMax独创的以闪电注意力机制为主的混合架构，使得在处理长上下文输入和深度推理时效率显著提升。例如，在使用8万Token进行深度推理时，MiniMax-M1仅需DeepSeek R1约30%的算力，从而在训练和推理过程中都具有算力效率优势。

微信截图_20250617090813.png

此外，MiniMax还提出了更快的强化学习算法CISPO，通过裁剪重要性采样权重来提升强化学习效率。在AIME的实验中，CISPO算法的收敛性能比包括字节近期提出的DAPO在内的其他强化学习算法快了一倍，显著优于DeepSeek早期使用的GRPO算法。这些技术创新使得MiniMax-M1的强化训练过程异常高效，仅用了512块H800三周的时间，租赁成本也大幅降低，比预期少了一个数量级。

在评测方面，MiniMax-M1在业内主流的17个评测集上均取得了优异成绩。特别是在软件工程、长上下文与工具使用等面向生产力的复杂场景中，MiniMax-M1展现出了显著优势。例如，在SWE-bench验证基准上，MiniMax-M1-40k和MiniMax-M1-80k分别取得了55.6%和56.0%的成绩，虽然略逊于DeepSeek-R1-0528的57.6%，但显著超越了其他开源权重模型。同时，依托其百万级上下文窗口，MiniMax-M1在长上下文理解任务中表现卓越，超越了所有开源权重模型，甚至在某些方面超越了OpenAI o3和Claude4Opus，全球排名第二。

值得一提的是，MiniMax-M1在代理工具使用场景（TAU-bench）中也同样领跑所有开源权重模型，并战胜了Gemini-2.5Pro。此外，MiniMax-M1-80k在大多数基准测试中始终优于MiniMax-M1-40k，这充分验证了扩展测试时计算资源的有效性。

在价格方面，MiniMax-M1保持了业内最低的价格。在MiniMax APP和Web上，用户可以不限量免费使用该模型，并通过官网以极具竞争力的价格购买API服务。这一举措无疑将进一步推动MiniMax-M1在市场上的普及和应用。

MiniMax-M1-40k：huggingface.co/MiniMaxAI/MiniMax-M1-40k

MiniMax-M1-80k：huggingface.co/MiniMaxAI/MiniMax-M1-80k

相关推荐

荐AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

AI日报栏目聚焦人工智能领域最新动态：1)阿里发布Qwen3-4B轻量级模型，手机端可运行；2)小红书开源多模态大模型dots.vlm1，在图表推理方面表现突出；3)MiniMax推出语音生成模型Speech2.5，多语种表现提升；4)Midjourney推出HD视频模式，提升专业影像质量；5)Cursor1.4版本增强异步任务处理能力；6)谷歌否认AI搜索影响网站流量，但数据显示用户行为改变；7)MiniCPM-V4.0开源发布，号称"手机上的GPT-4V"；8)AMD与高通宣布支持OpenAI的gpt-oss系列模型；9)腾讯开源WeKnora文档智能解析工具；11)疑似GPT-5信息在GitHub泄露；12)FlowSpeech实现书面语转口语的TTS技术突破。
OpenAI发布2款开源模型：gpt-oss系列能力接近o3和o4-mini

OpenAI发布开源模型系列GPT-OSS，包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构，20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口，支持动态参数调节和任务微调优化，性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能，包括网页交互和Python代码执行，在标准化测试中表现优异。开源策略为开发者提供高性能替代方案，重新定义了AI模型的应用边界。

人工智能开源模型 OpenAI
荐AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型MindLink；谷歌Gemini 2.5 Deep Think发布

【AI日报】汇总了最新AI领域动态：1)腾讯开源混元系列小尺寸模型，适用于消费级显卡；2)昆仑万维发布推理大模型MindLink，提升回答透明度；3)B站推出AI原声翻译功能，保留UP主音色；4)谷歌Gemini 2.5在数学奥赛夺金，展现强大推理能力；5)OpenAI展示GPT-5网络信息整合特性；6)苹果组建AI团队挑战ChatGPT；7)高德地图推出全球首个AI原生地图应用；8)Adobe推出AI图像合成工具Harmonize；9)NVIDIA发布革命性视频渲染技术；10)谷歌推出Android Studio免费AI编程助手；11)开源结构化信息提取工具LangExtract；12)Figma开发者模式升级提升设计转代码效率。

人工智能开源模型腾讯混元
荐AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

本文汇总了AI领域最新动态：1)阿里开源文生图模型Qwen-Image，中文文本渲染领先；2)ChatGPT周活用户达7亿，OpenAI年收入120亿美元；3)Anthropic测试Claude Opus 4.1，推理能力升级；4)智谱推出开发工具Zread.ai提升代码理解效率；5)xAI发布Grok Imagine4支持文生视频及NSFW内容；6)Character.AI推出首个AI原生社交功能；7)阿里与南开合作视频压缩技术LLaVA-Scissor；8)北京团队突破人形机器人3D视觉系统�

人工智能文生图模型阿里通义千问
大模型对比评测：Qwen2.5 VS Gemini 2.0谁更能打？

本文对比分析了四款AI大模型：Gemini2.0Flash-Lite（Preview）、Gemini2.0Flash（Experimental）、Gemini2.0Pro Experimental（Feb25）和Qwen2.5Coder Instruct32B。Gemini2.0Flash-Lite适合高并发低延迟应用，Gemini2.0Flash擅长实时多模态推理，Gemini2.0Pro适合复杂编程任务，Qwen2.5Coder在代码任务上性价比突出。建议使用AIbase模型广场进行高效筛选，该平台覆盖上万款AI模型，提供性能、价格等多维度直观对比，支持按任务类型、语言等精准筛选，并持续更新最新模型。

AI大模型选型 AI应用落地模型性能对比
GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

2025年8月7日，OpenAI正式发布GPT-5，官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升，在AIME2025测试中取得94.6%的高分，处理速度也有明显改善。但与竞争对手相比仍存在差距：Claude4在代码生成和逻辑推理方面表现优异，支持200K token长文本；Gemini2.5具备2M超大上下文窗口和全模态支持；国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI�
荐AI日报：火山引擎发布豆包3.0；通义开源Qwen3非思考模型；谷歌偷偷升级Imagen 4

【AI日报】栏目聚焦人工智能领域最新动态：1)火山引擎发布豆包系列AI模型升级，包括图像编辑3.0、同声传译2.0等；2)通义千问开源Qwen3-30B模型，支持多语言处理；3)OpenAI推出ChatGPT Study学习助手；4)中国发布HYPIR图像复原大模型；5)谷歌NotebookLM新增视频概览功能；6)谷歌Imagen4图像生成模型升级，性能媲美GPT-4o；7)昆仑万维开源多模态模型Skywork UniPic；8)理想汽车发布首搭VLA大模型的i8纯电SUV；9)谷歌在英国推出AI搜索模式；10)OWL团队开源多智能体协作工具；11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

人工智能图像编辑同声传译
马斯克宣布Grok4免费开放：全球最强AI模型学术问题表现已达到博士级别

马斯克今日上午在社交平台上宣布，Grok 4现在对所有用户免费开放，免费用户每天可完成少量查询，超过限制则需要订阅。 xAI官方介绍，用户只需使用自动”模式，Grok就会将复杂的查询路由到Grok 4。若用户偏好掌控一切”，则可以切换到专家”模式。
聚焦大模型训练效率提升北大依托昇腾突破细粒度混合并行技术

北京大学崔斌教授团队在鹏城实验室支持下，研发了面向大模型的高效分布式训练框架。该框架通过统一训练接口、细粒度模型切分与并行策略搜索算法，解决了训练任务多样性和负载不均问题，实现训练效率提升15%。同时利用昇腾计算资源管理能力，优化硬件通信效率，通过计算通信重叠技术提升流水线效率。研究成果已在NeurIPS等顶会发表3篇论文，展现了国产算力在分布式计算领域的潜力，为AI产业自主化突破提供支撑。

人工智能大模型训练分布式计算
哪个大模型性价比最高？用这个 AI 大模型费用计算器轻松比价

AI大模型快速发展，但不同厂商的定价规则差异大，导致选择困难。AIbase推出的AI大模型费用计算器（https://model.aibase.com/zh/calculator）能帮助开发者快速比较主流模型的调用成本。该工具覆盖GPT-4、Claude、文心一言等国内外热门模型，支持输入输出分开计费，实时更新官方定价，无需注册即可使用。用户只需输入文本，系统自动拆分token数并精准计算费用，结果清晰直观可排序。建议根据场景需求选择模型：平衡成本与性能可选GPT-4o、DeepSeek-V2；高精度需求选GPT-4 Turbo；中文场景优选国产模型。使用前通过计算器模拟成本，可避免项目超支风险。

大模型性价比人工智能

今日大家都在搜的词：

热文

3 天
7天

MiniMax-M1开源：全球首个大规模混合架构推理模型

荐AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

OpenAI发布2款开源模型：gpt-oss系列能力接近o3和o4-mini

荐AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型MindLink；谷歌Gemini 2.5 Deep Think发布

荐AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

大模型对比评测：Qwen2.5 VS Gemini 2.0谁更能打？

GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

荐AI日报：火山引擎发布豆包3.0；通义开源Qwen3非思考模型；谷歌偷偷升级Imagen 4

马斯克宣布Grok4免费开放：全球最强AI模型学术问题表现已达到博士级别

聚焦大模型训练效率提升北大依托昇腾突破细粒度混合并行技术

哪个大模型性价比最高？用这个 AI 大模型费用计算器轻松比价

今日大家都在搜的词：

热文

AI日报：昆仑万维发布SkyReels-A3模型；百度搜索PC端全面上线A

京东养车50亿补贴更名震骨价号称补贴不「唬」

REDMI Turbo 5已备案：首发天玑8500处理器

微信内存一下就少了10G上热搜无需担心误删重要资料

iPhone17系列仅标准版没涨价分析师称Pro机型将上调50美元

海底捞回应“改为半自助模式” 客服辟谣：系不实传闻

苹果iOS 26 Beta 5上线：细节优化更新内容一览

AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌

AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm

荣耀Magic7 Pro 16+512G卫星通信版开售：售价5199元

李想回应理想被黑：知道是谁干的背后有专业水军

AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKB

周鸿祎称很多成功人士看不起新东西 AI时代需终身学习

站长商机