首页 > AI头条  > 正文

MiniMax-M1开源:全球首个大规模混合架构推理模型

2025-06-17 09:10 · 来源: AIbase基地

近日,MiniMax公司宣布推出其全新模型MiniMax-M1,该模型作为世界上首个开源的大规模混合架构推理模型,在面向生产力的复杂场景中展现出了卓越性能,成为开源模型中的佼佼者。MiniMax-M1不仅超越了国内闭源模型,还接近了海外最领先模型的水平,同时保持着业内最高的性价比。

MiniMax-M1的一个显著特点是支持高达100万的上下文输入,与闭源模型Google Gemini2.5Pro相当,是DeepSeek R1的8倍,并且能够输出长达8万Token的推理结果。这一成就得益于MiniMax独创的以闪电注意力机制为主的混合架构,使得在处理长上下文输入和深度推理时效率显著提升。例如,在使用8万Token进行深度推理时,MiniMax-M1仅需DeepSeek R1约30%的算力,从而在训练和推理过程中都具有算力效率优势。

微信截图_20250617090813.png

此外,MiniMax还提出了更快的强化学习算法CISPO,通过裁剪重要性采样权重来提升强化学习效率。在AIME的实验中,CISPO算法的收敛性能比包括字节近期提出的DAPO在内的其他强化学习算法快了一倍,显著优于DeepSeek早期使用的GRPO算法。这些技术创新使得MiniMax-M1的强化训练过程异常高效,仅用了512块H800三周的时间,租赁成本也大幅降低,比预期少了一个数量级。

在评测方面,MiniMax-M1在业内主流的17个评测集上均取得了优异成绩。特别是在软件工程、长上下文与工具使用等面向生产力的复杂场景中,MiniMax-M1展现出了显著优势。例如,在SWE-bench验证基准上,MiniMax-M1-40k和MiniMax-M1-80k分别取得了55.6%和56.0%的成绩,虽然略逊于DeepSeek-R1-0528的57.6%,但显著超越了其他开源权重模型。同时,依托其百万级上下文窗口,MiniMax-M1在长上下文理解任务中表现卓越,超越了所有开源权重模型,甚至在某些方面超越了OpenAI o3和Claude4Opus,全球排名第二。

值得一提的是,MiniMax-M1在代理工具使用场景(TAU-bench)中也同样领跑所有开源权重模型,并战胜了Gemini-2.5Pro。此外,MiniMax-M1-80k在大多数基准测试中始终优于MiniMax-M1-40k,这充分验证了扩展测试时计算资源的有效性。

在价格方面,MiniMax-M1保持了业内最低的价格。在MiniMax APP和Web上,用户可以不限量免费使用该模型,并通过官网以极具竞争力的价格购买API服务。这一举措无疑将进一步推动MiniMax-M1在市场上的普及和应用。

MiniMax-M1-40k:huggingface.co/MiniMaxAI/MiniMax-M1-40k

MiniMax-M1-80k:huggingface.co/MiniMaxAI/MiniMax-M1-80k

  • 相关推荐
  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • OpenAI发布2款开源模型:gpt-oss系列 能力接近o3和o4-mini

    OpenAI发布开源模型系列GPT-OSS,包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构,20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口,支持动态参数调节和任务微调优化,性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能,包括网页交互和Python代码执行,在标准化测试中表现优异。开源策略为开发者提供高性能替代方案,重新定义了AI模型的应用边界。

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • AI日报:阿里推全新图片模型Qwen-Image;小米全量开源MiDashengLM-7B;智谱Zread.ai搭载 GLM-4.5

    本文汇总了AI领域最新动态:1)阿里开源文生图模型Qwen-Image,中文文本渲染领先;2)ChatGPT周活用户达7亿,OpenAI年收入120亿美元;3)Anthropic测试Claude Opus 4.1,推理能力升级;4)智谱推出开发工具Zread.ai提升代码理解效率;5)xAI发布Grok Imagine4支持文生视频及NSFW内容;6)Character.AI推出首个AI原生社交功能;7)阿里与南开合作视频压缩技术LLaVA-Scissor;8)北京团队突破人形机器人3D视觉系统�

  • 大模型对比评测:Qwen2.5 VS Gemini 2.0谁更能打?

    本文对比分析了四款AI大模型:Gemini2.0Flash-Lite(Preview)、Gemini2.0Flash(Experimental)、Gemini2.0Pro Experimental(Feb25)和Qwen2.5Coder Instruct32B。Gemini2.0Flash-Lite适合高并发低延迟应用,Gemini2.0Flash擅长实时多模态推理,Gemini2.0Pro适合复杂编程任务,Qwen2.5Coder在代码任务上性价比突出。建议使用AIbase模型广场进行高效筛选,该平台覆盖上万款AI模型,提供性能、价格等多维度直观对比,支持按任务类型、语言等精准筛选,并持续更新最新模型。

  • GPT-5正式发布:与Claude 4、Gemini 2.5等主流大模型谁更胜一筹?

    2025年8月7日,OpenAI正式发布GPT-5,官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升,在AIME2025测试中取得94.6%的高分,处理速度也有明显改善。但与竞争对手相比仍存在差距:Claude4在代码生成和逻辑推理方面表现优异,支持200K token长文本;Gemini2.5具备2M超大上下文窗口和全模态支持;国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI�

  • AI日报:火山引擎发布豆包3.0;通义开源Qwen3非思考模型;谷歌偷偷升级Imagen 4

    【AI日报】栏目聚焦人工智能领域最新动态:1)火山引擎发布豆包系列AI模型升级,包括图像编辑3.0、同声传译2.0等;2)通义千问开源Qwen3-30B模型,支持多语言处理;3)OpenAI推出ChatGPT Study学习助手;4)中国发布HYPIR图像复原大模型;5)谷歌NotebookLM新增视频概览功能;6)谷歌Imagen4图像生成模型升级,性能媲美GPT-4o;7)昆仑万维开源多模态模型Skywork UniPic;8)理想汽车发布首搭VLA大模型的i8纯电SUV;9)谷歌在英国推出AI搜索模式;10)OWL团队开源多智能体协作工具;11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

  • 马斯克宣布Grok4免费开放:全球最强AI模型 学术问题表现已达到博士级别

    马斯克今日上午在社交平台上宣布,Grok 4现在对所有用户免费开放,免费用户每天可完成少量查询,超过限制则需要订阅。 xAI官方介绍,用户只需使用自动”模式,Grok就会将复杂的查询路由到Grok 4。若用户偏好掌控一切”,则可以切换到专家”模式。

  • 聚焦大模型训练效率提升 北大依托昇腾突破细粒度混合并行技术

    北京大学崔斌教授团队在鹏城实验室支持下,研发了面向大模型的高效分布式训练框架。该框架通过统一训练接口、细粒度模型切分与并行策略搜索算法,解决了训练任务多样性和负载不均问题,实现训练效率提升15%。同时利用昇腾计算资源管理能力,优化硬件通信效率,通过计算通信重叠技术提升流水线效率。研究成果已在NeurIPS等顶会发表3篇论文,展现了国产算力在分布式计算领域的潜力,为AI产业自主化突破提供支撑。

  • 哪个大模型性价比最高?用这个 AI 大模型费用计算器轻松比价

    AI大模型快速发展,但不同厂商的定价规则差异大,导致选择困难。AIbase推出的AI大模型费用计算器(https://model.aibase.com/zh/calculator)能帮助开发者快速比较主流模型的调用成本。该工具覆盖GPT-4、Claude、文心一言等国内外热门模型,支持输入输出分开计费,实时更新官方定价,无需注册即可使用。用户只需输入文本,系统自动拆分token数并精准计算费用,结果清晰直观可排序。建议根据场景需求选择模型:平衡成本与性能可选GPT-4o、DeepSeek-V2;高精度需求选GPT-4 Turbo;中文场景优选国产模型。使用前通过计算器模拟成本,可避免项目超支风险。

今日大家都在搜的词: