首页 > AI头条  > 正文

小米首个推理大模型开源Xiaomi MiMo,70 亿参数

2025-04-30 13:48 · 来源: AIbase基地

全球知名科技公司小米正式发布其首个针对推理(Reasoning)而生的大型开源模型 ——Xiaomi MiMo。该模型旨在解决当前预训练模型在推理能力上的瓶颈,探索如何更有效地激发模型的推理潜能。MiMo 的推出标志着小米在人工智能领域的一次重要尝试,尤其是在数学推理和代码竞赛方面,表现出色。

** Xiaomi MiMo 的显著优势 **

据小米介绍,MiMo 在数学推理(AIME24-25)和代码竞赛(LiveCodeBench v5)的公开测评中,仅以7亿参数的规模便超越了 OpenAI 的闭源推理模型 o1-mini 和阿里巴巴的开源推理模型 QwQ-32B-Preview。此成绩不仅彰显了 MiMo 在推理任务上的优越性能,更为行业树立了新的标杆。

QQ_1745992004508.png

随着 DeepSeek-R1的推出,强化学习(RL)在业界引发了共创潮流。MiMo-7B 在相同的强化学习训练数据条件下,其在数学与代码领域的推理能力明显领先于现有的经典开源32B 模型,如 DeepSeek-R1-Distill-7B 和 Qwen2.5-32B。这样的成绩不仅展示了小米在算法和模型训练上的创新能力,更为其未来的 AI 发展奠定了坚实基础。

QQ_1745992016273.png

** 独特的训练方法推动推理能力提升 **

MiMo 的推理能力提升源于预训练与后训练阶段的多层面创新。在预训练阶段,MiMo 通过整合丰富的推理语料,合成了约200B tokens 的推理数据。训练过程中,小米采取了三阶段训练的方法,逐步增加训练难度,总共训练了25T tokens,以确保模型在复杂推理任务上的表现。

在后训练阶段,小米则聚焦于高效且稳定的强化学习算法和框架。通过引入 “测试难度驱动奖励”(Test Difficulty Driven Reward)策略,MiMo 有效解决了在困难算法问题中奖励稀疏的问题。同时,采用 “简单数据重采样”(Easy Data Re-Sampling)策略,提升了强化学习训练的稳定性和有效性。为了加速训练过程,小米还设计了无缝回放系统,使得 RL 训练速度提高了2.29倍,验证速度提升了1.96倍。

** 全面开源与未来展望 **

小米 MiMo 全系列的模型已开源至 HuggingFace 平台,用户可以方便地访问和使用这一前沿技术,具体链接为:[HuggingFace MiMo-7B](https://huggingface.co/XiaomiMiMo)。小米表示,MiMo 是其全新成立的大模型核心团队的初步尝试,尽管2025年似乎是大模型发展的后半程,但小米始终相信,通往通用人工智能(AGI)的道路仍然漫长且充满挑战。

QQ_1745992031430.png

小米将继续秉持务实创新的原则,勇敢探索未知领域,以思考突破智能的边界,回应每一次的好奇心。通过 MiMo,小米不仅希望推动人工智能技术的发展,更希望在未来的智能生活中,为用户带来更多可能性。

  • 相关推荐
  • AI日报:小米首个推理大模型开源Xiaomi MiMo;快手上线AI笔记工具“喵记多”;腾讯拆分AI团队

    本文汇总了AI领域最新动态:1)小米开源70亿参数大模型Xiaomi MiMo,在数学推理和代码竞赛中超越OpenAI和阿里模型;2)快手推出AI笔记工具"喵记多",简化笔记管理;3)Luma AI发布电影级镜头控制API,降低视频生成门槛;4)腾讯重组AI团队,加大语言模型研发投入;5)Anthropic为Claude引入新语音"Glassy";6)谷歌NotebookLM新增50+语言音频概述功能;7)xAI将发布Grok3.5模型;8)Meta推出独立AI助手应用挑战ChatGPT;9)OpenAI紧急修复GPT-4o"谄媚"问题;10)Mac本地AI助手Simular升级隐私保护;11)CameraBench项目帮助AI理解镜头运动;12)谷歌推出个性化语言学习AI工具。

  • OpenAI要Open了,奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

    OpenAI终于要OpenAI了!一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。这是自GPT-2以来,OpenAI首个开源的模型。无疑为OpenAI下一步增添了更多的戏剧性。

  • 刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

    现在的国产AI应用,一口气看好几分钟的视频,都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段,AI就摇身一变成“名侦探”做剖析:它会对整个视频的内容先做一个总结,再按照秒级,对视频片段做内容上的推演。商汤科技联合创始人杨帆认为:银河通用合伙人、大模型负责人张直政表示:除此之外,上海交通大学副教授闫维新对这个问题的看法是:总言之,商汤作为国�

  • 提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集

    今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言,是真正面向全栈工程”的评测基准。相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。

  • 微信,OpenAI和Kimi想一起去了:大模型的尽头依然还是社交平台

    AI圈最近弥漫着一股微妙的气息。人们似乎不再热议大语言模型的最新突破、以及AI应用的无限可能时,一些代表着未来的AI巨头,却似乎正将目光投向互联网那熟悉得不能再熟悉的角落——社交网络与社区。近期的传闻和动作颇具代表性,在大洋彼岸,手握ChatGPT和Sora等王牌的OpenAI,据称正内部测试类X的社交功能,其CEO Sam Altman甚至在私下征求反馈;而在国内,凭借长文本能力

  • 秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一

    Kimi-Audio是一款开源的通用音频基础模型,在语音识别、音频理解、音频转文本、语音对话等任务中表现优异。该模型采用集成式架构设计,包含音频分词器、音频大模型和音频去分词器三大核心组件,支持多模态输入处理。在十余项音频基准测试中,Kimi-Audio均取得领先性能,如LibriSpeech ASR测试WER仅1.28%,VocalSound测试达94.85%。模型使用1300万小时多语言音频数据进行预训练,并构建了自动处理流水线生成高质量训练数据。评估结果显示,Kimi-Audio在语音识别、音乐理解、语音情感分析等任务上全面超越同类模型,在OpenAudioBench和VoiceBench对话测试中也表现最佳。目前模型代码、检查点和评估工具包已在GitHub开源。

  • 开源即支持!基于昇腾MindSpeed MM玩转InternVL3多模态理解最新模型

    多模态理解领域当前已成了各家AI大模型公司“军备竞赛”的关键点之一,国内外知名AI大模型公司都争相通过发布最先进的多模态大语言模型展现其在多模态理解领域的前沿能力。近期,上海AI实验室推出了其最新的多模态大语言模型InternVL3 系列,相比上一代InternVL2. 5 模型,该模型展现出卓越的多模态感知和推理能力,同时进一步扩展了其工具使用、GUI代理、工业图像分析等

  • 小尺寸性能平板!联想拯救者Y700四代核心参数出炉:这些配置超越iPad mini 7

    联想拯救者Y700四代平板配置曝光,搭载骁龙8至臻版芯片,配备12GB/16GB内存和256GB/512GB存储,内置7600mAh电池支持68W快充。8.8英寸16:10屏幕比iPad mini7更窄、屏占比更高,重340g。采用12000mm铜制VC散热,双X轴线性马达,支持TF卡扩展。性能、散热、屏幕、续航等方面领先iPad mini7,更适合游戏和视频需求。预计5月发布。

  • 不要思考过程,推理模型能力能够更强

    UC伯克利和艾伦实验室的最新研究表明,推理模型无需依赖冗长的思考过程也能有效工作。研究人员提出的"无思考(NoThinking)"方法通过简单提示直接生成解决方案,跳过了传统推理模型中的显性思考步骤。实验证明,在低资源(低token数量、少模型参数)或低延迟情况下,NoThinking方法的表现优于传统思考方式,能减少token使用量并提高推理速度。该方法在数学问题解决、编程和形式定理证明等任务中表现优异,尤其在资源受限时优势更明显。研究还发现,结合并行计算扩展后,NoThinking能进一步提升性能,在保持准确性的同时显著降低延迟和计算成本。这一发现挑战了"推理模型必须依赖详细思考过程"的传统认知。

  • 国产六大推理模型激战OpenAI?

    2025年春节前夕,DeepSeek-R1模型发布,标志着中国AI进入推理模型新时代。文章梳理了国产大模型发展历程:从2022年ChatGPT引发国内追赶OpenAI热潮,到2023年"百模大战",再到2024年"AI六小虎"格局形成。重点分析了六大国产推理模型(DeepSeek、百度、阿里、科大讯飞、字节、腾讯)的技术特点与市场表现,指出国产模型在性能上已接近GPT-4水平。特别强调科大讯飞星火X1凭借全国产化技术路线获得政企青睐,以及DeepSeek-R1以560万美元超低成本实现高性能的突破。文章还探讨了英伟达芯片断供危机下,国产全栈技术路径的重要性,认为自主可控将成为对抗国际不确定性的关键。最后指出,随着推理模型成为竞争焦点,国产大模型正从技术追随转向自主创新阶段。

今日大家都在搜的词: