首页 > 业界 > 关键词  > 小米最新资讯  > 正文

小米自研AI大模型!Xiaomi MiMo再次登顶全球

2026-05-12 14:13 · 稿源: 快科技

快科技5月12日消息 小米官方今日发布公告称,根据OpenRouter平台的最新统计数据,Hermes Agent在全球调用量排名中位列第一,日均Token调用量达到2910亿,周调用量突破1.75万亿。

由小米自主研发的MiMo模型成为该平台调用量最大的贡献模型,近30天内累计贡献1.45万亿Token调用量。

小米自研大模型Xiaomi MiMo再登全球榜首

Hermes Agent作为全球发展速度最快的开源Agent框架,目前在GitHub上已获得超过14万星标。其核心特点包括自进化持久记忆、自主学习以及技能自我优化能力。

与普通聊天机器人不同,该智能体在使用过程中会不断变得更加智能。这对底层模型在指令执行的精确度、百万级上下文处理能力以及推理稳定性方面提出了很高的要求。

小米自研大模型Xiaomi MiMo再登全球榜首

MiMo系列模型能够在如此高强度应用场景中取得调用量领先,是对大模型综合能力的一次实战检验。

这也意味着,全球增长最快的开源Agent产品,在真实的高强度任务场景中,将小米MiMo作为首选推理引擎。

小米自研大模型Xiaomi MiMo再登全球榜首

为回馈全球开发者,小米正式启动“MiMo Orbit 100T Token计划”,面向全球AI用户免费提供Token权益,计划在30天内累计发放100万亿Token。

截至5月12日上午,已累计送出近80万亿Token,剩余额度有限,赠完即止。

举报

  • 相关推荐
  • 小米发布Xiaomi MiMo Claw正式版:免费时长增加!打通金山办公

    小米正式发布MiMo Claw,依托最新大模型实现一键部署智能体,并与金山办公打通。其核心模型MiMo-V2.5-Pro支持百万级超长上下文、千次工具调用,任务达标率63.8%,Token消耗降低40%以上。办公场景实现文档AI生成、实时编辑闭环,兼容超95%主流格式。免费用户每日使用时长延至4小时,订阅首月特惠14.9元,提供多档套餐,海外服务暂未开放。

  • AI日报:微信支付推出“AI专属卡“;小米龙虾MiMo Claw正式版发布;智谱AI正式开源GLM-5.2模型

    小米发布MiMo+Claw正式版,免费时长增至4小时。字节豆包用户超2亿但收入不足百万,AI资源转向企业端。智谱AI开源GLM-5.2,主打1M无损上下文与长程代码任务。微信支付发布"AI专属卡",主账户隔离设计保障Agent闭环消费。微软推Copilot Cowork智能体,以高性价比直面Claude;Anthropic紧急叫停Claude Agent SDK计费变更。昆仑万维发布天工3.1支持多Agent并行。OpenAI筹备双向语音模型GPT-B

  • 高考语文刚结束!卢伟冰晒小米Mimo写北京卷作文:网友直呼很不错

    小米集团总裁雷军在2026年高考语文结束后,用小米AI大模型Mimo创作了一篇题为《做规划与下功夫》的作文,迅速引发热议。文章以程端礼读书日程和钱学森科技规划为例,强调规划与功夫如鸟之双翼,缺一不可。规划指明方向,功夫将蓝图变为现实,二者在实践中共生。网友称赞其逻辑清晰,并调侃雷军分享清华经验,他幽默回应自己高考语文考得不好。

  • 小米MiMo Code发布并开源:界面全汉化!自进化终端AI编程助手

    小米正式发布并开源终端AI编程助手MiMo Code V0.1.0,基于OpenCode二次开发,采用MIT协议,个人和企业可自由使用修改。内置免费多模态模型MiMo-V2.5,性能对标Claude Sonnet 4.6,兼容主流大模型和第三方Token服务。独创持久记忆系统解决长会话信息丢失,Harness系统实现全流程自动化编程,实测在SWE-Bench等测试集得分高于Claude Code 5个百分点。支持语音输入、跨平台(Mac/Linux/Windows),界面全中文汉化,安装简洁。

  • 小米发布MiMo-V2.5-Pro-UltraSpeed:生成速度提升10倍!突破1000 tokens/s

    小米联合TileRT推出MiMo-V2.5-Pro-UltraSpeed,基于万亿参数大模型,在单台标准8卡GPU节点上首次将文本生成速度提升至1000+ tokens/s,峰值可达1200 tokens/s,无需定制专用芯片,大幅降低极速AI推理门槛。该版本同步上线运时API服务,定价为原版的3倍但速度提升约10倍,性价比突出。服务采用申请制,6月9日至23日开放试用,企业及开发者优先,普通用户可免费体验对话功能。性能飞跃依赖三大技术创新:FP4量化技术、DFlash区块并行预测解码和TileRT推理系统,重塑了AI应用场景,支持模型并行推演、自主纠错等,缓解代码生成等待,赋能高频交易、实时反欺诈等毫秒级决策场景。

  • 小米MiMo要蹭着DeepSeek蹦上牌桌

    ​5月27日,小米把 MiMo-V2.5系列 API 永久降价。 MiMo-V2.5-Pro 的输入缓存命中价格降到0.025元/百万 tokens,输入未命中价格3元/百万 tokens,输出价格6元/百万 tokens。普通版 MiMo-V2.5更低:缓存命中0.02元,输入未命中1元,输出2元。 这不是一次常规促销。 因为把价格横向一比就会发现,小米这次不是随便降价,而是直接对标 DeepSeek。 MiMo-V2.5-Pro 对 DeepSeek V4-Pro,MiMo-V2.5对 DeepSeek V4-Flash�

  • AI日报:小米开源AI编程助手MiMo Code;京东MALL首批人形机器人上岗;谷歌发布DiffusionGemma

    AI日报今日要点:小米开源终端AI编程助手MiMo Code,内置免费多模态模型;京东MALL首批人形机器人上岗,优必选助力618智慧零售;苹果Xcode 27原生集成Gemini,提升AI编程效率;谷歌发布实验性开源模型DiffusionGemma,采用文本扩散架构提速推理;微软因数据隐私担忧禁用员工使用Claude Fable 5;谷歌升级NotebookLM,引入Gemini 3.5 Flash与独立云计算机;华纳音乐收购Sureel AI,构建版权防护�

  • 腾讯网盘官网上线:打通AI!支持多应用数据互通、Agent调用

    腾讯上线AI网盘,主打打通人工智能应用生态,实现多端数据互通与资产沉淀。可连接多款AI应用,统一存储数据形成可复用资产。功能包括统一身份认证、跨应用搜索、高效共享协作及支持智能代理调用。提供个人、SaaS等多版本交付,但尚未公布正式发布时间。

  • 谁来给阿里Agent扛旗?

    “QoderWork的日活、周活、Token用量,在集团所有AI工具里都是第一。” 上周五,阿里巴巴CEO吴泳铭现身QoderWork团队会时,给出了这组内部口径。字母榜从阿里相关人士获悉,吴泳铭在会上提到,QoderWork正在成为“打通大模型和整个数字世界的接口”,未来要帮助所有办公室白领,成为类似OS的存在。 这句话出现的时间点很微妙。 同一时期,钉钉刚经历一场人员风波。CEO无招�

  • 考拉悠然发布Uran Agent:让智能体从工具进化为数字员工

    全球企业争相将AI智能体纳入战略,但多数仍停留在“能演示、难落地”阶段。Gartner预测,到2028年33%的企业软件将嵌入智能体,15%的日常决策由其自主完成,但超40%的项目可能因成本失控、价值不清等问题在2027年前被叫停。考拉悠然发布Uran Agent平台,以“元生智能”为核心,通过重构信息架构、支持智能体自我进化、多智能体协作及生态即插即用,旨在将智能体从一次性工具转化为持续创造价值的“数字员工”。

今日大家都在搜的词: